数理统计根据观察或实验得到的数据来研究随机现象,并对研究对象的客观规律做出合理的估计和判断
数理统计可以看成为逆向的概率论
有限的数据集被称作 样本
观察对象所有的可能取值被称作 总本
统计量是一种样本函数 用来进行统计推断的工具
样本均值和样本方差是两个重要的统计量
基本问题可以被分成两大类: 参数估计和假设检验
参数估计
参数估计是通过随机抽取的样本来估计总体分布的方法
-
点估计 具体方法包括矩估计法和最大似然估计法
矩估计法的思想在于用样本 k 阶矩估计总体的 k 阶矩
最大似然估计的直观理解是: 既然抽样得到的是已有的样本值, 就可以认为取到这一组样本值的概率较大,因而在估计参数的时候就需要让已有的样本值出现的可能性最大
估计量的评价标准
- 无偏性 估计量的数学期望等于未知参数的真实值
- 有效性 无偏估计量的方法尽可能小
- 一致性 当样本容量趋近于无穷时,估计量依概率收敛于位置参数的真实值
区间估计
通过参数估计出一个区间 这个区间叫做置信区间 这种方式叫做区间估计
置信区间: 对总体反复抽样,确定的置信区间
置信水平: 置信区间中包含真实值的比值
区间估计相当于在点估计的基础上提供了取值范围与界限
假设检验
参数估计的对象是总体的某个参数,假设检验的对象则是关于总体的某个论断,即是总体的假设
其中包含原假设 H0和备假设 H1,检验过程就是根据样本在 H0与 H1之间选择一种接受
假设检验的作用就是根据学习器在测实集上的性能推断其泛化能力的强弱,并确定所得结论的精确程度,可以进一步推广为不同学习器的性能