一、置信区间的估计
1.统计推断:统计推断是基于样本统计量对总体参数给出统计学结论
2.常用方法:置信区间估计和假设检验
3.95%置信度的含义:100次抽样结果的100个95%置信区间中,平均而言有95个置信区间包含了真实的总体均数。置信度常用C表示
二、置信区间
(1)已知σ时μ的置信区间
1.样本量为n的简单随机抽样数据,估计总体均数μ的置信区间,当总体分布服从正态分布时,样本均数μ服从
2.对于一个观察到的样本,μ的置信度为C的置信区间为,其中为μ的估计值,为误差范围
3.和C的关系为C越大则越大
(2)置信区间的误差范围
1. 高置信度是指结果准确性高,误差范围小是指结果精确性高
2. 减小置信区间误差范围的方法:
①选择较低的置信度,从而得到更小的
②选择更大的样本量n;
③减小σ
三、置信区间与样本量
1.合理的样本设计应在进行数据收集前先确定好统计推断方法,确定足够的样本量可使得后期置信区间的误差范围较小。
2.根据置信区间误差范围计算公式,计算简单随机抽样的样本量:
3.实际应用中,样本量大小的选择,除上述公式计算结果外,还应考虑其他因素,如数据收集过程中所花费的成本等,确保研究方案实施的可行性。
4.严谨的设计通常会事先假定一个无应答率,并以此校正样本量的计算。
四、注意事项
1.公式不适用于所有抽样方法,不同的抽样方法需要采用不同估计公式。
2. 公式适用条件
(1)数据必须来自相应总体的简单随机抽样;
(2)个体间相互独立;
(3)事先假定总体标准差已知,实际研究中很可能无法得到总体标准差。
3.选用统计方法前需对数据进行探索性分析,检查异常值以及数据是否服从正态分布;
4. 统计分析无法拯救糟糕的数据;
5. 实际操作中的问题(如无应答与失访)会给抽样研究带来额外的误差,这些误差可能比随机抽样误差大得多,并且研究结果中这些误差并不能被误差范围所反映;
6. 统计推断的概率是指该方法重复进行的正确频率,但并不知道某一次结果的正确性。