欢迎您注册蒲公英
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
统计杂谈之小样本置信区间计算 置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。 关于小样本置信区间的计算,使用一个例子来进行说明 某个品种1年生产19批,其中素片的产量数据为71.10、71.34、71.90、71.64、72.50、71.68、71.10、71.95、71.95、71.00、71.95、71.85、71.65、71.90、71.60、71.55、71.75、71.90、72.10,年终总结的时候,领导想知道如果大规模生产的话,真正的产量值是多少,其中给出95%置信值? 下面给出计算的过程 1. 拿到一组样本数据以后,我们习惯性的对数据进行描述性的计算,19个数据的均值xbar =71.71,标准差s=0.37 2.置信区间的计算使用的抽样样本的均值分布来进行,当样本数据合适(n≥30)的时候,标准差差能够通过样本得到很好的估计,抽样样本的均值分布标准符合正太分布,当时当样本量比较少(n<30)的时候,通过样本估计的标准差的偏差就会增大,这个时候抽样样本的分布图的尾部就会增厚,这个时候分布将不符合标准正太分布,而是复核t分布。这是时候样本直线区间的计算将使用t分布。 接着计算,抽样样本的均值Xbar =样本的均值xbar=71.71。抽样分布σ≈s/( n^1/2)=0.085 3. 95%置信范围: t值表,给出了双尾(中心值两侧限制)和单尾(中心值一侧限制)的概率值,我们求解的是均值两侧的范围,所以使用的双尾。同时不要计算自由度ν=n-1=19-1=18。查t值表:
可以看到t=2.101
就是上图中0到t的距离,t 的计算和标准z值的计算公式相同。 95%的执行区间就是,均值±2.101σ的范围。σ≈s/ =0.085 95%的置信区间就是:71.71±2.101×0.085=71.71±0.18=71.53~71.89 我们期望得到的产量值是71.71±0.18=71.53~71.89(α=0.05或95%的置信限) |