1)点估计
◎定义5.16:参数的点估计(point estimate)是指用某个样本统计量的某个具体取值直接作为总体参数的估计值。
例如,用样本均值直接作为总体均值的估计;用样本比例直接作为总体比例的估计。在5.1节中我们总结出了样本均值抽样分布和总体均值之间的联系,样本均值的期望和总体均值相等。可是,我们提供的样本统计量的某个取值来自于随机抽取的某一个样本,这个样本一旦抽出,样本的均值也就确定了,这个确实的值或等于总体均值,或不等。这样一来,就显现出了点估计的最大弊端,点估计无法提供估计值与总体参数真实值之间的接近程度信息。
2)区间估计
以估计总体均值为例,因为样本均值的数学期望与总体均值相等,衡量每个样本均值和总体均值接近程度,记为衡量每个样本均值和样本均值的均值之间的差异程度,很明显这其实就是样本均值的标准差(抽样标准误差)的定义。在点估计基础上加上这种估计可靠性的度量构造的一个概率性区间,就是总体参数的区间估计。
◎定义5.17:参数的区间估计(interval estimate)是指在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减边际误差而得到的。
对总体参数的估计区间一般是由对应的样本统计量加减边际误差得到的,结合样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。
区间估计的基本原理是怎样的呢?为了方便大家理解,这里首先回顾一下经验法则。当一组数据为对称分布时,约有68%的数据在平均数加减1个标准差的范围之内,即数据落在均值两侧各一个标准差的概率为0.68。也就是说构造以样本均值加减一个标准差的区间至少会包含68%的数据,注意,样本均值是已知的。
如果样本均值以一定的概率落在总体均值加减1个抽样标准差范围之内,那么样本均值加减1个抽样标准差的范围也会以一定的概率包含总体均值。
◎定义5.18:置信区间(confidence interval)是由样本统计量所构造的总体参数的估计区间;统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。
◎定义5.19:置信水平(confidence level)是指重复抽取相同容量的样本,可构造多个置信区间,置信区间包含总体参数真值的次数所占的比例。表示为(1-α)(通常以百分比形式表示,α为总体参数未在区间内的概率)。(www.xing528.com)
在构造估计总体参数的置信区间时,可选择希望的任意置信水平,表5.4中我们提供了在本书中经常用到的置信水平和标准正态分布曲线右下方面积为α/2时对应的标准正态变量z的值。
表5.4 常用置信水平的zα/2值
注意
①总体参数是未知常数,样本统计量是随机变量,区间估计是用一个区间估计总体参数所在的置信区间。
②置信水平为90%的置信区间意义为构造的所有区间中约有90%的区间包含总体参数的真值,10%的区间不包含。
③毫无疑问,构造的区间越多,逮捕到总体参数真值的机会越大,但实际上我们往往只抽取了一个样本。因此,构造的也只是某一个特定的区间,这个区间可能是90%的区间中的一个,也可能是10%的区间中的一个。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。