5.3.1 抽样误差的概念
当总体指标未知时,往往要安排一次抽样调查,然后用抽样调查所获得的抽样指标的观察值作为总体指标的估计值。这种处理方法是存在一定误差的,我们把抽样指标与所要估计的总体指标之间的差值称为抽样误差。抽样误差的大小能够说明抽样指标估计总体指标是否可行、抽样效果是否理想等调查性问题。常见的抽样误差有: 抽样平均数与总体平均数之差、抽样成数与总体成数之差。
比如某年级100名同学的平均体重=55kg,现随机地抽取10名同学为样本,其平均体重=52kg。若用52kg估计55kg,则误差为52-55=-3kg。如果重新抽10名同学,若测得=57kg,则其误差为2kg。这种只抽取部分样本而产生的误差,都被称为抽样误差。
由本例不难看出,抽样误差既是一种随机性误差,也是一种代表性误差。说其是代表性误差,是因为利用总体的部分资料推算总体时,不论样本选取有多么公正,设计多么完善,总还是一部分单位而不是所有单位,产生误差是无法避免的。说其是随机性误差,是指按随机性原则抽样时,由于抽样的不同,会得到不同的抽样指标值,由此产生的误差值各不相同。抽样误差中的代表性误差是抽样调查本身所固有的、无法避免的误差,但随机性误差则可利用大数定律精确地计算并能够通过抽样设计程序加以控制。
抽样误差不包括下面两类误差: 一类是调查误差,即在调查过程中由于观察、测量、登记、计算上的差错而引起的误差; 另一类是系统性误差,即由于违反抽样调查的随机原则,有意抽选较好单位或较坏单位进行调查,这样造成样本的代表性不足所引起的误差。这两类误差都属于思想、作风、技术等问题,所以是可以防止和避免的。
5.3.2 影响抽样误差的因素
(1) 抽样单位数的多少。由于总体内各元素之间总存在着差异,在其他条件不变的情况下,大量观察总比小量观察易于发现总体规律或特征,因此样本容量越大越能代表总体特征,抽样误差就越小。反之,样本容量越小,抽样误差就可能越大。
(2) 总体各单位标志值的差异程度。总体内各单位标志的差异程度越小,或总体的标准差越小,在其他条件给定下,则抽样误差就越小。反之,抽样误差就越大。
(3) 抽样方法。抽样方法不同,抽样误差也不同。一般说来,重复抽样的误差比不重复抽样的误差要大。
(4) 抽样的组织形式。选择不同的抽样组织形式,也会有不同的抽样误差。
5.3.3 抽样平均误差
一个总体可能抽取很多个样本,因此样本指标 (样本平均数、样本成数等) 就有不同的数值,它们与总体指标 (总体平均数、总体成数等) 的离差 (即抽样误差) 也就不同。抽样平均误差就是反映抽样误差一般水平的指标,通常用样本平均数 (或样本成数)的标准差来表示。
5.3.3.1 样本平均数的平均误差
以μx表示样本平均数的平均误差,σ表示总体的标准差。根据定义:
(1) 当抽样方式为重复抽样时,样本标志值x1,x2,…,xn是相互独立的,样本变量x与总体变量X同分布。所以得:,它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。
[例5.1]有5个工人的日产量分别为 (单位: 件): 6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。抽样平均误差为多少?(www.xing528.com)
解:根据题意可得:=10(件)
总体标准差(件)
抽样平均误差=2 (件)
(2) 当抽样方式为不重复抽样时,样本标志值x1,x2,…,xn不是相互独立的,那么,当总体单位数N很大时,这个公式可近似表示为:
与重复抽样相比,不重复抽样平均误差是在重复抽样平均误差的基础上,再乘以,而总是小于1,所以不重复抽样的平均误差也总是小于重复抽样的平均误差。如前例,若改用不重复抽样方法,则抽样平均误差为:
5.3.3.2 抽样成数的平均误差
总体成数P可以表现为总体是非标志的平均数。其标准差。
根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。
(1)在重复抽样下:
(2)在不重复抽样下:
当总体单位数N很大时,可近似地写成:
[例5.2]某企业生产的产品,按正常生产经验,合格率为90%,现从5000件产品中抽取50件进行检验,求合格率的抽样平均误差。
解: 根据题意,在重复抽样条件下,合格率的抽样平均误差为:
在不重复抽样条件下,合格率的抽样平均误差为:
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。