首页 理论教育 抽样估计的基本方法:旁观者清,主体感受深

抽样估计的基本方法:旁观者清,主体感受深

时间:2023-06-04 理论教育 版权反馈
【摘要】:在抽样调查中总体目标量的估计量及其精度都与具体抽样方法有关。当层内单元指标差异较小而层间单元指标差异较大时,采用分层抽样可以大大提高估计的精度。多阶抽样的主要缺点是估计量的结构比较复杂,估计量方差的估计也很复杂。

抽样估计的基本方法:旁观者清,主体感受深

5.2.1 抽样方法

抽样调查中的一个基本问题是样本的抽取方法。在抽样调查中总体目标量的估计量及其精度都与具体抽样方法有关。最基本的抽样方法有以下五种,实际调查所用的方法通常是这五种方法的各种形式的组合。

5.2.1.1 简单随机抽样

简单随机抽样 (simple random sampling) 也称为单纯随机抽样。从包含N个抽样单元的总体中抽取容量为n的简单随机样本,可以是从总体中逐个不放回地抽取n次,每次都在尚未入样的单元中等概率抽取; 也可以是从总体中一次取得全部n个单元,只要保证全部可能的样本每个被抽到的概率都相等即可。

简单随机抽样是其他抽样方法的基础,因为它在理论上最容易处理,并且当总体包含的抽样单元数N不太大时实施并不困难。但是当N很大时实施就很困难,主要是编制一个包含全部N个抽样单元的抽样框通常很不容易。另外当N很大时所抽到的样本单元往往很分散,使调查极不方便。因此,在大规模的抽样调查中很少单独采用简单随机抽样。

5.2.1.2 分层抽样

将总体中的抽样单元按某种原则划分或若干个子总体,每个子总体称为层。在每个层内独立地进行抽样,这样的抽样称为分层抽样 (stratified sampling)。如果在每层内均采用简单随机抽样,就称为分层随机抽样。在分层抽样中,先根据层样本对层的参数进行估计,然后再将这些层估计加权平均或求和作为总体均值或总值的估计。

分层抽样特别适用于既要对总体参数进行估计也要对子总体 (层) 参数进行估计的情形。分层抽样实施和组织都比较方便,样本单元分布比较均匀。当层内单元指标差异较小而层间单元指标差异较大时,采用分层抽样可以大大提高估计的精度。例如在居民收入调查中,按收入分布情况将居民分为最高收入层、高收入层、中等偏上层、中等收入层、中等偏下层、低收入层、最低收入层实施分层抽样,其估计精度就会比简单随机抽样显著提高。

5.2.1.3 二阶抽样与多阶抽样(www.xing528.com)

为抽样方便,有时我们把总体分成两个级别的抽样单元: 初级抽样单元和次级抽样单元,总体由若干初级单元组成,每个初级抽样单元由若干次级抽样单元组成,先按某种方法在由初级单元构成的一级抽样框中抽样,然后在中选的初级单元中由次级单元构成的二级抽样框中抽样,抽样过程分为两个阶段,这种抽样方法称为二阶抽样 (two stage sampling)。例如在企业职工收入调查中,把企业作为初级抽样单元,职工作为次级抽样单元,先对企业进行抽样,再对被抽中企业的职工进行抽样,然后对被抽中的职工进行调查,这就是二阶抽样。如果总体可以划分成多个级别的抽样单元,每一级别的抽样单元由若干下一级别的抽样单元组成,相应地存在多个级别的抽样框,抽样时先在一级抽样框中对一级单元抽样,再在中选的一级单元中对二级单元抽样,依次类推,这种抽样方法称为多阶抽样 (multi-stages ampling)。多阶抽样实施方便,而且不需要对每个高级别的抽样单元建立关于低级别抽样单元的抽样框,调查费用也比较低。例如在省抽县、县抽乡、乡抽村、村抽户的农产量四阶抽样中,凡未被抽中的县、乡、村就不必编制关于乡、村、户的抽样框。多阶抽样的主要缺点是估计量的结构比较复杂,估计量方差的估计也很复杂。

在二阶抽样中,如果对初级单元不再进行随机抽样,让所有的初级单元都入样,而在初级单元中对次级单元进行随机抽样,这样的二阶抽样就是分层随机抽样,层即初级单元。

5.2.1.4 整群抽样

在二阶抽样中如果把初级抽样单元称作由次级抽样单元组成的群,在抽中的群内不再对次级单元进行抽样而是进行普查,那么这种抽样方法就称为整群抽样 (cluster sampling)。当总体包含的次级单元为数众多且又缺少必要的档案资料因而无法直接对次级单元编制抽样框,而由次级单元组成的群的抽样框是现成的或者很容易编制时,常常采用整群抽样。整群抽样的优点是只需具备群即初级抽样单元的抽样框即可,无需具备关于次级单元的抽样框。整群抽样的效率与群的划分密切相关,如果总体划分成群后,群内差异小而群间差异大则估计精度就比较低。因此群的划分原则应是尽量扩大群内差异,使每个群都有较好的代表性。由此可知,划分群的原则正好和分层的原则相反。

5.2.1.5 系统抽样

若总体中的抽样单元都按一定顺序排列,在规定的范围内随机抽取一个单元作为初始单元,然后按照一套事先定好的规则确定其他样本单元,这种抽样方法称为系统抽样(systematic sampling)。与其他几种抽样方法不同的是,这里只有初始单元是随机抽取的,其他样本单元都随着初始单元的确定而确定。最简单的系统抽样是在取得一个初始单元后按相等的间隔抽取后继样本单元,这种系统抽样称为等距抽样。等距抽样的优点是实施简单,整个样本中只是初始单元需随机抽取,其余单元皆由此决定。另外,等距抽样有时甚至不需要编制抽样框,只需给出总体抽样单元的一个排列即可。如果对总体抽样单元的排列规则有所了解并加以正确利用,那么等距抽样就能达到相当高的精度。

以上对几种常用的抽样方法作了简单的介绍。在实际运用中会有许多变化,例如在某些抽样方法中,抽取样本单元可采用不放回抽样,也可采用放回抽样; 可采用等概率抽样,也可采用不等概率抽样。在具体设计抽样方案时还应考虑多种因素,以决定抽样方法的选择和组合。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈