首页 理论教育 简单随机抽样法的应用

简单随机抽样法的应用

时间:2023-08-10 理论教育 版权反馈
【摘要】:另一个常用的方法是按照顺序派给每一个名字一个数目,然后根据随机数表挑选。查对随机数表抽取样本的步骤如下:1)在界定总体的基础上,编制抽样框,其中包括给总体每个成员编上号码。3)在随机数表中由上到下抽样或从左到右,只要小于或等于总体规模数的数值就是样本号码,直到抽满规定的样本数为止。表9-1随机数表抽样节选

简单随机抽样法的应用

这是最基本的概率抽样法。总体内任何个体,无论属于什么类型或具有什么特征,都一视同仁地给予相等的机会进入样本。这个方法要求有一份完整而不重复的“抽样框”(sampling frame,或称“总体名单”),把总体内所有个体都列入榜内,每个个体只能列名一次。抽样框的界定必须仔细而且结合实际,含糊、重复、不全,都会造成系统性的偏差。“本年度”是指“学年”还是“历年”?若是后者,是否应包括九月后的新生或七月后离校的毕业生?留级者的名字是否剔除了?转校生列入了名单没有?学生名单大概是最易整理成为抽样框的了,其他的机构或行业很多时候未必有现成的名单。商店只会有订户名单,不可能有门市顾客的;活动中心举办多种活动,有些有固定参与者,但是不知有多少人同时参加几项活动;诊所保留了多年来的病人名单,其中很多近几年没再光顾,不来的原因可能是没病、死了、没钱、行动/交通不便或者不满意服务。你想研究过去两年内连续领受救济的家庭,有些救济类别可能因经费不足而停办,对应的那些家庭即使名单尚在,也不容易决定是否应当列入抽样框内;要找某区住户完整的名单,电话簿内的不全、人口调查局说法律规定名单不能披露……

以上每一种情况,都代表一类建造抽样框时遇到的实际问题。有经验的抽样者预估到问题的性质,有时必须在技术上或资源方面协助执行者整理名单,有时则必须复核名单的准确性。如果发现问题太大无法解决,此时应及早转换抽样方法,甚至调整概念或操作化方法,以免蹉跎时日,或引起误会。

有了完整而无重复的抽样框,决定了样本的大小后,下一步工作是从总体中公平地、不带系统偏差地抽出样本。最易明白的方法是抽签,你可把抽样框上每一个名字分别写进一片(且只有一片)外貌相同的签纸上,搅和均匀后抽出。这步工作执行起来虽然很简单,如果粗心大意却会损害公平机会,比如工作人员可能有意无意地遗漏了整页或整所学校的名字。另一个常用的方法是按照顺序派给每一个名字一个数目,然后根据随机数表(random number table,几乎每一本统计学课本的附录中都可找到,本书附录亦有)挑选。这份表上的数字经过数学家小心安排,避免了任何规律。查对随机数表抽取样本的步骤如下:

1)在界定总体的基础上,编制抽样框,其中包括给总体每个成员编上号码。

2)按照总体规模的位数,在随机数表中查对相同的位数。例如总体有5000人,就是4位数,我们便在随机数表中从任意4位数开始查对。

3)在随机数表中由上到下抽样或从左到右,只要小于或等于总体规模数的数值就是样本号码,直到抽满规定的样本数为止。(www.xing528.com)

4)把抽取出来的样本号码与抽样框中的名单相对照,与样本号码对应的单位名或个人姓名就是样本。

如果我们在一个5000人的总体中抽取200人作为样本,在编制好抽样框后,就可以在随机数表中直接抽样。表9-1是随机数表的节选,可以按任意方向在表中取4位数,若从左到右取前4位数,被抽取的样本号码是:1009、3754、0842、1280、3106(参见表9-1);如果取后面4位数,被抽取的样本号码是:0973、4226、0190、0657、0601、2697、4264;也可以从第二个数字开始取4位数,被抽取的样本号码是:0097、2807、1060、3573。需要注意的是,在一次抽样中,只能选择一种标准确定位数,不能一会儿取前面的4位数,一会儿取后面的4位数,一会儿取中间的4位数。

简单随机抽样法实用且最具有说服力,不过样本大时用这个方法颇为费时,因为弄出完善的抽样框可能要花很多时间和资源,弄不出完善的抽样框时就要全盘放弃简单随机抽样法。因此采用之前须小心估计其可行性。另外,当样本小而特征较多时,一些重要的因素不能兼顾,解决方法可以考虑分层抽样(9.3.3节)或配比方法(10章)。

表9-1 随机数表抽样节选

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈