首页 理论教育 抽样误差及其影响样本容量

抽样误差及其影响样本容量

时间:2023-07-29 理论教育 版权反馈
【摘要】:然而,当科学家选择测量哪些样本时,可能会带入一种特定的系统误差叫做抽样误差。抽样误差究竟是什么?在使用随机抽样时,测试样本的数量被称作“样本容量”。

抽样误差及其影响样本容量

科学家通过测量收集数据,并使用那些数据回答关于世界的问题。但是,科学家几乎不会测遍世界上事物的所有属性或值来得到数据。取而代之的是他们测量事物样本的属性或值。

然而,当科学家选择测量哪些样本时,可能会带入一种特定的系统误差叫做抽样误差(sampling error)。

抽样误差究竟是什么?在科学研究中,不管是测试病人对药物的反应,还是测量燃烧一桶煤所产生的热量,或者尝尝一锅汤的含盐量,总是不可能测量研究对象的所有个体。因此,科学家研究事物的样本(如一锅汤里的一勺),并进行测量。但是,为了避免测量值的误差,那些样本需要具有代表性(representative)。换言之,样本跟事物整体要足够相似,测试结果才能具有普遍性(generalizable)。如果结果具有普遍性,通过研究样本发现的研究问题的答案也将适用于样本来源的事物整体(人群、煤矿或汤锅)。

科学家采用许多办法来确保他们的样本有代表性,不同的领域偏爱不同的方法。样品源同质化(homogeneous sources)和随机抽样是其中两种方法。

3.4.1 样品源同质化

正如在烹调中那样,在做化学实验时科学家有时通过确保总体均匀混合,使得从中取出的样本具有代表性。如果品尝汤,你会想确保汤搅拌均匀。在科学研究中,确保样品源同质化的方式可能包括研磨固体制浆,或等待混合物的成分都达到同样的温度。如果混合物被均匀混合了,从总体(较大的量)中取出的样本会包含总体的所有成分,成分比例也与总体相同。当总体的量较小使得能够被均匀混合时,同质化的效果最好。同质化通常被应用于测试一种混合物质,而不是一系列单体物质。

3.4.2 随机抽样

在许多实验中,特别是那些涉及测试数量庞大的总体或材料(所有国民、森林里所有的树木、某汤料厂一天的产量等)的实验,科学家有时采用随机抽样(与随机误差是两回事)以确保样本具有代表性。如果总体是由个体成员(一个公民,一棵树或一罐汤)组成的,总体中的任何个体成员都有同等机会被选中进行测试,样本就被视为具有随机性。(www.xing528.com)

在使用随机抽样时,测试样本的数量被称作“样本容量”(sample size)。样本容量太小,可能就有不具备总体代表性。抽样数量占总体的百分比,取决于总体和被测对象的特征。

有时,科学家同时使用随机抽样和样品源同质化的方法。例如,为了测试特定某一天汤料厂所生产的汤罐头的含盐量,科学家们可能从那天生产的罐头中随机选择样本,把每个样本一一倒入搅拌机,然后从搅拌后的汤中舀取一勺进行测试。

质数(prime number)是不能进行因数分解的自然数。换言之,它只能被它本身和1整除。

下面的笑话由麻省理工学院和哈佛的数学专业的学生叙述:两个新学生的作业是找出100以内的所有质数。第一个学生说:“2是质数,3是质数……所有100以内的数,除了1,都是质数。”第二个学生嘲笑他。那么小的样本不可能是准确的。“明显,2是质数,3是质数,5是质数,7是质数……所有100以内的奇数,除了1,都是质数。”

上面笑话中的学生没能成功选出数字的随机样本来测试。然而在这个例子中,他们犯了个更严重的研究错误:他们过早停止了他们的取样过程。过早停止取样不但会导致样本不具备代表性,而且还有歪曲结果的可能。

例如,想象一下如果环境科学家想测试森林里的树木,了解它们中患某种病的有多少。在开始实验前,科学家确定从森林里大约10万棵树中,抽取5000棵样本就足够满足代表性了。但是,在测试了500棵树后,科学家没有发现患这种病的树。科学家应该停止测试吗?不该。当然,科学家可能想终止(测试是昂贵的)。但是500棵树的样本可能不足以代表10万棵树,即使这些树是随机抽取的。

在医学研究中,过早终止实验的影响可能更严重。医学测试通常涉及测试新药的几个品种,或者测试新药与旧药(或安慰剂)疗效的比较。但是,医学测试中不是所有的研究对象都是同时开始服药的,而且不是所有的药物都随着时间推移有持续的效果。因此,在测试新药时,医学研究者有时会面临困境。如果某种新药在实验中很早就显示很好的结果,最合乎道德的做法是停止实验,并把疗效很好的那种药提供给服用别的品种的药或者安慰剂或者还没有开始服药的研究对象使用。但是,如果科学家们太早终止实验,他们面临的风险是:没有足够大的研究对象样本使之具有代表性,判断药品有效性所测试的时间太短。如果科学家仅因为结果非常积极(即药物看来有效)而早早终止实验,会造成正系统偏差。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈