首页 理论教育 抽样推断的重要性及应用领域

抽样推断的重要性及应用领域

时间:2023-07-19 理论教育 版权反馈
【摘要】:第六章抽样推断统计学包括描述性统计和推断统计,推断统计代表了统计学的精华部分,而抽样推断属于推断统计的核心内容。第一节抽样推断的一般问题本节主要介绍抽样推断的概念、抽样推断的内容及其抽样调查在经济实践中的运用。在这种情况下,只能采用抽样推断的方法来了解全部产品的质量。由于现象的发展变化存在随机性和不确定性,借助抽样推断可对某些未知总体的假设进行真伪判断,以此获得比较正确的决策。

抽样推断的重要性及应用领域

第六章 抽样推断

统计学包括描述性统计和推断统计,推断统计代表了统计学的精华部分,而抽样推断属于推断统计的核心内容。经济实践中,从总体当中抽取部分单位进行调查,叫抽样调查。抽样调查可分为概率抽样和非概率抽样。非概率抽样是按照主观意愿进行的抽样,组成总体的大部分单位没有被抽中的机会(零概率),非概率抽样的具体形式包括定额抽样、判断抽样等,本章主要介绍概率抽样。它以概率论为基础,就参数估计假设检验问题形成了一套科学完整的理论体系

第一节 抽样推断的一般问题

本节主要介绍抽样推断的概念、抽样推断的内容及其抽样调查在经济实践中的运用。

一、抽样推断的概念

抽样推断是指按照随机原则,从研究对象的总体中抽取一部分单位(样本)进行调查,并用这一部分单位的指标数值去推断总体的指标数值,从而达到认识总体目的的一种统计方法。所谓总体,是指要认识对象的全体,又称为全及总体或母体。这里所讲的随机原则也称为等可能性原则,是指从总体中抽取样本单位时,保证总体中每个单位被抽中的可能性是相同的。按照随机原则抽样,能使抽取出来的样本分布近似于总体分布,使样本指标的代表性增强,保证抽样推断的结论有一定的可靠性。与其他调查方式相比,抽样推断有以下特点:

(1)建立在随机原则基础上。随机性原则是抽样调查的基本原则,遵循这个原则一方面可以避免统计估计的系统性误差;另一方面只有符合随机性原则,才能计算出抽样估计误差。

(2)根据部分单位的调查结果,对总体进行科学推断。抽样调查既是收集资料的方法,同时也是对统计总体进行认识的方法,用抽样资料对总体进行认识,需要依据统计估计和归纳推断。

(3)抽样误差不可避免,但可以事先计算和控制。用样本资料推断总体,必然会产生误差,但抽样误差的大小可以计算出来,并且还能进行控制。

二、抽样推断的应用

抽样推断作为一种科学的统计调查方法,其应用十分广泛,大体可归纳为以下几个方面:

(1)可用以对无限总体进行认识。无限总体包括的总体单位是不可数的,因此无法对该类总体进行全面调查,而需采用抽样调查推断的方法来认识总体的数量特征。

(2)可用于属于破坏性或消耗性的产品的质量检验。对于有些工业产品质量的检验,必须进行破坏性或消耗性的检验,才能了解其情况。例如,炮弹的杀伤力检验、灯泡的使用寿命检验、纱布的强力检验等。在这种情况下,只能采用抽样推断的方法来了解全部产品的质量。

(3)可用于某些不必要进行全面调查的现象。有些现象,虽然理论上可以进行全面调查,但由于调查对象包括的范围广,单位多,需花费大量的人力、物力和时间,这时可采用抽样推断的方法取得事半功倍的效果。例如,我国在了解城乡居民生活情况时,就是采用抽样推断的方法来获取资料。

(4)可以对全面调查的资料进行评价和修正。由于全面调查的工作量大,在调查登记和整理汇总资料的过程中,受主观和客观因素的影响,工作易出差错,为了加强全面调查资料的准确性,可以用抽样推断取得的资料来验证全面调查资料,并以此作为修正依据。

(5)可用于生产过程的质量控制。抽样推断不仅广泛用以生产成果的核算估计,而且还可以用于生产过程中的质量控制,检验生产工艺过程是否正常,如产品质量控制图的运用等。

第六,对某些总体的假设进行真伪判断,为决策提供依据。由于现象的发展变化存在随机性和不确定性,借助抽样推断可对某些未知总体的假设进行真伪判断,以此获得比较正确的决策。

三、抽样推断中的基本概念

本章所用到的基本概念包括总体与样本,参数与统计量,可能样本数目以及样本容量,重复抽样与不重复抽样,其中总体与样本、参数与统计量的概念在第一章导论中已经介绍过,本章再将其具体计算过程进行说明,总体参数由于标志的性质不同计算方法也不同。

1.参数与统计量

(1)参数。参数是用来描述总体特征的概括性数字度量,它反映的是总体的某种特征,包括总体均值、总体标准差及总体比率(也称为总体成数)。

总体均值为

标准差为

设具有某种属性的总体单位数为N1,不具有某种属性的总体单位为N0,则具有某种属性的总体比率(也称为总体成数)为

不具有某种属性的总体成数为

总体成数的标准差为

(2)统计量。统计量是根据样本资料计算的,用以估计和推断相应总体指标的综合指标。常见的统计量有样本平均数珋x,样本比率(也叫样本成数)p,样本方差s2或样本标准差s等。由于从一个总体中可以抽取很多样本,每次抽取的样本不同,其样本统计量也必然不同。所以样本统计量是随样本不同而不同的随机变量,它是样本变量的函数。

根据样本中各单位标志值或标志属性计算的综合指标称为统计量。统计量是样本变量的函数,用来估计总体参数的。因此和常用的总体参数相对应,有样本均值、样本方差和样本成数等。

常用样本指标(统计量)的计算方法有以下几种:样本均值:

样本比率:

样本方差:

样本标准差:

总体参数与样本统计量的比较可总结为表6-1所示内容。

表6-1 总体参数与样本统计量的对比

2.样本容量与样本可能数目

样本容量是指一个样本所包含的单位数,一般用n表示。通常,将样本单位数不少于30个的样本称为大样本,即n≥30为大样本;不及30个的称为小样本,即n<30为小样本。社会经济统计的抽样调查多属于大样本调查。

样本可能数目又称为样本个数,指按一定的抽样方法和抽样组织形式,从全及总体N个单位中随机抽取n个单位构成样本,一共可以抽出的不同样本的数量,一般用m表示。一个总体有多少样本,则样本统计量就有多少取值,从而形成统计量的分布,此分布是抽样推断的基础。

3.重复抽样与不重复抽样

重复抽样又称为有放回抽样,它是指从总体N个单位中,随机抽取一个单位,登记之后又放回总体,第二次再从全部N个单位中抽取第二个单位,登记之后再放回去,依此类推,直到抽够样本容量n为止。因此,重复抽样的样本是由n次相互独立的连续试验构成的,每次试验是在完全相同的条件下进行的,每个单位中选的机会在各次都完全相等。

不重复抽样又称为无放回抽样,它是从总体N个单位中随机抽取一个单位,登记之后不再放回总体,而是从剩下的总体单位N-1中抽取第二个单位,依此类推,最后从剩下的N-n+ 1个单位中抽取第n个样本数为止。因此,不重复抽样的样本也由n次连续抽选的结果构成,但连续n次抽选的结果不是相互独立的,每次抽取的结果都影响下一次抽取,因而每个单位的中选机会在各次是不相同的。

四、抽样推断的内容

利用样本资料认识总体的数量特征,主要内容包括参数估计和假设检验。

参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。假设检验是利用样本资料对总体所做的某种假设进行检验,来判断这种假设的真伪,以决定我们行动的取舍。这两方面更详细的内容将在以下各节予以介绍。

第二节 抽样分布与抽样推断的理论基础

本节所介绍的内容是抽样推断和假设检验的理论依据,这一理论依据揭示了统计量和总体参数之间在理论上所存在的关系,也是理解本章其它内容的基础。

一、抽样分布

1.抽样分布的概念

样本是总体的一部分。由于样本是随机抽取的,事先人们并不知道会出现哪些结果,所以,研究样本指标的全部可能取值及出现的概率大小是十分重要的。

根据前面基本概念的分析我们知道由样本数据计算的指标称为统计量。统计量是样本X1,X2,…,Xn的一个函数。一个样本可以有不同的函数,因此可以构造许多统计量,如样本均值、样本方差、样本标准差和样本比率等。这些统计量都是随机变量,它们的概率分布称为抽样分布。样本统计量是由n个随机变量构成的样本函数,故抽样分布属于随机变量函数的分布。

对于总体分布,通常我们用总体均值、总体方差去描述它的数量特征。同总体分布一样,样本统计量的分布即抽样分布同样具有样本均值、样本方差这两个数量特征。由于不同的抽样方法这些数量特征不完全相同,所以下面将分别从重复抽样与不重复抽样两种不同的抽样方法的条件下,分别介绍样本均值与样本比率的抽样分布。

2.抽样分布的类型

抽样分布包括样本均值的抽样分布、样本比率的抽样分布、样本方差的抽样分布。本教材只介绍前两个分布。

(1)样本均值的抽样分布

1)重复抽样下,样本均值的抽样分布。设总体的均值为μ,方差为σ2。当总体是有限总体时(即总体中的个体是有限的、可以计数的),其方差定义为

又设总体X服从正态分布N(μ,σ2),X1,X2,…,Xn,是取自总体的一个样本,则样本均值也服从正态分布,珋x的抽样分布为

证明 根据数学期望和方差的性质,且X1,X2,…,Xn相互独立,与总体有相同的分布,则有

当X服从正态分布时,根据中心极限定理,珋x随n的增加而近似于正态分布,即对于足够大的n,有

【例6-1】某班组5名工人一月份奖金分别是(A)20元、(B)25元、(C)30元、(D)35元、(E)40元。若以该班组为一总体,可计算出这个班组5名工人一月份的总体均值μ= 30元,总体方差σ2= 50。

现假设总体参数均未知,要求采取重复抽样方式,随机抽取2人为样本,求样本均值的数学期望及方差。

解 采取重复抽样,总体中的单位可以组成25个可能的样本,每个样本被抽取的概率如表6-2所示,将各个样本均值及其相应的概率pi依次排列,便形成了样本均值(平均每人月奖金)的抽样分布表。

表6-2 某班组工人平均每人月奖金(珔X)抽样分布表

样本均值的数学期望为

样本均值的方差及标准差为

样本均值的方差也可写成样本均值的标准差可写成σ珋x。由计算结果可知:样本均值的数学期望正好等于总体均值μ,即元。样本均值的方差为总体方差的,即

在重复抽样条件下,样本均值的抽样分布的数学期望和方差分别为

上述公式表明,总体均值μ与样本均值珋x,总体方差σ2与样本均值的方差

之间存在着一定的数量关系:

第一,样本均值的数学期望等于总体均值,或者说,样本平均数的平均数等于总体平均数。这说明样本平均数在平均的意义上等于总体的平均数μ。如果总体的平均数未知时,可以考虑用样本平均数代表总体平均数。

第二,样本均值的方差是总体方差的。当我们用去估计μ时,必然产生抽样误差,若总体方差σ2是已知的,则可以度量以估计μ产生的抽样误差。

2)不重复抽样下,样本均值的抽样分布。在不重复抽样情况下,每次抽样的条件发生了变化,使得样本中X1,X2,…,Xn各变量不相互独立。

【例6-2】仍以例6-1的资料为例,即某班组5名工人月奖金分别为(A)20元、(B)25元、(C)30元、(D)35元、(E)40元。若以该班组为一总体,可计算出这个班组5名工人一月份的总体均值μ= 30元,总体方差σ2= 50,用不重复抽样方法抽取两名工人构成样本,共有5 ×4= 20个样本,求样本平均数的数学期望、方差和标准差。

解 列出样本平均数的分布,如表6-3所示。

表6-3 某班组工人平均每人月奖金(珋x)抽样分布表

样本均值的数学期望为

样本均值的方差及标准差分别为

以上结果表明:

第一,在不重复抽样中,样本均值的方差等于重复抽样的样本均值的方差乘以修正因子,即在不重复抽样情况下,样本均值的方差为

用上面各数据带入上式,则

第二,修正因子也称为有限总体的校正系数,通常情况下,N很大,N-1几乎等于N,所以修正因子可简化为称为抽样比。若样本容量n相对于N很小,则抽样比很小,这时每次抽样的条件仅仅发生微小的变化,这微小的变化可以忽略不计,实际工作中,当抽样比小于5%时也近似为1。

第三,若从有限总体中不重复抽样,只要样本容量足够大(如n≥30),样本均值的抽样分布就近似地服从均值为μ,方差为的正态分布。

(2)样本比率的抽样分布

1)重复抽样下样本比率的抽样分布。在统计工作中,需要调查的变量不仅有均值,还有比率(成数),如调查产品中废品比率、工人出勤率、工时利用率等,还需要对这种总体中具有某种特征或标志的单位在总体中所占的比率做出推断,这个比率称为总体比率或成数,记作π,总体比率的方差为π(1-π)。

由样本均值和抽样分布性质可以推广到样本比率的分布,根据中心极限定理,当样本容量足够大时,样本比率的抽样分布近似为正态分布。在重复抽样的情况下,样本比率的抽样分布的数学期望E(p)和方差分别为

可见,样本比率的均值等于总体比率,样本比率的方差是总体方差的

2)不重复抽样下样本比率的抽样分布。我们已经知道在重复抽样和不重复抽样情况下,样本均值的抽样分布区别在于两者的方差不同,而样本比率的抽样分布情况在重复与不重复抽样中也是如此,即在不重复抽样情况下,样本比率的抽样分布的数学期望和方差分别为

以上公式表明:

第一,在不重复抽样中,样本比率的均值等于总体比率。

第二,不重复抽样的样本比率的方差等于重复抽样的样本比率的方差乘以修正因子

通过对上述两种不同的抽样方法及其抽样分布的讨论,将所得结果列表,如表6-4所示。

表6-4 重复抽样与不重复抽样下样本统计量的计算方法

二、抽样推断的理论基础

1.大数定律

大数定律是阐述大量同类随机现象的平均结果的稳定性的一系列定理的总称。这里只介绍对抽样推断具有重要意义的两个大数定律。

(1)独立同分布大数定律。设X1,X2,…,Xn是独立同分布的随机变量序列,且存在有限的数学期望E(Xi)=μ和方差D(Xi)=σ2(i= 1,2,3,…,n),则对任意小的正数ε,有

该大数定律表明:当n充分大时,相互独立且服从同一分布的一系列随机变量取值的算术平均数与其数学期望μ的偏差任意小的概率接近于μ。该定理给出了平均值具有稳定性的科学描述,从而为使用样本均值去估计总体均值(数学期望)提供了理论依据。

(2)伯努利大数定律。设m是n次独立重复试验中事件A发生的次数,π是每次试验中事件A发生的概率,则对任意小的正数ε,有伯努利大数定律表明:当重复试验次数n充分大时,事件A发生的频率依概率1收敛于事件A发生的概率。该定律以严格的数学形式阐明了频率具有稳定性,提供了用频率估计概率的理论依据。

大数定律告诉我们,当n→∞时,样本均值趋近于总体均值,频率趋近于概率,但是怎样确定样本均值与总体均值之间在某一范围内的概率呢?事件发生的频率与概率之间的差异在某一范围内的可能性又有多大?解答这类问题的是中心极限定理。

2.中心极限定理

在实际问题中,一个随机现象常常受许多随机因素的共同影响。例如,一个地区某种农作物的总产量(或平均产量),就是由种子、耕作方法、施肥量、气温、湿度、土质等随机因素(包括众多不易观察或观察不到的因素)共同作用的结果。研究这些随机因素造成的总影响,是人们普遍感兴趣的问题,也是概率中一个极其重要的内容。

在一般情况下,人们很难求出各种随机因素总和的确切分布形式,但当n很大时,可以求出它的近似分布。一般说来,如果一个随机变量是由大量相互独立的随机因素的影响所造成,而每个因素在总影响中所起的作用都不大,则这个随机变量服从或近似服从正态分布。概率论中,阐述大量随机变量之和分布趋近于(收敛于)正态分布的一系列定理统称为中心极限定理。这里只介绍最简单也是最实用的两个定理。

(1)独立同分布的中心极限定理(列维-林德伯格定理)。设X1,X2,…,Xn是独立同分布的随机变量序列,且存在有限的数学期望E(Xi)=μ和方差D(Xi)=σ2(i= 1,2,3,…,n),那么当n→∞时,有

上述定理表明,独立同分布的随机变量序列不管服从什么分布,其n项总和的分布趋近于正态分布。由这一定理可得出如下结论:不论总体服从何种分布,只要其数学期望和方差存在,对这一总体进行重复抽样时,当样本量n充分大时,珔X就趋于正态分布。中心极限定理为均值的抽样推断奠定了理论基础。

(2)棣莫佛-拉普拉斯中心极限定理。设随机变量X服从二项B(n,π),那么当n→∞时,X渐近服从均值为nπ及方差为nπ(1-π)的正态分布,即

上述定理表明,当n很大时,nπ与nπ(1-π)也都不太小时,二项分布可以用正态分布去近似。这为近似计算二项分布的概率提供了一种简便的方法。

中心极限定理是概率论中最著名的定理之一。它不仅提供了近似计算独立随机变量之和的概率分布的简单方法,而且有助于解释为什么很多随机现象呈正态分布这一事实。

由中心极限定理可知,如果一个随机变量可以看作是众多独立的随机变量之总和,即使各单个随机变量的分布并不明确,但只要它们存在有限均值和方差,这个总和变量的分布就趋近于正态分布。例如,在任意一段时间内,一个城市的居民生活用电总量是大量相互独立居民用电量的总和;一个超市一周的营业额是大量顾客各自购买额的总和;炮弹射击的落点与目标的误差,也可以看作是瞄准时的误差、空气阻力所产生的误差、炮弹或炮身结构所引起的误差以及很多其他因素引起的小误差之总和。根据中心极限定理,这些随机变量都服从或近似服从正态分布。在自然界和社会经济现象中,这类现象很普遍。许许多多的随机变量都可以视为众多随机变量之总和。正因为如此,许多随机现象都服从或近似服从正态分布。

在实际调查与推断中,总体是什么分布通常都是未知的。有了中心极限定理,我们只要能够得到足够大(通常n≥30)的随机样本,就可以放心地利用正态分布的性质进行各种统计推断。

三、几个常用的重要分布

1.χ2分布

设随机变量X1,X2,…,Xn相互独立,且都服从标准正态分布N(0,1),则随机变量χ2=服从自由度为n的χ2分布,即χ2~χ2(n)。

χ2分布具有下列性质:

性质1 如果Z~χ2(n),则E(Z)= n,D(Z)= 2n。(证明略)

性质2(可加性)Z1~χ2(n1),Z2~χ2(n2),且Z1与Z2相互独立,则

          Z1+ Z2~χ2(n1+ n2)

2.t分布

设X~N(0,1),Y~χ2(n),且X与Y相互独立,则

即随机变量T服从以n为自由度的t分布。t分布的密度函数关于y轴对称。当n趋于无穷大时,t分布的极限为标准正态分布。

3.F分布

设X~χ2(n1),Y~χ2(n2),且X与Y相互独立,则

即随机变量F服从以n1为第一自由度,n2为第二自由度的F分布。

4.正态总体的抽样分布

下面介绍总体为正态分布时的几个重要分布定理,它们在以后各章中都有重要应用。

定理1 设(X1,X2,…,Xn)是来自正态总体N(μ,σ2)的样本,珋x为样本均值,s2为样本方差,则

(3)珋x与s2相互独立。(证明略)。

定理2 设(X1,X2,…,Xn)是来自正态总体N(μ,σ2)的样本,珋x为样本均值,s2为样本方差,则证 由定理1知相互独立,由t分布的定义知

定理3 设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)是分别来自于总体N(μ1,σ2),N(μ2,σ2)

的样本,且两个样本相互独立,,则有

其中

证 由定理的条件及定理1的结论(1)知,从而

再由定理1的结论(2)及χ2分布的性质2知

且由定理1的结论(3)知U和V相互独立,从而由t分布的定义知

要特别注意:此定理中两个正态分布总体的方差相同。

定理4 设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)是分别来自于总体的样本,且两个样本相互独立如定理3定义,则

证 由定理条件及定理1知相互独立,且

从而由F分布的定义知

定理1~4非常重要,它们是后面各章的理论基础,应予以重视。特别是定理1要熟练掌握。

第三节 抽样误差

抽样误差在抽样推断中占有很重要的地位,是用统计量推断总体参数时要用到的一个很重要的概念。本节主要介绍抽样误差的概念、来源及计算方法。

一、抽样误差的概念

1.误差的来源

在抽样调查中,误差的来源有登记性误差和代表性误差两大类。登记性误差是指在调查汇总过程中由于观察、测量、登记和计算等方面的差错或被调查者提供虚假资料而造成的误差。任何一种统计调查都可能产生登记性误差。代表性误差是指用样本指标推断总体指标时,由于样本结构与总体结构不一致,样本不能完全代表总体而产生的误差。它又分为系统误差随机误差两种。系统误是差指由于存在非随机因素引起的样本代表性不足而产生的误差。随机误差又称为偶然误差,指遵循随机原则抽样,由于随机因素引起的代表性误差。

2.抽样误差的含义

抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体单位的结构,而引起抽样指标和全及指标之间的绝对离差,又称为随机误差。抽样误差具体又可分为抽样实际误差与抽样平均误差

(1)抽样实际误差。抽样实际误差是指某一具体样本的样本估计值与总体参数的真实性之间的离差。比如,xi-μ,pi-π,等等。由于总体参数是未知数,因此,每次抽样的实际抽样误差是无法计算的,而且一次抽样实际误差不足以代表可能产生的所有误差,因此实际中一般用抽样平均误差来说明样本指标和总体指标之间的平均差异程度。

(2)抽样平均误差。抽样平均误差是反映抽样误差一般水平的指标,它的实际含义是指抽样平均数(或成数)的标准差,即它反映了抽样指标与总体指标的平均离差程度。其作用首先表现在它能够说明样本指标代表性的大小。平均误差大,说明样本指标对总体指标的代表性低;反之,则说明样本指标对总体指标的代表性高。

本章后面尤其是在抽样推断中所提到的抽样误差均指抽样平均误差。

二、抽样误差的计算

1.抽样平均误差的定义公式

根据抽样平均误差的定义,我们可列出抽样平均误差的定义公式。

抽样平均数的抽样误差为

抽样成数的抽样误差为

式中,m为样本的可能数目;μ,π均为总体的均值和比率。

由抽样平均误差的定义公式可知,由于总体参数(μ,π)未知,也不可能列出所有可能的样本估计值,所以抽样平均误差是不能也没有必要按定义公式来计算的。实际中都是根据概率论和数量统计的有关理论来推导其计算公式。

2.抽样平均误差的推导公式

根据概率论和数理统计的有关理论,经证明发现抽样平均误差与总体方差之间存在一定的关系,具体如下:

(1)重复抽样

抽样平均数的抽样误差为

抽样成数的抽样误差为

(2)不重复抽样

抽样平均数的抽样误差为

抽样成数的抽样误差为

推导公式和定义公式的计算结果是一致的,但上述推导公式中的σ和π为未知的总体参数,所以,推导公式的运用也受到一定的限制。实际应用中,经常采用以下几种方法来代替总体标准差:用样本标准差(s)代替总体标准差(σ);用过去同样问题全面调查或抽样调查的经验数据代替;在正式抽样调查之前,先组织试验性抽样,用试验样本资料代替。用样本比率p代替总体比率π。

【例6-3】随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58千克,标准差为10千克。求抽样推断的平均误差。

解 已知n= 100人,珋x= 58千克,s= 10千克,本例中,σ未知,用s代替,则即当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1千克。

【例6-4】某工厂生产一种新型灯泡共2 000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4 800小时,样本标准差为300小时,求抽样推断的平均误差是多少?

解 已知N= 2 000只,n= 400只,珋x= 4 800小时,s= 300小时,则

重复抽样

不重复抽样

计算结果表明:根据部分产品推断全部产品的平均使用寿命,采用不重复抽样比重复抽样的平均误差要小。

【例6-5】某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?

解 已知n= 400人,ni= 80人,则样本成数为

即根据样本资料推断全部学生中戴眼镜的学生所占比重,推断平均误差为2%。

【例6-6】一批食品罐头共60 000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差。

解 已知N= 60 000桶,n= 300桶,ni= 6桶,则样本成数为

对重复抽样:

对不重复抽样:

计算结果表明:不重复抽样的平均误差小于重复抽样的误差,但N的数值越大,则两种方法计算的抽样平均误差就越接近。

由抽样误差的公式可知,影响抽样误差的因素有:总体各单位标志值的差异程度,样本的单位数,抽样的方法,抽样调查的组织形式。

第四节 抽样调查的组织形式及误差计算

根据调查对象的性质和研究目的的不同,基本的抽样组织方式有简单随机抽样、分层抽样、系统抽样、整群抽样和多阶段抽样5种。

一、简单随机抽样

简单随机抽样(Simple Random Sampling)又称为纯随机抽样,它是按照随机原则,直接从总体N个单位中抽取n个单位作为样本的一种抽样方法,是其他抽样方法的基础。这种方法的适应条件是均匀总体,在抽样理论中占有重要地位,它的数学性质简单,其理论也成熟。许多其他抽样方法都是在简单随机抽样的基础上发展起来的。简单随机抽样在实施过程中也有其局限性:首先,这种调查方式需要有包含所有单位的一个完整抽样框。我们知道,当N很大时,准备这样的抽样框是很费事的,而且往往办不到。其次,由于抽取的样本单位比较分散,调查过程中人力、物力和财力的消耗比较大,所以在进行大规模抽样调查时,其抽样组织工作也很难实施。

在抽样调查中,简单随机抽样主要采用抽签法和随机数字表法来抽取样本。

1.抽签法

抽签法即给总体每个单位编号,然后抽出所需的单位数n,这n个签上的号码即为选中的单位号码。这种方法适合于总体单位N不太大的情形,当N很大时,这种方法很不方便。因此,最常用的方法是利用随机数字表。

2.随机数字表法

随机数字表法是指对总体各单位编号后,再利用随机数字表来确定抽取的号码。随机数字表是由计算机或其他随机方法制成的,表中的0,1,2,…,9这10个数字出现的机会是等概率的,但排列的顺序是随机的。假定要从250个总体单位中抽取20个样本,样本的编号为001 ~250,因此,我们可以选择随机数字表中任意相邻的3列,假设选择后3列,若从随机数字表中第一个数字开始,凡抽到的数字在250以下,相应的单位就为抽中单位;若抽中的单位大于250,则将其舍去,如此反复进行若干次,直到抽满20个样本单位为止。若重复出现前面所选的数字,在重复抽样下可重复使用,在不重复抽样下就会舍去。在选数时,可以从表的左面到右面,也可以从上面到下面,甚至也可以按对角线的方法进行。

3.用统计软件随机抽样

也可用计算机统计软件进行随机抽样,只要将全部数据(或总体单位)输入,选择随机抽样功能就可自动生成样本。

第三节所介绍的误差计算就是简单随机抽样条件下的误差计算方法,这里不再赘述。

二、分层抽样

1.类型抽样的概念及特点

分层抽样(Stratified Sampling)又称为分类抽样或类型抽样,即先将总体所有单位按某些重要标志划分为若干层(或类),再从各层中随机抽取一定数目的单位构成子样本,然后将这些子样本合起来构成总体的样本。

在分层的过程中,要保证层中的差异较小,各层之间的差异较大,各层的划分可根据研究者的判断或研究者的需要进行,也可按照一些既定的分组方法进行。

按照各层之间的抽样比例是否相等分层抽样可分为等比例分层抽样与非等比例分层抽样两种,按等比例分层抽样即根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本。例如,假定某大学的学院相对今年的毕业生进行一次调查,以便了解他们的就业倾向,该学院有5个专业:会计金融市场营销国际贸易行政管理,今年共有1 500名毕业生,其中会计专业500名,金融专业350名,市场营销专业300名,国际贸易专业150名,行政管理专业200名。假定要选取180人作为样本,则样本容量与总体单位数的比例为12%(= 180/1 500)。按这一比例抽取,各专业应抽取的人数分别为会计专业60人,金融专业42人,市场营销专业36人,国际贸易专业18人,行政管理专业24人。但是,如果有的曾在总体中的比例太小,其样本量就会非常少,此时就可以采用非等比例分层抽样。

分层抽样有如下特点:

(1)分层抽样在对总体参数进行估计时,还能对每层的参数进行估计,不仅研究了总体,而且还了解了总体内部的某些信息。有时,掌握了分层的情况,其意义可能大于了解总体本身。

(2)分层抽样的组织和实施灵活方便。如按地区或系统的分层抽样,可以按自然的地理区域或行政系统分别实施调查中的每个步骤,从而便于行政管理。

(3)由于分层抽样是在各层中进行的,所以,抽取的样本在总体中散布得更均匀。当总体较大,总体内部结构复杂,各个总体单位之间差异较大时,采用分层抽样可以避免简单随机抽样下出现极端偏差的情况,而取得令人满意的结果。这也是分层抽样的适应条件。

(4)分层抽样能较大地提高抽样的精度。分层抽样对层而言是全面调查,对层内各单位而言是非全面调查。因此,分层抽样的精度即估计量方差的大小仅与各层内方差大小有关,而与层间方差无关。分层抽样的目的正是要将性质类似的单位划归一类(或层),尽量缩小层内差异,扩大层间差异,从而减少估计量的方差,提高抽样的精度。

2.分类抽样条件下误差的计算

简单随机抽样的抽样误差公式,是其他抽样组织形式抽样误差计算的基础,分层抽样需要对总体先进行分组,然后再组织抽样。总体方差由两部分组成:一部分是组间方差,即各类型组之间标志的差异程度;另一部分是组内方差,即各类型组组内各单位标志值之间的差异程度。在类型抽样情况下,因为从各类型组都抽取了样本单位,对各类型组来说是全面调查,因此,组间方差是可以不考虑的,影响抽样误差的总方差是组内方差。在计算类型抽样的抽样平均误差时,总体方差需要用平均组内方差进行计算。

样本平均数的抽样误差的计算公式如下:

在重复抽样条件下

在不重复抽样条件下

式中,珚σ2代表总体各组内方差的均值代表样本各组内方差的均值;

【例6-7】某企业有甲、乙两个车间都生产保温瓶胆,乙车间的产量是甲车间的两倍。为了调查该企业保温瓶胆的保温时间t,按两个车间的产量等比例共抽查60只瓶胆。资料如表6-5所示,试计算该企业瓶胆平均保温时间的抽样平均误差。

表6-5 甲、乙车间保温瓶胆检测表

由于甲、乙两个车间是按产量等比例抽取样本,n= n1+ n2= 60,根据题意n1/n2= 1/2,所以,n1= 20,n2= 40;s1= 1.2,s2= 0.8,平均保温时间的抽样平均误差(这里按重复抽样计算,如果是不重复抽样,加修正系数)的计算过程如下:

在重复抽样条件下,样本比例的抽样误差计算公式如下:

在不重复抽样条件下,样本比例的抽样误差计算公式如下:

式中

代表样本比例组内方差的平均值,计算过程如下:

式中,pi代表个组的样本比例;ni代表各组的样本容量。

三、系统抽样

系统抽样(Systematic Sampling)也称为机械抽样,它是先将总体N个单位按某种顺序排列,再按规则确定一个随机起点,每隔一定间隔逐个抽取样本单位的一种抽样方法。最简单的系统抽样是直线等距抽样。

系统抽样的优点有如下几个方面:

(1)抽取样本简单易行。具体表现在:①系统抽样只要随机确定一个起始点,所有样本便随之而定;②它对抽样框的要求也比较简单,有时采用系统抽样不必重新编制抽样框,现成的门牌号、职工花名册和居委会的户口册、汽车尾数等,都可供其抽样使用;③系统抽样容易被不熟悉抽样的非专业人员所掌握,而且也便于抽样过程的监督与检查。

(2)由于系统抽样的样本单位比较均匀,尤其是若调查者对总体的结构有一定的了解,则可以利用已有信息将总体单位均匀地分布在总体中,因此,它提高了样本的代表性,其估计的精度高于简单随机抽样。

在应用系统抽样时,应注意数据排列的周期性变化,如果抽样的间隔正好与现象周期波动的间隔相吻合,那么抽出的样本代表性就会很差。例如,要了解超市的日平均销售额,抽样间隔为7天,若抽取的第一个样本恰巧是周末,由于每到双休日超市的销售额会上升,则抽中的样本就会缺乏代表性。

在系统抽样中,根据排队标志的性质不同,可分为按有关标志排列和按无关标志排列。排列标志的选择是系统抽样很重要的一步。

按有关标志排列就是指排列标志与调查内容有密切的关系。例如,农业产量抽样调查按平均亩产的大小顺序排列,住户收入情况调查时按住户平均月收入排列再进行抽样等就是有关标志排列。

按无关标志排列是指排列的标志与调查内容没有直接关系。例如,调查居民收入情况时,按街道门牌号排列抽取被调查户;调查学生成绩时,按学生号排列顺序抽取样本等,都是按无关标志排列。这时,总体单位的排列顺序实际上仍然是随机的,其抽样效果十分接近简单随机抽样的效果。

按无关标志排列法和有关标志排列法在抽样平均误差的计算上有所不同,无关标志排列法从总体的排列顺序和调查标志来看,完全是随机的,它与简单随机抽样的性质相同,因此,可视作简单随机抽样的一个特例,其抽样平均误差可以用简单随机抽样的公式计算;有关标志排列法的每个抽样间隔相当于类型抽样的各层,可视作分层抽样的一个特例,其抽样平均误差的计算与分层抽样相同。

四、整群抽样

整群抽样(Cluster Sampling)是指将总体各单位划分为若干个群,然后以群为单元,从总体中随机抽取一部分群,对被抽中的群内所有单位进行全面调查的一种抽样方法。例如,某政府机关要了解某市中学生的体质情况,可将学校作为群,对抽中的若干群(中学)的全部学生都进行调查。又如,某电信公司想了解某市居民电话的拥有量,可将街道或者居民楼作为群,抽样时先抽街道或居民楼,再调查每个被抽中群的每一居民户,这便是整群抽样。

在实际中,整群抽样是一种常用的抽样方法,它的优点之一是由于样本单位比较集中,所以容易集中力量进行调查,便于组织与管理,也节省了调查时间和费用。另外,整群抽样不需要所有总体单位的抽样框,如上面提到的对某市居民电话拥有量进行调查,要找到一份全市所有居民的抽样框很难,也没必要,只要编制一份街道委员会的抽样框便可以了。整群抽样与简单随机抽样相比,由于整群抽样的样本单位不能均匀地分布于总体各个部分,所以样本的代表性要差一些,估计量的精度不高。

根据方差分析的原理,总体方差可分解成群间方差和群内方差两部分,群内方差大则群间方差小,群内方差小则群间方差大。整群抽样对于群而言是非全面调查,对于抽中群的所有单位而言则是全面调查,因此整群抽样要求或希望群间差异量小,群间差异小意味着每个群均具有足够的代表性来推断总体,这与分层抽样要求层间差异尽量大的情形正好相反。可见,整群抽样估计量精度的大小取决于群间差异程度的大小。在大规模的抽样调查中,只有当群内差异大而群间差异小时,才可考虑采取整群抽样方式。

五、多阶段抽样

多阶段抽样(Mulit-stage Sampling)也称为多级抽样,它是先从总体中随机地抽取若干初级(一级)单位,再从一级单位中抽取二级单位……如此下去,直至抽取所要调查的基本单位的一种抽样方法。它可以是两阶段抽样,也可以是三阶段抽样甚至更多阶段的抽样。多阶段抽样是把抽取样本单位的过程分为几个阶段来进行,它适用于研究当社会经济现象总体较大,单位分布面较广,很难一次直接从总体中抽取足够样本单位的情况。我国的农业产量调查采用的就是先抽出大单位,再从抽出的大单位中抽取小单位,从抽取的小单位中再抽取更小的单位,直至抽出最基本的样本单位。例如,某省要从100多万农户抽取500户进行亩产量情况的调查研究。第一阶段,在全省所有县中随机抽取若干个县;第二阶段,在抽中的县中随机抽取若干个乡;第三阶段,在抽中的乡中随机抽取若干个村;最后阶段,在所有被抽中的村中随机抽取农户直至抽得500户。

在多阶段抽样中,各阶段抽样的方法可以采用简单随机抽样、系统抽样,也可以采用重复或不重复的不等概率抽样。所以,多阶段抽样实际上是多种方式的组合抽样。

多阶段抽样的特点是样本单位相对集中,因而与简单随机抽样相比,实施调查工作比较方便;多阶段抽样并不需要所有低级的抽样框,只需对那些已抽中的单位才准备下一级单位的抽样框,因而降低了调查成本;多阶段抽样方法灵活性大,在方差大的阶段可多抽样本单位,方差小的阶段可少抽样本单位,而且在每个抽样阶段还可以选择较适宜的抽样方式,这样有利于减少抽样误差,提高抽样估计精度。

第五节 参数估计与样本容量的确定

参数估计是统计学最重要的基本问题之一。这里的参数是指总体分布中的未知参数。例如,总体服从两点分布B(1,p),其中p未知,则p是参数;若总体服从正态分布N(0,σ2),其中σ2未知,则σ2是参数;若总体服从正态分布N(μ,σ2),其中μ,σ2均未知,则μ,σ2是参数。所谓参数估计是指由样本对总体中的(未知)参数做出估计。另外,在有些实际问题中,实际并不知道总体X的分布类型,而要对其有些数字特征,如均值E(X)、方差D(X)等做出估计。通常我们把这些数字特征称为参数,这些问题也属于参数估计问题。

参数估计有点估计和区间估计两种方式。

对一组统计调查数据或实验数据,可求得平均数、百分率、标准差等统计指标以概括说明这群观察数据的特征,称为样本特征值。由于样本特征是通过统计方法求得的,故又把它称为统计量。在研究过程中,研究者首先得到的是样本统计量,用样本统计量估计或推论总体参数的过程叫参数估计。例如,在估计居民购买行为时,通过调查附近110个居民的某种产品购买率为10%,这是样本数,可用它来直接表示总体成数,用以说明居民的购买水平,这样的估计叫“点估计”。但由于存在抽样误差,不同样本(如再抽查110人)可能得到不同的估计值。因此,我们常用“区间估计”总体成数(或总体平均数)大概在哪一个范围内,这个范围就叫可信区间。区间小的一端叫下限,大的一端叫上限。常用的有95%可信区间与99%可信区间。

一、点估计

一般地,参数点估计问题的提法如下:设θ是总体分布中一个要估计的参数(总体均值、方差等)。现在从总体中得到一个随机样本x1,x2,…,xn,计算估计θ的统计量为^θ(x1,x2,…,xn),简记为^θ。这就得到θ的点估计值。用样本统计量的值直接作为总体参数的估计值的过程就是点估计,又称为定值估计。

由于估计量是样本的函数,是随机变量,因此对于不同的样本值得到的参数估计值往往是不相同的。在点估计中最关键的是确定估计量。下面具体加以讨论。

要估计总体的某一指标,并非只能用一个样本指标,可能有多个样本指标供选择,即对同一总体参数,可能会有不同的估计量。作为一个好的估计量,必须有如下性质:

第一,无偏性。样本统计量的数学期望等于被估计的总体参数。如果E(^θ)=θ,则称^θ为θ的无偏估计量。一个估计量如果不是无偏的,就称它是有偏估计量。

第二,有效性。好的点估计量应具有较小的方差。在用估计量^θ来估计总体的某个参数θ时,如果其他所有对θ的估计量^θ都有Var(^θ)≤Var^θn,那么,这个估计量就是总体参数θ的有效估计量。

第三,一致性。随着样本容量的增大,估计量越来越接近被估计的总体参数。

如果^θn满足则称为的致估计量。

点估计的方法一般有矩估计法、极大似然估计法等。可以证明,样本均值、样本比例作为总体均值和总体比率的点估计是无偏、有效、一致的。样本方差是总体方差的无偏估计量;样本均值作为总体均值的无偏估计量,是总体均值所有线性无偏估计量(指估计量是样本的线性函数)中最有效的。

【例6-7】某公司估计临时工的日平均工资μ,可以随机从中抽取36人作为样本,调查得到这36人的日工资x1,x2,…,x36如下所示,求临时工的日平均工资的点估计值。

解 样本均值是总体均值的点估计,可用简单平均数珋x估计^μ。可知

即该公司临时工的日平均工资为85.75元。

二、区间估计

1.区间估计与置信区间

从点估计中,我们知道:若只是对总体的某个未知参数θ的值进行统计推断,那么点估计是一种很有用的形式,即只要得到样本观测值(x1,x2,…,xn),点估计值能给我们对θ的值有一个明确的数量概念。

但是仅仅是θ的一个估计值,它并没有反映出这个近似值的误差范围,这对实际工作来说是不方便的,而区间估计正好弥补了点估计的这个缺陷。

以总体均值的区间估计为例来说明区间估计的基本原理。在重复抽样的情况下,有由此可以知道样本均值落到总体均值μ的两侧各为一个标准差范围内的概率为0.687 3,落在两个抽样标准差范围内的概率为0.954 5。实际上,珋x是已知的,而μ是未知的,它同时也是要估计的总体参数。由于珋x和μ的距离是对称的,因此如果有95.45%的样本均值落在μ的两个标准差的范围内,则约有95.45%的样本均值所构成的两个标准误差的区间会包括μ。即若有

则有

通俗来讲,如果抽取100个样本来估计总体均值,由100个样本均值所构成的100个区间中,约有95.45%的区间包含总体均值。

由前面可知:区间估计是指对于一个具体问题得到的样本值后,计算出两个统计量给出了一个具体的区间,是参数θ尽可能地落在该区间内。

若^θ为未知参数θ的估计量,对于给定的概率1-α(0<α<1),存在两个统计量,使得

则随机区间

称为参数θ的置信水平为1-α的置信区间称为置信下限称为置信上限,1-α称为置信水平,α称为显著性水平。

事实上,在对称分布下,人们往往选用ε对称区间来进行区间估计。^θ为未知参数θ的估计量,设其最大误差为某个正数ε,给定概率1-α(0<α<1),即P(^θ-ε<θ<^θ+ε)= 1-α,此时,置信水平为1-α的置信区间为(^θ-ε,^θ+ε)。也就是是说,^θ1=^θ-ε,^θ2= ^θ+ε,如图6-1所示。

图6-1 对称分布时的区间估计

置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性。对于置信水平为1-α的置信区间,一方面,置信水平1-α越大,估计的可靠性越高;另一方面,区间

的长度(2ε)越小,估计的精确性越好。但这两方面通常是矛盾的,提高可靠性通常会使精确性下降(区间长度变大),而提高精确性通常会使可靠性下降,1-α变小,所以要找两方面的平衡点。

2.一个总体的均值的参数估计

简单随机抽样条件下大样本时,无论总体分布状态如何,样本均值的抽样分布都可视为正态分布,当已知总体方差σ2时,有,即

对于显著性水平α,有为标准正态分布的上分位数,即有

由此得到总体均值μ在(1-α)置信水平下的置信区间为

另外,最大误差可表示为Δ珔X,有

几个常用的值如表6-5所示。

表6-5 常用正态分布分位数表

【例6-8】某公司估计临时工的日平均工资μ,取得样本资料见例6-7中数据所示。又知总体方差为289,试在95%的置信水平下对该公司临时工的日平均工资进行区间估计。

解 已知样本容量为36,为大样本。又知查表知。根据总体方差已知条件下总体均值的置信区间公式,有

总体均值μ的置信下限为

总体均值μ的置信上限为

所以可以以95%的概率保证该公司临时工的平均工资在79.76~90.86元之间。

【例6-9】在例6-8中假设最大误差为4.66元,试对临时工的日平均工资进行区间估计。

解 已知知,

查表6-5知,1-α= 0.90。

总体均值μ的置信下限为:

总体均值μ的置信上限为

所以可以以90%的概率保证该公司临时工的平均工资在80.65~89.97元之间。

如果总体方差σ2未知,在大样本条件下,则可以用样本方差s2代替总体方差σ2,这时总体均值μ在置信水平(1-α)下的置信区间为如果采用不重复抽样,这时总体均值μ在置信水平(1-α)下的置信区间为

相应的总体方差σ2未知,总体均值μ在置信水平(1-α)下的置信区间为

【例6-10】某公司估计临时工的日平均工资μ,取得的样本资料见例6-7中的数据。

1)假定该公司临时工队伍庞大,试在95%的置信水平下对该公司临时工的日平均工资进行区间估计。

2)假定该公司临时工总人数为100人,试在95%的置信水平下对该公司临时工的日平均工资进行区间估计。

解 已知样本容量为36,为大样本。又知

并由1-α= 0.95查表,知

1)该公司临时工队伍庞大时,根据式(6-32),总体均值μ的置信下限为:

总体均值μ的置信上限为

所以可以以95%的概率保证该公司临时工的平均工资在79.76~90.86元之间。

2)该公司临时工总人数为100人时,根据式(6-34),总体均值μ的置信下限为

总体均值的置信上限为

所以可以以95%的概率保证该公司临时工的平均工资在80.55~89.77元之间。

当抽样为小样本或其他抽样分布不能视为正态分布的情形,请参见数理统计学或高级统计学教材。

3.单个总体成数的参数估计

简单随机抽样条件下,样本容量很大时,或n·p≥5且n·(1-p)≥5,样本比率p的抽样分布近似服从正态分布,即,其中为总体的比率。

样本比率p经过标准化后的随机变量服从标准正态分布,即

则总体比率在置信水平(1-α)下的置信区间为

用上式计算总体比率π的置信区间时,π的值应该是已知的。但实际上却不然,π的值恰恰是我们要估计的,所以我们用样本比率p来代替π,此时计算总体比率π的置信区间可表示为

式中为标准正态分布上分位数;是估计总体比例时的最大误差,可用表示。

在大样本不重复抽样条件下,样本比率p的方差为

此时总体比率在置信水平(1-α)下的置信区间为

此时最大误差为

【例6-11】某企业在一项关于职工工资的研究中,从该企业职工随机选取了36人组成一个样本调查,有6人的日工资超过100元。试对工资超过100元人员比率构造95%的置信区间。

解 已知n= 36,n1= 6,则

根据式(6-37),得总体比率π的置信下限为

总体比率π的置信下限为

所以可以以95%的概率保证该公司日工资超过100元人员比例在4.729%~29.27%之间。

三、样本容量的确定

从理论上说,样本容量越大,对总体特征的估计误差越小。但从实践角度看,抽样数目过大,则会增大调查及相关的工作量。因此,样本容量的确定要综合考虑相关因素。

一般来说,抽样数目以满足在一定的概率保证下抽样误差不超过给定的允许范围的最小样本容量为界。因此,可根据抽样极限误差与抽样数目的关系来确定抽样数。

1.均值参数估计中样本容量的确定

考虑大样本的情况,这时样本均值珔X服从正态分布,即

于是,在(1-α)的置信水平下,存在临界值

使得,即

又有,最大误差

在重复抽样下,抽样平均误差

,故在该置信水平(1-α)下最大误差为时,必要的抽样数为

在不重复抽样下,抽样的平均误差,所以必要的样本单位数为

由此可知,在简单随机抽样条件下,抽样数目由抽样方法、总体方差、最大误差以及概率保证程度三者确定。当总体方差σ2未知时,可用样本方差s2代替。

【例6-12】某传媒公司要估计小型超市去年广告费用支出情况。经验表明,总体方差为7.8。如置信水平取95%,并使估计处在总体平均值附近的万元的范围内,这家广告公司应抽取多大的样本?

解 已知,应抽取的样本容量为

即约抽取30家小超市进行调查。

2.总体比例参数估计中的样本容量的确定

在大样本下,样本比例的分布趋近于正态分布为抽样平均误差。设在(1-α)的置信水平下,对应的临界值为

在重复抽样下,并有最大误差可得最小的必要抽样单位数为在不重复抽样下,抽样平均误差。当,所以必要的样本单位数为

在进行抽样时,如果总体比率π未知,可用样本比率p代替。某些时候,若有多个可供参考的比率数值,为了保证抽样推断的把握程度,应选其中方差最大值来计算,也就是应取接近50%的样本比率计算方差值。

【例6-13】一家家电零售公司要估计某地区有液晶彩色电视机的家庭所占的比率。该公司希望对比例的估计误差不超过0.05,要求的可靠程度为95%,应抽多少家庭作为样本(没有可利用的p估计值)?

解 已知未知时用最大方差时的样本比例50%代替。

应抽取的样本容量为

即约抽取385个家庭进行调查。

第六节 假设检验

前已述及,参数估计和假设检验是抽样推断的两个重要内容,它们都是利用样本对总体进行某种推断。然而推断的角度不同,参数估计是用样本统计量估计总体参数,总体参数在估计前是未知的,而在假设检验中,则是事先对总体参数提出一个假设,然后利用样本信息去检验这个假设是否成立。

一、假设检验的概念

假设检验是利用样本的实际资料来检验事先对总体某些数量特征所做假设是否可信的一种统计方法。它先对研究总体的参数做出某种假设,然后通过样本的观察来决定假设是否成立。若认为该假设正确,则称接受该假设;否则,称拒绝该假设。实际中,对总体所提的假设一般有两类:一类是对总体分布的某个未知参数或总体的某个数字特征提出假设。例如,假设总体X的均值E(X)为已知数μ0。又如,已知总体X服从正态分布,假设总体期望值为μ0。这类假设称为参数假设。用样本值检验这类假设称为参数假设检验或简称为参数检验。另一类是对总体分布提出假设。例如,假设总体X服从正态分布。又如,假设总体X的分布函数为已知分布函数F0(x)。这类假设称为分布假设。用样本值检验这类假设称为分布假设检验。统计假设检验亦称为显著性检验。

例如,某公司甲工作地的临时工的平均日工资为96元。该公司要考察乙地临时工的工资状况,问这两地的平均工资水平有无明显差异。这时就要把当地市场临时工日平均工资与另一工作地市场临时工的日平均工资进行比较,做出结论。也就是说,先假设这两个市场临时工的日平均工资相同,然后用样本资料来检验这个假设是否正确。在这个过程中,需要把判断出错的概率控制在比较小的数值之下。又如,某工厂生产瓶装饮料,按规定每瓶液体体积为618毫升。今从一批该种饮品中任意抽取10瓶,发现有6瓶低于618毫升。若规定不符合标准的比例不应超过5%,判断该批饮料是否满足标准要求。对于该批饮料的不合格率我们事先并不知道,要根据样本的不合格率估计该批食品的不合格率,然后与规定的不合格率标准(即不超过5%)进行比较,做出该批饮料能否满足标准要求的判定。也就是说,我们先假设该批饮料的不合格率不超过5%,然后用样本不合格率来检验假设是否正确。在这个过程中,同样需要把判断出错的概率控制在比较小的数值之下。这都是一个假设检验问题。

由以上可以看出,假设检验是对所关心的却又是未知的总体参数先做出假设,然后抽取样本,利用样本提供的信息对假设的正确性进行判断的过程。假设检验主要通过实际抽样指标与假设总体指标之间的检验,用以判断原假设的总体和现在实际的总体是否发生了显著的差异。它是进行经济管理决策的有力工具。

假设检验与区间估计既有联系,又有区别。一方面,它们在对某一现象实例进行分析时,用的是同一个样本、同一个统计量、同一种分布;同时,区间估计问题可转换成假设检验问题,假设检验问题也可转换成区间估计问题。另一方面,假设检验和区间估计所考虑的问题不同,因而两者所关心的结论也不一样。在假设检验中,所关心的是检验总体参数值有无变化,而区间估计的目的在于通过样本资料来推断总体参数在一定概率水平下的可能取值范围。

二、假设检验的基本思想

假设检验应用了小概率原理,也就是发生概率很小的随机事件在一次实验中是几乎不可以发生的。下面我们结合一个具体的例子来说明如何利用这一基本原理。例如,有一个饮料厂商宣称其产品的合格品率很高,可以达到99%。如果厂商的宣称是真的,那么从一批产品中随机抽取1件,而这一件恰好是不合格品的概率只有1%。也就是说,随机抽取1件是不合格品的情况就几乎是不可能发生的。但如果这种情况确实发生了,就有理由怀疑原来的假设(即产品中只有1%不合格品)是否成立。这时就可以否定饮料厂商的承诺,做出厂商宣称是假的推断。这时进行推断的依据就是小概率原理。下面我们结合具体例子来说明在假设检验中如何运用这一基本原理。

例如,某洗衣粉厂用自动包装机包装洗衣粉,每袋标准重量为500克。由长期实践表明,袋装重量(单位:克)服从正态分布,且标准差σ为2克比较稳定。某日,为了检验包装机是否正常,在装好的袋中随机地抽取7袋,称得净重分别为501.8,502.4,499,500.3,504.5, 498.2,505.6,问机器是否正常?

在这个问题中,按题意袋装重量X是一个正态总体N(μ,σ2),由于标准差比较稳定,我们可认为σ2= 4为已知,因此要看机器是否正常,就是要看每袋平均重量是否为500克。为此,我们提出假设每袋平均重量是500克,用H0表示此项假设,即

假设H0:μ= 500

现在用抽得的样本值检验假设H0是否成立。若检验的结果是接受假设H0,则认为机器正常;若检验的结果是拒绝假设H0,则认为机器不正常。

要用样本判断假设H0是否成立,首先要构造一个适用于检验假设H0的统计量,称为检验统计量。由于现在要检验的假设涉及总体的均值μ,自然想到可借助样本均值珔X这一统计量,对此,我们构造统计量

从直观上分析,我们知道珋x是μ的无偏估计量,因此,如果假设H0为真,则统计量U的观察值的绝对值| u|应在E(U)= 0附近,一般| u|不应太大。若过分地大,我们就怀疑假设H0的正确性而拒绝H0。基于这样的想法,我们可适当选定一个常数k,得检验法:在一次抽样后,如果| u|≥k,就拒绝H0;反之,如果| u|<k,就接受H0。在本例中,如果取k= 1.96,由于u= 2.249,| u|>1.96,所以拒绝H0,即认为机器不正常。

从理论上分析,当假设H0为真时,总体X服从正态分布N(500,4),因而U服从标准正态分布N(0,1),由标准正态分布表可知P{|U|≥1.96}= 0.05,这表明事件{|U|≥1.96}是一个小概率事件,在一次抽样中发生的概率仅有0.05,根据实际推断原理,事件{| U|≥1.96}在一次抽样中不大可能发生。如果在一次抽样中,所得样本值|u|≥1.96,说明在一次抽样中事件{|U|≥1.96}竟然发生了,这与实际推断原理相矛盾,这就使我们对最初的假设H0表示怀疑而拒绝H0;相反,如果抽到的样本值使|u|<1.96,说明在一次抽样中小概率事件{|U|≥1.96}没有发生,这与实际推断原理是一致的,在这种情况下,没有理由拒绝原来的假设H0,而应该接受H0。这样就得检验法:在一次抽样后,如果| u|≥1.96,则拒绝H0;如果| u|<1.96,则接受H0。这与上面的直观分析是一致的。(www.xing528.com)

从上面的理论分析可见,要给出检验假设H0的一个检验法,主要是在H0成立的前提下,做出一个适当的小概率事件,如上面把概率为0.05的事件{|U|≥1.96}作为小概率事件,然后按实际推断原理,在一次具体的抽样后,如果这个小概率事件发生了,就拒绝H0,如果这个小概率事件没有发生,就接受H0。那么,概率小到什么程度的事件才算是小概率事件呢?通常是根据实际问题事先给定一个值α(一般给定α为0.05,0.01,0.1等值),当事件的概率不超过α时,就认为是一个小概率事件。显然,α值给得越小,小概率事件在一次抽样中越不容易发生,也就越不容易拒绝假设H0,因此,α越小,拒绝假设H0就越有说服力,或者说,样本值提供了不利于假设H0的显著证据。

需要指出,假设检验的方法是建立在实际推断原理的基础上的,但是仅利用它是不够的,还应该与直观一致。如在上面的例子中,当H0成立时,由标准正态分布表可知P{| U|≤0.06}= 0.05,此式表明,H0成立时,{|U|≤0.06}是一个小概率事件,如果对此小概率事件运用实际推断原理,获得如下检验法:在一次抽样后,若| u|≤0.06,则拒绝假设H0,即认为机器不正常;若| u|>0.06,则接受H0,即认为机器正常。显然,这与上面的直观分析相矛盾,所以,此种检验法是不可取的。

三、假设检验的两类错误

当然,推断也可能会犯错误,即这100件产品中确实只有1件是不合格品,而恰好在这次抽取中被抽到了。所以这个例子中犯这种错误的概率是1%,也就是说我们在冒1%的风险做出厂商宣称是假的这样一个推断。这里的1%就是显著性水平。显著性水平是在进行假设检验时事先确定的一个可允许的作为判断界限的小概率标准。显著性水平代表的意义是在一次试验中小概率事物发生的可能性大小。在假设检验中,可以依据显著性水平的大小把概率分布划分为两个区间:小于给定标准的概率区间成为拒绝区间,大于这个标准的概率区间则为接受区间。事件属于接受区间,原假设成立而无显著差异;事件属于拒绝区间,拒绝原假设而认为有显著性差异。

在检验假设H0时,如果得到检验法:当所采用的检验统计量的观察值落在集合W时,就拒绝H0;当检验统计量的观察值落在集合珚W时,就接受H0,则称W和珚W分别为H0的拒绝域和接受域。显然W和珚W是两个不相交的集合,并且W和珚W的并集就是检验统计量的所有可能取值的集合。拒绝域和接受域的分界点称为临界值。例如,在上例中,拒绝域为W={u∣| u|≥1.96},接受域为珚W={u∣| u|<1.96},临界值为k1=-1.96和k2= 1.96。

由于检验假设H0,是根据一次抽样后所得的样本值求得的检验统计量的观察值,看它是否落在拒绝域W中而做出拒绝或接受H0的决定,且样本带有随机性,因此,可能会发生所做决定与真实情况不符而产生错误。错误有两类:一类是H0为真,但被拒绝了,称这类错误为第Ⅰ类错误;另一类是H0不真,但被接受了,称这类错误为第Ⅱ类错误。

犯第Ⅰ类错误的概率记为P{拒绝H0/H0为真}= a。前面我们看到了,a的大小反映了我们拒绝H0的说服力,所以称a为检验的显著性水平,简称为水平。它是根据实际问题事先给定的,用来控制犯第Ⅰ类错误的。上例中给定了水平为a= 0.05。犯第Ⅱ类错误的概率记为P{接受H0/H0不真}=β,这个概率的计算通常是很复杂的,我们不做过多的探讨。

是否犯某一类错误,犯错误的可能性(即概率)大小取决于参数的真值和所用的检验方法及所得到的样本值。参数的真值是未知的,样本的取值是随机的,我们所能做到的只是适当地选择检验法,使少犯某一类错误。实际中,我们不可能要求一个检验方法永远不会出错,但可以要求尽可能使犯错误的概率小一些。为此,在确定检验法时,我们应尽可能使犯两类错误的概率都较小。但是,由进一步讨论可知,一般说来,当样本容量固定时,若减少犯某一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率减小除非增加样本容量。在固定样本容量的情况下,我们通常是控制犯第Ⅰ类错误的概率,使它不超过某个给定的值a,这种对犯第Ⅰ类错误的概率加以控制而不考虑犯第Ⅱ类错误的检验问题,称为显著性检验问题。如果一个检验法犯第Ⅰ类错误的概率不超过a,即P{拒绝H0/H0为真}≤α,则称这个检验法为显著性水平为a的检验法。

显然,对同一个检验问题可能构造出许多不同的检验法。那么如何评价这些不同的检验法呢?什么是最好的检验法呢?通常是这样理解的:对给定的水平a,首先要求检验法是水平a的检验法,再在所有水平为a的检验法中,选取犯第Ⅱ类错误的概率β最小的检验法为最好的检验法。关于评价检验法的标准,以及在某一标准下求最好的检验法等问题是假设检验理论中比较深刻的问题,超出了本书的范围。

四、假设检验的步骤

一个完整的假设检验过程,通常包括以下4个步骤:

(1)根据题意,建立原假设H0和备择假设H1。把需要以通过样本去推断其正确与否的命题称为原假设,用H0表示。例如,在上述工资调查这个例子中,可以事先提出一个命题(假设):“两地的平均工资水平并无明显差异”,于是可以这样表示H0:μ= 96(元),这里μ表示乙地临时工的平均日工资,它与该公司甲地临时工的平均日工资相同。与原假设相对立的假设是备择假设,用H1表示。在上面这个例子中,备择假设H1意味着“甲乙两地临时工的平均工资水平存在明显差异”,可以表示为H1:μ≠96(元)。

根据所研究问题的性质不同,统计假设检验可分为双侧检验和单侧检验两种类型。所谓双侧检验是指所关心的问题是要检验样本所取自总体的参数值(如均值、比率)与另一特定值有无显著性差异,而不问差异的方向是正或负时所采用的一种统计检验方法。在双侧检验中,原假设取等式。上面所建立的假设就是双侧检验假设。其一般形式为

H0:θ=θ0 H1:θ≠θ0

所谓单侧检验是指当所要检验的是样本所取自总体的参数值是大于或小于某个特定值时,所选择使用的一种单方面的检验方法。单侧检验包括左单侧检验和右单侧检验两种方法。如果所要检验的是样本所取自总体的参数值是否大于某个特定值,应采用右单侧检验;若考虑是否小于某个特定值,则采用左单侧检验。在单侧检验中原假设采用不等式形式。常用假设形式有

左单侧检验 H0:θ≥θ0 H1:θ<θ0

右单侧检验 H0:θ≤θ0 H0:θ>θ0

(2)选定检验统计量及其分布,并根据抽样资料计算样本统计量的实际值。在假设检验中,如同在参数估计中一样,要借助于样本统计量进行统计推断。用于假设检验问题的统计量称为检验统计量。在具体问题里,选择什么统计量作为检验统计量,需要考虑的因素与参数估计相同。例如,用于进行检验的样本是大样本还是小样本,总体方差已知还是未知等。在不同的条件下选择不同的检验统计量,并计算统计量的值。

在大样本下,对总体均值与总体比率进行假设检验所选择的统计量主要是z统计量。如大样本下对总体均值进行假设检验时选取大样本下对总体成数进行假设检验时选取。这与区间估计是一致的。

(3)选择显著水平α,求出相应的临界值。假设检验是围绕对原假设而展开的。如果原假设正确而接受原假设(同时拒绝了备择假设),或原假设错误而拒绝原假设(同时也就接受了备择假设),这表明做出了正确的决定。但是,由于假设检验是根据样本提供的信息进行推断的,也就有犯错误的可能。如果原假设正确,而我们却把它当成错误的加以拒绝。犯这种错误的概率就是假设检验中的显著性水平α,也就是决策中所面临的风险。所以,显著性水平是指当原假设正确时人们却把它拒绝了的概率或风险。这个概率是由人们确定的,通常取α= 0.05或α= 0.01。其表明,当做出接受原假设的决定时,其正确的可能性(概率)为95%或99%,这就相当于区间估计中的置信水平(1-α)。根据显著性水平α和统计量的分布,可以找出接受域和拒绝域的临界点。如果使用z统计量时,其临界点双侧假设检验时为,单侧检验时为zα

(4)做出假设决策,依据样本数据计算的统计量的值与临界值比较,做出接受或拒绝原假设H0的判断。如果样本统计量落入拒绝域,就拒绝原假设,否则就接受原假设。五、总体参数的假设检验

总体参数假设检验就是检验已知分布形式(本节主要考虑正态分布)的总体的某些参数(例如均值、比率或者方差)是否与事先所做的假设存在显著性差异,又称为显著性检验。主要包括对总体均值、总体比率和总体方差的假设检验。下面分不同情况介绍假设检验的理论和方法。

1.总体均值的假设检验

总体均值的假设检验就是由样本信息所推断的当前总体均值是否与事先假设的总体均值存在显著性差异。

设样本X1,X2,…,Xn来自于正态总体N(μ,σ2),样本均值为珋x,样本方差为s2,考虑总体均值μ的检验问题。

(1)总体方差σ2已知。

对于双侧检验,建立的假设为

H0:μ=μ0 H1:μ≠μ0

式中,μ0为一个给定的常数。

对于左(右)单侧检验,建立的假设为

H0:μ≥(或≤)μ0 H1:μ<(或>)μ0

可以利用上面介绍过的Z检验法,构造检验统计量

在原假设成立的条件下,该统计量的分布为z~N(0,1)。从而在给定的显著性水平α下,我们可从标准正态分布表中查得临界值(对应于左右单侧检验的临界值分别为-zα和 zα)。

根据样本资料及其假设,计算出样本统计量的值z。这样,我们便可以得出原假设的拒绝域为

(对双侧检验而言)

(对左单侧检验而言)

(对右单侧检验而言)

当z值处于拒绝域中时,我们就可拒绝原假设,否则不能拒绝原假设。

(2)总体方差σ2未知。

总体方差σ2未知时,如果样本为大样本(n≥30),中心极限定理可以认为样本均值仍然服从正态分布,即,均值μ的假设检验与上同,只是把总体方差用样本方差代替;如果样本是小样本(n<30),均值μ的假设检验类似上面方差σ2已知时的做法,只是在构造检验统计量时,不是利用Z检验法,而是在原假设成立的条件下,利用t检验法。

对于双侧检验,建立的假设为

H0:μ=μ0,H1:μ≠μ0

对于左(右)单侧检验,建立的假设为

H0:μ=μ0,H1:μ<(或>)μ0

构造检验统计量

式中

,为样本标准差。t统计量就是用样本标准差s来代替z统计量中未知的总体标准差σ。

对于临界值,在t分布表中查得临界值tα/2(n-1)(双侧检验)、-tα(n-1)(左单侧检验)、tα(n-1)(右单侧检验)。

根据样本资料及假设,计算出样本统计量的值t0,这样,可以得出对原假设的拒绝域为:样本统计量的值t满足

当t值落入拒绝域,就拒绝原假设,否则不能拒绝原假设。

这里应该注意的是,在实际中不能够确定总体是否满足正态分布,但是样本容量n很大。根据中心极限定理,该总体分布近似服从正态分布,对该总体均值的检验可以依据上面总体方差未知的程序来进行。对于小样本的情况,我们也根据上面的t检验来进行。

【例6-14】为了考察某种类型电子元件的使用寿命情况,假设该电子元件使用寿命的分布为正态分布。根据历史记录得知该分布的参数为:平均使用寿命μ为100小时,给定显著水平α= 0.05。问该类型电子元件的使用寿命是否有明显的提高。

解 此题为单侧检验,且是右单侧检验。以μ表示元件的平均使用寿命(小时),则

1)建立假设

H0:μ≤100,即使用寿命无明显变化;

H1:μ>100,即使用寿命有明显提高。

2)确定检验统计量及其分布

3)确定临界值

右单侧检验的临界值为zα。由于给定的显著性水平α= 0.05,那么双侧概率水平为2× 0.05= 0.1,则F(zα)= 1-0.1= 0.9,查正态分布概率表得到zα= 1.645,即为临界值。

4)计算样本统计量并做出判断

根据样本资料,计算样本统计量:

由于计算的样本统计量z>1.645,所以拒绝原假设H0,可以认为该类型电子元件的使用寿命确实有所提高。

【例6-15】在例6-14中,如果抽出100个样本元件,测得其平均使用寿命为98小时,其余条件相同,试问该类型元件的使用寿命是否有显著性下降。

解 此例为左单侧检验问题。

1)建立假设

H0:μ≥100,即使用寿命无明显变化;

H1:μ<100,即使用寿命有显著性下降。

(2)确定检验统计量及其分布

在原假设成立的条件下,检验统计量为

3)确定临界值

此时左单侧检验的临界值为-zα,根据上面的结果,得到临界值为-zα=-1.645。

(4)计算样本统计量并做出判断

样本统计量为

由于计算的样本统计量z<1.645,所以拒绝原假设H0,可以认为该类型电子元件的使用寿命有显著性下降。

【例6-16】某糖果生产基地,生产的标准是每袋糖果净重为500克。今从一批产品中抽出10袋,实际测得每袋糖果的净重(克)为:

512 503 498 507 496 489 499 501 496 506给定显著性水平α= 0.01,试问该批糖果的生产是否正常。

解 该例中,检验的问题是糖果净重是否符合500克的标准,属于双侧检验的问题。

1)建立假设

H0:μ= 500,H1:μ≠500

2)确定临界值

由于是双侧检验,所以应该有两个临界值:上临界值和下临界值。又因为总体的标准差未知,需要用样本的标准差S代替,因此,统计量服从的是自由度为n-1的t分布,而非正态

分布。此例中n= 10,α= 0.01,则自由度为10-1= 9,查t分布表得到,上临界值t0.005(9)= 3.25,由于分布的对称性,下临界值为

3)计算样本统计量

在计算样本统计量之前,需要先计算样本均值和样本标准差。样本均值:

样本标准差:

检验的样本统计量:

4)做出判断

根据样本计算的统计量t= 0.335在-3.25到3.25之间,所以不能拒绝原假设,也即在99%的置信度下,可以认为该批生产正常。

【例6-17】根据上例,假定所要检验的是该批产品是否显著地高于标准。

解 这样检验问题就变成单侧检验了,且为右单侧检验问题。

1)建立假设

H0:μ≤500,H1:μ>500

2)确定临界值

由于是单侧检验,所以只有一个临界值;n= 10,α= 0.01,查表知临界值为

3)计算样本统计量

和上例的计算一样,得到样本统计量为0.335。

4)做出判断

由于实际的样本统计量t= 0.335小于临界值2.821,所以不能拒绝原假设,可以认为该类生产没有显著地高于标准。该结论与上例的结论相符。

2.两个总体均值之差的假设检验

两个总体均值之差的检验是对两个不同总体的均值之间的差异性是否显著所进行的检验。为了分析的简化和方便,我们假定x是取自于均值为μx、方差为的正态总体X的一个样本,y是取自于均值为μy、方差为的正态总体Y的一个样本,样本容量分布为n1,n2,且假定两样本相互独立为对应的样本均值和样本方差,显著性水平为α。下面我们分总体方差已知和未知两种情况,来分析总体均值的差异显著性检验。

(1)两个总体方差已知。

1)双侧检验。原假设为H0xy,备选假设为H1x≠μy

根据上面的假设和抽样分布理论,我们可以得到

所以在原假设成立下,构造的检验统计量为

在显著性水平α下,我们查标准正态分布表得到临界值Zα/2。将样本资料代入所构造的检验统计量,得到样本统计量z。若| z|>Zα/2,则拒绝原假设;反之,则不能拒绝原假设。

2)左单侧检验。原假设为H0x≥μy,备选假设为H1x<μy

此时从标准正态分布表查得的临界值为Zα。检验的拒绝域为z<-Zα

3)右单侧检验。原假设为H0x≤μy,备选假设为H1x>μy

此时的临界值也为Zα。检验的拒绝域为z>Zα

(2)两总体方差未知但相等。在两方差未知但相等的情况下,我们根据抽样分布理论可知:

对于双、单侧检验,原假设都是相同的,均为H0xy。只是在双侧检验时,备选假设H1x≠μy;在左单侧检验时,备选假设为H1x<μy;在右单侧检验时,备选假设为H1x> μy。

在原假设成立的情况下,根据上面的公式,我们可以构造如下的检验统计量:

可以根据样本资料的数据,计算样本检验统计量的数值。

对于双侧检验,可以从t分布表中查得临界值,此时原假设的拒绝域为:反之,就不能拒绝原假设。

对于左、右单侧检验,从t分布表中查得临界值tα(n1+ n2-2)。左单侧检验拒绝原假设的范围是:t<-tα(n1+ n2-2)。右单侧检验拒绝原假设的范围是:t>tα(n1+ n2-2)。若t在拒绝域之外,则不能拒绝原假设。

【例6-18】将某小学一年级学生随机分为两组,对其中一组运用新型的教学方式,称为新型组;另一组按照传统的教学方式,称为传统组。经过6个月后,对该年级学生进行成绩测试。假设两组成绩的总体标准差相同。从新型组抽取31名,求得的平均成绩为78.06,标准差为9.36;同样,从传统组抽取31名学生,求得的平均成绩为76.30,标准差为10.12。假设两组成绩的总体标准差相同。比较两组学生的平均成绩是否有显著性差异。

解 此题属于在两总体方差未知(但是假定两方差相等)下,检验两组均值是否有差异的问题。

依题意有,珋x= 76.30,珋y= 78.06,Sx= 10.12,Sy= 9.36,n1= n2= 31。

1)建立假设H0xy,备选假设H1x≠μy

2)构造检验统计量为

其中由于相等的标准差σ未知,我们用

来估计。

3)确定临界值

从t分布表中查得临界值t0.025(60)= 2.00。

4)计算样本统计量及判断,将样本资料代入检验统计量得到因而有不能拒绝原假设,即两组的均值没有显著性差异。

3.总体比率的假设检验

比率是反映现象数量结构的指标,也称为成数。如就业率、升学率、产品合格率等。要考察总体比率是否发生显著性变化,可以通过样本比率对其进行假设检验。与对总体均值的假设检验类似,总体比率的假设检验包括单样本和多样本(本处只考虑两样本情况)总体比率检验。

(1)单个样本比率的假设检验。

当样本容量比较大时(实践中较少对样本比例进行小样本检验,且其检验程序相对复杂),按照中心极限定理,分布以正态分布为极限。因而,对总体比率的假设检验可以借助正态分布来进行。

建立假设:

构造的检验统计量为

服从标准正态分布,即Z~N(0,1)。式中,p代表样本比率

代表总体比率。

对于显著性水平α,可以通过查标准正态分布表,得到临界值Zα/2。从样本数据中计算得出样本比率p代入检验统计量,得到样本统计量z。将样本统计量与临界值进行比较,若| z|>zα/2,则拒绝原假设;反之,则不能拒绝原假设。

我们以例子来说明单样本比率检验的过程。

【例6-19】某牌子的冰箱生产商声明,其产品在该地区的市场占有率为60%。为了检验该说法的正确与否,我们在该地区随机调查了100名购买冰箱的消费者,其中有57人购买的是该牌子的冰箱,试问该生产商的声明是否可靠?(α= 0.05)

解 经分析,本例属于双侧检验。样本市场占有率

1)建立假设:H0:ρ= 60%,H1:ρ≠60%。

2)检验统计量:

3)计算临界值:在5%的显著性水平下,从标准正态分布表中可以查得临界值为Z0.025 = 1.96。

4)计算样本统计量及判断:

样本统计量

| z|= 0.612<1.96,因而,我们不能拒绝原假设,即生产商的声明是可靠的。

(2)两个样本总体比率差的检验。

如果要考察两个总体比率之间是否有显著性差异,可以用两样本总体比率差检验。

假定对应两总体的样本容量分别为n1,n2,当n1,n2都比较大时,我们可以构造如下的检验统计量,该检验统计量服从标准正态分布。

若建立的原假设为H0121-π2= 0),相应的临界值为Zα/2;若建立的原假设为H01≥(或≤)ρ2,则相应的临界值为Zα。能否拒绝原假设的判断规则如前面所述。

【例6-20】考察专业股票分析师和普通股民对整个股票市场走势的判断是否存在显著性差异。在100名专业股票分析师中,有55%的人认为股票市场将上升;在150名普通股民中,有48%的人持相同观点。试问专业分析师和普通股民的观点是否存在显著性差异(α = 0.05)。

解 根据题设,已知n1= 100,n2= 150,p1= 55%,p2= 48%。

建立原假设H0:p= p0,备选假设H1:p≠p0

根据样本资料计算检验统计量的值:

由正态分布表查出α= 0.05时的临界值为Z0.025= 1.96。因为z= 1.089<1.96,所以不能拒绝原假设。

4.正态总体方差的假设检验

方差是反映现象在数量上变异程度的指标,反映变化的均衡程度。对于正态总体方差的检验主要有两种:一种是检验总体方差是否显著等于某一给定的确定值,另一种是检验总体方差是否显著地在某个给定的范围内。

在参数估计中,我们已经知道可以用样本方差作为总体方差的无偏估计。样本方差的计算公式中的(n-1)为自由度,说明样本中有(n-1)个样本单位的取值是可以独立确定的,这是由于分子中珔X的约束使得独立的样本单位少了一个。

对建立的原假设为,备选假设

检验统计量为

在原假设成立的条件下,该统计量服从自由度为n-1的χ2分布,即

χ2分布曲线全部处于第一象限,其中唯一的参数是自由度。当自由度大于30时,分布曲线接近于正态分布。其分布曲线如图6-2所示,有=α。根据显著性水平α和自由度n-1,查χ2分布表可以得到临界值。若检验统计量,拒绝原假设;反之,则不能拒绝原假设。

图6-2 χ2分布图

【例6-21】已知生产某种型号的螺钉厂,在正常条件下其螺钉长度服从正态分布N(4.0,0.04)(单位:厘米)。现在我们对某日生产的螺钉随机抽取6个,测得长度为4.1,3.6,3.8,4.2,4.1,3.9,试问该日生产的螺钉总体标准差是否正常(α = 0.05)?

解 可以计算出样本标准差S= 0.226,该假设检验的过程如下:

1)建立假设:

2)检验统计量

3)临界值:从χ2分布表可以得到临界值

4)计算样本统计量及其判断:所以,不能拒绝原假设,可以认为该日生产的螺钉总体标准差正常。

5.两个正态总体方差比的检验

假定有两个样本,分别为,两样本容量分别为n1和n2,且相互独立。其中分别为两正态分布总体的均值和方差。又分别为两样本的方差,下面分两情况对方差进行检验。

(1)两总体均值μx,μy已知。在两总体均值已知的情况下,我们用样本方差去估计两总体的方差此 时样本方差的计算公式如下:

式中,两个样本方差的分母(自由度)都为各自的样本容量。

根据抽样分布理论可知:,且统计量

即统计量F服从F分布。

建立假设:

对于双侧检验在原假设成立下,检验统计量为

根据显著性水平α和自由度,查F分布表可以得到两个临界值:Fα/2(n1,n2),F1-α/2(n1,n2)。若样本统计量F满足:F<Fα/2(n1,n2)或F>F1-α/2(n1,n2),那么就可在(1-α)%概率水平下拒绝原假设。反之,如果计算的样本统计量值在区域[Fα/2(n1,n2),F1-α/2(n1,n2)]之中,那么我们就不能拒绝原假设。

对于左单侧检验,建立的备选假设为据以判断的临界值为Fα(n1,n2),拒绝域为样本统计量F<Fα(n1,n2)。

对于右单侧检验,建立的备选假设为据以判断的临界值为F1-α(n1,n2),拒绝域为样本统计量F>F1-α(n1,n2)。

(2)两总体均值μx,μy未知。在两总体均值未知下,我们用如下计算公式的样本方差去估计两个总体的方差

式中,珔X与珔Y分别为样本均值,两个样本方差的分母(自由度)都为各自的样本容量减去1。

由于,有统计量

从而可以将其作为检验统计量。

建立的原假设:,在原假设成立条件下,检验统计量对于双侧检验,备选假设为,当样本统计量或F>时,拒绝原假设;反之,则不能拒绝原假设。

对于左单侧检验,备选假设为,据以判断的临界值为Fα(n1-1,n2-1),拒绝域为样本统计量F<Fα(n1-1,n2-1)。

对于右单侧检验,备选假设为,据以判断的临界值为F1-α(n1-1,n2-1),拒绝域为样本统计量F>F1-α(n1-1,n2-1)。

【例6-22】为了比较甲、乙两个地区人均月收入不平均的差异,分别在两个地区调查8户和7户居民,其人均月收入如表6-6所示(假设收入都服从正态分布)。试问甲区的人均月收入的不平衡性是否大于乙地区。

表6-6 各地区人均月收入  单位:元

解 人均月收入的不均衡性可以用方差(或者标准差)来表征,因而问题就转化为检验两地区人均月收入方差(标准差)的差异性。

从调查的样本资料中,我们可以得到n1= 7,n2= 8,S1= 199.7,S2= 235.66。

1)建立假设:

2)检验统计量

3)临界值:从F分布表中查得临界值为F1-0.05(6,7)= 3.87。

4)样本统计量的计算及判断:

所以不能拒绝原假设,即不能认为甲地区的人均月收入波动较小。

第七节 运用Excel进行参数估计与假设检验

一、利用Excel进行区间估计

在Excel中,可使用公式和函数结合的方法进行参数估计。以下结合例6-7说明Excel的操作步骤,如表6-7所示。

第一步,把数据输入到Excel表格中。本例中,数据位置为A2:D10。

第二步,计算样本个数。在G2单元格中输入= COUNT(A2:D10),单击确定。

第三步,计算样本均值。在G3单元格中输入=AVERAGE(A2:D10),单击确定。

第四步,计算样本标准差。在G4单元格中输入= STDEV(A2:D10),单击确定。

第五步,计算抽样平均差。在G5单元格中输入=G4/SQRT(G2),即公式

第六步,计算最大误差。在G6输入值后中,在G7单元格中输入= G5* G6,单击确定。

第七步,计算置信下限。在G8单元格中输入=G3-G7,单击确定。

第八步,计算置信上限。在G9单元格中输入=G3+G7,单击确定。

表6-7 利用Excel进行区间估计输出表

这样就由表6-7中可以看出相应的置信区间。

二、利用Excel进行假设检验

假设检验先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。以下结合例6-7利用Excel的函数值构造一张工作表来实现在总体方差未知情况下的总体均值假设检验。Excel操作步骤如下。

第一步,把数据输入在Excel表格中。本例中,数据位置为A2:D10。

第二步,计算样本个数。在G2单元格中输入=COUNT(A2:D10),单击确定。

第三步,计算样本均值。在G3单元格中输入=AVERAGE(A2:D10),单击确定。

第四步,计算样本标准差。在G4单元格中输入= STDEV(A2:D10),单击确定。

第五步,计算抽样平均差。在G5单元格中输入=G4/SQRT(G2),即公式

第六步,输入总体均值的假设值μ0。在G6单元格中输入96。

第七步,输入显著性水平。在G7单元格中输入0.05。

第八步,计算检验统计量。在G8单元格中输入=(G3-G6)/G5,相当于公式z

第九步,计算双侧检验临界值,在G9单元格中输入= NORMSINV(G7/2)。这利用了 Excel正态分布函数,也可直接输入1.96。

第十步,利用Excel中的IF函数输出检验结果。在G10单元格中输入= IF(ABS(G8)>ABS(G9)“拒绝H0”,“接受H0”)

如表6-8所示,检验结果为在5%的显著水平之下拒绝H0假设。所以,根据样本的计算结果,这两地的平均工资水平有明显差异。以上例子说明如何组合使用Excel的公式和函数,以构造出一个能实现对正态总体均值的双侧假设检验工作表。对于其他情形,可以使用相关统计理论构造相应工作表。也可以使用Excel中“数据分析”工具进行其他部分假设检验工作(如双样本等方差检验等)。

表6-8 利用Excel进行假设检验输出表

思考与练习

一、判断正误

1.抽样推断是指按照随机原则,从研究对象的总体中抽取一部分单位进行调查,并用这一部分单位的指标数值去推断总体的指标数值,从而达到认识总体目的的一种统计方法。( )

2.抽样误差不可避免,所以不能事先计算和控制。( )

3.参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。( )

4.假设检验是利用样本资料对总体所作的某种假设进行检验,推断过程假设原假设不成立。( )

5.在抽样推断中,用来反映总体数量特征的指标称为总体指标或全及指标,也叫总体参数。( )

6.代表性误差是指用样本指标推断总体指标时,由于样本结构与总体结构不一致,样本不能完全代表总体而产生的误差。它又分为抽样误差和随机性误差两种。( )

7.抽样平均误差是反映抽样误差一般水平的指标,它的实际含义是指抽样平均数(或成数)的标准差,即它反映了抽样指标与总体指标的平均离差程度。( )

8.参数估计的有效性是指样本统计量的数学期望等于被估计的总体参数。如果E(^θ)=θ,则称^θ 为θ的无偏估计量。( )

9.在进行抽样时,如果总体比例π未知,可用样本比例p代替。某些时候,若有多个可供参考的比例数值,为了保证抽样推断的把握程度,应选其中方差最大值来计算,也就是应取接近50%的样本比例计算方差值。( )

10.假设检验是建立在原假设成立前提下,运用小概率原理结合反证法来进行统计推断的。这里的小概率是预先未知的。( )

二、单项选择题

1.置信区间表明的是一个( )。

A.绝对可靠的范围 

B.可能的范围 

C.绝对不可靠的范围 

D.不可能的范围

2.无偏性是指( )。

A.样本指标的平均数等于被估计的总体指标

B.当样本容量n充分大时,样本指标充分靠近总体指标

C.随着n的无限增大,样本指标与未知的总体指标之间的离差任意小的可能性趋于实际必然性

D.作为估计量的方差比其他估计量的方差小

3.样本平均数和全及总体平均数( )。

A.前者是一个确定值,后者是随机变量 

B.前者是随机变量,后者是一个确定值

C.两者都是随机变量 

D.两者都是确定值

4.类型抽样的误差取决于( )。

A.组内方差 

B.组间方差 

C.总方差 

D.总体标准差

5.其误差大小取决于组间方差的抽样组织方式是( )。

A.简单随机抽样 

B.类型抽样 

C.等距抽样 

D.整群抽样

6.当总体内部差异比较大时,比较适合的抽样组织方式是( )。

A.纯随机抽样 

B.整群抽样 

C.分层抽样 

D.简单随机抽样

7.若甲估计量的方差小于乙估计量的方差,则称( )。

A.甲是无偏估计量 

B.乙是一致估计量 

C.乙比甲有效 

D.甲比乙有效

8.某厂要对某批产品进行抽样调查,已知以往的产品合格率分别为90%,93%,95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为( )。

A.144 

B.105 

C.76 

D.109

9.在总体方差不变的条件下,样本单位数增加3倍,则抽样误差( )。

A.缩小1/2 

B.为原来的  

C.为原来的1/3 

D.为原来的2/3

10.在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量( )。

A.增加9倍 

B.增加8倍 

C.为原来的2.25倍 

D.增加2.25倍

11.抽样误差是指( )。

A.在调查过程中由于观察、测量等差错所引起的误差

B.在调查中违反随机原则出现的系统误差

C.随机抽样而产生的代表性误差

D.人为原因所造成的误差

12.用样本指标估计总体指标,要求当样本单位数充分大时,抽样指标也充分地靠近总体指标,称为抽样估计的( )。

A.无偏性 

B.一致性 

C.有效性 

D.充分性

13.反映样本指标与总体指标之间的平均误差程度的指标是( )。

A.抽样误差系数 

B.概率度 

C.抽样平均误差 

D.抽样极限误差

14.抽样平均误差是( )。

A.全及总体的标准差 

B.样本的标准差

C.抽样指标的标准差 

D.抽样误差的平均差

15.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( )。

A.简单随机抽样 

B.类型抽样 

C.等距抽样 

D.整群抽样

16.若一项假设规定显著性水平α= 0.05,下面表述中正确的是( )。

A.接受H0时的可靠性为95% 

B.接受H1时的可靠性为95%

C.H1为真时被拒绝的概率为5% 

D.H0为假时被接受的概率为5%

17.若假设形式为H0:μμ0,H1:μ<μ0,当随机抽取一个样本时,其均值珋x=μ0,则( )。

A.有可能接受原假设,但有可能犯第Ⅰ类错误

B.有可能接受原假设,但有可能犯第Ⅱ类错误

C.肯定接受原假设,但有可能犯第Ⅰ类错误

D.肯定接受原假设,但有可能犯第Ⅱ类错误

18.在一次假设检验中,当显著性水平α= 0.01,原假设被拒绝时,则用α= 0.05时,( )。

A.一定会被拒绝 

B.一定不会被拒绝 

C.有可能拒绝原假设 

D.需要重新检验

三、多项选择题

1.下面哪些说法是错的( )。

A.抽样调查中的代表性误差是可以避免的

B.抽样调查中的系统误差是可以避免的

C.抽样调查中的随机误差是可以避免的

D.抽样调查中的随机误差是不可以避免的

E.抽样调查中的系统误差是不可以避免的

2.抽样估计的优良标准有( )。

A.无偏性 

B.数量性 

C.有偏性

D.一致性 

E.有效性

3.影响抽样平均误差的因素有( )。

A.总体标志变异程度 

B.样本容量 

C.抽样方法

D.抽样组织方式 

E.可靠程度

4.抽样组织方式有( )。

A.简单随机抽样 

B.分层抽样 

C.机械抽样

D.整群抽样 

E.重置抽样

5.下列哪些说法是对的( )。

A.全及总体是唯一确定的 

B.样本指标是随机变量 

C.样本是唯一的

D.样本指标可有多个 

E.总体指标只有一个

6.假设总体方差不变,当样本容量增加8倍,则抽样平均误差( )。

A.为原来的

B.为原来的1/3 

C.缩小1/3

D.缩小2/3 

E.缩小

7.抽样估计的特点是( )。

A.运用演绎推理法 

B.运用归纳推理法 

C.运用确定的数学分析法

D.运用不确定的概率估计法 

E.存在抽样误差

6.抽样调查方式的优越性表现在以下几个方面( )。

A.全面性 

B.经济性 

C.时效性

D.准确性 

E.灵活性

9.抽样调查的特点是( )。

A.遵循随机原则 

B.与典型调查的特点相同

C.必然产生抽样误差 

D.通过综合汇总达到调查目的

E.用部分单位指标值去推断总体指标值

10.影响抽样误差大小的因素有( )。

A.样本各单位标志值的差异程度 

B.总体各单位标志值的差异程度

C.样本单位数 

D.抽样方法

E.抽样调查的组织形式

11.对于总体、样本及其指标的认识( )。

A.总体是唯一确定的,样本是随机的 

B.总体指标是确定不变的

C.统计量是样本变量的函数 

D.统计量是随机变量

E.统计量是不确定的

四、简答题

1.试述分层抽样的原则和方法?

2.有人说:“t检验适用于样本容量小于30的情况。z检验适用于大样本检验”,谈谈你对此的看法。

3.如果两总体中的所有个体都进行了智力测验,这两个总体智商的平均数差异是否还需要统计检验?为什么?

4.为了建立最好的多元线性回归方程,一般采用什么方式选择自变量?

5.为什么抽样调查得到的样本统计可以推论总体参数?

6.平均数的显著性检验和平均数差异的显著性检验的区别联系。

7.正态分布的标准差有何统计意义?在统计检验中为什么会用到标准差?

8.正态分布的特征是什么?统计检验中为什么经常要将正态分布转化成标准正态分布?

9.在进行差异的显著性检验时,若将相关样本误作独立样本处理,对差异的显著性有何影响?为什么?

10.为什么要做区间估计?怎样对平均数作区间估计?

11.抽样调查要想得到比较准确的结果,需要控制哪些技术环节?

五、计算题

1.设年末某储蓄所按储蓄存款户账号的大小为序,每隔10户抽1户,共抽取100户的资料如下:

试以95.45%(zα/2= 2)的概率,估计以下指标的范围:

(1)该储蓄所存款户平均每户的存款余额;

(2)该所储蓄存款余额在30 000元以上的户数占全部存款户数的比重。

2.随机地从一批螺钉中抽取16枚,测得其长度为(单位:厘米)为2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15,2.12,2.14,2.10,2.13,2.11,2.14,2.11。设螺钉长分布为正态分布,试求总体平均数μ的置信水平为90%的置信区间:

(1)已知σ= 0.01cm;

(2)若σ未知。

3.在一项家庭调查中,我们想了解居民拥有某一品牌的空调情况。今随机抽取200户居民,调查发现拥有该品牌空调的家庭占到23%。求总体比率的置信区间,置信水平为90%和95%。

4.某市第四次人口普查显示,该市老年人口老龄化(65岁以上)比率为14.7%。若你作为大学管院暑期社会实践队成员到某市对该市人口老龄化问题进行研究,随机调查了400名当地市民,发现有57人年龄在65岁以上。那么你的调查结果是否支持该市老龄化率为14.7%的看法?(α= 0.05)

5.从两个总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表所示,试求μ1-μ2分别在90%和95%置信水平下的置信区间。

6.某一个居民小区共有居民500户,小区管理者采取一项新的供水措施,想了解居民是否赞成。采取重复抽样的方式抽取了50户,其中共有32户赞成,18户反对。求:

(1)总体中赞成该项改革的户数比例的置信区间,置信水平为95%;

(2)如果小区管理者预计赞成的比例达到80%,应抽取多少户进行调查?

7.从两个总体中各抽取n1= n2= 250的独立随机样本,来自总体1的样本比率为p1= 40%,来自总体2的样本比率为p2= 30%。试求总体p1-p2分别在90%和95%置信水平的置信区间。

8.对于方差σ2为已知的正态总体,问抽取容量n为多大样本时,才能使得总体平均数μ的置信水平为1-α的置信区间长度不大于L?

9.已知某苗圃中树苗高度服从正态分布,其高度的标准差为8.2厘米,根据长势估计其平均高度为60厘米。今从苗圃中随机抽取64珠,测得苗高并求得其均值为62厘米。试在显著性水平α= 0.05的条件下检验所估计的高度是否正确。

9.从某乡的小麦田中随机抽取20亩(1亩= 666.67米2),测得每块的实际亩产量(单位:千克)分别为:120,122,102,114,134,145,84,96,160,124,136,108,154,113,135,150。假设小麦产量服从正态分布,试问:能否在显著性水平α= 0.01下认为该乡小麦亩产量平均为120千克?

10.某地调查了一种危害林木的昆虫两个世代每块卵卵粒数。第一世代调查了128粒卵,得均值为47.3粒,均方差为25.5粒;第二世代调查了69粒卵,得均值为74.9粒,均方差为47.2粒。试在显著性水平α= 0.05条件下检验该昆虫两世代卵块卵粒数差异是否显著。

11.从两台同类型机床生产的两批产品中,抽取容量分别为12和18的小样本,求得产品长度均值分别为31.2和29.2;样本方差分别为0.84和0.40,单位为毫米。试在显著性水平α= 0.05下检验两台机床的性能是否一样。

12.在某次民主选举中,从A区和B区中分别选取300人和200人做调查,发现支持某位候选人的比例分别为56%和48%。试在0.05的显著性水平下检验下列结论:

(1)两个地区对该候选人的支持率有差异;

(2)该候选人在A区更受拥护。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈