首页 理论教育 一个总体参数估计时样本统计量的抽样分布优化

一个总体参数估计时样本统计量的抽样分布优化

时间:2023-07-03 理论教育 版权反馈
【摘要】:统计推断目的在于推断总体特征,而这种推断的基础就是抽样分布。因为抽样是随机的,所以我们说统计量是一个随机变量,而样本统计量的组合构成的频数分布就是抽样分布。◎定义5.3:从总体中重复随机抽取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布,称为某个统计量的抽样分布。由于现实中不可能将所有的样本都抽出来,因此,统计量的抽样分布实际上是一种理论分布。小结图5.13种不同性质的分布

一个总体参数估计时样本统计量的抽样分布优化

在进行参数估计之前,我们需要知道如何通过样本得到总体信息。这就需要对统计推断的基础理论依据——抽样分布(sampling distribution)有一定的认识。统计推断目的在于推断总体特征,而这种推断的基础就是抽样分布。回想一下,在前面章节所学过的相关内容:参数用于描述总体;参数一般都是未知的;通过从总体中抽取随机样本来获取必要的数据;利用这些数据来计算一个或更多的统计量。

例如,为了估计总体的均值,就要计算样本均值。虽然样本均值与总体均值之间有一定的差距,但我们可以预期它们是很接近的。但是,接近程度到底如何?我们还必须能度量它们接近的程度。抽样分布正好可以帮助我们解决这个问题,在知道样本均值和总体均值接近程度的基础上,就可对总体均值进行估计了。

什么是抽样分布呢?要理解这个概念的内涵,我们有必要介绍两种和它相关但性质不同的分布:总体分布和样本分布。

统计学中来陈述分布,可通俗地将其理解为数据集合反映出的特征,对数值型数据而言,最明显又可与函数联系起来的特征就是频数分布了。理解了这个,总体分布和样本分布的定义就呼之欲出了。

◎定义5.1:总体中所有数据所形成的相对频数分布,称为总体分布(population distribution)。

在前面第1章中,我们陈述过总体分为有限总体和无限总体,现实中,无限总体是较为普遍的,有时即使是有限的,但是从成本或者破坏性上考虑,我们往往也得不到总体里面的所有数据。因此,总体分布往往事先是不知道的。但是,我们又需要知道总体分布的相关信息,所以通常根据经验大致了解总体的分布类型,或者假定总体服从某种分布等。因为最终我们作为研究者所关心的并不是所有数据到底是如何分布,而是通过总体的参数来知道总体的特征。知道总体分布的定义之后,样本分布的定义就可以以此类推了。

◎定义5.2:从总体中随机抽取一个样本,这一个样本中所有数据所形成的相对频数分布,称为样本分布(sample distribution)。(www.xing528.com)

因为样本是从总体中抽取的,来自于总体,所以其能反映总体的相关信息和特征也是理所当然,这也是为什么样本分布也称经验分布。但是,样本是随机抽取的,只是总体中的一部分,当这部分只是总体中很小的一部分时,即当样本容量很小时,这种代表性就会被大大削减。那么,到底怎么根据样本推断总体的特征呢?

◎定义5.3:从总体中重复随机抽取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布(sampling distribution),称为某个统计量的抽样分布。

由于现实中不可能将所有的样本都抽出来,因此,统计量的抽样分布实际上是一种理论分布。如图5.1所示,我们对前面讲到的3种不同性质的分布进行了总结归纳。

小结

图5.1 3种不同性质的分布

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈