样本是总体的代表和反映,是进行统计推断的基本依据。但是,对于不同的总体,甚至对于同一个总体,我们所关心的问题往往是不一样的。有时可能只需要估计出总体的均值,而有时则希望了解总体的分布情况。因此在实际应用中我们并不是直接利用样本进行推断,而是首先对样本进行必要的“加工”和“提炼”,把样本中所包含的我们关心的信息集中起来。就是说,我们需要针对不同的问题对样本进行不同的处理,这种处理就是构造出样本的某种函数,然后利用这些样本的函数来进行统计推断。
统计量作为由统计数据计算得来的量,是样本的函数。例如,n 袋食盐的平均重量,上海市n个夏季暴雨的总次数等都是统计量。统计研究最根本的任务,就是由样本推断总体,由统计量推断总体参数或者总体的分布,即通过对样本的研究解决整个总体的问题。下面对这些概念做较严格的表述。
1.统计量的定义
定义6.2.1 设(X1,X2,…,Xn)为来自总体X 的一个样本,T=g(X1,X2,…,Xn)是样本的函数,且g(X1,X2,…,Xn)中不含有任何未知参数,则称T=g(X1,X2,…,Xn)是一个统计量。若(x1,x2,…,xn)是相应于(X1,X2,…,Xn)的样本值,则称g(x1,x2,…,xn)是统计量g(X1,X2,…,Xn)的观察值。
注意,统计量只依赖于样本,不依赖于其他任何未知参数,因此统计量应该是切实可以计算的。统计量作为观测结果的函数也是随机变量。这一章将讨论一些常用统计量的概率分布——抽样分布。样本的各种数字特征都是常用的统计量。随机样本和统计量是随机变量,它们的实现是具体的样本值和统计量的值。为便于叙述,有时简称“样本”和“统计量”,读者应按具体内容的上下文来正确理解其含义。当进行一般性讨论时,“样本”和“统计量”一般应视为随机变量;在处理具体问题时,“样本”和“统计量”多指其实现。
2.常用统计量
样本数字特征和顺序统计量是最常用的统计量。
样本均值X、样本方差S2 和样本标准差S 是最常用的样本数字特征,其中
(2)样本矩
对于k>0,k阶样本原点矩Ak 和k 阶样本中心矩Bk 定义为
(3)顺序统计量
顺序统计量的概念在统计分析和统计推断中应用广泛,有些重要的统计量就是通过顺序统计量定义的。设(X1,X2,…,Xn)是来自总体X 的简单随机样本,以X(1),X(2),…,X(n)依次表示n次抽样结果的最小观测值,第二小观测值…X(n)是最大观测值,而每一个X(i)(i=1,2,…,n)作为样本(X1,X2,…,Xn)的函数,称作第i个顺序统计量,其中最常用的是最小观测值X(1)和最大观测值X(n):
为便于叙述,把基于简单随机样本(X1,X2,…,Xn)的顺序统计量X(1)≤X(2)≤…≤X(n),称为简单顺序统计量。而样本极差R 定义为
(4)经验分布函数
数理统计的核心内容是统计推断。统计推断就是由样本推断总体,由样本的分布推断相应总体的分布,由样本的数字特征推断总体的数字特征。我们现在讨论样本特征与相应总体特征——频率与概率、经验分布与概率分布、样本数字特征与总体数字特征的关系。大数定律是连接样本特征与总体特征的桥梁。(www.xing528.com)
分布函数可以描绘各种类型的随机变量。与总体分布函数对应的统计量是经验分布函数。设F(x)是总体X 的分布函数,(X1,X2,…,Xn)是来自总体X 的简单随机样本,(x1,x2,…,xn)是简单随机样本观察值。另外,(X(1),X(2),…,X(n))为简单顺序统计量,(x(1),x(2),…,x(n))是相应的观察值。
用vn(x),x∈(-∞,∞)表示X1,X2,…,Xn 中不大于x 的随机变量的个数。定义经验分布函数Fn(x)为
经验分布函数Fn(x)的观察值为
总体X 的经验分布函数又称作样本分布函数。
经验分布函数有如下简单性质。
①对于给定的x,Fn(x)是一统计量,其概率分布和数字特征为
②对于给定的样本值(x1,x2,…,xn),Fn(x)是一普通的分布函数,是阶梯函数,并且具有分布函数的一切性质。
③对于任意x∈(-∞,∞),经验分布函数Fn(x)依概率收敛于总体的分布函数F(x)[1]:
证明 注意到,对于任意x,νn(x)服从参数为(n,F(x))的二项分布,立即得式(6.2.5)和式(6.2.6)。性质②显然。性质③可以由伯努利大数定律得到。
注意,性质③有重要理论意义。因为总体的经验分布函数Fn(x)收敛于总体的理论分布函数F(x),所以只要样本容量n充分大,就可以由经验分布函数Fn(x)任意精确地估计总体的分布函数F(x),而分布函数完全决定和描绘总体的一切行为、性质和特征。然而,经验分布函数却不便于处理具体的统计推断问题。这是因为,一方面,用经验分布函数Fn(x)逼近理论分布函数F(x),通常要求样本容量n非常大,以致实际上在多数情形下难以实现;另一方面,通常分布函数本身也不便于处理具体随机变量。然而,经验分布函数收敛于理论分布函数这一事实,沟通了经验分布和理论分布,为统计推断奠定了理论基础。
例6.2.1 假设总体X 在区间[0,2]上服从均匀分布,Fn(x)是总体X 的经验分布函数,基于来自X 的容量为n 的简单随机样本,求Fn(x)的概率分布、数学期望和方差。
解 总体X 的分布函数为
因此,由式(6.2.5)和式(6.2.6)知,对于任意x∈[0,2],有
对于x<0,P{Fn(x)=0}=1;对于x>2,P{Fn(x)=1}=1。
例6.2.2 设(2,1,5,1.5,2,1,3.5,1)是一简单随机样本值,将各观测值按从小到大的顺序排列,得1,1,1,1.5,2,2,3.5,5,则经验分布函数为
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。