在数理统计中,通常把被研究的对象的全体称为总体.把组成总体的每一个研究对象称为个体.总体中所包含的个体的个数称为总体的容量.容量为有限的总体称为有限总体,容量为无限的总体称为无限总体.
例如:研究某批灯泡的平均寿命时,该批灯泡的全体就构成了总体,而其中每一个灯泡就是个体,在实际问题中,我们所关心的并不是研究对象本身,而是反映它们某种性质的数量指标.如灯泡的使用寿命就是我们所关心的一个数量指标,显然它是一个随机变量.后面所提到的总体通常是指这个总体的某一数量指标,一般用X,Y来表示,如果指标X的分布函数是F(X),则F(X)也称为总体的分布函数.
下面以推断灯泡寿命为例来说明如何作统计推断.
设灯泡寿命低于1 000小时者为次品,现在来讨论如何确定一批灯泡的次品率.最简单的办法是把每个灯泡做寿命测试,这是不可能的.因为若测得全部结果,这批灯泡也全报废了.所以,一般情况下,我们只能从整批灯泡中抽取一部分灯泡做寿命测试并记录结果,然后根据这组数据,计算出这部分灯泡的次品率,从而来推断整批灯泡的次品率.
例9.2 现从这批灯泡(总数为10 000个)中任意抽取10个灯泡做寿命(小时)试验,试验结果为
(1 010,980,1 203,904,999,1 200,1 530,1 140,983,1 001).
可以看出,其中有4个灯泡的寿命低于1 000,次品率为40%,从而可以粗略地推断出这批灯泡的次品率为40%.
一般地,为了考察总体的某一数量指标,从总体中抽取n个个体来进行试验或观察,这n个个体称为来自总体的一个样本,个数n称为样本的容量.从总体中抽取一个个体,就是对代表总体的随机变量X进行一次试验(或观测),从总体中抽取n个个体,就是对代表总体的随机变量X进行n次试验(或观测),即得到一个容量为n的样本X1,X2,…,Xn,记作(X1,X2,…,Xn).当试验结束后,就得到一组实数(x1,x2,…,xn),称为样本观测值或样本值.显然,样本值不再是随机变量.(www.xing528.com)
在例9.2中,10 000个灯泡的使用寿命是总体,总体容量为10 000,每一个灯泡的使用寿命是个体,抽查的10个灯泡的使用寿命是一个样本,样本容量为10,样本值为(1 010,980,1 203,904,999,1 200,1 530,1 140,983,1 001).
为了能根据样本比较准确地推断总体的属性,所选取的样本应具有以下特性:
(1)代表性.在抽取样本时,不能只考虑局部,在小范围内选取,而应从整体出发;
(2)随机性.确定了选择范围后,随机抽取;
(3)独立性.在同样的条件下,抽取独立完成,上一次抽取不影响下一次抽取.
我们称满足上述特性的样本为简单随机样本.一般地,若无特殊声明,本书讨论的样本均指简单随机样本.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。