首页 理论教育 用样本估计总体

用样本估计总体

时间:2023-07-20 理论教育 版权反馈
【摘要】:从总体中抽取一部分个体组成的集合叫作样本,样本中所含的个体个数叫作样本容量,抽取样本的过程叫作抽样.科学的抽样方法可使样本具有代表性,常用的抽样方法有随机抽样(抽签法、随机数表、计算机产生随机数)、系统抽样、分层抽样.统计估计是利用样本数据获取总体信息的重要手段,主要分成两类,一类是用样本中某事件出现的频率估计该事件出现的概率,叫作概率估计;另一类用样本的平均数和样本的标准差估计总体均值和总体标准

用样本估计总体

从总体中抽取一部分个体组成的集合叫作样本,样本中所含的个体个数叫作样本容量,抽取样本的过程叫作抽样.科学的抽样方法可使样本具有代表性,常用的抽样方法有随机抽样(抽签法、随机数表、计算机产生随机数)、系统抽样、分层抽样.统计估计是利用样本数据获取总体信息的重要手段,主要分成两类,一类是用样本中某事件出现的频率估计该事件出现的概率,叫作概率估计;另一类用样本的平均数和样本的标准差估计总体均值和总体标准差,简称参数估计

方法简述

1.系统抽样方法

例1 采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( ).

A.7 B.9 C.10 D.15

点拨 系统抽样指把总体中每一个个体编上号,按某种相等的间隔抽取样本的方法.因此现将960个人从1—960编号,要抽取32个人,即30人抽一人,即编号间隔为30,那么抽出的人编号是一个以9为首项,以30为公差的等差数列,题目的意思即为这个等差数列在[451,750]内有多少项的问题.

解答 将960个人从1—960编号,要抽取32个人,即30人抽一人,即编号间隔为30,那么抽出的人编号是一个以9为首项,以30为公差的等差数列.

则an=9+(n-1)·30=30n-21,

且451≤30n-21≤750,所以

所以n=16,17,…,25.

所以共有25-16+1=10(人),所以选C.

反思 系统抽样抽出样本的编号成等差数列,关键在于确定首项和间隔.

2.分层抽样方法

例2 某车间甲组有10名工人,其中有4名女工人;乙组有10名工人,其中有6名女工人.现采用分层抽样(层内采用不放回简单随机抽样)从甲、乙两组中共抽取4名工人进行技术考核.求:

(1)从甲、乙两组各抽取的人数;

(2)从甲组抽取的工人中恰有1名女工人的概率;

(3)抽取的4名工人中恰有2名男工人的概率.

点拨 分层抽样是把总体分成若干个部分,然后在每个部分进行抽样的方法,若每个部分的个体个数分别为N1,N2,…,Nk,每个部分分别抽取n1,n2,…,nk个个体,满足

解答 (1)从甲组抽2人,从乙组抽2人.

(2)

(3)

反思 分层抽样要保证每一层抽取个体数与层总个体数比值相同.

3.概率估计

例3 有一个容量为66的样本,数据的分组及各组的频数如下:

[11.5,15.5),2;[15.5,19.5),4;[19.5,23.5),9;[23.5,27.5),18;[27.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5),3.根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是( ).

A. B. C. D.

点拨 概率估计即用样本中事件出现的频率估计事件出现的概率,所以即计算频率.

解答 大于或等于31.5的数据所占的频数为12+7+3=22,该数据所占的频率约为

反思 样本频率可以估计事件发生的概率.

4.参数估计

例4 随机调查某公司内10名雇员的年薪如下(单位:元):58000,22000,39000,38000,45000,41000,40000,75000,40000,43000,试估计该公司雇员的平均年薪与公司雇员年薪的标准差.

点拨 可以用样本平均数来估计总体的平均数,用样本的标准差来估计总体的标准差.

解答 

所以估计公司的平均年薪为44100,公司年薪的标准差为13924.

反思 样本平均数的方法与总体平均数的计算方法相同,但样本标准差的公式要注意:s=,在计算器上是xσn-1项.

例5 某大公司为改善职工的出行条件,随机抽取50名员工,调查他们的居住地与公司的距离,结果如下表所示:

(1)求员工居住地到公司的平均距离;

(2)画出该公司员工居住地到公司距离的频率直方图.(www.xing528.com)

点拨 样本平均数可用公式:=x1f1+x2f2+…+xnfn,xi是各数据区间的中点,fi是样本出现频率.频率直方图的横轴为组区间,纵轴为频率/组距

解答 (1)=1.5×0.25+4.5×0.28+7.5×0.22+10.5×0.18+13.5×0.02+16.5×0.05=6.27.

(2)

例5答图

反思 频率直方图中各矩形的面积即为样本出现频率,所有矩形面积之和一定为1.

易错解读

例6 下列命题错误的是________.

①系统抽样和分层抽样都是等可能性抽样;

②概率估计就是用事件发生的频率来估计该事件的概率,如事件A发生的频率为0.75,则(A)=0.75;

③样本为x1,x2,…,xn,样本容量为n,则可用来估计总体平均值;

④可用来估计总体标准差.

解答 ④ 用标准差的点估计值来估计总体标准差.

易错点 概念辨析.

例7 某工厂对一批产品进行抽样检测,根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图如图所示,已知产品净重的范围是区间[96,106],样本中净重在区间[96,100)的产品个数是24,则样本中净重在区间[100,104)的产品个数是______.

例7图

解答 面积即为频率,则各面积为:0.1;0.2;0.3;0.25;0.15.

样本中净重在区间[96,100)的产品个数是24,所以总的样本个数X满足:0.3X=24,所以X=80.则样本中净重在区间[100,104)的产品个数是80×(0.3+0.25)=44(个).

易错点 数据分析.

经典训练

1.电池厂从某日生产的电池中抽取10个进行寿命测试,得到数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该电池的平均寿命估计为_________,方差估计为_________.

2.某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调査,应从小学中抽取_________所学校,从中学中抽取_________所学校.

3.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.

4.有5只苹果,它们的质量分别为125,a,121,b,127(单位:克).若该样本的中位数和平均值均为124,则该样本的标准差s=_________.(用数字作答)

5.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为调查产品的销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售和售后服务情况,记这项调查为②.则完成①②适宜采取的抽样方法依次为( ).

A.分层抽样、简单随机抽样

B.随机抽样、系统抽样

C.随机抽样、分层抽样

D.系统抽样、分层抽样

6.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

第6题图

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

根据已知条件完成下面的2×2列联表.

7.某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测试了每件产品的质量指标值,得到下面试验结果:

A配方的频数分布表:

B配方的频数分布表:

分别估计用A配方,B配方生产的产品的优质品率;并求两种配方的平均指标值.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈