首页 理论教育 随机抽样研究:线性关系及易错点分析

随机抽样研究:线性关系及易错点分析

时间:2023-07-20 理论教育 版权反馈
【摘要】:,yn,满足:yi=kxi+b,若x1,x2,…,yn的平均数,标准差sy.所以所以sy=|k|sx.易错点已知有两个总体,x1,x2,…,xn的平均数为,标准差为sx,y1,y2,…

随机抽样研究:线性关系及易错点分析

在统计问题中,把研究对象的全体叫作总体.分别通过四个统计量来研究总体的数据,总体平均数、总体中位数、总体方差、总体标准差.本节讨论有限总体的问题.把有限总体中所有数据的算术平均数作为总体平均数,用来刻画总体的平均状态.总体中位数指将总体中所有数据从小到大排列后,当总体中个体个数为奇数时,总体中位数即中间一个数;若总体中个体个数为偶数时,总体中位数是中间两个数的算术平均数.总体中位数同样反映总体的平均状态.总体方差指总体中每一个数据到总体平均数距离平方的算术平均,反映了总体数据的离散程度.总体标准差是总体方差的算术平方根,同样反映总体数据的离散程度,但其单位与个体单位一致,所以经常使用总体标准差来刻画总体的离散程度.

方法简述

1.利用计算器统计功能计算统计量

由于统计问题涉及的个体数较多,计算比较复杂,所以利用好计算器的统计功能会带来很大便利.

例1 某小镇有1200户家庭,调查得到每户人家的人口数如下表所示:

求该小镇每户人家的平均人数和家庭人口数的方差.

点拨 输入个体以及个体数,在这里必须打开计算器输入频数的功能,然后使用计算器的统计量计算功能计算平均数和方差,但要注意的是,统计量的计算过程中,计算器只提供直接运算标准差的功能,计算方差还需将标准差平方.

解答 shift+mode;向下导航;选择3(STAT);在Frequency中选择ON,打开频数功能Mode+2(STAT);选择1(1-VAR).

在左侧输入数据,在右侧输入相应频数,完成数据输入,利用AC键退出

Shift+1(【STAT】),切换至统计运算状态,选择5(VAR)进入统计量计算功能.

1:总体中个体的个数;2:计算总体平均数;

3:总体标准差;4:总体标准差的点估计值;

选择2,得每户人家的平均人数:3.165;

选择3,得家庭人口数的标准差:1.40.

则家庭人口数的方差为1.97.

反思 计算器的使用给基本统计量的计算带来了很大的便利,所以需要熟练掌握计算器统计功能的基本操作.

2.总体稳定性的比较

总体稳定性的比较通过计算总体标准差,并比较总体标准差的大小来实现,总体标准差越小,则总体的稳定性越好.

例2 某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:

品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.

品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.

对品种A与B的亩产量及其稳定性进行比较,并说明理由.

点拨 总体方差指总体中每一个数据到总体平均数距离平方的算术平均,反映了总体数据的离散程度.总体标准差是总体方差的算术平方根,同样反映总体数据的离散程度,而且计算器的统计功能可以直接运算,所以我们通过计算并比较总体标准差的大小来体现总体的稳定性.

解答 品种A的标准差为29.04,品种B的标准差为15.71,所以品种B的亩产量稳定性好.

反思 总体方差和总体标准差体现了总体中的个体相对于总体平均数的离散程度,值越小,则离散程度越小,总体越稳定,是可以体现总体稳定性的统计量.

3.统计量概念的应用

必须熟悉各基本统计量的计算方法.

例3 已知x是1,2,x,4,5这五个数据的中位数,又知-1,5,,y这四个数据的平均数为3,则x+y的最小值为________.

点拨 本题涉及两个统计量的概念,总体中位数可以确定x的范围,总体平均数可以确定x,y之间的关系,这样对于双变量函数x+y来说,就可以将双变量转化为单变量了,同时也得到了变量的定义域,接下来就可以根据函数的思想求解x+y的最小值了.

解答 由x是1,2,x,4,5这五个数据的中位数可知,2≤x≤4.

又因为-1,5,,y这四个数据的平均数为3,

可得=3,则y=+8.

所以x+y=x++8(2≤x≤4).

因为x+y=x++8≥10,当且仅当x=1∉[2,4]时等号成立,

所以x+y=x++8在区间[2,4]上单调递增.

所以(x+y)min,当且仅当x=2且y=时取到.

反思 对每一个统计量的概念、计算方法、含义的理解非常重要.双变量函数的最值问题需要从两个变量的关系来实现双变量化单变量,同时求最值的时候还需函数的定义域.

易错解读

例4 已知有两个总体,x1,x2,…,xn;y1,y2,…,yn,满足:yi=kxi+b(k≠0,1≤i≤n,i∈N),若x1,x2,…,xn的平均数为,标准差为sx,求y1,y2,…,yn的平均数,标准差sy.(www.xing528.com)

所以

所以sy=|k|sx

例2 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ).

A.甲地:总体均值为3,中位数为4

B.乙地:总体均值为1,总体方差大于0

C.丙地:中位数为2,众数为3

D.丁地:总体均值为2,总体方差为3

解答 对A而言:总体均值为3,中位数为4,说明10个数据的和为30,且中间两数的平均数为4,考虑只需构造最大数是否超过7,那就让其他数尽可能小,例如:0,0,0,0,4,4,4,4,4,10,显然满足总体均值为3,中位数为4,但中间有一个数为10,超过7,所以不成立;

对B而言:总体均值为1,总体方差大于0,说明10个数据之和为10,且10个数据不全为1,可以使尽可能多的数为0,例如:0,0,0,0,0,0,0,0,0,10,所以不成立;

对C而言:中位数为2,众数为3,说明中间两个数的平均数为2,且在所有数据当中3的个数最多,所以可以构造:0,0,1,1,2,2,3,3,3,10,所以不成立.

所以选D.

易错点 排除法可以比较容易地解决问题,如果从正面出发会比较麻烦:

总体均值为2,则x1+x2+…+x10=20.

总体方差为3,则

所以

所以若要个体大于7,只能是10个个体中的一个.

不妨设x10最大,则x10>7的值且只能是x10=8,

由于x1,x2,…x9∈N,由第二个式子可知,

9个数只能是:1,1,1,1,1,1,0,0,0或2,1,1,0,0,0,0,0,0,而这两组数据均不满足第一个式子,所以x10≤7.

经典训练

1.某人5次上班途中所花的时间分别为x,y,10,11,9,已知这组数据的平均数为10,方差为2,则=________.

2.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:吨/公顷):

其中产量比较稳定的小麦品种是_________.

3.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体中位数为10.5,若要使总体的方差最小,则a=_________,b=_________.

4.为调查参加运动会的1000名运动员的年龄情况,从中抽查了其中100名运动员的年龄,就这个问题来说,下列说法中正确的是( ).

A.1000名运动员是总体 B.每个运动员是个体

C.抽取的100名运动员是样本 D.样本容量是100

5.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:

s1,s2,s3分别表示甲、乙、丙三名运动员这次成绩的标准差,则有( ).

A.s3>s1>s2 B.s2>s1>s3

C.s1>s2>s3 D.s2>s3>s1

6.某班40人随机分成两组,第一组18人,第二组22人,两组学生在某次数学测验中的成绩如下:

求全班的平均成绩和标准差.

7.设有一样本x1,x2,…,xn,其标准差为sx,另有一样本y1,y2,…,yn,其标准差为sy,其中yi=-3xi+2(1≤i≤n,i∈N),求证:sy=3sx

8.某公司有50个雇员,他们的工资情况如下:

年薪的平均数、中位数、标准差.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈