独立性检验统计学的一种检验方式.与适合性检验同属于K2检验,它是根据次数资料判断两类因子彼此相关或相互独立的假设检验.
方法简述
1.基本定义法
例1 在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的作用?
点拨 在使用该种血清的人中,有=48.4%的人患过感冒;在没有使用该种血清的人中,有=56.8%的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.
解答 提出假设H0:感冒与是否使用该种血清没有关系.由列联表中的数据,求得K2=≈7.075.
∵当H0成立时,K2≥6.635的概率约为0.01,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.
反思 注意解题基本过程.
例2 为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?_______________________________________________
点拨 在口服的病人中,有≈59%的人有效;在注射的病人中,有≈67%的人有效.从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明.
解答 提出假设H0:药的效果与给药方式没有关系.由列联表中的数据,求得
当H0成立时,K2≥1.3896的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设H0,即不能作出药的效果与给药方式有关的结论.
反思 如果观测值K2≤2.706,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.
例3 某地区的羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的,现研制一种新的预防药,任选6只羊做实验,结果6只羊服用此药后均未患病.你认为这种药是否有效?
点拨 假设药物无效,并计算其对应的概率,通过概率去判断这种药是否有效.
解答 现假设“药无效”,则事件“6只羊都不患病”发生的概率为(1-0.4)6≈0.0467,这是一个小概率事件.这个小概率事件的发生,说明“药无效”的假设不合理,应该认为药是有效的.
反思 假设检验是利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,即在论述H0不成立的前提下,有利于H0的小概率事件发生,就推断H0发生.
例4 研究人员选取170名青年男女大学生样本,对他(她)们进行一种心理测试.发现60名女生对该心理测验中的最后一道题目的反应是:作肯定回答的有18名,否定回答的有42名;而110名男生在相同的题目上作肯定回答的有22名,否定回答的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法进行判断.
点拨 把所给数据列出列联表,被调查的人有两种性别:男、女,每种性别又有两种情况:肯定、否定,这是一个2×2列联表的独立性检验的问题,因此只需求出K2,用它的大小即可确定是否拒绝原来的假设从而得出两个变量之间的关系,也可采用三维柱形图进行判断.而题目要求利用两种方法进行判断,因而我们采取三维柱图与独立性检验两种方法进行判断.
解答 根据题目所给出的数据建立如下列联表:
例4答图
相应的三维柱形图如图所示,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“性别与态度有关”.
但根据列联表中的数据得到:K2=≈2.158<2.706.
因此没有充分证据显示“性别与态度有关”.
反思 利用图形来判断两个变量之间是否有关系,可以画出三维柱形图,也可以画出二维条形图,仅从图形上只可以粗略地估计两个分类变量的关系,可以结合所求的数值来进行比较.作图时应注意单位统一,图形准确,但它不能给我们两个分量有关或无关的精确的可信程度,若要作出准确的判断,则需借助独立性检验的有关计算.
易错解读
例5 在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判断是否在恶劣气候飞行中男人比女人更容易晕机.
解答 根据题意,列出列联表如下:
则(www.xing528.com)
∵K2>2.706,故我们有90%的把握认为在这次航程中男人比女人更容易晕机.
易错点 利用独立性检验来考查两个分量是否有关系,并且能较为准确地给出这种判断的可靠程度,具体的做法是根据观测数据计算,由公式所给出的检验随机变量K2的值,并且K2的值越大,说明“X与Y有关系”成立的可能性就越大.
经典训练
1.下列属于相关现象的是( ).
第2题图
2.如图所示,图中有5组数据,去掉( )组数据后,剩下的4组数据的线性相关性最大.
A.e B.c
C.d D.a
3.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机调查了9965人,得到如下结果(单位:人):
根据表中数据,你认为吸烟与患肺癌有关的把握有( ).
A.90% B.95% C.99% D.100%
4.调查某医院某段时间内婴儿出生的时间与性别的关系,得到如下的数据表:
你认为婴儿的性别与出生时间有关系的把握为( ).
A.80% B.90% C.95% D.99%
5.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
如果某天气温是2℃,则这天卖出的热饮杯数约为( ).
A.100 B.143 C.200 D.243
6.某矿山采煤的单位成本Y与采煤量x有关,其数据如下表所示:则Y对x的回归系数是________.
7.对于回归直线方程=4.75x+257,当x=28时,y的估计值为________.
8.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则K2=___________.
9.由一个2×2列联表中数据计算得K2=4.013,有_________的把握认为两个变量有关系.
10.某个服装店经营某种服装,在某周内获纯利y(元),与该周每天销售这种服装件数x之间的一组数据关系如下表所示:
已知
(1)求,y;
(2)画出散点图;
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。