第三章 统计案例
3.2 独立性检验的基本思想及其初步应用
A级 基础巩固
一、选择题
1.若用独立性检验的方法,我们得到能有99%的把握认为变量X与Y有关系,则( )
A.K2≥2.706 B.K2≥6.635
C.K2<2.706 D.K2<6.635
解析:根据临界值表可知,选项B正确.
答案:B
2.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
分类
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为( )
A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5 D.a=2,b=3,c=5,d=4
解析:比较.选项A中,=;选项B中,=;选项C中 ,=;选项D中,=.所以选项D正确.
答案:D
3.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出( )
A.性别与喜欢理科无关
B.女生中喜欢理科的比为80%
C.男生比女生喜欢理科的可能性大些
D.男生不喜欢理科的比为60%
解析:从等高条形图可以看出,男生比女生喜欢理科的可能性大些.
答案:C
4.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.
A.① B.①③
C.③ D.②
解析:①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A、B,③正确.排除D,所以选项C正确.
答案:C
5.某校为了研究初一学生吃零食是否与性别有关,从初一年级抽取了100名学生调查购买零食的费用,规定每月在零食上花费不低于30元的为吃零食较多,每月在零食上花费不满30元的为吃零食较少.根据收集的数据得到了一个2×2列联表,并计算得出K2的观测值为k=4.365,则下列结论正确的是( )
A.有97.5%的把握认为“初一学生吃零食与性别有关”
B. 有95%的把握认为“初一学生吃零食与性别有关”
C. 该校初一学生中有95%的学生吃零食较多
D. 该校初一学生中有95%的女生吃零食较多
解析:因为k=4.365>3.841,所以有95%的把握认为“初一学生吃零食与性别有关”.
答案:B
二、填空题
6.下列关于K2的说法中,正确的有________.
①K2的值越大,两个分类变量的相关性越大;
②若求出K2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;
③独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则做出拒绝H0的推断.
解析:对于①,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错误;根据独立性检验的概念和临界值表知②③正确.
答案: ②③
7.某小学对232名小学生调查发现:180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,用独立性检验的方法判断多动症与性别________(填“有关”或“无关”).
解析:由题目数据列出如下列联表:
性别
多动症
无多动症
总计
男生
98
82
180
女生
2
50
52
总计
100
132
232
由表中数据可看到
k=≈42.117>10.828.
所以,在犯错误的概率不超过0.001的前提下,认为多动症与性别有关系.
答案:有关
8. 某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有________的把握认为糖尿病患者与遗传有关系.
解析:先作出如下糖尿病患者与遗传列联表(单位:人):
家族
糖尿病发病
糖尿病不发病
总计
阳性家族史
16
93
109
阴性家族史
17
240
257
总计
33
333
366
根据列联表中的数据,得到K2的观测值为k=≈6.067>5.024.故我们有97.5%的把握认为糖尿病患者与遗传有关系.
答案:97.5%
三、解答题
9.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:
分类
患病
未患病
总计
服用药
10
45
55
未服用药
20
30
50
总计
30
75
105
试用等高条形图分析服用药和患病之间是否有关系.
解:根据列联表所给的数据可得出服用药患病的频率为≈0.18,未服用药患病的频率为=0.4,
两者的差距是|0.18-0.4|=0.22,两者相差很大,
作出等高条形图如图所示,
因此服用药与患病之间有关系的程度很大.
10.为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2分别是注射药物A和药物B后的试验结果(疱疹面积单位:mm2).
表1 注射药物A后皮肤疱疹面积的频数分布表
疱疹面积
60,65)
65,70)
70,75)
75,80)
频数
30
40
20
10
表2 注射药物B后皮肤疱疹面积的频数分布表
疱疹面积
60,65)
65,70)
70,75)
75,80)
80,85)
频数
10
25
20
30
15
完成表3中的2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
表3
药物
疱疹面积小于
70 mm2
疱疹面积不小于
70 mm2
总计
注射药物A
a=
b=
注射药物B
c=
d=
总计
n=
解:表3完成如下:
药物
疱疹面积小于
70 mm2
疱疹面积不小于
70 mm2
总计
注射药物A
a=70
b=30
100
注射药物B
c=35
d=65
100
总计
105
95
n=200
由列联表中的数据,得K2的观测值为k=≈24.561>10.828.
因此,有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
B级 能力提升
1.有两个分类变量x,y,其2×2列联表如下表.其中a,15-a均为大于5的整数,若在犯错误的概率不超过0.1的前提下认为“x与y之间有关系”,则a的取值应为( )
变量
y1
y2
x1
a
20-a
x2
15-a
30+a
A.5或6 B. 6或7
C.7 或8 D.8或9
解析:查表可知,要使在犯错误的概率不超过0.1的前提下,认为K2之间有关系,则K2>2.706,而K2===,要使K2>2.706得a>7.19或a<2.04.又因为a>5且15-a>5,a∈Z,所以a=8或9,故当a取8或9时在犯错误的概率不超过0.1的前提下,认为“x与y之间有关系”.
答案:D
2.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
分类
又发作过心脏病
未发作过心脏病
总计
心脏搭桥手术
39
157
196
血管清障手术
29
167
196
总计
68
324
392
试根据上述数据计算K2=________,比较这两种手术对病人又发作心脏病的影响有没有差别_________.
解析:提出假设H0:两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得K2的观测值.k=≈1.78.
当H0成立时,K2=1.78,又K2<2.072的概率为0.85.所以,不能否定假设H0.也就是不能做出这两种手术对病人又发作心脏病的影响有差别的结论.
答案:1.78 不能做出这两种手术对病人又发作心脏病的影响有差别的结论
3.某教育科研机构研发了一款新的学习软件,为了测试该软件的受欢迎程度,该公司在某市的两所初中和两所小学按分层抽样法抽取部分学生进行了调研.已知这四所
学校在校学生有9 000人,其中小学生5 400人,参加调研的初中生有180人.
(1)参加调研的小学生有多少人?
(2)该科研机构将调研的情况统计后得到下表:
学生
喜爱使用
该学习软件
不太喜爱使用
该学习软件
总计
初中生
60
120
180
小学生
90
总计
请将上表填写完整,并据此说明是否有99.9%的把握认为“喜爱使用该学习软件”与“学生年龄”有关.
解:(1)这四所学校共9 000人,其中小学生5 400人,
所以初中生有3 600人,
因为参加调研的初中生有180人,
所以抽取比例为=.
所以参加调研的小学生有5 400×=270(人).
(2)由(1)知参加调研的总人数为180+270=450,
所以表格中的数据如下表所示:
学生
喜爱使用
该学习软件
不太喜爱使用
该学习软件
总计
初中生
60
120
180
小学生
180
90
270
总计
240
210
450
因为,K2=≈16.071>10.828,
所以有99.9%的把握认为“喜爱玩该游戏”与“学生年龄”有关.