3.2独立性检验的基本思想及其应用(1)
【学情分析】:
在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断问题,并理解统计思维与确定性思维的差异。
【教学目标】:
(1)知识与技能:理解分类变量的含义;会根据收集的数据列出2×2列联表,并会阅读三维柱形图和二维条形图,并粗略判断两个分类变量是否有关系;理解假设检验思想,会利用独立性检验精确判断两个分类变量是否有关系;
(2)过程与方法:利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法;
(3)情感态度与价值观:通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;在合作讨论中学会交流与合作,启迪思维,提高创新能力;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。
【教学重点】:理解独立性检验的基本思想及实施步骤。
【教学难点】:.(1)了解独立性检验的基本思想;
(2)了解随机变量的含义,太大认为两个分类变量是有关系的。
【教学过程设计】:
教学环节
教学活动
设计意图
一、问题引入
1.介绍分类变量的概念:变量的不同”值”表示个体所属的不同类别,如性别变量男女,是否吸烟,宗教信仰,国籍等.
2. 在日常生活中,我们关心两个分类变量之间是否有关系,如:吸烟是否与患肺癌有关?
引例.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸烟
2099
49
2148
总计
9874
91
9965
那么吸烟是否对患肺癌有影响?
为探索新知识做准备.
二、探究新知
教师引导:统计学中一般采取什么方式手段研究分析解决问题? 如何运用统计学的方法进行分析判断?
学生探究:
1.利用频率分布表判断;
不患肺癌
患肺癌
总计
不吸烟
99.46%
0.54%
1
吸烟
97.72%
2.28%
1
由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有影响;
2.利用统计图直观判断
(1) 通过三维柱形图判断两个分类变量是否有关系:
由图中能清晰看出各个频数的相对大小, 由患肺癌在吸烟者与不吸烟者中的相对频数差异可粗略估计吸烟对患肺癌有影响;
(2) 通过二维条形图判断两个分类变量是否有关系:
作出患肺癌在吸烟者与不吸烟者中的的频率条形图
由图中可看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例, 可估计吸烟对患肺癌有影响.
教师引导:上面通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否如此呢?并且能够以多大的把握认为”吸烟与患肺癌有关”?能否用统计学观点进一步考察这个问题.
师生共同探究:
为研究的一般性,在列联表中用字母代替数字
不患肺癌
患肺癌
总计
不吸烟
a
b
a+b
吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
师:若假设吸烟与患肺癌两个变量没有关系,则应得到什么结论?
生:在吸烟者中患肺癌的比例约等于不吸烟者中患肺癌的比例,即
a/a+b≈c/c+d a(c+d) ≈ c(a+b) ad -bc ≈ 0
师:若计算ad –bc的结果,由此可以初步得出什么结论?
生:︱ad –bc︱越小,说明吸烟与患肺癌之间关系越弱;
︱ad –bc︱越大,说明吸烟与患肺癌之间关系越强.
师:为使不同的样本容量的数据有统一的评判标准,可构造一个随机变量
其中 为样本容量
若假设成立,应该很小;若很大,说明假设不成立,即两变量有关系. 利用上述公式,可计算出问题中的的观测值为
同学们肯定会提出同一问题:那么这个值是不是很大?怎样才算很大?
在假设成立的情况下,统计学家估算出如下的概率:
现在的观测值56.632远大于6.635,即假设成立的概率为0.01,是小概率事件,也就是假设不合理的程度约为99%,,因此可以下结论:有99%的把握认为“吸烟与患肺癌有关系”。这就是两个分类变量独立性检验的基本思想,可以表述为:当 很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系。
师:类比反证法的原理,你能否总结出独立性检验的基本步骤?
生:(1)假设两个分类变量与无关系;
(2)计算出的观测值;
(3)把k的值与临界值比较确定与有关的程度或无关。
鼓励学生自己寻找研究问题的一般统计学的方法
通过图表的方法,使学生巩固统计学中一般研究问题的基本思路。
利用独立事件同时发生的概率公式启发学生做出假设
采用类比的方法,便于学生理解假设检验的思想
三、形成方法
方法总结:
要推断“X与Y有关系”成立的可能性的方法:
1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系, (1) ︱ad -bc︱ (2) a/a+b≈c/c+d
2、利用独立性检验精确判断两个分类变量是否有关系
(1)假设无关 (2)求k值 (3)下结论
培养学生归纳的能力
四、练习巩固
1、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个变量有关系的可能性就( A )
A.越大 B.越小 C.无关系 D.无法确定
2、对于2×2列联表,在二维条形图中,两个比例的值相差越大,则
“与有关系”的可能性 越大 。
3、为了调查高中生的数学成绩和物理成绩的关系,在某校随机抽取部分学生做调查,得到下列两份图表
根据以上图表,列出相应的列联表,根据图形回答,数学成绩好坏与物理成绩好坏 关系。
解:列联表如下:
物理好
物理差
合计
数学好
80
120
200
数学差
70
30
100
合计
150
150
300
根据图形,可知数学成绩好坏与物理成绩好坏 有 关系。
巩固知识,培养技能.
五、拓展与提高
思考:
1、某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的,今研制一种新的预防药,任选5只羊做试验,结果这5只羊服用此药后均未患病,问此药是否有效?
解:假设药无效,5只羊都不生病的概率是,这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明假设不对,即药是有效的。
2、某接待站在某一周曾接待过12次来访,已知所有这12次接待都是在周二和周四进行的,问是否可以推断接待时间是有规定的?
解:利用小概率事件进行判断。假设接待时间没有有规定,即一周内任意一天都等可能,则12次接待在周二和周四的概率为,即千万分之三,根据小概率事件在一次实验中几乎不可能发生的思想,可知假设不成立,即可推断接待时间是有规定的。
加深学生对假设检验思想的理解,能应用于实际问题中
五、小结
判断两个分类变量是否有关的方法
反思归纳
六、作业
1为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:
患病
未患病
总计
服用药
10
45
55
未服用药
20
30
50
总计
30
75
105
请问有多大把握认为药物有效?
2、通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:
女
男
总计
读营养说明
16
28
44
不读营养说明
20
8
28
总计
36
36
72
请问性别和读营养说明之间在多大程度上有关系?
同步练习与测试:
(基础题)
1、根据下表计算:
不看电视
看电视
男
37
85
女
35
143
计算随机变量的观测值k= 。
解:把表格补充完整
不看电视
看电视
总计
男
37
85
122
女
35
143
178
总计
72
228
300
4.51
2、独立性检验常作的图形是 和 。
答案 :三维柱形图 ,二维条形图
3、两个临界值为3.841与6.635。当时,认为事件A与B是 (填“有关的”或“无关的”);当时,有99%的把握说事件A与B是 (填“有关的”或“无关的”)。
答案:无关的 ,有关的
4、用统计量进行独立性检验时使用的表称为 ,要求表中的四个数据大于 。
答案:列联表 ,5
(中等题)
5、设A为一随机事件,则下列式子中不正确的是()
A. B.
C. D.
答案:选C
6、统计假设成立时,有以下判断:
其中真命题个数是( )
A.1 B.2 C.3 D.4
答案:选C
7、设事件A与B相互独立,则(1)和B相互独立;(2)和A相互独立;(3)和相互独立,其中真命题是( )
A.(1)(2) B.(1)(3) C.(2)(3) D.(1)(2)(3)
答案:选D