章末综合测评(三) 统计案例
(时间120分钟,满分150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法中错误的是( )
A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(xi,yi)(i=1,2,…,n)将散布在某一条直线的附近
B.如果两个变量x与y之间不存在着线性关系,那么根据它们的一组数据(xi,yi)(i=1,2,…,n)不能写出一个线性方程
C.设x,y是具有相关关系的两个变量,且y关于x的线性回归方程为=x+,叫做回归系数
D.为使求出的线性回归方程有意义,可用统计检验的方法来判断变量y与x之间是否存在线性相关关系
【解析】 任何一组(xi,yi)(i=1,2,…,n)都能写出一个线性方程,只是有的不存在线性关系.
【答案】 B
2.如图1所示,有5组数据,去掉哪组数据后(填字母代号),剩下的4组数据的线性相关性最大( )
图1
A.E B.C
C.D D.A
【解析】 由题图易知A,B,C,D四点大致在一条直线上,而E点偏离最远,故去掉E点后剩下的数据的线性相关性最大.
【答案】 A
3.在一次试验中,当变量x的取值分别为1,,,时,变量y的值分别为2,3,4,5,则y与的回归曲线方程为( ) 【导学号:97270064】
A.=+1 B.=+3
C.=2x+1 D.=x-1
【解析】 由数据可得,四个点都在曲线=+1上.
【答案】 A
4.有下列说法:
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
②用相关指数R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;
③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.
其中正确命题的个数是( )
A.0 B.1
C.2 D.3
【解析】 ①选用的模型是否合适与残差点的分布有关;对于②③,R2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.
【答案】 D
5.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A B
C D
【解析】 在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.
【答案】 D
6.在2×2列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( )
A.与 B.与
C.与 D.与
【解析】 当ad与bc相差越大,两个分类变量有关系的可能性越大,此时与相差越大.
【答案】 A
7.如图2,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )
图2
A.相关系数r变大
B.残差平方和变大
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
【解析】 由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.
【答案】 B
8.(2016·安庆一中期中)在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )
说谎
不说谎
总计
男
6
7
13
女
8
9
17
总计
14
16
30
A.在此次调查中有95%的把握认为是否说谎与性别有关
B.在此次调查中有99%的把握认为是否说谎与性别有关
C.在此次调查中有99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分证据显示说谎与性别有关
【解析】 由表中数据得k=≈0.002 42<3.841.
因此没有充分证据认为说谎与性别有关,故选D.
【答案】 D
9.某地财政收入x与支出y满足线性回归方程=x++e(单位:亿元),其中=0.8,=2,|e|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿 B.9亿
C.10.5亿 D.9.5亿
【解析】 代入数据得y=10+e,∵|e|<0.5,
∴|y|<10.5,故不会超过10.5亿.
【答案】 C
10.(2016·合肥高二检测)废品率x%和每吨生铁成本y(元)之间的回归直线方程为=256+3x,表明( )
A.废品率每增加1%,生铁成本增加259元
B.废品率每增加1%,生铁成本增加3元
C.废品率每增加1%,生铁成本平均每吨增加3元
D.废品率不变,生铁成本为256元
【解析】 回归方程的系数表示x每增加一个单位,平均增加个单位,当x为1时,废品率应为1%,故当废品率增加1%时,生铁成本平均每吨增加3元.
【答案】 C
11.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,C.a′ D.【解析】 由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,b′=2,a′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得===,=-=-×=-,所以a′.
【答案】 C
12.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于( )
A.3 B.4 C.5 D.6
附:
P(K2≥k0)
0.05
0.025
k0
3.841
5.024
【解析】 2×2列联表如下:
x1
x2
总计
y1
10
21
31
y2
c
d
35
总计
10+c
21+d
66
故K2的观测值k=≥5.024.
把选项A,B,C,D代入验证可知选A.
【答案】 A
二、填空题(本大题共4小题,每小题5分,共20分.将答案填在题中的横线上)
13.已知一回归直线方程为=1.5x+45,x∈{1,5,7,13,19},则=________. 【导学号:97270065】
【解析】 因为=(1+5+7+13+19)=9,且=1.5+45,所以=1.5×9+45=58.5.
【答案】 58.5
14.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:
积极支持企业改革
不赞成企业改革
总计
工作积极
54
40
94
工作一般
32
63
95
总计
86
103
189
对于人力资源部的研究项目,根据上述数据试求K2的观测值为________.
【解析】 根据列联表中的数据,得到k=
≈10.76.
【答案】 10.76
15.(2016·深圳高二检测)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
零件数x(个)
10
20
30
40
50
加工时间Y(min)
62
75
81
89
现发现表中有一个数据模糊看不清,请你推断出该数据的值为________.
【解析】 由表知=30,设模糊不清的数据为m,则=(62+m+75+81+89)=,因为=0.67+54.9,
即=0.67×30+54.9,
解得m=68.
【答案】 68
16.某地区恩格尔系数Y(%)与年份x的统计数据如下表:
年份x
2006
2007
2008
2009
恩格尔系数Y(%)
47
45.5
43.5
41
从散点图可以看出Y与x线性相关,且可得回归方程为=x+4 055.25,据此模型可预测2017年该地区的恩格尔系数Y(%)为________.
【解析】 由表可知=2 007.5,=44.25.
因为= +4 055.25,
即44.25=2 007.5+4 055.25,
所以≈-2,所以回归方程为=-2x+4 055.25,令x=2 017,得=21.25.
【答案】 21.25
三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)以下是某地区不同身高的未成年男性的体重平均值表.
身高/cm
60
70
80
90
100
110
体重/kg
6.13
7.9
9.99
12.15
15.02
17.5
身高/cm
120
130
140
150
160
170
体重/kg
20.92
26.86
31.11
38.85
42.25
55.05
(1)给出两个回归方程:
①y=0.429 4x-25.318,
②y=2.004e0.019 7x.
通过计算,得到它们的相关指数分别是:R=0.9311,R=0.998.试问哪个回归方程拟合效果更好?
(2)若体重超过相同身高男性平均值的1.2倍为偏胖,低于0.8为偏瘦,那么该地区某中学一男生身高为175 cm,体重为78 kg,他的体重是否正常?
【解】 (1)∵R>R,
∴选择第二个方程拟合效果更好.
(2)把x=175代入y=2.004e0.019 7x,
得y=62.97,
由于=1.24>1.2,所以这名男生偏胖.
18.(本小题满分12分)关于x与y有如下数据:
x
2
4
5
6
8
y
30
40
60
50
70
为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲模型=6.5x+17.5,乙模型=7x+17,试比较哪一个模型拟合的效果更好.
【解】 R=1-=1-=0.845,
R=1-=1-=0.82.
又∵84.5%>82%,
∴甲选用的模型拟合效果更好.
19.(本小题满分12分)为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件.试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?
【解】 (1)2×2列联表如下:
合格品数
次品数
总计
甲在生产现场
982
8
990
甲不在生产现场
493
17
510
总计
1 475
25
1 500
由列联表可得|ac-bd|=|982×17-493×8|=12 750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.
(2)由2×2列联表中数据,计算得到K2的观测值为
k=≈13.097>6.635,
所以在犯错误的概率不超过0.01的前提下,认为质量监督员甲是否在生产现场与产品质量有关系.
20.(本小题满分12分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:
y1
y2
x1
a
20-a
x2
15-a
30+a
其中a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系?
【解】 查表可知,要使在犯错误的概率不超过0.1的前提下认为x与y之间有关系,则k≥2.706,而
k=
==.
故k≥2.706,得a≥7.19或a≤2.04.
又a>5且15-a>5,a∈Z,解得a=8或9,
故a为8或9时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系.
21.(本小题满分12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年 份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
=,=-.
【解】 (1)由所给数据计算得=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
===0.5,
=-=4.3-0.5×4=2.3,
所求回归方程为=0.5t+2.3.
(2)由(1)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入(1)中的回归方程,得
=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
22.(本小题满分12分)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
图3
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(1)根据已知条件完成下面的2×2列联表,并据此资料判断“体育迷”与性别是否有关?
非体育迷
体育迷
总计
男
女
总计
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,
若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
附:K2=,
P(K2≥k0)
0.05
0.01
k0
3.841
6.635
【解】 (1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成2×2列联表如下:
非体育迷
体育迷
总计
男
30
15
45
女
45
10
55
总计
75
25
100
将2×2列联表中的数据代入公式计算,得
k==
=≈3.030.因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.
(2)由频率分布直方图可知,“超级体育迷”为5人,其中女生为2人.
记:从“超级体育迷”中取2人,至少有1名女性为事件A.
则P(A)==,
即从“超级体育迷”中任意选取2人,至少有1名女性观众的概率为.
相关推荐
-
高中数学选修2-1配套课时作业:第三章 空间向量与立体几何 3.1.5 Word版含答案
06-24 -
高中数学选修2-3 第一章 计数原理 1.1-第1课时学业分层测评 Word版含答案
06-24 -
高中数学选修2-3 第二章 随机变量及其分布 2.3-2.3.2学业分层测评 Word版含答案
06-24 -
高中数学必修四课时训练 平面向量应用举例 2.5.1 Word版含答案
06-24 -
高中数学必修3配套单元检测:第一章 单元检测 A卷 Word版含答案
06-23 -
高中数学选修2-3练习:2.4 正态分布 Word版含解析
06-23 -
高中数学选修2-3练习:2.1.1 离散型随机变量 Word版含解析
06-23 -
高中数学选修2-1配套课时作业:第三章 空间向量与立体几何 3.1.2 Word版含答案
06-22 -
高中数学选修2-2课时作业:第一章 导数及其应用1.2.2基本初等函数的导数公式及导数的运算法则三
06-22 -
高中数学必修4课时达标检测(十二)函数y=Asin(ωx+φ)的图象(一) Word版含解析
06-22