阶段质量检测(一)
一、选择题(本大题共10小题,每小题5分,共50分)
1.对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )
A.函数关系 B.线性关系
C.相关关系 D.回归关系
解析:选C 由相关关系的概念可知,C正确.
2.在一线性回归模型中,计算其相关指数R2=0.96,下面哪种说法不够妥当( )
A.该线性回归方程的拟合效果较好
B.解释变量对于预报变量变化的贡献率约为96%
C.随机误差对预报变量的影响约占4%
D.有96%的样本点在回归直线上
解析:选D 由相关指数R2表示的意义可知A、B、C三种说法都很妥当,相关指数R2=0.96,其值较大,说明残差平方和较小,绝大部分样本点分布在回归直线附近,不一定有96%的样本点在回归直线上,故选D.
3.(湖北高考改编)根据如下样本数据得到的回归方程为=x+,则( )
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
A.>0,<0 B.>0,>0
C.<0,<0 D.<0,>0
解析:选A 作出散点图如下:
观察图象可知,回归直线=x+的斜率<0,当x=0时,=>0,故>0,<0.
4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是=-0.7x+,则=( )
A.10.5 B.5.15
C.5.2 D.5.25
解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得=5.25.
5.下面的等高条形图可以说明的问题是( )
A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的
B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同
C.此等高条形图看不出两种手术有什么不同的地方
D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握
解析:选D 由等高条形图可知选项D正确.
6.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为=7.19x+73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是( )
A.身高一定为145.83 cm
B.身高大于145.83 cm
C.身高小于145.83 cm
D.身高在145.83 cm左右
解析:选D 用线性回归方程预测的不是精确值,而是估计值.当x=10时,y=145.83,只能说身高在145.83 cm左右.
7.在2×2列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( )
A.与 B.与
C.与 D.与
解析:选A 当ad与bc相差越大,两个分类变量有关系的可能性越大,此时与相差越大.
8.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )
A.相关系数r变大
B.残差平方和变大
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
解析:选B 由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.
9.已知变量x,y之间具有线性相关关系,其回归方程为=-3+x,若i=17,i=4,则的值为( )
A.2 B.1
C.-2 D.-1
解析:选A 依题意知,==1.7,==0.4,而直线=-3+x一定经过点(,),所以-3+×1.7=0.4,解得=2.
10.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于( )
A.3 B.4
C.5 D.6
解析:选A 列2×2列联表如下:
x1
x2
总计
y1
10
21
31
y2
c
d
35
总计
10+c
21+d
66
故K2的观测值
k=≥5.024.
把选项A、B、C、D代入验证可知选A.
二、填空题(本大题共4小题,每小题5分,共20分)
11.给出下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木,其断面直径与高度之间的关系;
⑤学生与他(她)的学号之间的关系.
其中有相关关系的是________(填序号).
解析:利用相关关系的概念判断.①是不确定关系.②曲线上的点与该点坐标是一种对应关系,即每一个点对应一个坐标,是确定关系.⑤学生与其学号也是确定的对应关系.
答案:①③④
12.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是________.
解析:设回归直线的方程为=x+.
回归直线的斜率的估计值是1.23,即=1.23.
又回归直线过样本点的中心(4,5),
所以5=1.23×4+,解得=0.08,
故回归直线的方程为=1.23x+0.08.
答案:=1.23x+0.08
13.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表.由表中数据得线性回归方程=x+,其中=-2.现预测当气温为-4℃时,用电量的度数约为________.
用电量y/度
24
34
38
64
气温x/℃
18
13
10
-1
解析:由题意可知
=×(18+13+10-1)=10,
=×(24+34+38+64)=40,
=-2.
又回归直线=-2x+过点(10,40),
故=60,
所以当x=-4时,=-2×(-4)+60=68.
答案:68
14.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得k≈3.918,经查对临界值表P(K2≥3.841)≈0.05.对此,四名同学做出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列命题中,正确的是________(填序号).
①p∧(綈q); ②(綈p)∧q;
③(綈p∧綈q)∧(r∨s); ④(p∨綈r)∧(綈q∨s).
解析:查对临界值表知P(K2≥3.841)≈0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”;95%仅是指“血清能起到预防感冒的作用”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能,故p真,其余都假.结合复合命题的真假可知,选①④.
答案:①④
三、解答题(本大题共4小题,共50分.解答时应写出文字说明、证明过程或演算步骤)
15.(本小题满分12分)某地区在调查一种传染病与饮用水的关系时得到如下数据:饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.画出列联表,并说明能否在犯错误的概率不超过0.10的前提下认为这种疾病与饮用水有关.
解:依题意得2×2列联表:
得病
不得病
合计
干净水
5
50
55
不干净水
9
22
31
总计
14
72
86
此时,由题中数据可得K2的观测值
k=≈5.785,
由于5.785>2.706,故在犯错误的概率不超过0.10的前提下认为这种传染病与饮用不干净水有关系.
16.(本小题满分12分)某同学6次考试的数学、语文成绩在班中的排名x,y如下表:
x
7
6
5
3
2
1
y
13
11
9
6
4
2
对上述数据用线性回归方程=x+来拟合y与x之间的关系.
解:由于=4,=7.5,
(xi-)(yi-)=50,
(xi-)2=28,
那么==≈1.786,
=-=7.5-1.786×4=0.356.
此时可得=1.786x+0.356.
17.(本小题满分12分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:
y1
y2
x1
a
20-a
x2
15-a
30+a
其中a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系?
解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x与y之间有关系,则k≥2.706,而
k=
=
=.
由k≥2.706得a≥7.19或a≤2.04.
又a>5且15-a>5,a∈Z,即a=8或9,
故a为8或9时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系.
18.(本小题满分14分)在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:
年龄x
23
27
39
41
45
49
50
脂肪
含量y
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄x
53
54
56
57
58
60
61
脂肪
含量y
29.6
30.2
31.4
30.8
33.5
35.2
34.6
(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;
(2)求相关指数R2,并说明其含义;
(3)给出37岁时人的脂肪含量的预测值.
解:(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.
设线性回归方程为=x+,
则由计算器算得≈0.576,≈-0.448,
所以线性回归方程为=0.576x-0.448.
(2)残差平方和: = (yi-i)2≈37.20,
总偏差平方和: (yi-)2≈644.99,
R2=1-≈0.942,
表明年龄解释了94.2%的脂肪含量变化.
(3)当x=37时,=0.576×37-0.448≈20.9,故37岁时人的脂肪含量约为20.9%.
(时间90分钟,满分120分)
一、选择题(本大题共10小题,每小题5分,共50分)
1.在画两个变量的散点图时,下面叙述正确的是( )
A.预报变量在x轴上,解释变量在y轴上
B.解释变量在x轴上,预报变量在y轴上
C.可以选择两个变量中任意一个变量在x轴上
D.可以选择两个变量中任意一个变量在y轴上
解析:选B 在散点图中,预报变量在y轴上,解释变量在x轴上.
2.在回归分析中,残差图中的纵坐标为( )
A.残差 B.样本编号 C. D.(n)
解析:选A 残差是真实值与预报值的差,残差分析就是对这些残差画出残差图进行分析,在残差图中,横坐标代表编号,纵坐标代表残差.
3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是( )
x
4
5
6
7
8
9
10
y
14
18
19
20
23
25
28
A.线性函数模型 B.二次函数模型
C.指数函数模型 D.对数函数模型
解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.
4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为( )
P(K2>k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.25% B.95%
C.5% D.97.5%
解析:选D ∵k>5.024,而在观测值表中对应于5.024的是0.025,∴有1-0.025=97.5%的把握认为“X和Y有关系”,故选D.
5.如图所示,图中有5组数据,去掉________(填字母代号)组数据后,剩下的4组数据的线性相关性最大 ( )
A.E B.C
C.D D.A
解析:选A ∵A,B,C,D四点分布在一条直线附近且贴近某一直线,E点离得远,∴去掉E点剩下的4组数据的线性相关性最大.故答案为A.
6.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为( )
A.=2x+1 B.=x+2
C.=x+1 D.=x-1
解析:选C ∵==2.5,==3.5,∴这组数据的样本中心点是(2.5,3.5),把样本中心点代入四个选项中,只有=x+1成立,故选C.
7.为判定喜欢黑色的人是否易患抑郁症,对91名大学生进行调查,得到如下2×2列联表:
患抑郁症
未患抑郁症
合计
喜欢黑色
15
32
47
不喜欢黑色
14
30
44
合计
29
62
91
附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
则下列说法正确的是( )
A.在犯错误的概率不超过0.01的前提下认为喜欢黑色与患抑郁症有关系
B.在犯错误的概率不超过0.05的前提下认为喜欢黑色与患抑郁症有关系
C.在犯错误的概率不超过0.1的前提下认为喜欢黑色与患抑郁症有关系
D.不能认为喜欢黑色与患抑郁症有关系
解析:选D 经计算K2≈9.8×10-5≤3.841,故没有理由认为喜欢黑色与患抑郁症有关.
8.为了评价某个电视栏目改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算得K2≈0.99.根据这一数据分析,下列说法正确的是 ( )
A.有99%的人认为该栏目优秀
B.有99%的人认为该栏目是否优秀与改革无关
C.有99%的把握认为该栏目是否优秀与改革有关系
D.没有充分理由认为该栏目是否优秀与改革有关系
解析:选D 只有K2>6.635才能有99%的把握认为该栏目是否优秀与改革有关系,而即使K2>6.635也只是对“该栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论.故选D.
9.若残差平方和是325,总偏差平方和是923,则随机误差对预报变量变化的贡献率为( )
A.64.8% B.60%
C.35.2% D.40%
解析:选C 相关指数R2表示解释变量对预报变量变化的贡献率,故随机误差对预报变量变化的贡献率为
×100%=×100%≈35.2%.
10.下面是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出( )
A.性别与喜欢理科无关
B.女生中喜欢理科的百分比为80%
C.男生比女生喜欢理科的可能性大些
D.男生不喜欢理科的百分比为60%
解析:选C 由等高条形图可知,女生中喜欢理科的百分比约为1-0.8=0.2=20%,
男生中喜欢理科的百分比约为1-0.4=0.6=60%,
因此男生比女生喜欢理科的可能性大些.
二、填空题(本大题共4小题,每小题5分,共20分)
11.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:以x+1代x,得=0.254(x+1)+0.321,
与=0.254x+0.321相减可得,
年饮食支出平均增加0.254万元.
答案:0.254
12.在线性回归方程y=a+bx中,b为回归系数,下列关于b的说法中正确的是________(填序号).
①b为回归直线的斜率;
②b>0,表示随x增加,y值增加,b<0,表示随x增加,y值减少;
③b是唯一确定的值;
④回归系数b的统计意义是当x每增加(或减少)一个单位,y平均改变b个单位.
解析:b是由总体的一个样本,利用一定的方法得到的,选择不同的样本或不同的计算方法得到的b是不同的,故③错.
答案:①②④
13.独立性检验显示:有90%的把握认为性别与是否喜爱喝酒有关.下列说法中正确的是________(填序号).
①在100个男性中约有90个人爱喝酒;
②如果某人爱喝酒,那么此人为男性的可能性为90%;
③认为性别与是否喜爱喝酒有关判断出错的可能性为10%;
④有90%的把握认为10个男性中有9个人爱喝酒.
解析:根据独立性检验的概念可知③正确,其他说法均错误.
答案:③
14.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程=3-5x,变量x增加1个单位时,y平均增加5个单位;
③线性回归方程=x+必过(,);
④在一个2×2列联表中,由计算得K2=13.079,则在犯错误的概率不超过0.001的前提下认为这两个变量间有关系.
其中错误的个数是________.
本题可以参考独立性检验临界值表:
P(K2≥k0)
0.5
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解析:①将一组数据中的每个数据都加上或减去同一个常数后,因为D(X+b)=D(X),其稳定性不变,所以方差恒不变;②设有一个回归方程=3-5x,变量x增加1个单位时,y平均减少5个单位,而不是增加5个单位;③线性回归方程=x+必过(,);④在一个2×2列联表中,由计算得K2=13.079,13.079>10.828,且P(K2>10.828)=0.001,所以在犯错误的概率不超过0.001的前提下认为这两个变量间有关系.因此,①③④正确,②错误,故只有1个错误的说法.
答案:1
三、解答题(本大题共4小题,共50分.解答时应写出文字说明、证明过程或演算步骤)
15. (本小题满分12分)在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外的27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外的33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)能否在犯错误的概率不超过0.025的前提下认为性别与休闲方式有关系?
解:(1)2×2列联表为:
看电视
运动
总计
女
43
27
70
男
21
33
54
总计
64
60
124
(2)由列联表中的数据,计算K2的观测值
k=≈6.201.
因为6.201>5.024,因此在犯错误的概率不超过0.025的前提下认为性别与休闲方式有关系.
16.(本小题满分12分)某种产品的广告费用支出x万元与销售额y万元之间有如下的对应数据:
x
2
4
5
6
8
y
20
30
50
50
70
(1)根据上表提供的数据,求出y关于x的回归直线方程;
(2)据此估计广告费用为10万元时所得的销售收入.(x=145,xiyi=1 270)
解:(1)==5,
==44,
===8.5,
=-=44-8.5×5=1.5,
∴回归直线方程为=8.5x+1.5.
(2)当x=10时,预报y的值为=8.5×10+1.5=86.5(万元).所以所得的销售收入约为86.5万元.
17.(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别的列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.
附: K2=
P(K2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
解:(1)300×=90,
所以应收集90位女生的样本数据.
(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以估计该校学生每周平均体育运动时间超过4小时的概率为0.75.
(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别的列联表如下:
每周平均体育运动时间与性别的列联表
男生
女生
总计
每周平均体育运动时间不超过4小时
45
30
75
每周平均体育运动时间超过4小时
165
60
225
总计
210
90
300
结合列联表可算得K2的观测值
k==≈4.762>3.841.
所以在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.
18.(本小题满分14分)以下资料是一位销售经理收集到的年销售额y(千元)和销售经验x(年)的关系:
销售经验x/年
1
3
4
4
6
8
10
10
11
13
年销售额y/千元
80
97
92
102
103
111
119
123
117
136
(1)根据这些数据画出散点图并作直线=78+4.2x,计算 (yi-i)2;
(2)依据这些数据求回归直线方程并据此计算
(yi-i)2;
(3)比较(1)(2)中的残差平方和 (yi-i)2的大小.
解:(1)散点图与直线=78+4.2x的图形如图,
对x=1,3,…,13,有
i=82.2,90.6,94.8,94.8,103.2,111.6,120,120,124.2,132.6,
(yi-i)2=179.28.
(2)=xi=7,
xiyi=8 128,
x=632,
=yi=108,
∴=4,=-=108-4×7=80,
故=80+4x,对x=1,3,…,13,有
i=84,92,96,96,104,112,120,120,124,132,
(yi-i)2=170.
(3)比较可知,(2)中求出的 (yi-i)2较小.
相关推荐
-
高中数学选修1-1 章末综合测评1 Word版含答案
08-17 -
高中数学选修1-1 第二章圆锥曲线与方程 学业分层测评12 Word版含答案
08-16 -
高中数学选修1-1课时提升作业2椭圆及其标准方程Word版含答案
08-14 -
高中数学选修1-2课时提升作业(一) 1.回归分析的基本思想及其初步应用 探究导学课型 Word版含答案
08-14 -
高中数学选修1-2期中综合检测(一~二) Word版含解析
08-14 -
高中数学选修1-1课时自测3.4 生活中的优化问题举例Word版含答案
08-13 -
高中数学选修1-1课时自测2.1.2 椭圆的简单几何性质 第2课时 椭圆方程及性质的应用Word版含答案
08-13 -
人教版高中数学必修二检测圆与方程 课后提升作业 二十九 4.3.1 Word版含解析
08-13 -
高中数学选修1-1课时自测2.1.2 椭圆的简单几何性质 第1课时 椭圆的简单几何性质Word版含答案
08-12 -
高中数学选修1-2课时跟踪检测(九) 复数代数形式的加减运算及其几何意义 Word版含解析
08-12