学业分层测评
(建议用时:45分钟)
[学业达标]
一、选择题
1.为了研究变量x和y的线性相关性,甲、乙两人分别利用线性回归方法得到回归直线l1和l2,已知两人计算过程中,分别相同,则下列说法正确的是( )
A.l1与l2一定平行
B.l1与l2重合
C.l1与l2相交于点(,)
D.无法判断l1和l2是否相交
【解析】 回归直线一定过样本点的中心(,),故C正确.
【答案】 C
2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
哪位同学建立的回归模型拟合效果最好?( )
A.甲 B.乙 C.丙 D.丁
【解析】 相关指数R2越大,表示回归模型的拟合效果越好.
【答案】 A
3.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
【解析】 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
【答案】 A
4.对于指数曲线y=aebx,令U=ln y,c=ln a,经过非线性化回归分析后,可转化的形式为( )
A.U=c+bx B.U=b+cx
C.y=c+bx D.y=b+cx
【解析】 由y=aebx得ln y=ln(aebx),∴ln y=ln a+
ln ebx,
∴ln y=ln a+bx,∴U=c+bx.故选A.
【答案】 A
5.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如表所示:
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为( )
A.=x-1 B.=x+1
C.=88+x D.=176
【解析】 设y对x的线性回归方程为=x+,
因为==,=176-×176=88,所以y对x的线性回归方程为=x+88.
【答案】 C
二、填空题
6.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性进行分析,并用回归分析的方法分别求得相关指数R2与残差平方和Q(,)如下表:
甲
乙
丙
丁
R2
0.67
0.61
0.48
0.72
Q(,)
106
115
124
103
则能体现A,B两个变量有更强的线性相关性的为________.
【解析】 丁同学所求得的相关指数R2最大,残差平方和Q(,)最小.此时A,B两变量线性相关性更强.
【答案】 丁
7.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)对比结果如下:
与实际相符数据个数
与实际不符合数据个数
总计
甲回归方程
32
8
40
乙回归方程
40
20
60
总计
72
28
100
则从表中数据分析,________回归方程更好(即与实际数据更贴近).
【解析】 可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为=,而乙回归方程的数据准确率为=.显然甲的准确率高些,因此甲回归方程好些.
【答案】 甲
8.如果某地的财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过________亿元. 【导学号:97270060】
【解析】 ∵x=10时,y=0.8×10+2+e=10+e,
∵|e|≤0.5,∴y≤10.5.
【答案】 10.5
三、解答题
9.某服装店经营某种服装,在某周内纯获利y(元)与该周每天销售这种服装件数x之间的一组数据如下表:
x
3
4
5
6
7
8
9
y
66
69
73
81
89
90
91
(1)求样本点的中心;
(2)画出散点图;
(3)求纯获利y与每天销售件数x之间的回归方程.
【解】 (1)=6,≈79.86,样本点的中心为(6,79.86).
(2)散点图如下:
(3)因为=≈4.75,=-≈51.36,
所以=4.75x+51.36.
10.为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:
时间x/天
1
2
3
4
5
6
繁殖个数y
6
12
25
49
95
190
(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;
(2)求y与x之间的回归方程.
【解】 (1)散点图如图所示:
(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于是令z=ln y,则
x
1
2
3
4
5
6
z
1.79
2.48
3.22
3.89
4.55
5.25
由计算器算得,=0.69x+1.112,则有=e0.69x+1.112.
[能力提升]
1.(2016·青岛一中调研)某学生四次模拟考试中,其英语作文的减分情况如表:
考试次数x
1
2
3
4
所减分数y
4.5
4
3
2.5
显然所减分数y与模拟考试次数x之间有较好的线性相关关系,则其线性回归方程为( )
A.y=0.7x+5.25 B.y=-0.6x+5.25
C.y=-0.7x+6.25 D.y=-0.7x+5.25
【解析】 由题意可知,所减分数y与模拟考试次数x之间为负相关,所以排除A.
考试次数的平均数为=(1+2+3+4)=2.5,
所减分数的平均数为=(4.5+4+3+2.5)=3.5,
即直线应该过点(2.5,3.5),代入验证可知直线y=-0.7x+5.25成立,故选D.
【答案】 D
2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x
6
8
10
12
y
2
3
5
6
若x与y具有线性相关关系,则线性回归方程为________.
【解析】 iyi=6×2+8×3+10×5+12×6=158,==9,
==4,
=62+82+102+122=344,
===0.7,
=-=4-0.7×9=-2.3,
故线性回归方程为=0.7x-2.3.
【答案】 =0.7x-2.3
3.某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:
时间
二月上旬
二月中旬
二月下旬
三月上旬
旬平均气温x(℃)
3
8
12
17
旬销售量y(件)
55
m
33
24
由表中数据算出线性回归方程=x+中的=-2,样本中心点为(10,38).
(1)表中数据m=__________.
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为__________件.
【解析】 (1)由=38,得m=40.
(2)由=- ,得=58,
故=-2x+58,
当x=22时,=14,
故三月中旬的销售量约为14件.
【答案】 (1)40 (2)14
4.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
图312
(xi-)2
(wi-)2
(xi-)(yi-)
(wi-)(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
表中wi=,w]=wi.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为=,=- .
【解】 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,先建立y关于w的线性回归方程.
由于===68,
=- =563-68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,
因此y关于x的回归方程为=100.6+68.
(3)①由(2)知,当x=49时,
年销售量y的预报值=100.6+68=576.6,
年利润z的预报值=576.6×0.2-49=66.32.
②根据(2)的结果知,年利润z的预报值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以当==6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.