温馨提示:
此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。
课时提升作业(一)
回归分析的基本思想及其初步应用
(25分钟 60分)
一、选择题(每小题5分,共25分)
1.下列三个说法:
(1)残差平方和越小的模型,拟合的效果越好;
(2)用R2来刻画回归的效果时,R2的值越小,说明模型拟合的效果越好;
(3)直线=x+和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差[yi-(xi+)]2是该坐标平面上所有直线中与这些点的偏差最小的直线.
其中正确的个数为 ( )
A.1个 B.2个 C.3个 D.4个
【解析】选B.由R2的定义可知:R2越接近于1,表明两个随机变量线性相关性越强,所以(2)不正确,其余说法正确.
2.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温x(℃)
18
13
10
-1
用电量y(度)
24
34
38
64
由表中数据得回归直线方程=x+中≈-2,预测当气温为-4℃时,用电量的度数约为 ( )
A.68℃ B.67℃ C.66℃ D.65℃
【解析】选A.由表格得(,)为(10,40),
又(,)在回归方程=x+上且≈-2,
所以40=10×(-2)+ ,解得: =60,所以=-2x+60.
当x=-4时, =-2×(-4)+60=68.
3.(2014·重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据测算的线性回归方程可能是 ( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
【解题指南】根据正相关可知斜率为正,再根据线性回归方程经过点(,)可求出结果.
【解析】选A.由正相关可知斜率为正,故可排除C,D两项,又因为=0.4x+2.3经过点(3,3.5),故A项正确.
【补偿训练】(2015·临沂高二检测)某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:度)之间有下列数据关系:
x
-2
-1
0
1
2
y
5
4
2
2
1
甲、乙、丙三位同学对上述数据进行了研究,分别得到了x与y之间的三个线性回归方程:①y=-x+2.8,②y=-x+3,③y=-1.2x+2.6;其中正确的是 ( )
A.① B.② C.③ D.①③
【解析】选A.回归方程=x+表示的直线必过点(,),即必过点(0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点(0,2.8),故正确的是①.
4.(2015·泰安高二检测)在回归分析中,R2的值越大,说明残差平方和 ( )
A.越大 B.越小
C.可能大也可能小 D.以上均错
【解析】选B.因为R2=
所以当R2越大时,(yi-)2越小,即残差平方和越小.
5.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76, =-.据此估计,该社区一户年收入为15万元家庭的年支出为 ( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
【解题指南】样本中心点(,)一定在回归直线上.
【解析】选B.由题意得
==10,
==8,
所以=8-0.76×10=0.4,
所以=0.76x+0.4,把x=15代入得到=11.8.
二、填空题(每小题5分,共15分)
6.在研究身高和体重的关系时,求得相关指数R2≈ ,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.
【解析】结合R2的计算公式R2=可知,当R2=0.64时,身高解释了64%的体重变化.
答案:0.64
7.若根据10名儿童的年龄x(岁)和体重y(kg)数据用最小二乘法得到用年龄预报体重的回归方程是=2x+7,已知这10名儿童的年龄分别是2,3,3,5,2,6,7,3,4,5,则这10名儿童的平均体重是 .
【解析】由题意可得=2+7,又=4,所以=15.
答案:15kg
8.(2015·扬州高二检测)某校高二(8)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)构成如下数据(15,79),(23,97),(16,64),
(24,92),(12,58),求得的回归直线方程为=2.5x+,则某同学每周学习20小时,估计数学成绩约为 分.
【解析】=×(15+23+16+24+12)=18,
=×(79+97+64+92+58)=78,
把(,)代入=2.5x+,可求得=33,
把x=20代入=2.5x+33得=2.5×20+33=83.
答案:83
三、解答题(每小题10分,共20分)
9.关于x与y有如下数据关系:
x
2
4
5
6
8
y
30
40
60
50
70
为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲模型=6.5x+17.5,乙模型=7x+17,试比较哪一个模型拟合的效果更好.
【解析】==1-=0.845,
==1-=0.82,
84.5%>82%,所以甲模型拟合效果更好.
【拓展延伸】R2=1-的意义
R2越大,残差平方和越小,从而回归模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近1,表示回归的效果越好(因为R2越接近1,表示解释变量和预报变量的线性相关性越强).
10.(2015·深圳高二检测)PM2.5是指大气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如表:
时间
周一
周二
周三
周四
周五
车流量x(万辆)
50
51
54
57
58
PM2.5的浓度y(微克/立方米)
69
70
74
78
79
(1)根据上表数据,请在下列坐标系中画出散点图.
(2)根据上表数据,用最小二乘法求出y关于x的线性回归方程=x+.
(3)若周六同一时间段车流量是25万辆,试根据(2)求出的线性回归方程预测,此时PM2.5的浓度为多少(保留整数).
【解析】(1)散点图如图所示.
(2)因为==54,
==74,
(xi-)(yi-)=4×5+3×4+3×4+4×5=64,
(xi-)2=(-4)2+(-3)2+32+42=50,
===1.28,
=-=74-1.28×54=4.88,
故y关于x的线性回归方程是=1.28x+4.88.
(3)当x=25时,=1.28×25+4.88=36.88≈37,
所以可以预测此时PM2.5的浓度约为37微克/立方米.
(20分钟 40分)
一、选择题(每小题5分,共10分)
1.(2015·眉山高二检测)已知样本点散落在某一条曲线y=附近,作变换z=
lny,利用线性回归模型来求其中的参数a,b,则拟合其变换后的样本点的直线
方程为 ( )
【解析】选A.对方程y=两边取以e为底的对数即得.
2.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归直线方程为=2x+a,若样本点(r,1)与(1,s)的残差相同,则有 ( )
A. r=s B.s=2r C.s=3-2r D.s=2r+1
【解析】选C.由残差的定义可得,
1-(2r+a)=s-(2+a),化简得s=3-2r.
【延伸探究】若将题中的“=2x+a”改为“=bx+a”,同时将“样本点(r,1)与(1,s)”改为“样本点(1,1)与(2,4)”,则b= .
【解析】由残差的定义可得1-(b+a)=4-(2b+a),
化简得b=3.
答案:3
二、填空题(每小题5分,共10分)
3.已知回归方程为=2x+1,而实验得到的一组数据为(2,4.9),(3,7.1),(4,9.1),则残差平方和为 .
【解析】(yi-i)2=(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.
答案:0.03
4.(2015·石家庄高二检测)已知一组具有线性相关关系的数据(x1,y1),(x2,y2),
…,(xn,yn),其样本点的中心为(2,3),若其回归直线的斜率估计值为-1.2,则该回归直线方程为 .
【解析】由题意可设回归直线为=-1.2x+,由于回归直线过样本点的中心(2,3),故有3=-1.2×2+,解得=5.4,故回归直线方程为=-1.2x+5.4.
答案: =-1.2x+5.4
【补偿训练】(2014·渭南高二检测)已知x与y之间的几组数据如下表:
x
0
1
3
4
y
1
4
6
9
则y与x的线性回归方程=x+过点 ( )
A.(0,1) B.(1,4) C.(2,5) D.(5,9)
【解析】选C.因为==2,==5,所以根据线性回归方程必过样本中心点,可得=x+必过(2,5).
三、解答题(每小题10分,共20分)
5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20, =- .
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
【解题指南】(1)利用线性回归系数公式求出,的值,从而可确定回归直线方程.
(2)利用二次函数求最值.
【解析】(1)由于=×(8+8.2+8.4+8.6+8.8+9)=8.5,
=×(90+84+83+80+75+68)=80,
又=-20,所以=-=80+20×8.5=250,从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1000
=-20(x-8.25)2+361.25.
当且仅当x=8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
【拓展延伸】建立回归模型的基本步骤
(1)确定解释变量和预报变量.
(2)画散点图,观察是否存在线性相关关系.
(3)确定回归方程的类型,如=x+.
(4)按最小二乘法估计回归方程中的参数.
(5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适.
6.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程=t+.
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:回归方程=t+中,
【解题指南】(1)直接利用回归系数公式求解即可.(2)利用回归方程代入直接进行计算即可.
【解析】(1)列表计算如下:
i
ti
yi
tiyi
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50
∑
15
36
55
120
故所求回归方程为=1.2t+3.6.
(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).
【补偿训练】(2015·西安高二检测)下表是某年美国旧轿车价格的调查资料,以x(年)表示轿车的使用年数,y(美元)表示相应的年均价格,求y关于x的非线性回归方程.
使用年数x
1
2
3
4
5
6
7
8
9
10
平均价格y
2 651
1 943
1 494
1 087
765
538
484
290
226
204
【解题指南】画出散点图或进行相关性检验,确定两变量x,y是否线性相关.由散点图得x,y之间的回归模型.然后转化为线性回归模型进行拟合,预报回归模型,求回归方程.
【解析】画散点图如图1所示,
看出y与x呈指数关系,于是令z=lny.变换后得数据:
x
1
2
3
4
5
6
7
8
9
10
z
7.883
7.572
7.309
6.991
6.640
6.288
6.182
5.670
5.421
5.318
画散点图如图2所示,由图可知各点基本处于一条直线,
由于==5.5,
==6.5274,
所以由表中数据可得线性回归方程为=8.166-0.298x,因此旧轿车的平均价格对使用年数的非线性回归方程为=e8.166-0.298x.
关闭Word文档返回原板块