温馨提示:
此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。
课时提升作业 一
回归分析的基本思想及其初步应用
一、选择题(每小题5分,共25分)
1.下列四个命题中正确的是( )
①在线性回归模型中,e是x+预报真实值y的随机误差,它是一个观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.
A.①③ B.②④ C.①④ D.②③
【解析】选B.e是预报变量y的随机误差,故①不正确;R2越接近1,拟合的效果越好,故③不正确.
2.甲、乙、丙、丁4位同学各自对A,B两个变量进行回归分析,分别得到散点图与残差平方和(yi-)2如表:
甲
乙
丙
丁
散点图
残差
平方和
115
106
124
103
哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高?( )
A.甲 B.乙 C.丙 D.丁
【解析】选D.根据线性相关的知识,散点图中各样本点带状分布越均匀,同时保持残差平方和越小,回归分析建立的线性回归模型的拟合效果越好.由试验结果知,丁拟合效果较好些.
3.关于残差的叙述正确的是( )
A.残差就是随机误差
B.残差就是方差
C.残差都是正数
D.残差可以用来判断模型拟合的效果
【解析】选D.根据残差的意义及作用知,D正确.
4.(2016·大连高二检测)在一次试验中,测得(x,y)的4组值分别为A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为( )
A. =x+1 B. =x+2
C. =2x+1 D. =x-1
【解析】选A.由已知条件可知=,=,而回归直线必经过样本点的中心,故选项A符合题意.
5.(2016·济南高二检测)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg
【解题指南】根据线性相关、回归直线、样本点的中心等相关概念判断.
【解析】选D.
选项
具体分析
结论
A
x的系数大于零,正相关
正确
B
由回归直线方程的计算公式=-可知直线l必过点(,)
正确
C
由一次函数的单调性知,x每增加1cm,体重平均增加0.85kg,是估计变量
正确
D
体重应约为58.79kg,估计变量
不正确
二、填空题(每小题5分,共15分)
6.对于回归方程=257+4.75x,当x=28时,y的估计值是________.
【解析】当x=28时,=257+4.75×28=390,
所以y的估计值为390.
答案:390
7.若对于变量y与x的10组数据的回归模型中,R2=0.95,又知残差平方和为120.53.那么(yi-)2=________.
【解析】由公式R2=1-
得0.95=1-得(yi-)2=2410.6.
答案:2410.6
8.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x(单位:千箱)与单位成本y(单位:元)的资料进行线性回归分析,结果如下:
=,=71,=79,xiyi=1481.
则销量每增加1000箱,单位成本下降________元.
【解析】由题意知=≈-1.8182,
=71-(-1.8182)×≈77.36,=-1.8182x+77.36,销量每增加1千箱,则单位成本下降1.8182元.
答案:1.8182
三、解答题(每小题10分,共20分)
9.(2016·武汉高二检测)某公司有6名推销员,其工作年限与年推销金额数据如下:
推销员编号
1
2
3
4
5
工作年限x(年)
3
5
6
7
9
年推销金额y(万元)
2
3
3
4
5
(1)求年推销金额y关于工作年限x的线性回归方程.
(2)若第6名推销员工作年限为11年,试估计他的年推销金额.
【解析】(1)设所求的回归方程为=x+,
则===0.5,
=-=0.4.
所以年推销金额y关于工作年限x的线性回归方程为=0.5x+0.4.
(2)当x=11时,=0.5×11+0.4=5.9(万元),
所以可以估计第6名推销员的年推销金额为5.9万元.
10.已知某校在一次考试中,5名学生的数学和地理成绩如表:
学生的编号i
1
2
3
4
5
数学成绩x
80
75
70
65
60
地理成绩y
70
66
68
64
62
(1)根据上表,利用最小二乘法,求出y关于x的线性回归方程=x+(其中=0.36).
(2)利用(1)中的线性回归方程,试估计数学90分的同学的地理成绩(四舍五入到整数).
(3)若从5人中选2人参加数学竞赛,其中1、2号不同时参加的概率是多少?
【解析】(1)=(80+75+70+65+60)=70,
=(70+66+68+64+62)=66,
=0.36,所以=-=40.8,
所以y关于x的线性回归方程为=0.36x+40.8.
(2)若x=90,则y=0.36×90+40.8≈73,
即数学90分的同学的地理成绩估计为73分.
(3)五人中选两人的不同选法有(1,2),(1,3),(1,4), (1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)共10种不同选法.其中1,2号不同时参加的有9种,
所以1,2号不同时参加的概率P=.
一、选择题(每小题5分,共10分)
1.(2016·石家庄高二检测)为了研究两个变量x和y之间的线性相关关系,甲、乙两位同学分别独立做了100次和150次试验,并且利用最小二乘法求得回归直线分别为l1,l2.已知两人在试验中发现变量x的观察数据的平均值都是s,变量y的观察数据的平均值都是t.下列说法中正确的是( )
A. l1和l2有交点(s,t)
B. l1与l2相交,但交点不一定是(s,t)
C. l1与l2必平行
D. l1与l2必重合
【解析】选A.由题意知,(s,t)是甲、乙两位同学所做试验的样本点的中心,而回归直线恒过样本点的中心,故A正确.
2.在某种新型材料的研制中,试验人员获得了下列一组试验数据,现准备用下列四个函数中的一个近似地表示这些数据的规律,其中最接近的一个是( )
x
1.95
3.00
3.94
5.10
6.12
y
0.97
1.59
1.98
2.35
2.61
A.y=2x B.y=log2x
C.y=(x2-1) D.y=2.61cosx
【解析】选B.作散点图,从图中观察可知,应为对数函数模型.
二、填空题(每小题5分,共10分)
3.(2016·福州高二检测)某人收集统计近几年来春节期间的平均气温x与某取暖商品销售额y的有关数据(如表):
平均气温(℃)
-2
-3
-5
-6
销售额(万元)
20
23
27
30
根据上述数据,用线性回归的方法,求得销售额y与平均气温x之间的线性回归方程为=x+中系数=-2.4,预测平均气温为-8℃时,该商品的销售额大约为________万元.
【解析】=-4,=25,即这组数据的样本点的中心为(-4,25),将=-2.4代入回归直线方程且回归直线过样本点中心得=15.4.故回归直线方程为=-2.4x+15.4.当x=-8时,=-2.4×(-8)+15.4=34.6.
答案:34.6
4.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.
【解析】由题意知=2,=3,=6.5,所以=-=3-6.5×2=-10,即回归直线的方程为=-10+2x.
答案:=-10+2x
三、解答题
5.(10分)(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-
)2
(wi-
)2
(xi-
)(yi-)
(wi-
)(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
表中wi=,=wi.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:=,=-.
【解析】(1)由散点图的变化趋势可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,先建立y关于w的线性回归方程.
由于===68,
=-=563-68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.
(3)①由(2)知,当x=49时,年销售量y的预报值=100.6+68=576.6,
年利润z的预报值=576.6×0.2-49=66.32.
②根据(2)的结果知,年利润z的预报值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以当==6.8,即x=46.24时,取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
【补偿训练】(2016·济宁高二检测)假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,现测得5组数据如下:
x
15.0
25.8
30.0
36.6
44.4
y
39.4
42.9
42.9
43.1
49.2
(1)以x为解释变量,y为预报变量作出散点图.
(2)求y与x之间的回归方程,对基本苗数56.7预报有效穗.
(3)计算各组残差,并计算残差平方和.
(4)求R2,说明回归模型的拟合效果.
【解析】(1)散点图如图所示:
(2)由(1)中的图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.
设回归方程为=x+,=30.36,=43.5,
=5101.56,
=1320.66,2=921.7296,
xiyi=6746.76.
由=≈0.29,=-≈34.70,
故所求的回归直线方程为=34.70+0.29x.
当x=56.7时,=34.70+0.29×56.7=51.143.
估计成熟期有效穗为51.143.
(3)由于=xi+,可以算得=yi-,分别为=0.35,=0.718,=-0.5,
=-2.214,=1.624,
残差平方和:≈8.43.
(4)(yi-)2=50.18,
故R2=1-≈0.832.
故回归模型拟合效果较好.
关闭Word文档返回原板块