第三章 统计案例
3.1 回归分析的基本思想及其初步应用
第1课时 线性回归模型
A级 基础巩固
一、选择题
1.有下列说法:
①线性回归分析就是由样本点去寻找一条直线,贴近这些样本点的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过回归方程=x+及其回归系数b,可以估计和观测变量的取值和变化趋势;
④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.
其中正确说法的个数是( )
A.1 B.2 C.3 D.4
解析:①反映的是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③反映的是回归模型y=bx+a+e,其中e为随机误差,故也正确.④不正确,在求回归方程之前必须进行相关性检验,以体现两变量的关系.
答案:C
2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( )
A.b与r的符号相同 B.a与r的符号相同
C.b与r的符号相反 D.a与r的符号相反
解析:因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.
答案:A
3.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( )
A.=x+1 B.=x+2
C.=2x+1 D.=x-1
解析:求出样本中心(,)代入选项检验知选项A正确.
答案:A
4.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,A正确;由回归方程系数的意义可知回归直线过样本点的中心,,B正确;依据回归方程中y的含义可知,x每变化1个单位,y相应变化约0.85个单位,C正确;用回归方程对总体进行估计不能得到肯定的结论,故D错误.
答案:D
5.(2015·福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x/万元
8.2
8.6
10.0
11.3
11.9
支出y/万元
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=y-,.
据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
解析:由已知得 ==10(万元),
==8(万元),
故=8-0.76×10=0.4.
所以回归直线方程为=0.76x+0.4,社区一户年收入为15万元家庭年支出为=0.76x+0.4,社区一户年收入为15万元家庭支出为=0.76×15+0.4=11.8(万元).
答案:B
二、填空题
6.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y(单位:件)与月平均气温x(单位:℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表所示:
月平均气温x/℃
17
13
8
2
月销售y/件
24
33
40
55
由表中数据算出线性回归方程=x+中的=-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________.
解析:由表格得(,)为(10,38),又(,)在回归直线=x+上,且=-2,所以38=-2×10+,=58,所以=-2x+58,当x=6时,=-2×6+58=46.
答案:46
7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:
=71-(-1.818 2)×≈77.36,则销量每增加1千箱,单位成本下降________元.
解析:由已知可得,=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.
答案:1.818 2
8.已知一个线性回归方程为=1.5x+45,其中x的取值依次为1,7,5,13,19,则=________.
解析:==9,因为回归直线方程过点(,),所以=1.5x+45=1.5×9+45=58.5.
答案:58.5
三、解答题
9.某医院用光电比色计检验尿汞时,得尿汞含量x(单位:mg/L)与消光系数y读数的结果如下:
尿汞含量x
2
4
6
8
10
消光系数y
64
138
205
285
360
(1)画出散点图;
(2)求回归方程.
解:(1)散点图如图所示:
(2)由图可知y与x的样本点大致分布在一条直线周围,因此可以用线性回归方程来拟合它.
设回归方程为=x+.
故所求的线性回归方程为=36.95x-11.3.
10.某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份
2008
2010
2012
2014
2016
需求量/万吨
236
246
257
276
286
(1)利用所给数据求年需求量与年份之间的回归直线方程=x+;
(2)利用(1)中所求出的直线方程预测该地2018年的粮食需求量.
解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程.为此对数据预处理如下:
年份2012年
-4
-2
0
2
4
需求量257万吨
-21
-11
0
19
29
对预处理后的数据,容易算得=0,=3.2.所以
==6.5,
=-=3.2.
由上述计算结果,知所求回归直线方程为
-257=(x-2 012)+=6.5(x-2 012)+3.2,
即=6.5(x-2 012)+260.2.①
(2)利用直线方程①,可预测2018年的粮食需求量为
=6.5×(2 018-2 012)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).
B级 能力提升
1.某考察团对全国10大城市进行职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(单位:千元),估计该城市人均消费额占人均工资收入的百分比约为( )
A.83% B.72% C.67% D.66%
解析:因为当=7.675时,x=≈9.262,
所以≈0.829≈83%.
答案:A
2.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为________,用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.
解析:这5天的平均投篮命中率为
==0.5,
==3.
所以==0.01,=-=0.47.
所以回归直线方程为=0.01x+0.47.
当x=6时,=0.01×6+0.47 =0.53.
答案:0.5 0.53
3.某市垃圾处理厂的垃圾年处理量(单位:千万吨)与资金投入量x(单位:千万元)有如下统计数据:
分类
2012年
2013年
2014年
2015年
2016年
资金投入量x/
千万元
1.5
1.4
1.9
1.6
2.1
垃圾处理量y/
千万吨
7.4
7.0
9.2
7.9
10.0
(1)若从统计的5年中任取2年,求这2年的垃圾处理量至少有一年不低于8.0 千万吨的概率;
(2)由表中数据求得线性回归方程为=4x+,该垃圾处理厂计划2017年的垃圾处理量不低于9.0千万吨,现由垃圾处理厂决策部门获悉2017年的资金投入量约为1.8千万元,请你预测2017年能否完成垃圾处理任务,若不能,缺口约为多少千万吨?
解:(1)从统计的5年垃圾处理量中任取2年的基本事件共10个:(7.4,7.0),(7.4,9.2),(7.4,7.9),(7.4,10.0),(7.0,9.2),(7.0,7.9),(7.0,10.0),(9.2,7.9),(9.2,10.0),(7.9,10.0),其中垃圾处理量至少有一年不低于8.0千万吨的基本事件有6个:(7. 4,9.2),(7.4,10.0),(7.0,9.2),(7.0,10.0),(9.2,7.9),(9.2,10.0).
所以,这2年的垃圾处理量至少有一年不低于8.0千万吨的概率为P==.
(2)==1.7,
==8.3,
因为直线=4x+过样本中心点(,),
所以8.3=4×1.7+,解得=1.5.
所以=4x+1.5.
当x=1.8时,=4×1.8+1.5=8.7<9.0,
所以不能完成垃圾处理任务,缺口约为0.3千万吨.