1.2 回归分析
第二课时
一、基础过关
1.某商品销售量y(件)与销售价格x(元/件)成线性相关关系,且r<0,则其回归方程可能是
( )
A. =-10x+200 B. =10x+200
C. =-10x-200 D. =10x-200
2.在回归直线方程 = + x中,回归系数 表示 ( )
A.当x=0时,y的平均值
B.x变动一个单位时,y的实际变动量
C.y变动一个单位时,x的平均变动量
D.x变动一个单位时,y的平均变动量
3.下列说法中正确的有:①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1,或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上. ( )
A.①② B.②③
C.①③ D.①②③
4.每一吨铸铁成本yc(元)与铸件废品率x%建立的回归直线方程yc=56+8x,下列说法正确的是 ( )
A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8%
C.废品率每增加1%,成本每吨增加8元
D.如果废品率增加1%,则每吨成本为56元
5.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是 ( )
A.直线l1和l2有交点(s,t)
B.直线l1和l2相交,但是交点未必是点(s,t)
C.直线l1和l2由于斜率相等,所以必定平行
D.直线l1和l2必定重合
二、能力提升
6.研究人员对10个家庭的儿童问题行为程度(x)及其母亲的不耐心程度(Y)进行了评价结果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.
下列哪个方程可以较恰当的拟合 ( )
A. =0.771 1x+26.528
B. =36.958ln x-74.604
C. =1.177 8x1.014 5
D. =20.924e0.019 3x
7.已知x,y之间的一组数据如下表:
x
1.08
1.12
1.19
1.25
y
2.25
2.37
2.43
2.55
则y与x之间的回归直线方程 = x+ 必过点___________________________.
8.已知回归直线方程为 =0.50x-0.81,则x=25时,y的估计值为________.
9.关于回归分析,下列说法错误的是__________.(填序号)
①在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一
确定;
②散点图反映变量间的线性相关关系,误差较大;
③散点图能明确反映变量间的关系.
10.在彩色显影中,由经验知:形成染料光学密度y与析出银的光学密度x由公式y=Ae (b<0)表示.现测得试验数据如下:
xi
0.05
0.06
0.25
0.31
0.07
0.10
yi
0.10
0.14
1.00
1.12
0.23
0.37
xi
0.38
0.43
0.14
0.20
0.47
yi
1.19
1.25
0.59
0.79
1.29
试求y对x的回归方程.
11.为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:
天数x/天
1
2
3
4
5
6
繁殖个数y/个
6
12
25
49
95
190
(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;
(2)描述解释变量x与预报变量y之间的关系.
三、探究与拓展
12.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数,并作出相关性检验.
年份
1949
1954
1959
1964
1969
1974
1979
1984
1989
1994
1999
人口数/百万
542
603
672
705
807
909
975
1 035
1 107
1 177
1 246
答案
1.A 2.D 3.C 4.C 5.A 6.B
7.(1.16,2.4) 8.11.69 9.③
10.解 由题给的经验公式y=Ae,两边取自然对数,便得ln y=ln A+,与回归直线方程相对照,只要取u=,v=ln y,a=ln A.就有v=a+bu.
题给数据经变量置换u=,v=ln y变成如下表所示的数据:
ui
20.000
16.667
4.000
3.226
14.286
10.000
vi
-2.303
-1.966
0
0.113
-1.470
-0.994
ui
2.632
2.326
7.143
5.000
2.128
vi
0.174
0.223
-0.528
-0.236
0.255
可得ln =0.548-,即 =e0.548-=e0.548·e-≈1.73e-,
这就是y对x的回归方程.
11.解 (1)所作散点图如图所示.
(2)由散点图看出样本点分布在一条指数型函数y=c1ec2x的周围,于是令z=ln y,则
x
1
2
3
4
5
6
z
1.79
2.48
3.22
3.89
4.55
5.25
由计算器得: =0.69x+1.115,
则有 =e0.69x+1.115.
12.解 为了简化数据,先将年份减去1949,得到下表:
x
0
5
10
15
20
25
30
35
40
45
50
y
542
603
672
705
807
909
975
1 035
1 107
1 177
1 246
作出散点图如图,根据公式可得回归直线方程为 =527.591+14.453x.
由于2004对应的x=55,代入回归直线方程可得 =1 322.506(百万),即2004年的人口总数估计为13.23亿.
下面对其进行线性相关性检验:
(1)作统计假设H0∶x与y不具有线性相关;
(2)由0.01与n-2=9的附表中查得r0.01=0.735;
(3)根据公式得相关系数r=0.998;
(4)因为|r|=0.998>0.735,即|r|>r0.01,
所以有99%的把握认为x与y之间具有线性相关关系,回归直线方程为 =527.591+14.453x,用这个方程去估计我国2004年的人口数是有意义的.