§2.3 变量间的相关关系
学习目标
1.了解变量间的相关关系,会画散点图.2.
根据散点图,能判断两个变量是否具有相关关系.3.了解线性回归思想,会求回归直线的方程.
ruize
知识点一 变量间的相关关系 相关关系的定义
变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系. 知识点二 散点图及正、负相关的概念
思考 粮食产量与施肥量间(在一定范围内)的相关关系有什么特点? ★答案★ 在施肥不过量的情况下,施肥越多,粮食产量越高. 梳理 (1)散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.点(x,y)叫样本点中心. (2)正相关与负相关
①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 知识点三 回归直线 回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.回归直线过样本点中心. (2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程. (3)最小二乘法:
求线性回归方程y=bx+a时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
^
^
^
ruize
x-xy-yxy-nxyb==,
x-x
x-nx
a=y-bx,
n
^
i=1ni
i
ii
i=1
i=1
ni
2
n
2i
2
i=1
^^
其中,b是线性回归方程的斜率,a是线性回归方程在y轴上的截距.
^^
1.人的身高与年龄之间的关系是相关关系.( × ) 2.农作物的产量与施肥量之间的关系是相关关系.( √ ) 3.回归直线过样本点中心(x,y).( √ )
类型一 变量间相关关系的判断
例1 下列两个变量之间是相关关系的是( )
ruize
A.圆的面积与半径之间的关系 B.球的体积与半径之间的关系 C.角度与它的正弦值之间的关系
D.降雪量与交通事故的发生率之间的关系 考点 变量间的相关关系 题点 相关关系的判断 ★答案★ D
解析 由题意知A表示圆的面积与半径之间的关系S=πr2,B表示球的体积与半径之间的关4πr3
系V=,C表示角度与它的正弦值之间的关系y=sinα,都是确定的函数关系,只有D是
3相关关系,故选D.
反思与感悟 函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 跟踪训练1 下列两个变量间的关系不是函数关系的是( ) A.正方体的棱长与体积 B.角的度数与它的正切值
C.单产为常数时,土地面积与粮食总产量 D.日照时间与水稻的单位产量 考点 变量间的相关关系 题点 相关关系与函数关系的辨析 ★答案★ D
解析 函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项V=a3,B项y=tanα,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系. 类型二 散点图的应用
例2 5名学生的数学和物理成绩(单位:分)如下:
学生 成绩 数学成绩 物理成绩
判断它们是否具有线性相关关系. 考点 散点图
A 80 70 B 75 66 C 70 68 D 65 64 E 60 62 ruize
题点 利用散点图判断两个变量是否有相关关系
解 以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.
由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.
反思与感悟 (1)判断两个变量x和y间具有哪种相关关系,最简便的方法是绘制散点图.变量之间可能是线性的,也可能是非线性的(如二次函数),还可能不相关.
(2)画散点图时应注意合理选择单位长度,避免图形偏大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
跟踪训练2 下列图形中两个变量具有线性相关关系的是( )
ruize
考点 散点图
题点 利用散点图判断两个变量是否有相关关系 ★答案★ C
解析 A是一种函数关系;B也是一种函数关系;C中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 类型三 回归直线的求解与应用
例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:
转速x(转/秒) 每小时生产有缺点的零件数y(件)
(1)画出散点图;
(2)如果y对x有线性相关关系,请画出一条直线近似地表示这种线性关系;
516
(3)在实际生产中,若它们的近似方程为y=x-,允许每小时生产的产品中有缺点的零件
707最多为10件,那么机器的运转速度应控制在什么范围内? 考点 回归直线 题点 回归直线的应用 解 (1)散点图如图所示:
11 9 8 5 16 14 12 8 ruize
ruize
(2)近似直线如图所示:
516
(3)由y≤10得x-≤10,解得x≤14.9,所以机器的运转速度应控制在14转/秒内.
707引申探究
1.本例中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 51651
解 因为y=x-,所以当x增加一个单位时,y大约增加.
70770
2.本例中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 516516
解 因为y=x-,所以当y=7时,7=x-,
707707解得x≈11.
反思与感悟 求线性回归方程的一般步骤
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出). (2)作出散点图,确定x,y具有线性相关关系. (3)把数据制成表格xi,yi,x2i,xiyi. (4)计算x,y
n
2,xi,xiyi. i=1i=1
n
xy-nx y
b=,
(5)代入公式计算b,a,公式为x-nx
a=y-bx.
n
ii
^
i=1
^
^
n
2i
2
i=1
^
^
ruize
^
^
^
(6)写出线性回归方程y=bx+a.
跟踪训练3 某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:
x y 考点 回归直线 题点 求回归直线方程 (1)画出散点图; (2)求回归方程. 解 (1)散点图如图所示.
2 30 4 40 5 60 6 50 8 70
(2)列出下表,并用科学计算器进行有关计算.
i xi yi xiyi x2i 1 2 30 60 4 2 4 40 160 16 53 5 60 300 25 x2i=145,54 6 50 300 36 5 8 70 560 64 x=5,y=50,xiyi=1380 i=1i=1
ruize
xiyi-5x y
于是可得,b=
^
i=1
5
5
x2i-5x
i=1
^
^^1380-5×5×50
==6.5,a=y-bx=50-6.5×5=17.5.
145-5×522
于是所求的回归方程是y=6.5x+17.5.
1.对变量x,y有观测数据(xi,yi)(i=1,2,3,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,3,…,10),得散点图2,由这两个散点图可以断定( )
A.x与y正相关,u与v正相关 B.x与y正相关,u与v负相关 C.x与y负相关,u与v正相关 D.x与y负相关,u与v负相关
ruize
考点 散点图
题点 利用散点图判断两个变量是否有相关关系 ★答案★ C
解析 由图1可知,点散布在从左上角到右下角的区域,各点整体呈递减趋势,故x与y负相关;
由图2可知,点散布在从左下角到右上角的区域,各点整体呈递增趋势,故u与v正相关. 2.工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为y=50+80x,下列判断正确的是( )
A.劳动生产率为1000元时,工人工资为130元 B.劳动生产率提高1000元时,工人工资平均提高80元 C.劳动生产率提高1000元时,工人工资平均提高130元 D.当月工资为250元时,劳动生产率为2000元 考点 回归直线 题点 回归直线的应用 ★答案★ B
解析 因为回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1000元时,工人工资平均提高80元.
3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系 B.回归直线过样本点中心(x,y)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg 考点 回归直线 题点 回归直线的应用 ★答案★ D
解析 当x=170时,y=0.85×170-85.71=58.79,体重的估计值为58.79kg.
4.某地区近10年居民的年收入x与年支出y之间的关系大致符合y=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.
^
^
^
^
ruize
考点 回归直线 题点 回归直线的应用 ★答案★ 12.1
解析 将x=15代入y=0.8x+0.1,得y=12.1.
5.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则线性回归方程是________. ★答案★ y=1.23x+0.08
解析 回归直线的斜率的估计值为1.23,即b=1.23, 又回归直线过定点(4,5),∴a=5-1.23×4=0.08, ∴y=1.23x+0.08.
^
^
^
^
^
^
1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求线性回归方程时应注意的问题
(1)知道x与y成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的. (2)用公式计算a,b的值时,要先计算b,然后才能算出a.
3.利用回归方程,我们可以进行估计和预测.若回归方程为y=bx+a,则在x=x0处的估计值为y0=bx0+a .
^
^
^
^
^
^
^
^
^
^
ruize
一、选择题
1.判断下图中的两个变量,具有较强相关关系的是( )
ruize
考点 两个变量的线性相关的应用 题点 相关性强弱的判断 ★答案★ B
解析 A,C是函数关系,D中的点的分布毫无规则,横轴、纵轴表示的两个变量之间相关性不强.
2.某商品销售量y(件)与销售价格x(元/件)负相关,则其线性回归方程可能是( ) A.y=-10x+200 C.y=-10x-200 考点 正相关、负相关
题点 利用数据或方程判断两个变量的正负相关 ★答案★ A
解析 x的系数为负数,表示负相关,排除B,D,由实际意义可知x>0,y>0,C中,散点图不经过第一象限,故选A. 3.已知x与y之间的一组数据:
x y
已求得关于y与x的线性回归方程为y=2.2x+0.7,则m的值为( ) A.1 C.0.7
考点 回归直线 题点 样本点中心的性质
B.0.85 D.0.5
^
^^
B.y=10x+200 D.y=10x-200
^
^
0 m 1 3 2 5.5 3 7 ruize
★答案★ D
0+1+2+3m+3+5.5+7^
解析 x==1.5,y=,将其代入y=2.2x+0.7,可得m=0.5,故
44选D.
4.设有一条回归直线的方程为y^
=2-1.5x,则变量x增加1个单位时( ) A.y平均增加1.5个单位 B.y平均增加2个单位 C.y平均减少1.5个单位 D.y平均减少2个单位 考点 回归直线 题点 回归直线的应用 ★答案★ C
解析 ∵回归方程为y^
1=2-1.5x, ∴y^
2=2-1.5(x+1),
∴②-①得y^
^
2-y1=-1.5,即y平均减少1.5个单位,故选C. 5.根据如下样本数据得到的回归方程为y^
=b^
x+a^
,则( )
x 3 4 5 6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0
A.a^
>0,b^
>0 B.a^
>0,b^
<0 C.a^
<0,b^
>0 D.a^
<0,b^
<0
考点 散点图 题点 散点图的应用 ★答案★ B
解析 画出散点图,知a^
>0,b^
<0.
① ②
ruize
6.已知x与y之间的一组数据:
x 0 1 2 3 y 1 3 5 7
若y与x线性相关,则y与x的回归直线y^
=b^
x+a^
必过( ) A.点(2,2) B.点(1.5,0) C.点(1,2) D.点(1.5,4)
考点 回归直线 题点 样本点中心的性质 ★答案★ D
解析 ∵x=0+1+2+31+3+4=1.5,y=5+7
4=4,
∴回归直线必过点(1.5,4).故选D. 7.已知x,y的取值如表所示:
x 2 3 4 y 6 4 5
如果y与x线性相关,且线性回归方程为^y=b^x+13
^2
,则b等于( A.-12 B.12 C.-110
D.110
考点 回归直线
)
ruize
题点 求回归直线方程 ★答案★ A 解析 ∵x=
2+3+46+4+5
=3,y==5, 33
∴回归直线过点(3,5),
^13
∴5=3b+,
2^1
∴b=-,故选A.
2
8.某产品的广告费用x(单位:万元)与销售额y(单位:万元)的统计数据如下表:
广告费用x 销售额y
根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.6万元 C.67.7万元
考点 两个变量线性相关的应用 题点 利用线性回归预报变量的值 ★答案★ B
4+2+3+549+26+39+54
解析 x==3.5,y==42.因为回归直线过点(x,y),所以
4442=9.4×3.5+a.
解得a=9.1.故回归方程为y=9.4x+9.1. 所以当x=6时,y=6×9.4+9.1=65.5. 二、填空题
9.在一次试验中测得(x,y)的四组数据如下:
x y
根据上表可得线性回归方程y=-5x+a,据此模型预报当x=20时,y的值为________. 考点 两个变量的线性相关的应用 题点 利用线性回归预报变量的值
^
^
^
^
^
^
^
^
^
^
4 49 2 26 3 39 5 54 B.65.5万元 D.72.0万元
16 50 17 34 18 41 19 31 ruize
★答案★ 26.5 解析
16+17+18+1950+34+41+31x==17.5,y==39,
44
∴回归直线过点(17.5,39), ∴39=-5×17.5+a, ∴a=126.5,
∴当x=20时,y=-5×20+126.5=26.5.
10.某工厂对某产品的产量与成本的资料分析后有如下数据:
产量x(千件) 成本y(万元)
由表中数据得到的线性回归方程y=bx+a中b=1.1,预测当产量为9千件时,成本约为________万元.
考点 两个变量的线性相关的应用 题点 利用线性回归预报变量的值 ★答案★ 14.5
解析 由表中数据得x=4,y=9,代入线性回归方程得a=4.6,∴当x=9时,y=1.1×9+4.6=14.5.
11.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归方程为y=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差____________分. 考点 回归直线 题点 回归直线的应用 ★答案★ 20
解析 令两人的总成绩分别为x1,x2. 则对应的数学成绩估计为 y1=6+0.4x1,y2=6+0.4x2,
所以|y1-y2|=|0.4(x1-x2)|=0.4×50=20.
12.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:
^
^
^
^^
^
^
^
^
^
^
^
^
2 7 3 8 5 9 6 12 ruize
时间x 命中率y
1 0.4 2 0.5 3 0.6 4 0.6 5 0.4 小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6h篮球的投篮命中率为________. 考点 两个变量的线性相关的应用 题点 利用线性回归预报变量的值 ★答案★ 0.5 0.53
0.4+0.5+0.6+0.6+0.42.5
解析 y===0.5,
551+2+3+4+5^
x==3.由公式,得b=0.01,
5从而a=y-bx=0.5-0.01×3=0.47. 所以回归方程为y=0.47+0.01x.
所以当x=6时,y=0.47+0.01×6=0.53. 三、解答题
13.2018年元旦前夕,某市统计局统计了该市2017年10户家庭的年收入和年饮食支出的统计资料如下表:
年收入x(万元) 年饮食支出y(万元) 年收入x(万元) 年饮食支出y(万元)
(1)如果已知y与x是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:xiyi=117.7,x2i=406)
i=1
i=1
10
10
^^
^
^
2 0.9 6 1.9 4 1.4 7 1.8 4 1.6 7 2.1 6 2.0 8 2.2 6 2.1 10 2.3 考点 回归直线 题点 求回归直线方程
解 依题意可计算得,x=6,y=1.83,x2=36, xy=10.98,
ruize
又∵xiyi=117.7,x2i=406,
i=1
i=1
1010
xiyi-10x y
∴b=
^
i=1
10
10
≈0.17,a=y-bx=0.81,
2
^
x2i-10x
i=1
^
∴y=0.17x+0.81.
∴所求的线性回归方程为y=0.17x+0.81. (2)当x=9时,y=0.17×9+0.81=2.34(万元)
可估计大多数年收入9万元的家庭每年饮食支出约为2.34万元. 四、探究与拓展
14.某公司过去五个月的广告费支出x(单元:万元)与销售额y(单位:万元)之间有下列对应数据:
x y
工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且回归方程为y=6.5x+17.5,有下列说法:①销售额y与广告费支出x正相关;②丢失的数据(表中▲处)为30;③该公司广告费支出每增加1万元,销售额一定增加6.5万元;④若该公司下月广告费支出为8万元,则销售额约为75万元.其中,正确的说法有( ) A.1个 C.3个
考点 回归直线 题点 回归直线的应用 ★答案★ B
解析 由回归直线方程为y=6.5x+17.5,可知b=6.5,则销售额y与广告费支出x正相关,220+m220+m所以①正确;设丢失的数据为m,由表中的数据可得x=5,y=,把点5,55220+m
代入回归方程,可得=6.5×5+17.5,解得m=30,所以②正确;该公司广告费支出
5每增加1万元,销售额不一定增加6.5万元,所以③不正确;若该公司下月广告费支出为8万元,则销售额约为y=6.5×8+17.5=69.5(万元),所以④不正确.故选B. 15.已知x与y之间的几组数据如下表:
^
^
^
^
^
2 ▲ 4 40 5 60 6 50 8 70 B.2个 D.4个
ruize
x y
1 0 2 2 ^
^
3 1 ^
4 3 5 3 6 4 假设根据上表数据所得线性回归方程为y=bx+a.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( ) A.b>b′,a>a′ B.b>b′,a<a′ C.b<b′,a>a′ D.b<b′,a<a′ 考点 回归直线 题点 求回归直线方程 ★答案★ C
解析 由(1,0),(2,2)求b′,a′. 2-0b′==2,a′=0-2×1=-2.
2-1
求a,b时,xiyi=0+4+3+12+15+24=58,
i=1
^
^
6
^
^
^
^
^
^
^
^
713x=,y=,
26
x2i=1+4+9+16+25+36=91,
i=1
6
71358-6××^265∴b==,
72791-6×213571351
a=-×=-=-,
672623
^
∴b<b′,a>a′.
^^
因篇幅问题不能全部显示,请点此查看更多更全内容