【实验目的】
掌握多重共线性的检验及处理方法 【实验内容】
建立并检验我国钢材产量预测模型 【实验步骤】
【例1】表1是1978-1997年我国钢材产量(万吨)、生铁产量(万吨)、发电量(亿千瓦时)、固定资产投资(亿元)、国内生产总值(亿元)、铁路运输量(万吨)的统计资料。
表1 我国钢材产量及其它相关经济变量统计资料 年份 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 钢材产量Y 2208 2497 2716 2670 2920 3072 3372 3693 4058 4386 4689 4859 5153 5638 6697 7716 8428 8980 9338 9979 生铁产量X1 3479 3673 3802 3417 3551 3738 4001 4384 5064 5503 5704 5820 6238 6765 7589 8956 9741 10529 10723 11511 发电量X2 2566 2820 3006 3093 3277 3514 3770 4107 4495 4973 5452 5848 6212 6775 7539 8395 9281 10070 10813 11356 固定资产投资X3 668.72 699.36 746.9 638.21 805.9 885.26 1052.43 1523.51 1795.32 2101.69 2554.86 2340.52 2534 3139.03 4473.76 6811.35 9355.35 10702.97 12185.79 13838.96 国内生产总值X4 3264 4038 4518 4862 5295 5935 7171 8964 10202 11963 14928 16909 18548 21618 26638 34634 46759 58478 67885 74463 铁路运输量X5
一、检验多重共线性 ⒈ 相关系数矩阵检验法
利用相关系数可以分析解释变量之间的两两相关情况。在Eviews软件中可以直接计算相关系数矩阵。
本例中,在Eviews软件命令窗口中键入:
COR X1 X2 X3 X4 X5
或在包含所有解释变量的数组窗口中点击View\\Correlations,其结果如图6-1所示。由相关系数矩阵可以看出,解释变量之间的相关系数均为0.8以上,大部分更在0.9以上,即解释变量之间是高度相关的。
图6-1 解释变量间的相关系数矩阵
2. 综合统计检验法
将Y对所有的解释变量回归,即LS Y C X1 X2 X3 X4 X5,得到图6-2所示的结果:
图6-2 多元线性回归结果
图6-2的结果中,R2和F的值都很大,但T的绝对值都比较小,同时,X4和X5的系数估计值不合理,所以此模型存在多重共线性。
3. 辅助回归方程检验
当解释变量多于两个且变量之间呈现出较复杂的相关关系时,可以通过建立辅助回归模型来检验多重共线性。本例中,在Eviews软件命令窗口中键入:
LS X1 C X2 X3 X4 X5 LS X2 C X1 X3 X4 X5 LS X3 C X1 X2 X4 X5 LS X4 C X1 X2 X3 X5 LS X5 C X1 X2 X3 X4
2
对应的回归结果如图2-6所示。
图6-3
图6-4
3
图6-5
图6-6
4
图6-7
上述每个回归方程的R2都很大,F检验值都非常显著,方程回归系数的T检验值表明:X1与X5,X2与X3,X3与X2、X5,X4与X5,X5与X1、X3、X4的T检验值较小,这些变量之间可能不相关或相关程度较小。
二、利用逐步回归方法处理多重共线性 ⒈建立基本的一元回归方程
根据相关系数和理论分析,钢材产量与生铁产量关联程度最大。所以,设建立的一元回归方程为:
YX1
⒉逐步引入其它变量,确定最适合的多元回归方程(回归结果如表2所示) 表2 逐步回归过程 模型 C -567.90 (0.000) -34.57 (0.711) 2896.26 (0.000) 2720.44 (0.000) -9760.9 (0.000) X1 0.9214 (0.000) X2 X3 X4 X5 R2阶段 最优 √ Y=f(X1) 0.8841 (0.000) 0.9941 Y=f(X2) 0.5725 (0.000) 0.9952 Y=f(X3) 0.1088 (0.000) 0.9263 Y=f(X4) 0.1068 (0.000) 0.9360 Y=f(X5) 0.8726 5
Y=f(X1,X2) -287.69 (0.011) -703.21 (0.015) -636.3 (0.028) -1349.2 (0.015) -260.78 (0.245) -393.01 (0.061) -188.88 (0.708) 0.4159 (0.003) 0.959 (0.000) 0.9414 (0.000) 0.8578 (0.000) 0.4051 (0.012) 0.4433 (0.003) 0.4073 (0.006) 0.4872 (0.001) -0.0249 (0.574) 0.9970 √ Y=f(X1,X3) -0.0025 (0.779) 0.9939 Y=f(X1,X4) 0.0084 (0.126) 0.9938 Y=f(X1,X5) Y=f(X1,X2, X3) Y=f(X1,X2, X4) Y=f(X1,X2, X5) 0.4910 (0.001) 0.4911 (0.001) 0.5025 (0.002) 0.0046 (0.889) 0.9946 -0.0039 (0.535) 0.9969 -0.0010 (0.841) 0.9969 0.9969 所以,建立的多元回归模型为: Y = -287.69 + 0.4159*X1 + 0.4872*X2
6
因篇幅问题不能全部显示,请点此查看更多更全内容