线性回归中非多重共线性假定与解决方案（1）

2013-12-18 MedSci MedSci原创

adminms

北京妇产医院妇幼保健院医生/ 主任医师

span> (7.27) (7.28)当样本容量增大时，和也增大，而趋近于总体相关系数，为某一个确定的值，所以与均趋于减小，从而提高了

1. 非多重共线性假定

对于多元线性回归模型

y_t = b₀+ b₁x_t₁ + b₂x_t₂ + … + b_k_-1x_tk_-1 + u_t

的假定之一是解释变量间不存在多重共线性，即

|| ¹1, (i, j = 1, 2, …, k-1, i ¹ j) (7.1)

或

|| 不近似等于1, (i, j = 1, 2, …, k-1, i ¹ j) (7.2)

其中表示x_i, x_j的相关系数。若用矩阵描述，则非多重共线性假定是

　　rk (X 'X ) = rk (X ) = k (7.3)

其中rk (X )表示X的秩。k表示X的列数。

在k-1元回归模型中，就解释变量之间的关系而言，有三种可能。

（1）= 0，(i, j = 1, 2, …, k-1, i ¹ j)。解释变量之间相互独立，是正交的。此时多元回归模型中的回归系数b_j都可以通过与之相对应的简单线性回归方程来估计。

（2）|| = 1，(i, j = 1, 2, …, k-1, i ¹ j)。解释变量间存在完全的线性关系。这时模型参数将无法确定。直观地分析，当两个解释变量按同一方式变化时，要分清每个解释变量对因变量的影响程度是非常困难的。

（3）实际中，上面两种情形是很少见的。常见的情形是

0< ||<1，(i, j = 1, 2, …, k-1, i ¹ j)

即解释变量间存在一定程度的线性关系。随着共线性程度的加强，对回归参数估计的准确性和稳定性都会带来影响。因此我们关心的不是有无多重共线性，而是多重共线性的程度。

若解释变量之间存在 || =1，称解释变量完全共线性。若解释变量之间存在 || 接近1，称解释变量不完全共线性。这两种情形都会给回归参数的估计带来不良影响。

{nextpage}

1. 多重共线性的来源

在实际的经济问题中，多重共线性是一种普遍存在的现象。它主要来自两个方面。

（1）经济变量在时间上有共同变化的趋势。当经济处于上升时期，如国民收入，固定资产投资，国民消费，就业率等都增长；当经济处于低迷时期，这些变量又都趋于下降。显然，当模型中选用了若干这样的变量作解释变量时，就会出现多重共线性。

（2）有时模型中考虑把某些解释变量的滞后变量作为单独的解释变量加入模型。当期变量与其滞后变量作为两个变量自然是相关的，所以可以肯定，在含有当期变量与其滞后变量做解释变量的模型中常存在多重共线线性。如

消费_t = f (收入_t，收入_t_-1)

库存额_t = f (销售额_t，销售额_t_-1，销售额_t_-2)

问题中常存在多重共线性。

{nextpage}

第三节多重共线性的后果

7.1节介绍多重共线性，其中包括两种情形。一种是解释变量间存在完全线性关系，称完全多重共线性；一种是解释变量间有近似的线性关系，称不完全多重共线性。下面按这两种情形分别讨论多重共线性引起的后果。

1. 完全多重共线性的后果

(1) 回归系数估计量变得不稳定。以二元线性回归模型y_t=b₀+b₁x_t₁+b₂x_t₂+u_t为例进行讨论，有。查看证明过程

同理也有类似结果。可见，当=1时，,的值变得不稳定。

（2）回归系数的方差变得无穷大。对于模型（7.4），

(7.11)

(7.12)

把（7.9）式代入（7.11）式

(7.13)

从而使Var() 变为无穷大。同理Var() 也变为无穷大。不难推证，以上结论对k-1个解释变量的多元回归模型也适用。

2. 不完全共线性的后果

完全共线性是一种不常见的极端情况。当解释变量间存在不完全多重共线性时，下面仍以二元线性回归模型为例，说明所导致的后果。

二解释变量x_t₂, x_t₁的关系表示如下。

x_t₂= l x_t₁ + v_t (7.14)

其中l ¹ 0，v_t为随机误差项，Cov(x_t₁,v_t) = 0（只要v_t ¹ 0，x_t₂, x_t₁的相关系数就不等于1）。把（7.14）式代入（7.10）式

(7.15)

（上式的推导中利用了条件Cov(x_t₁,v_t) = 0。）同理也可推导出的表达式。显然在不完全多重共线性条件下，,是可估计的。

下面分析,的方差。由（7.11）式，

(7.16)

同理

(7.17)

从（7.16）和（7.17）式可以看出，当 || 接近1时，即当解释变量间存在不完全多重共线性时，,的方差逐渐增加；当 || = 1时，Var()，Var() ® ¥。

为对回归系数估计量的方差随解释变量的相关系数 || 的增加而增加的情形有所了解，看表7.1。表中给出Var() 随 || 增加而迅速增加的情形，当= 0时，Var()计算公式（7.16）退化为简单线性回归模型方差的计算公式。当= 0.8时，Var()是= 0（非多重共线性）时相应方差的2.78倍。当= 0.99时，Var() 高达50.25倍（根据（7.16）式计算）。

表7.1 Var() 随增加变化表

	Var()
0.00	(s²/S₁₁)
0.50	1.33 (s²/S₁₁)
0.80	2.78 (s²/S₁₁)
0.90	5.26 (s²/S₁₁)
0.95	10.26 (s²/S₁₁)
0.98	25.25 (s²/S₁₁)
0.99	50.25 (s²/S₁₁)
1.00	¥

相似的结论可以向k-1个解释变量的多元线性回归模型推广。回归系数估计量方差的增加导致回归系数估计量的抽样精度下降，t统计量的值变小，使假设检验失去意义。

3. 多重共线性后果的矩阵描述

（1）当 || = 1，即解释变量间存在完全多重共线性时，X为降秩矩阵，则 (X'X)^-1不存在，= (X 'X)^-1 X 'Y 不可计算，() = (X 'X)^-1不可计算。

（2）若 || ¹1，但 | r_x_{i x}_j | 接近1，即解释变量间存在不完全多重共线性时，仍具有无偏性。

E() = E[(X 'X)^-1X 'Y ] = E[(X 'X) ^-1X '(Xb + u)]

= b + (X 'X)^-1X 'E(u)= b

因为X 'X接近降秩矩阵，即 | X 'X | 接近0，() = (X 'X)^-1变得很大。所以丧失有效性。

{nextpage}

多重共线性检验

下面介绍二种检验方法。

1. 分析用样本估计的多元回归方程

如果回归方程的拟合优度（可决系数）R²很高，而回归系数估计量的t统计量的值却都很低（t检验通不过），即的估计方差，（j = 1, 2, …, k-1）都非常大，说明解释变量间存在严重的多重共线性。举例说明如下

例7.1 关于家庭人均消费y_t，家庭人均收入x₁和家庭人均储蓄x₂的数据如表7.2。

表7.2 人均消费y_t，人均收入x₁，人均储蓄x₂数据

y_t	x₁	x₂
70	80	810
65	100	1009
90	120	1273
95	140	1425
110	160	1633
115	180	1876
120	200	2052
140	220	2201
155	240	2435
150	260	2686

得二元线性回归方程OLS估计结果如下，

= 24.7747 + 0.9415 x₁ - 0.0424 x₂ (7.18)

（1.14）（-0.53） R²= 0.96，F =92.4

从结果看，可决系数R² = 0.96已相当高。x₁, x₂共同解释了因变量y_t变差的96%。F = 92.4，说明检验结果高度显著。但与,相应的t值却都很低。在a = 0.05甚至a = 0.1水平上都未能通过显著性检验。此外b₂估计值为负（-0.0424），也与常理和经济理论不符。以上现象说明解释变量x₁, x₂间存在严重的多重共线性。

下面考察x₁与x₂的相关系数。得= 0.9979。说明x₁与x₂几乎是完全共线性的。分别用y_t对x₁, x₂作简单线性回归，得

= 24.4545 + 0.5091 x₁

(14.2) R² =0.96

= 24.3480 + 0.0498 x₂

(13.4) R² = 0.96

可见，x₁, x₂都是y_t的重要解释变量。它们各自都能解释因变量y_t变差的96%。但是，当用x₁, x₂做二元回归时（见（7.18）式），两个回归系数估计量却都未能通过t检验。

2. Klein判别法

对于多元线性回归模型

y_t = b₀+ b₁x_t₁ + … + b_k_-1x_tk_-1 + u_t

Klein判别法的步骤如下：

（1）计算回归方程的可决系数R²以及解释变量的简单相关系数, (i, j = 1, 2, …, k-1, i ¹ j)。

（2）若存在某个 || > R²，则认为x_i与x_j间存在严重的多重共线性。

例7.2 用1975-1986年全国货运量y_t（亿吨），农业总产值x₁（千亿元），重工业总产值x₂（千亿元），轻工业总产值x₃（千亿元），数据（摘自中国统计年鉴1987）得关于货运量的三元线性回归方程如下

= 14.6119 - 5.8515 x₁+ 3.9752 x₂+5.3225 x₃ (7.19)

(-2.20) (2.46) (1.98) R²= 0.87, F= 17.9

三个解释变量x₁，x₂，x₃的简单相关系数如下：

r_x_1,
x2 = 0.984， r_x_1,
x3 = 0.994， r_x_2,
x3 = 0.975

因为解释变量间的三个相关系数都大于三元回归方程的可决系数0.87，所以依据Klein判别法，解释变量间的多重共线性是严重的。

版权声明：
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料，版权均属于梅斯医学所有。非经授权，任何媒体、网站或个人不得转载，授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章，或“梅斯号”自媒体发布的文章，仅系出于传递更多信息之目的，本站仅负责审核内容合规，其内容不代表本站立场，本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。
在此留言

评论区 (3)

#插入话题

插入图片

[GetPortalCommentsPageByObjectIdResponse(id=1701377, encodeId=31fd1e013771d, content=<a href='/topic/show?id=214ee756845' target=_blank style='color:#2F92EE;'>#线性回归#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=135, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=77568, encryptionId=214ee756845, topicName=线性回归)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=748630348850, createdName=天堂的云, createdTime=Tue Sep 09 20:25:00 CST 2014, time=2014-09-09, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1987974, encodeId=9706198e9747f, content=<a href='/topic/show?id=446a91002d6' target=_blank style='color:#2F92EE;'>#解决方案#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=69, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=91002, encryptionId=446a91002d6, topicName=解决方案)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=c279140, createdName=vividelife, createdTime=Thu Jun 12 23:25:00 CST 2014, time=2014-06-12, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1946393, encodeId=2afa1946393cd, content=<a href='/topic/show?id=184f30033b6' target=_blank style='color:#2F92EE;'>#共线性#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=62, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=30033, encryptionId=184f30033b6, topicName=共线性)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=9cb02500048, createdName=ms6832696159214430, createdTime=Thu Apr 24 11:25:00 CST 2014, time=2014-04-24, status=1, ipAttribution=)]
2014-09-09 天堂的云

#线性回归#

135 0
[GetPortalCommentsPageByObjectIdResponse(id=1701377, encodeId=31fd1e013771d, content=<a href='/topic/show?id=214ee756845' target=_blank style='color:#2F92EE;'>#线性回归#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=135, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=77568, encryptionId=214ee756845, topicName=线性回归)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=748630348850, createdName=天堂的云, createdTime=Tue Sep 09 20:25:00 CST 2014, time=2014-09-09, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1987974, encodeId=9706198e9747f, content=<a href='/topic/show?id=446a91002d6' target=_blank style='color:#2F92EE;'>#解决方案#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=69, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=91002, encryptionId=446a91002d6, topicName=解决方案)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=c279140, createdName=vividelife, createdTime=Thu Jun 12 23:25:00 CST 2014, time=2014-06-12, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1946393, encodeId=2afa1946393cd, content=<a href='/topic/show?id=184f30033b6' target=_blank style='color:#2F92EE;'>#共线性#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=62, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=30033, encryptionId=184f30033b6, topicName=共线性)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=9cb02500048, createdName=ms6832696159214430, createdTime=Thu Apr 24 11:25:00 CST 2014, time=2014-04-24, status=1, ipAttribution=)]
2014-06-12 vividelife

#解决方案#

69 0
[GetPortalCommentsPageByObjectIdResponse(id=1701377, encodeId=31fd1e013771d, content=<a href='/topic/show?id=214ee756845' target=_blank style='color:#2F92EE;'>#线性回归#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=135, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=77568, encryptionId=214ee756845, topicName=线性回归)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=748630348850, createdName=天堂的云, createdTime=Tue Sep 09 20:25:00 CST 2014, time=2014-09-09, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1987974, encodeId=9706198e9747f, content=<a href='/topic/show?id=446a91002d6' target=_blank style='color:#2F92EE;'>#解决方案#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=69, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=91002, encryptionId=446a91002d6, topicName=解决方案)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=c279140, createdName=vividelife, createdTime=Thu Jun 12 23:25:00 CST 2014, time=2014-06-12, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1946393, encodeId=2afa1946393cd, content=<a href='/topic/show?id=184f30033b6' target=_blank style='color:#2F92EE;'>#共线性#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=62, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=30033, encryptionId=184f30033b6, topicName=共线性)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=9cb02500048, createdName=ms6832696159214430, createdTime=Thu Apr 24 11:25:00 CST 2014, time=2014-04-24, status=1, ipAttribution=)]
2014-04-24 ms6832696159214430

#共线性#

62 0

内科

外科

专科科室

热点

按科室浏览

临床工具

科研工具

其他工具

科研数智化

真实世界研究解决方案

数字化学术传播解决方案

其它

研究设计与统计

线性回归中非多重共线性假定与解决方案（1）

相关资讯

科室

工具

服务

研究设计与统计

线性回归中非多重共线性假定与解决方案（1）

相关资讯

Spine：术前冠状位脊柱不平衡对术后功能无显著影响

科室

工具

服务