欢迎来到天天文库
浏览记录
ID:15152170
大小:117.50 KB
页数:5页
时间:2018-08-01
《解决动物性状多重共线性的一种方--逐步通径分析法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、解决动物性状多重共线性的一种方 ——逐步通径分析法孙德林焦骅冯蕴华(农业部农经学院沈阳农业大学)动物性状多重共线性是指多元回归中自变量间存在着高度相关性。导致自变量与因变量间的回归关系发生改变。失去自变量与因变量间原有的生物学意义。本文选择奶牛305天产奶量(y)与最高日产出现天数(X1)。最高月产奶量(X2)、90天产奶量(X3)、最高日产奶量(X4)及30天产奶量(X5)六个性状资料。运用通径分析原理与方法阐述动物性状多重共线性的存在及产生的原因。并进行逐步通径分析建立最优回归方程
2、。把引起多重共线性的自变量弃留在回归方程之外。从而达到科学预测之目的。一、动物性状多重共线性现象 动物性状多重共线性主要表现在简单回归系数和偏回归系数符号相反。同时表现不合实际的回归系数。下面结合实例加以说明。 资料取自辽宁省锦州市种畜场黑白花奶牛产奶记录。对上这六个性状。采用普通最小二乘法建立回归方程。=-2430.97+31.45X1-28.23X2+17.97X3+484.35X4-34.48X5 从上述回归方程可以看出:最高日产奶出现天数(X1)增加一个单位。305天产奶量(y)增辑3145单位。即产
3、奶高峰出现越晚。对305天产奶量越有利。最高月产奶量(X2)增加一个单位。305天产奶量(y)减少28.23单位。即最高月产对305天产奶量有不利的影响。以上两点与实际情况不符。奶牛实践证明。产奶高峰出现越早越好。希望产奶高峰早日到来,最高月产奶量对305天产奶量极为有利,必然表现“正”联系。二、动物性状多重共线性的剖分根据通径分析原理。我们可以建立如下正规方程组。根据原始资料可计算变量间两两简单相关系数列表如下。并代上式求解出各通径系数。各性状相关矩阵表性状X1X2X3X4X5X6最高日产出现天数(X1)1000000-0.
4、124277-0.165490-0.247799-0.147389-0.156218最高月产级量(X2) 10000000.9740230.9559420.8685420.72560490天产奶量(X3) 10000000.9489200.9183850.727383最高日产奶量(X4) 10000000.8842370.68840330天产奶量(X5) 10000000.556947Py·x1=0.041534。Py·x2=-0.449499。Py·x3=1.250212。Py·x4=0.620192。Py·x5
5、=-0.725743。其符号与偏回归系数一致。我们知道。一个现象原因与结果的关系可以剖分成直接原因与间接原因。即:所以,必然有:根据这个原理我们可对上述几个不合理的通径系数其组成加以剖分。x1对y的通径系数Py·x1=0.041534的组成。x2对y的通径系数Py·x2=-0.449449的组成。=0.725604-[(-0.124277)×0.041534+0.974023×1.250212+0.955942×0.620192+0.868542×(-0.725743)]=-0.449449 以上剖分可以看出。通径系数(
6、或偏回归系数)受两方面因素影响。一是该自变量与因变量间相关系数的大小。一是该自变量与其他自变量相关系数大小。因此,不能孤立看待一个通径系数。x对y的通径系数Py·x1=0.041534,而二者相关系数rx1y=-0.156218。一个是“正”值,一个是“负”值。按照过去通径系数理论分析。x1对y的直接作用是“正”值。其实这并不够全面。而且与事实相反。造成“正”值通径系数原因是,x1与x2。x4存在负相关。原有x1y相关系数量“负”值再减去一个比自己大的“负”数。必然表现为“正”数。x1与y间真实关系一定是“负”的,x2对y的通
7、径系数Py·x2=-0.449449。而rx2y=0.725604同样是一正一负。这是因为x2与x3、x4耻辱在较高正相关(rx2x3=0.974023。rx3x4=0.955942)。原x2y相关系数的“正”值减去1一个比自己大的“正”值必然出现一个“负”数。这种现象称x2与x3。X4存在“共线性”。即是由于多重共线性造成x2对y的通径系数Py·x2=-0.449449与实际情况不符的原因。 因为通径系数符号与相应偏回归系数符号一致。所以上述对Py·x1。Py·x2解释同样适合b1=31.45。b2=-28.23。这就
8、是多重共线性造成的结果。三、逐步通径分析 动物性状中多重共线性解决办法尚未见过报道。这里采用逐步通径分析法加以解决。其步骤如下。1.计算各自变量标准化回归平方和计算公式:。则。。。。2.挑选平方和最大者引入方程。并作显著性检验。上述平方和。为最大。所以x2首先被引入方程
此文档下载收益归作者所有