多重共线性的产生原因及其诊断处理_刘国旗.pdf

多重共线性的产生原因及其诊断处理_刘国旗.pdf

ID:47997558

大小:123.63 KB

页数:4页

时间:2020-01-11

多重共线性的产生原因及其诊断处理_刘国旗.pdf_第1页
多重共线性的产生原因及其诊断处理_刘国旗.pdf_第2页
多重共线性的产生原因及其诊断处理_刘国旗.pdf_第3页
多重共线性的产生原因及其诊断处理_刘国旗.pdf_第4页
资源描述:

《多重共线性的产生原因及其诊断处理_刘国旗.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第24卷第4期合肥工业大学学报(自然科学版)Vol.24No.42001年8月JOURNALOFHEFEIUNIVERSITYOFTECHNOLOGYAug.2001多重共线性的产生原因及其诊断处理刘国旗(安徽医科大学卫生管理学院,安徽合肥230032)摘要:随着计算机应用的普及,多元回归分析在生产、科研等实践中得到广泛应用。但是,在使用线性回归模型时,容易忽视应用条件,即自变量间不存在近似线性关系,否则会使结果不准确,甚至严重偏离变量间本来的依存关系。因此,有必要分析多重共线性的产生原因及对线性回归模型的影响,进而给出诊断多重

2、共线性的常用方法,最后总结几种克服共线性的方法,并以卫生管理中的一个实例加以说明。关键词:多元回归分析;线性模型;多重共线性;卫生人力中图分类号:O212;R195文献标识码:A文章编号:1003-5060(2001)04-0607-04Causeofmulti-collinearityanditsdiagnosisandtreatmentLIUGuo-qi(CollegeofHealthManagement,AnhuiMedicalUniversity,Hefei230032,China)Abstract:Intheapplc

3、ationofmultipleregressionanalysis,theapplicationconditionthatthereisnolinearrelationshipbetweenindependentvariablesisapttobeoverlooked,thereforetheobtainedresultmaybecomeincorrectandevenbefarfromtheoriginalrelationshipbetweenthevariables.Inthispa-per,thecauseofmulti-

4、collinearityanditseffectonlinearregressionareanalyzed,andsomeusefulwaysofdiagnosingandtreatingmulti-collinearityareintroduced.Anexampleofhealthmanagementispresentedtoshowthediagnosingandtreatingmethods.Keywords:multipleregressionanalysis;linearmodel;multi-collinearit

5、y;healthmanpower0引言多元统计分析是数理统计学近年来迅速发展的一个分支,多元分析方法是一种很有用的数据处理方法,而线性回归是多元分析中用得较多的一种统计分析方法,在医学科学和卫生管理研究中同样得到广泛使用。例如:①描述某些因素与某一医学现象间的数量关系;②分析某些因素对疾病发生、发展及预后的影响程度;③进行疾病和卫生事业发展水平的预测、预报等。[1]多元线性回归模型及其基本假设为Y=U0+U1X1+U2X2+…+UkXk+X(1)收稿日期:2001-03-26作者简介:刘国旗(1964-),男,安徽合肥人,安徽医

6、科大学讲师.608合肥工业大学学报(自然科学版)第24卷式中Y——因变量Xj——自变量U0、Uj——自变量系数,称为模型参数(j=1,2,…,k)X——随机误差项若调查或试验得n组数据,可令y11x11x12…x1kU0X1y21x21x22…x2kU1X2Y=X=β=ε=yk1xn1xn2…xnkUkXn则(1)式可用矩阵表示为Y=Xβ+ε(2)基本假设如下:(1)因变量Y与自变量Xj之间存在(1)式的线性统计关系。(2)Xj是确定性变量,可以控制或预先给定,且Xj之间不存在线性关系或较强的统计相关性。2(3)各误差项εi为独

7、立随机误差,服从N(0,σ)分布。模型的回归方程为Y=Xβ,在满足基本假设的条件下,由最小二乘法求得正规方程,从而可得参数的最佳线性无偏估计。即T-1TU=(XX)XY,rank(X)=k+1(3)但在实际应用中,常会因某个假设条件不满足而导致模型失效,最常见的是违背基本假设(2)去解释变量之间的多重共线性。1多重共线性对模型的影响T若某些自变量间存在完全线性相关性,则X的秩小于k+1,(XX)是不可逆的,因而不能求得各偏回归系数的LS估计或估计值不唯一,这种极端情况称为“完全多重共线性”,在实际工作中也较少见。一般情况下,自变

8、量之间都存在一定程度的相关性,如研究肿瘤病人的余命,与初始治疗的时间、肿瘤恶变程度、病人经济状况及治疗方法等有关,一般经济状况好的病人选择治疗方法会好些,因此这两种因素有相关性。若相关程度较低,其影响可以忽略。若相关程度较高,则会使各回归系数估计的方差很大,[2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。