正文描述:《岭回归在财政收入中的应用毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、岭回归在财政收入中的应用信息与计算科学2003级母培松指导老师杜世平副教授摘要:本论文介绍了岭回归的统计学原理和方法,阐述了岭回归和最小偏二乘法的差别和关系,总结了评价岭回归的效应的性质和其确定方法,讨论了岭回归在经济领域中的具体应用,并用matlab软件来实现计算程序。关键词:岭回归,岭迹,病态矩阵,有偏估计RidgeregressionreturnforrevenueMuPeisongInformationandComputationalScience,Grade2003DirectedbyDushiping(AssociateProfessor)Abstract:Thispaperi
2、ntroducedtheridgeregressionstatisticaltheoryandmethods,Describedthedifferencesandrelationshipsintheridgeregressionandthepartialleasttwomultiplication,RaisedridgeRegressionevaluationofthekeffectofnatureanditsmethod,Moredetaileddiscussionsontheridgeregressionintheeconomicfieldthespecificapplication,
3、usingMatlabsoftwaretoachieveprogram.Keywords:RidgeRegression,RidgeTrace,PathologicalMatrix,BiasedEstimate1引言在回归分析中最小二乘法是最常用的方法,使用最小二乘法的一个前提是不为零,即矩阵非奇异,当所有变量之间有较强的线性相关性时,或者变量之间的数据变化比较小或者部分变量之间有线性相关性时,矩阵的行列式比较小,甚至趋近于0,一般在实际应用中处理:当<0.01时常被称为病态矩阵[1~2],它表明最小二乘法并非在各方面都尽善尽美,因为这种矩阵在计算过程中极易造成约数误差,因此得到的数据往往
4、缺乏稳定性和可靠性。岭回归是在自变量信息矩阵的主对角线元素上人为地加入一个非负因子19,从而使回归系数的估计稍有偏差、而估计的稳定性却可能明显提高的一种回归分析方法,它是最小二乘法的一种补充,岭回归可以修复病态矩阵,达到较好的效果。近年来,它在经济、工业生产、工程技术、环境保护等方面已有一定的应用。本论文介绍了岭回归的相关理论,以及岭回归与常回归的联系与区别,并结合实际例子阐述岭回归的应用。2岭回归的统计基础2.1岭迹的概念线性回归分析的正规方程组可以写成:(1)其最小平方解则为:(2)式(1)和(2)中的为自变量的阶矩阵,为的转置,为对称的方阵,通常称为信息矩阵,为的逆阵,为因变量的向量
5、,为待解元,即回归系数的向量,这里的为观察值组数,为待估计的回归系数。当时,矩阵为病态矩阵,这样最小偏二乘法就会产生较大的误差,是的无偏估计,但很不稳定,在具体取值上与真值有较大的偏差,甚至有时会出现与实际经济意义不符的正负号。如果我们在的主对角线元素上加上一个非负因子,即令:=(3)(为阶单位矩阵),那么和有何不同呢(下文在这些统计数后均加标记(),便于与最小二乘法,即=0的统计数相区别)?最先研究这一问题的是Hoerl和Kennard以及Marquardt[5],他们的基本结论是:是的非线性函数;=0时,=同为最小平方估计数;而后,随着的增大,中各元素的绝对值均趋于不断变小(由于自变数
6、间的相关,个别可能有小范围的向上波动或改变正、负号),它们对的偏差也将愈来愈大;如果,则。随的改变而变化的轨迹,就称为岭迹,参见图1,岭迹图表明,的加入使成为回归系数的有偏估计数。192.2的效应实际上,的加入会影响到回归分析中的许多统计数[3,4,9],而不仅是上述的。其中最重要的还有以下两项:1)随着的增大,离回归平方和和离回归均方都将增大,亦即必有和,这是随着增大的偏差也愈来愈大的直接反应[3,4,9]。2)随着的增大,的逆阵、即的主对角元素将不断减小[3,4,9],亦即必有。由于回归系数的误差均方,所以在适当可能使和,即回归系数的误差均方之和较=0时为小,这意味着的估计将比更稳定。
7、3岭回归程序3.1模型变换通常的线性回归模型为[5]:(4)具有:,,该模型中回归系数的最小平方估计为:(5)岭回归分析通常要先对变数作中心化和标量化处理[3~4],以使不同自变数处于同样数量级上而便于比较,这就是引入新变数,令(6)于是式(4)变为:19(7)进一步有:,上述表示回归系数,是由变数估计,它们在统计上又称为标准化回归系数。的最小平方估计为:(由于)(8)所以在实际分析中,因变数可仍用观察值向量而不用中心化
显示全部收起
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。