资源描述:
《毕业论文:岭回归及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中南民族大学毕业论文学院:数学与统计学学院专业:统计学年级:2009级题目:岭回归及其应用学生姓名:莫文扬学号:09063202指导教师姓名:汪宝彬职称:副教授2013年5月3日中南民族大学本科毕业论文(设计)原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果.除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品.本人完全意识到本声明的法律后果由本人承担.作者签名:年月日目录摘要1关键词1Abstract1KeyWords1引言21多元线性回归模型21.
2、1多元线性回归模型的两种形式21.1.1一般形式21.1.2典则形式31.2多元线性回归模型的普通最小二乘估计31.3多元线性回归模型的多重共线性41.3.1多重共线性的定义41.3.2多重共线性的成因41.3.3多重共线性的常见诊断方法41.4多元线性回归模型的有偏估计61.4.1均方误差61.4.2常见的有偏估计62岭回归62.1岭回归产生的背景62.2岭回归估计的定义72.3岭回归估计的性质及其优良性82.4岭迹分析82.5岭参数的确定方法之岭迹法102.6基于岭回归方法的模型自变量的选择112.7广义岭回归113岭
3、回归的实证分析11结论18致谢18参考文献19岭回归及其应用摘要:本文首先通过介绍线性回归模型相关的背景知识来引出岭回归这种有偏估计方法,其次从各方面对该方法进行了深入的分析和综述,最后为了体现出在解决多重共线性问题上岭回归法比LS法的优越性,使用了SPSS19.0统计软件着重对中国民航客运量的这一实例做了详细的岭回归分析和具体操作步骤的说明,比较两种方法的优劣的同时突出了岭回归的特殊作用.关键词:多重共线性;最小二乘估计;岭回归;岭迹;岭参数RidgeregressionanditsapplicationAbstract
4、:Inthispaper,weintroducetheridgeregressionbasedonthebackgroundofthelinearregressionmodel.Thenwealsoanalysisandreviewthebiasedestimationaccordingtoseveralaspects.InordertopresenttheadvantageoftheridgeregressionpriortoLSmethod,wefocusonthestatisticalinferenceonChina
5、’scivilaviationpassengertrafficbySPSS19.0.Theconcretestepsaregiven,Comparetheadvantagesanddisadvantagesofthetwomethodsatthesametimehighlightingthespecialfunctionofridgeregression.KeyWords:Multicollinearity;Theleastsquaresestimation;Ridgeregression;Ridge;Ridgeparam
6、eter21引言众所周知,最小二乘估计(LS)有许多优良的性质,它在线性统计模型的参数估计理论中占有十分重要的地位,特别是1900年Markov证明了著名Gauss-Markov定理,阐明了最小二乘估计在线性无偏估计类中是方差最小的.然而,随着电子计算机的飞速发展,人们越来越多的使用计算机来处理大型回归问题.这时,由于处理的自变量很多,有时难免会出现多重共线性问题,这往往导致LS估计的性质不理想,甚至很坏,这具体表现在LS估计的均方误差会变得很大,此时,尽管LS估计是线性最佳无偏估计,但却不再是个好的估计.于是,近几年来,
7、许多统计学者致力于改进LS估计,提出了许多新的估计,其中很重要的一类估计就是有偏估计.其中主要有岭估计、stein估计、主成分估计以及特征根估计等,这些估计有一个共同点:有偏性,即它们的均值并不等于待估参数;但是,这些估计的均方误差都比最小二乘估计要小.岭回归是在自变量信息矩阵的主对角线元素上人为地加入一个非负因子,从而使回归系数的估计稍有偏差、而估计的稳定性却可能明显提高的一种回归分析方法,它是最小二乘法的一种补充,岭回归可以修复病态矩阵,达到较好的效果.近年来,它在经济、工业生产、工程技术、环境保护等方面已有一定的应用
8、.本论文介绍了多元线性回归模型的多重共线性问题、岭回归的相关理论(包括定义、性质和优良性等),重点在于介绍岭参数的选择并结合实际例子阐述岭回归的应用.目前,就国内的发展水平来看,有关岭回归的论文颇多,大多集中在硕士和博士论文,本文不将主要内容放在理论的证明上,而是更加侧重于实证的分析,使用的统计软件版本