从理论到应用——浅析lasso模型

从理论到应用——浅析lasso模型

ID:20931737

大小:381.50 KB

页数:13页

时间:2018-10-18

从理论到应用——浅析lasso模型_第1页
从理论到应用——浅析lasso模型_第2页
从理论到应用——浅析lasso模型_第3页
从理论到应用——浅析lasso模型_第4页
从理论到应用——浅析lasso模型_第5页
资源描述:

《从理论到应用——浅析lasso模型》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、专业文档本科生学年论文题目:从理论到应用——浅谈lasso模型指导教师:学院:姓名:学号:班级:WORD资料可编辑专业文档从理论到应用——浅谈lasso模型【摘要】回归模型是我们在处理数据中常用的方法。其中,Lasso模型是一种适用于多重共线性问题,能够在参数估计的同时实现变量的选择的回归方法。本文从lasso模型的概念谈起,对其起源、思想、与岭回归的比较、通过lar的算法实现等方面进行了探究。另外还使用R语言对简单案例进行lasso模型的应用。最后简述了lasso模型的研究现状。【abstract】Regressionmodelisourcommon

2、lyusedmethodinprocessingdata.Lassomodelisakindofregressionmethodformultiplelinearproblems,whichcanbeusedtoachieveparameterestimationandvariableselectionatthesametime.Thispaperstartsfromtheconceptofthelassomodel,includingitsorigin,ideas,andthecomparisonofridgeregression,throughla

3、ralgorithmimplementation,etc.Inaddition,usingRlanguagetosolveasimplecasethroughlasso.Atlast,theresearchstatusoflassomodelisintroduced.【关键词】Lasso岭回归最小角回归R语言【keywords】LassoridgeregressionlarRlanguageWORD资料可编辑专业文档目录一、定义及基本信息4二、起源与原理4三、模型的思想4四、Lasso与岭回归51、岭回归的概念52、Lasso与岭回归的比较5五、Las

4、so的算法步骤61、lasso算法实现的背景62、最小角回归73、用lar实现lasso7六、案例分析81、问题描述82、简单线性回归求解93、利用lasso求解11七、应用与研究现状12八、参考资料13WORD资料可编辑专业文档一、定义及基本信息Lasso模型是由RobertTibshirani在1996年JRSSB上的一篇文章Regressionshrinkageandselectionviathelasso所提出的一种能够实现指标集合精简的估计方法。在参数估计的同时实现变量的选择(可以解决回归分析中的多重共线性问题)。全称:LeastAbsolu

5、teShrinkageandSelectionOperator读音:[læ‵su:]而不是[‵læso]RobertTibshirani简介:生于1956年7月10日,担任斯坦福大学theDepartmentsofStatisticsandHealthResearchandPolicy的教授。1985-1998年担任多伦多大学的教授。他主要研究方向是致力于开发处理复杂数据的分析统计工具。Lasso模式是他最著名的贡献。同时在著名的"GeneralizedAdditiveModels","AnIntroductiontotheBootstrap",and

6、"TheElementsofStatisticalLearning"三本书中都有他的编著。[1]二、起源与原理在常规的回归分析中,假设我们有一组(xi,yi),i=1,2,...,N,其中xi=(xi1,...,xip)T,yi是第i维观测值的回归量的数据。普通最小二乘(OLS)通过最小化残差平方和来进行估计。它对数据的分析不那么令人满意通常有两个原因。一是预测精度:OLS往往偏差较低但方差大;预测精度有时可以用缩小或设置一些系数为0的方法来提高。通过这样做,我们牺牲一点偏差减少预测的方差值,因此可以提高整体预测准确性。第二个原因是可解释性的问题。在大

7、量的预测值中,我们通常想确定一个展现出最强影响的更小的子集。两个公认优秀的改善OLS估计的方法是子集选择(subsetselection)和岭回归(ridgeregression)它们都有缺点。子集选择提供了可解释的模型但是可变性非常强,因为它是一个离散的过程——回归量要么保留要么从模型中去掉。小的数据变化就会使得模型的选择改变,这会降低预测准确度。岭回归是连续缩小参数的过程,因此更稳定:然而它不会使得任何参数为0,没办法得出简单的可解释的模型。lasso模型就此提出,Theleastabsoluteshrinkageandselectionopera

8、tor,同时缩小(shrinkage)和设置成参数为0(selection),保持了子集选择和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。