基于Lasso类方法在时间序列变量选择中的应用.pdf

基于Lasso类方法在时间序列变量选择中的应用.pdf

ID:53003796

大小:1.13 MB

页数:7页

时间:2020-04-10

基于Lasso类方法在时间序列变量选择中的应用.pdf_第1页
基于Lasso类方法在时间序列变量选择中的应用.pdf_第2页
基于Lasso类方法在时间序列变量选择中的应用.pdf_第3页
基于Lasso类方法在时间序列变量选择中的应用.pdf_第4页
基于Lasso类方法在时间序列变量选择中的应用.pdf_第5页
资源描述:

《基于Lasso类方法在时间序列变量选择中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、鲁东大学学报(自然科学版)JournalofLudongUniversity(NaturalScienceEdition)2016,32(1):14—18基于Lasso类方法在时间序列变量选择中的应用杨丽娟,马云艳(鲁东大学数学与统计科学学院,山东烟台264039)摘要:在时间序列场合下对Lasso方法与AdaptiveLasso方法进行比较,数值模拟结果表明AdaptiveLasso方法比Lasso方法更加有效.通过对沪深300指数的技术指标的历史数据进行变量选择,比较发现二者均可以有效并准确地选择出合适变量,且Adapt

2、iveLasso方法的参数估计相对更加精确.最后,根据选出变量及其参数进行预测,结果表明AdaptiveLasso方法变量选择和参数估计效果良好.关键词:Lasso方法;变量选择;时间序列中图分类号:O212.1文献标志码:A文章编号:1673-8020(2016)01-0014-05近几年来,使用数理统计模型从大量数据中有效地挖掘出信息越来越受到业界的关注.在建立模型的初期,为了尽量减小因缺少重要的自变量而出现的模型偏差,人们通常会选择尽可能多的自变量.但是,建模的过程又需要寻找对因变量最具有强解释力的自变量集合,即通过自

3、变量选择(指标选择、字段选择等)来提高模型的解释性和预测精度.指标选择在统计建模的过程中是一个比较重要的问题,而Lasso方法则是能够实现指标集合精简的一种估计方法.[1]Lasso(leastabsoluteshrinkageandselectionoperator)算法是通过构造一个惩罚函数获得一个精炼的模型,通过最终确定一些指标的系数为零,从而实现了指标集合精简的目的.这是一种处理具有复共线性数据的有偏估计.Lasso的基本思想是,在回归系数的绝对值之和小于一个常数的约束条件下,使残[2]差平方和最小化,从而能够产生某

4、些严格等于0的回归系数,得到解释力较强的模型.Katayama等提[3]出了用Lasso方法识别相关的预测因子在高维多元线性回归分析的模型.Zou指出Lasso变量选择方法不能同时满足模型选择的相合性和参数估计达到槡n的收敛速度,故提出了线性模型的AdaptiveLas-so方法.同Lasso方法相比,该方法是对不同系数采用不同程度的压缩,从而使得最优的特征能够更快[4]更好地被选择出来;而且文[3]证明了AdaptiveLasso具有Fan等提出的Oracle性质.文[5]介绍了A-daptiveLasso在自回归过程子集

5、选择的应用.股市行情在社会、经济中备受人们关注,同时,它也是特别复杂的.从各个指标中选出有效的变量对[6]于进一步分析股票变化,了解股票行情便有着重要的作用.王宣承利用Lasso方法以沪深300股指期货为例研究了变量选择.文[7]研究了股票证券的平均收益率与风险因子的关系.[8]本文利用R统计软件的Lars软件包、Msgps包、Lqa包等对Lasso类方法在AR时间序列数据中进行模拟,并利用沪深300指数技术指标的历史数据进行实例分析,选出合适变量及其参数并对其进行预测.1模型与方法1.1Lasso方法文[9]指出假设有模型

6、数据(X1,Y1),(X2,Y2),…,(Xn,Yn),考虑通常的线性模型:收稿日期:2015-10-10;修回日期:2015-11-26基金项目:鲁东大学博士人才引进基金(LY2013001,LY201222);山东省科技发展计划项目(2012YD01056);鲁东大学名校工程精品课程项目(20130495,20130496)作者简介:杨丽娟(1989—),女,山东潍坊人。硕士研究生,研究方向为非参数统计、时间序列。E-mail:302765460@qq.com。通讯作者:马云艳(1978—),女,山东济宁人。讲师,博士,

7、研究方向为非参数统计、时间序列。E-mail:mayunyan78@163.com。第1期杨丽娟,等:基于Lasso类方法在时间序列变量选择中的应用15p(j)Yi=∑βjXi+εi,(1)j=1其中i=1,2,…,n,ε1,ε2,…,εn是独立同分布的,且E[εi]=0;{Xi;i=1,2,…,n}是独立的,Y∈R.11^21(j)(j)2为方便起见,把数据标准化,满足Y珔=∑Yi=0及σj=∑(Xi-X珔)=1,对于所有的j.nni=1通常把模型(1)记为下面的形式:Y=Xβ+ε,(2)其中,Xn×p为自变量矩阵,βP×

8、1为系数向量,εn×1为误差向量,Yn×1为反应向量,β0为真实系数值.Lasso方法选用l1-惩罚,其估计定义为β^(λ)=argmin(‖Y-Xβ‖2/n+λ‖β‖),(3)21np22其中,‖Y-Xβ‖2=∑(Yi-(Xβ)i),‖β‖1=∑

9、βj

10、,λ≥0是一个惩罚项.i=1j=1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。