欢迎来到天天文库
浏览记录
ID:23933817
大小:2.87 MB
页数:49页
时间:2018-11-11
《超高维部分线性模型的pgfr变量筛选》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、UDC:510学校代码:10005中文图书分类号:0212.7学号:S201406083密级:公开北京工业大学理学硕士学位论文题目:超高维部分线性模型的PGFR变量筛选英文题目:PGFRVARIABLESCREENINGFORULTRA-HIGHDIMENSIONALPARTIALLYLINEARMODEL论文作者:赖秋楠学科:统计学研究方向:非参数统计与数据分析申请学位:理学硕士指导教师:李高荣教授所在单位:应用数理学院答辩日期:2017年5月授予学位单位:北京工业大学
2、独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研宄工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研宄成果,也不包含为获得北京工业大学或其它t育机构的学一位或证书而使用过的材料。与我同工作的同志对本研宄所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:敕拉梯'-5_日期:■M月2白l年丫关于论文使用授权的说明、:本人完全了解北京工业大学有关保留使用学位论文的规定,即学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容、。
3、,可以采用影印缩印或其他复制手段保存论文(保密的论文在解密后应遵守此规定)签名:趟蹲率日期年r月if日■导师签名f:了鬲豪日期年月摘要摘要部分线性模型是一类重要的半参数回归模型,结构是将线性模型与非参数模型相结合既保留了参数回归模型容易解释的优点又保留了非参数回归模型灵活,,性的特点可以更好地拟合数据.,随着科学技术和计算机的快速发展,数据收集变得越来越容易,超高维数据频繁的出现在生物医学、工程研究、金融等各个领域,如何处理和分析这些数据成为目前具有挑战的前沿问题.在超高维数据下,针对线性回归模型的变量筛选研究已经很多线性模
4、型更多的还是在低维数据下,而部分进行研究.,因此研究超高维部分线性模型的变量筛选具有理论意义和实际意义本文主要考虑超高维部分线性模型,其中线性部分的维数P远远大于样本量n,且维数p随着样本量n呈指数阶增长.为了有效的进行变量筛选根据截面向前回,归(rofiledforwardreression简写为PFR)算法考虑到协变量之间的相关性本文提pg,,,出了rofile贪娶向前回归(rofilereedyforwardreression,简写为PGFR)算法.从模拟ppgg研究和实例分析可以看出PGFR完成的是非常有效的.,本论文的研究工作
5、主要有以下两个方面:1.针对超高维部分线性模型rofile,首先基于半参数回归的p方法,把超高维部分线性模型转化成超高维线性模型.其次为了对高维线性分量进行有效的变量筛,PGFR变一选.在,考虑到协变量之间的相关性,提出了量筛选方法定正则条件下,证PGFR明了所提变量筛选方法具有筛选相合性.为了确定所选模型是否能够依概率一趋于1包含真实模型进步提出了BIC准则并证明了BIC准则能够依概率趋于1选,,择真实模型;2.针对PGFR变量筛选方法,本论文将考虑在每次做变量筛选时,选入2个或4个协变量进入模型作为重要变量的情况.首先通过三个不同的例子进
6、行数值模拟,观察所得结果发现筛选重要变量具有有效性.然后将本方法分别与PFR、确定性独立,sureindeendencescreenin写为Serativesureindc-筛选(pg,简IS)和迭代确定性独立筛选(itendencescreennIIiSS比分析pg,简写为)方法进行对,发现在协变量间共线性较强或者一模型信噪比较低时每次选入4个协变量进入模型的效果更好.为了验证本文所,一PFR提出的PGFR方法的有效性个实际数据进行分析、SISISIS,我们对,并和和方法进行对比发现所提方法能够有效完成变量筛选.,最后给出结论与展望概
7、述了本论文所获得的主要研究成果和创新点并指,,,一出进步研究的问题和方向.roe关键词:部分线性模型fil贪婪向前回归超高维数据筛选相合性;p;;;变量筛选-I-AbstractAbstractPartialllinearmodelisateofI?ysemiarametricreressionmodel.tsstructureisacomyppgbinationoflinearregressionmodelsandnonparametric
此文档下载收益归作者所有