基于复合分位数回归的超高维稀疏数据的特征选择研究

基于复合分位数回归的超高维稀疏数据的特征选择研究

ID:34579238

大小:706.55 KB

页数:48页

时间:2019-03-08

基于复合分位数回归的超高维稀疏数据的特征选择研究_第1页
基于复合分位数回归的超高维稀疏数据的特征选择研究_第2页
基于复合分位数回归的超高维稀疏数据的特征选择研究_第3页
基于复合分位数回归的超高维稀疏数据的特征选择研究_第4页
基于复合分位数回归的超高维稀疏数据的特征选择研究_第5页
资源描述:

《基于复合分位数回归的超高维稀疏数据的特征选择研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10270分类号:O21学号:152200647硕士学位论文基于复合分位数回归的超高维稀疏数据的特征选择研究学院:数理学院专业:概率论与数理统计研究方向:数理统计研究生姓名:李晓指导教师:岳荣先教授完成日期:2018年4月上海师范大学硕士学位论文摘要摘要随着计算机技术和人工智能的发展,数据爆炸是当代最热门的问题之一。在超高维数据中,数据的样本量大幅增长,此时只有少数的协变量与响应变量有关联,模型呈现稀疏性特征且模型参数的解释性较差。统计人员面临着识别最重要特征的任务,并构建最优解释模型,将这些重要特征与响应变量联系起来。从超高维数

2、据中提取有用的特征是对超高维数据建模的基础。因为此时模型呈现稀疏性,所以对超高维数据进行任何精确分析之前,重要的是删除最明显的非影响特性特征。由于维数过高,许多传统的建模方法和高维数据变量选择方法不适用于超高维数据分析。近年来,为了这个目标,数学家已经开发了一些算法。比较可行的策略是建立一个两阶段特征选择过程,第一阶段使用快捷高效变量筛选过程将特征维度降低到样本量之下的合适规模,并且能够保留所有的重要特征,在此基础上再使用一些有效的方法对降维后的高维数据进行重要变量选择。论文中提出了一种超高维数据特征选择方法,基于复合分位数模型提出了稀疏性

3、限制的复合分位数估计模型来实现超高维数据特征选择第一阶段过程,将特征维度降低到样本量之下的合适规模。与此同时引入MM算法和IHT迭代硬阀值算法对稀疏性限制复合分位数估计模型进行求解。特征选择第二阶段采用LASSO和SCAD惩罚似然方法对降维后的数据进行重要特征选择。文章中的筛选方法自然地采用了筛选过程中特征的联合效应,这使其本身具有超越现有方法的优势。论文中方法得到了许多建模设置下的仿真研究的进一步支持。关键词:超高维稀疏数据;复合分位数;IHT算法;MM算法。IAbstractShanghaiNormalUniversityMastero

4、fPhilosophyABSTRACTWiththedevelopmentofcomputertechnologyandartificialintelligence,dataexplosionisoneofthemostpopularissuesinthecontemporaryera.Intheultra-highdimensionaldata,thesamplesizeofthedatahasincreasedsignificantly.Atthistime,onlyasmallnumberofcovariatesareassociat

5、edwiththeresponsevariables.Themodelexhibitssparsecharacteristicsandthemodelparametersarepoorlyinterpreted.Statisticiansfacethetaskofidentifyingthemostimportantfeaturesandconstructanoptimalinterpretationmodelthatlinkstheseimportantfeatureswithresponsevariables.Extractinguse

6、fulfeaturesfromultra-high-dimensionaldataisthebasisformodelingultra-high-dimensionaldata.Becausethemodelissparseatthistime,itisimportanttoremovethemostobviousnon-impactfeaturecharacteristicsbeforeanyaccurateanalysisofultra-high-dimensionaldata.Duetothehighdimensionality,ma

7、nytraditionalmodelingmethodsandhighdimensionaldatavariableselectionmethodsarenotsuitableforultra-highdimensionaldataanalysis.Inrecentyears,mathematicianshavedevelopedsomealgorithmsforthisgoal.Themorefeasiblestrategyistoestablishatwo-stagefeatureselectionprocess.Inthefirsts

8、tage,thefastandefficientvariablescreeningprocessisusedtoreducethefeaturedimensiontotheapp

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。