欢迎来到天天文库
浏览记录
ID:50153151
大小:2.97 MB
页数:57页
时间:2020-03-07
《充分降维理论中PHD方法的局部影响分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号,密级-UDC学校代码.^{由鉍H七專YUNNANUNIVERSITYOFFINANCEANDECONOMICS学术碩士耐光生学位冷文充分降维理论中PHD方法的局部影响分析学院(部、所):统计与数学学院专业:统计学(理学)姓名:王智慧导师:陈飞副教授论文起止时间:2014年1月〜2015年4月学位论文原创性声明声明:本人所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。尽我所知,除文中己经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研宄做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意
2、识到本声明的法律结果由本人承担。论文作者签名:日期:冰丨1年月曰学位论文版权使用授权书本人完全了解云南财经大学有关保留、使用学位论文的规定,即••学校有权保留并向国家有关部门或机构送交论文和论文电子版,允许学位论文被查阅或借阅;学校可以公布学位论文的全部或部分内容,可以采用影印、缩印或其它复制手段保存、汇编、发表学位论文;授权学校将学位论文的全文或部分内容编入、提供有关数据库进行检索。(保密的学位论文在解密后遵循此规定)论文作者签名:.导师签名:日期:>斤年月日曰期:年月日摘要在统计学的发展中,我们越来越多地面临高维数据的挑战。使用非参数方法对这些高维数据进行
3、处理时可能面临着“维数诅咒”问题,尤其是在回归问题中,当模型的形式未知而自变量维数很高时,核函数和样条逼近等非参数方法都将因为数据稀疏而失效。如果因变量是高维自变量的少数几个线性组合的函数,那么,只要准确的找出这些线性组合的组合系数,则维数过高带来的问题也就不复存在。难点在于,这些组合系数的寻找不能依赖于因变量与自变量之间的函数关系,充分降维理论就是针对这样的问题而提出。该领域已经引起了人们的广泛关注,提出了许多方法和理论。在各种充分降维理论和方法中,主Hessian方向(PHD)法是应用较为广泛的一种。然而,由于其基本理论依据为stein引理,有赖于自变量的
4、正态假设,因此,主Hessian方向也是对数据分布假设要求较高的一种降维方法。所以,研究这种方法的影响分析是有必要的。在主Hessian方向的影响分析领域,目前只有基于影响函数的数据删除法。这种方法在探测一些特殊的影响模式方面的效率不够令人满意,故此,本文提出了一种针对主Hessian方向的局部影响分析方法。该方法以空间位移函数和拟曲率为理论基础,可以在联合扰动下使用,与基于数据删除法的方法相比,该法对于模型中存在的强影响因素的探测效能较好。本文得到的理论结果主要包括:对于基于因变量的y-型PHD方法和基于普通最小二乘残差的r-型PHD方法,在数据点扰动模式下
5、,均给出了拟曲率的表达式和最强影响方向的求取方法,在此基础上,建立了用于探测强影响数据点的局部影响评价统计量。此外,证明了所提出的局部影响分析理论对于自变量向量的仿射变换具有不变性,考虑到充分降维理论的问题背景,这个不变性是非常必要,也是很重要的。此外,我们使用本文提出的方法进行了模拟分析和真实数据分析,通过与数据删除法进行比较,说明了该方法的优势。关键词:充分降维;主Hessian方向;迹相关系数;空间位移函数;局部影响分析。AbstractAbstractInthedevelopmentofstatistics,wearefacedwithmoreandm
6、orechallengesofhighdimensionaldata.Usingnonparametricmethodstodealwithhighdimensionaldatamaysufferfrom“curseofdimension”.Especiallyintheregression,whenthebasicformofthemodelisunknownandalotofpredictorcandidatesexist,nonparametricmethodssuchaskernelfunctionandsplineapproximationmayal
7、lbeinefficientduetothesparsedata.However,iftheresponseonlydependsonseverallinearcombinationsofthepredictorcandidates,weonlyneedtofindoutthecoefficientsoftheselinearcombinationstosolvetheproblemofhighdimension.However,itisadifficultproblemtoestimatethecombinationcoefficientswithoutan
8、yassumptionaboutthe
此文档下载收益归作者所有