投影寻踪技术的理论及应用研究进展

投影寻踪技术的理论及应用研究进展

ID:34524565

大小:235.16 KB

页数:6页

时间:2019-03-07

投影寻踪技术的理论及应用研究进展_第1页
投影寻踪技术的理论及应用研究进展_第2页
投影寻踪技术的理论及应用研究进展_第3页
投影寻踪技术的理论及应用研究进展_第4页
投影寻踪技术的理论及应用研究进展_第5页
资源描述:

《投影寻踪技术的理论及应用研究进展》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第24卷第1期柳州师专学报Vol124No112009年2月JournalofLiuzhouTeachersCollegeFeb12009投影寻踪技术的理论及应用研究进展吴春梅,罗芳琼(柳州师范高等专科学校数学与计算机科学系,广西柳州545004)摘要:投影寻踪技术是国际统计界于70年代中期发展起来的、用来处理和分析高维观测数据,尤其是非正态、非线性高维数据的一种新兴统计方法。它利用计算机直接对高维数据进行投影降维分析,进行数据客观投影诊断,自动找出能反映高维空间规律的数据结构,达到研究分析高维数据的目的。本文对30多年来投影寻踪技术在应用领域方面的文献进行收集整理,探讨投影寻踪

2、技术在相关领域的应用和发展状况,为从事投影寻踪研究或应用的专业人员获取和利用相关信息提供线索和参考。关键词:投影寻踪;岭函数;回归分析中图分类号:TP30116文献标识码:A文章编号:1003-7020(2009)01-0120-06数据分析法(ConfirmatoryDataAnalysis,简称CDA)。0前言但实际问题中有许多数据并不满足正态分布,需要用近三十多年来,随着计算技术的发展和计算机的稳健的或非参数的方法去解决。不过,当数据维数很普及,国际统计界发展了一类处理和分析高维数据的高时,这些方法都将面临一些困难:(1)随着维数增新兴统计方法———投影寻踪(Project

3、ionPursuit,简称加,计算量迅速增大;(2)对于高维数据,即使样本量PP)法,它是采用“审视数据→模拟→预测”探索性数很大,仍会存在高维空间中分布稀疏的“维数祸根”,据分析(ExploratoryDataAnalysis,简称EDA)的新途非参数法也很难使用;(3)低维稳健性好的统计方法[1]径,适宜于非线性、非正态分布数据的处理,并能避用到高维时稳健性变差。因此,当数据的结构或特免“维数祸根”,因为投影寻踪技术不需要人为地把高征与假定不相符时,模型的拟合和预报的精度均差,维数据整理成知识、构造成数据库进行训练后再推尤其对高维非正态、非线性数据分析,传统的CDA方理,而是

4、直接利用计算机对高维数据进行投影降维分法很难收到好的效果。其原因是它过于形式化、数学析,进行数据客观投影诊断,自动找出能反映高维空化,受束缚大,难以适应千变万化的客观世界,无法真间规律的数据结构,它具有稳健性、抗干扰性和准确正找到数据的内在规律,远不能满足高维非正态数据[2-3]分析的需要。为了克服上述困难,需要对客观数据不度高等优点,因此在许多领域获得成功应用。作假定或只作极少假定,而采用“直接审视数据———1投影寻踪技术的产生背景与实现方通过计算机模拟数据结构———检验”这样一种探索性法数据分析方法。而PP就是实现这种新思维的一条行111投影寻踪技术的产生背景之有效的途径。随

5、着科学技术的发展,高维数据的统计分析越来PP最早由Kruskal在70年代初提出并进行试越普遍,也愈来愈重要。多元分析方法是解决这类问验。他把高维数据投影到低维空间,发现数据的聚类[4-5]题的有力工具。但传统的多元分析方法是建立在总结构和解决化石分类问题。随后Friedman和体服从某种分布比如正态分布这个假定基础之上的,Tukey提出了一种把整体上的散布程度和局部凝聚采用所谓的“对数据结构或分布特征作某种假定———程度结合起来的新指标进行聚类分析,正式提出了[6]按照一定准则寻找最优模拟———对建立的模型进行PP概念。1981年,Friedman等人相继提出了PP[7]证实”

6、,也就是“假定—模拟—检验”这样一种证实性回归,PP分类和PP密度估计,Donoh则提出了用[收稿日期]2008-11-10[基金项目]广西青年科学基金(0832092)[作者简介]吴春梅(1970—),女,讲师,研究方向:计算机应用和神经网络应用;罗芳琼(1971—),女(壮族),广西忻城人,讲师。120Shannan熵作投影指标的方法,并利用PP的基本思归模型仍采用最小二乘法作为极小化判别准则,即选想给出了多元位置和散布的一类仿射同变估计。Di2择式(1)中的参数amj和岭函数个数M的适当组合,aeonis,Friedma和Jones还讨论了PP的其他有关理使下式L论问题[8

7、-10]。Huber在1985年对上述工作和结果作Mp2L=minE[Y-∑Gm(∑amjxj)](2)[11]m=1j=1了概括和总结。我国学者成平等1985年证明了T达到极小,即要求Zm=amX最大化。目前建立投影PP密度估计的一个收敛性问题,并于1987年给出了[12]寻踪回归模型一般采用Friedman和Stuetzle提出的PP经验分布的极限分布。他们还对多元位置和散[16][13]多重平滑回归技术,鉴于该方法涉及许多复杂的布的PP型估计性质进行了讨论。陈忠琏和李国数学

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。