欢迎来到天天文库
浏览记录
ID:33288107
大小:5.61 MB
页数:65页
时间:2019-02-23
《并行kpca特征提取设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得丞洼王些太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:i司哥褥签字日期:≯房年z月必自学位论文版权使用授权书本学位论文作者完全了解丞洼王些太堂有关保留、使用学位论文的规定。特授权丞洼王些太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关
2、部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:陵蛹静签字日期:矽房年j?》月诊日剔醛轹诗、秀签字日期:y廖年≥月≯j咱学位论文的主要创新点一、通过理论分析提出一种借助于特征值比值的核参数选择准则来指导核参数选择。使用UCI(UCInrineMachineLeamingReposito巧)中的基准数据集进行实验比较,实验结果表明提出的参数选择中的特征值比值与特征提取效果密切相关。因此,在使用核主成分分析方法进行特征提取时,可采用该准则进行核参数的选择。二、通过对核方法与核主成分分析方法的深入研究,结合并行计算理论与技术,通过对核主成分分析算法的固
3、有并行性分析,设计了并行核主成分分析特征提取算法。该方法使用了数据划分、流水线等并行技术,充分的发挥了多核处理器的计算能力,克服了基于核的主成分分析方法在大数据情况下运算时间过长的不足。摘要自二十世纪九十年代以来,核方法已被应用于多个领域,其中包括模式识别、机器学习等。核方法是一种非线性方法,其思想是:使用非线性映射,将原始数据映射到高维空间(特征空间)中,并在这个新的空间中对数据进行线性的学习或分析。由于非线性映射十分复杂,所以,核方法中使用核技巧利用核函数有效的规避了非线性映射的复杂计算,降低了计算的复杂度。基于核的主成分分析ⅨemelPriIlcipalComponentAnalys
4、is,KPCA)方法是核方法中的一种,它等价于在高维空间中对数据进行主成分分析(PCA)处理。相对于PCA来说,KPCA方法具有更准确的特征提取效果并且更适用于解决实际问题。本文主要针对KPCA方法进行深入研究。核方法的一个重要的特点是需要确定核参数。无论使用哪种核函数都至少会有一个核参数需要确定,locA也不例外。只有确定核函数与核参数后,KPCA才可以使用。与许多核方法一样,KPCA的特征提取效果很大程度上依赖于其核参数的选择。因此,参数的选择是核方法研究领域中的一个重要方面。本文借助于样本特征值代表的物理意义,提出一种基于比值的参数选择准则。实验表明,在使用KPCA时,可以采用该准则
5、选择核参数。本文通过对KPCA算法的时间复杂度与空间复杂度分析,得出推测:l(PCA算法的计算速度与数据维数无关而是与数据个数有关,而PCA算法的计算效率与数据维数有关。所以,在计算小数据集情况下,KPCA表现出优由于PcA的特征提取质量与效率,但是在数据量增大的情况下,尤其是低维大数据的情况下,KPCA的计算效率明显低于PCA。本文另一部分通过使用并行计算理论与技术,对串行KPCA特征提取算法进行并行化分析并提出并行解决方案。最后采用并行优化技术优化并行程序,进一步提高并行效果。关键词:特征提取;KPcA:参数选择;并行化;SillceⅡlel990s,kemelmetllodhasbe
6、enusedinmanyfieldsthatinclud访gpattemrecognition,machille1eammgandSoon.Asakindofnonlinearmetllod,廿1ecentralideaofkemelme廿lodis:mappingt11eoriginaldatatofeaturespacewitllakindofnonliIlearmappingandanalysisthedataillfeaturewithalinearmethod.DuetononliIlearmappingisVe巧complicate,kemel仃ickandkemel缸ncti
7、onareuSedtoavoidtllecomplexcalculationeffectiVelyandreducethecomputationalcomplexi够.KemelPrincipalComponentAnalysis(KPCA)isakiIldofkemelmethods,whichisequivalenttoanglicizillgdatain诧aturespacew油PrincipalComponent
此文档下载收益归作者所有