欢迎来到天天文库
浏览记录
ID:35180202
大小:6.22 MB
页数:60页
时间:2019-03-20
《基于空间旋转的支持向量机改进算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、TP3-010058'"變班.^3'^',F瑚蒜j?為扁巧瞧隱;.?.、…w,>?.ill!廉琴闘麟:..而-…?《一-挪-心‘?一策-,叫;论文题目:基于空间旋转的支持向量机.改进雛巧聽^糸■学科专业:计算机科学与技术;作者姓名:田佳林I-,.寺指导教师陈科副教授:藝二Q一二月?完成曰期五年十:独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加W标注和致谢之处外,论文中不包含其他人己经发表或
2、撰写巧的研究成果,化不巧含为获得天津工业大学或其佈教育机构的挙化或.证书而使用过的材料一同王作的同志对本研巧所做的任何贡献均己在论文。与我中作了明确的说明并表示了谢意。学位论文作者签名;贷隹;^签字曰期刻/方年3月曰7学位论文版权使用授权书本学位论文作者完全了解支達王业支堂_有关保留、使用学位论文的规定。特授权天津工业大学可W将学位论义的令部或部分内容编入有关数据库讲行检索,并采用影印、缩印或扫描等复制手段保存、汇编供查阅和借阅。同意学校向国家有关部口或机构送交论文的复印件和磁盘。(保密的学位论文在解
3、密后适用本授权说明)学位论文作者签名:导师签名扭隹桃:巧呼签字曰期部((年3月7曰签字曰期:7〇《年5月曰(7学位论文的主要创新点一、通过对支持向量机的深入研究,发现支持向量机不能充分的利用样本属性;使用支持向量机进行类别划分时可认为只利用了超平面法向量方向,但除该方向之外其他方向的属性仍然有着或多或少的作用。二、提出了旋转空间特征提取算法,利用支持向量机算法和旋转矩阵对空间中样本节点重复进行旋转和投影,W达到特征提取的目的。实验结果表明,本算法性能优异,比目前主流的主成分分析算法提取
4、的特征效果更好。摘要随着大数据时代的到来,庞大的数据量给人们带来无限商机,也引起了学术界、企业界及政府机构的高度重视。但数据的复杂性和多样性也导致数据价值密度不高,兀余数据较多等问题。如何从庞大的数据集中提取有效信息^辅助数据!分析已成为数据挖掘和机器学习领域研究的焦点。一数据挖掘的个重要研究内容是特征选择和持征提取。其中,主成分分析算法是一种常见的特征提取方法,它通过计算协方差达到特征提取的目的。支持向一一量机最初是种用于对数据进行类别划分和预测的机器学习算法,通过在个高一一一维空间中寻找个超平面,使
5、得分布于超平面同侧的数据尽可能属于同个类别。本文通过对支持向量机算法做深入研究后,发现支持向量机算法也可W被用一于特征提取,。借鉴主成分分析算法中的旋转思想本文提出了种基于支持向量机、空间旋转与坐标投影的特征提取方法;然后用皮尔森相关系数验证单个特征的有效性;最后使用主流分类器验证所提取特征的有效性。实验结果表明,本算法在样本集上提取到的前3个特征与分类标签均有显著的相关性,而第3个レッ后的将征与类标签的相关性极弱。在不同分类器的分类结果中,当使用经旋转空间特征提取算法处理后的特征时,分类结果在77%的样本
6、集上获得了比当使用PCA算法处理后的特征时更髙的预测正确率,在超过88%的样本集上获得了比直接使用源数据时更离的预测正确率;特别是当使用朴素贝14叶斯算法时,%在本算法处理后的特征上比直接在源数据上正确率高出近;当,1使用单层决策树时,在本算法处理后的特征上比在经PCA处理后的特征上测正确率高出近10%。:关键词支持向量机;冗余数据;大数据;特征提取ABSTRACTWiththeadventoftheeraofbigdat:a,thehugeamountofdatabringsu
7、nHmikdn,busi打essopportu打ities,attractingtheacademic,idustryandgovemme打tagenciesreatatentionbutwithdataisbecominincreasinlcomlexanddiversesomeg,;ggypissuesaearlttt.toextractppikelowerdaadensiyandmoredaaredundancySohowusefulinformation
8、fromlargedatatofacilitatedataanalysisandcalculationsarebecomingmoreandmoreimortan
此文档下载收益归作者所有