欢迎来到天天文库
浏览记录
ID:35185677
大小:3.33 MB
页数:64页
时间:2019-03-21
《数据维数约简及分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、’'?;'’式,-*;";/瓜/,品巧矿獻..',.、.、:p’A:^,、吟,時‘..、.,、.-.Vt.级分类号知.密.、'f見古‘.10154UDC\单位代码、.*AI!;X.’.,-‘‘矿.',.I:-V‘矣、-户f;;濟气‘'工业大学文il宁<:>^^硕±学位论文寒马妇^"..,,.I-数据维数约简及分类算法研究''■K:、/-'若U';f专业:通信与信息系统'研究生:周勇、.、,ay.I—指导教师:蔡希朦副教授^,/';、;、
2、兴.';、V■;、嘴'VU.一/'—'、:?\.‘....、、,.:;K:、‘;’’,’:、^.、I./李Win--、、-‘W./-、、-\‘,,—j’‘''-.护'’V冷.to.;;.六隹月;;.基.別'..?一^?‘5、,'1'己..?-..>n,/、;-...、4.',AWJ、.、—.’'‘沪爲^藏%—独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加yA标注和致谢的地方外,论文中,不包含
3、其他人已经发表或撰写过的研究成果,也不包含为获得迁宁王业大学或其他教育机构的学位或证书而使用过的材料一同工作的同志对本研究所作的任。与我何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名:年月^曰5争关于论文使用授权的说明本人完全了解迁宁工业大学有关保留、使用学位论文的规定,目P:学校有权保留送交的复印权,允许论文被查阅和借阅学校可W公布论文的全部或部;分内容,可W采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)研究生签名:导师签名;黎餐邸>1《年?月方曰IMasterThesisDataDimensio
4、nalityReductionandClassificationAlgorithmsSpeciality:CommunicationandInformationSystemsCandidate:ZHOUYongSupervisor:AssociateProfessorCAIXi-biaoLiaoningUniversityofTechnologyJinzhou,121001,ChinaMarch2016摘要辽宁工业大学硕士学位论文摘要随着信息技术的发展,涌现出海量数据,推动了机器学习理论不断地向前发展。样本数据维数越高,数据存储越困难,同时数据的计算量也越大;此外,数据中还存在着噪声或
5、者冗余特征。因此,如何降低高维数据的维数,避免“维数灾难”问题,提高数据的分类精度,已经成为机器学习领域关注的一个热点问题。非负矩阵分解作为一种矩阵分解算法,约束待分解矩阵中和因式分解获得的矩阵中所有的元素为非负。这种非负性约束具有明确的物理意义,使得非负矩阵分解作为一种维数约简算法得到了广泛关注。同时,半监督学习(semi-supervisedlearning)由于能够同时利用少量的已知标记样本和大量未标记样本数据进行有效的学习,大大克服了有监督学习算法中样本数量不足问题,提高了分类的精度,因而半监督学习方法在图像分类、文本分类及邮件分类等问题中得到了普遍的运用。论文集成基于非负矩阵
6、分解的维数约简算法和基于半监督学习的分类算法,首先提出了一种基于非负矩阵分解与一致性学习的半监督学习算法。然后,在非负矩阵分解过程中引入类别信息,提出了一种基于约束非负矩阵分解与一致性学习的半监督分类算法。该算法在降维过程中引入少量已知标签类别信息作为约束条件,增强数据降维后的特征表示能力。最后,引入类别之间的依赖性,提出了一种基于构建类别图的维数约减的半监督学习算法。该算法分别在样本与样本之间、类与类之间创建图,构建基于图的正则化框架,再通过求解Sylvester方程得到未标记样本的标签。在公开数据集上的实验结果表明,论文算法在充分利用少量已知标签的同时用于数据的维数约简,不仅能有效
7、地降低了数据的维度,还能够有效地提高分类器的泛化能力。关键词:机器学习;维数灾难;维数约简;半监督学习;Sylvester方程IAbstract辽宁工业大学硕士学位论文AbstractWiththedevelopmentofinformationtechnology,hugeamountsofdatahaveconstantlysprungup,whichpushesforwardthetheoryofmachinelearning.Thehi
此文档下载收益归作者所有