欢迎来到天天文库
浏览记录
ID:33104455
大小:2.80 MB
页数:74页
时间:2019-02-20
《多值属性和多标记数据分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号——UDC——1736051密级——编号——卡I匆大·学CENTRALSOUTHUNIVERSITY硕.士学位论文论文题目:垒笪星:睦盘多盘坦塑握佥耋学科、专业:焦!垦生通焦三堡研究生姓名:鄞丛焦导师姓名及专业技术职务:奎塞塾撞jf,j√_iMulti..valuedandMulti..1abeledDataClassificationSpeciality:.InformationandCommunicationEngineering—MasterDegreeCandidate:.Q堕Q№曼=ji垒nSupe
2、rvisor:£!Q鱼墨曼Q!LiHQng..SchoolofInformationSciCentralSouthChangsha,Huna原创性声明本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名:樾日期:趁坦年』月丝日学位论文版权使用授权书本人了解中南大学有关保
3、留、使用学位论文的规定,即:学校有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。作者签名:垄胆导师签名纽日期作者签名:垄越导师签名三堑红日期摘要随着计算机技术、网络技术和数据库技术的迅速发展,现实中越来越多的应用都与多值属性、多标记数据密切相关,因此多值属性和多标记数据的分类算法成为了当前数
4、据挖掘和机器学习领域的一个研究热点。目前的研究主要集中于多标记数据的分类算法,没有考虑多值属性的问题,而且大多数算法没有充分学习标记之间的相关信息,加上现实中多样本的数量少、标记困难等问题,对传统的分类算法提出很多新的挑战。本文的主要工作分为3个部分:(1)提出5种多值属性分解算法,结合已有的多标记分类算法,建立多值属性多标记分类的学习框架,并通过实验比较了不同分解算法的优劣,验证了按照取值顺序进行分解的学习效果最好;(2)改进已有的贝叶斯网络算法,提出了结合通用贝叶斯网络GBN和多网贝叶斯网络MBN的多标记学习算
5、法,能够有效获取多个标记之间的相关信息,较大地提高了分类的精度;(3)针对多标记数据标记样本少的问题,结合实际对基于多标记组合算法的缺点进行了深入分析,建立多标记组合的分层模型,并提出基于不确定度的主动学习和基于置信度的半监督学习,交替选择最有效的样本进行学习,最终建立分层多标记分类器模型,实验验证了该方法能够大大提高多标记分类器的有效性和鲁棒性。本文的研究成果为学习多标记之间的相关信息以及在少量标记样本下的多标记分类学习提供了有效的方法,并通过结合多值属性分解的算法,为多值属性多标记数据的分类建立了新的学习框架。
6、关键词多值属性分解,多标记分类,分层模型,贝叶斯网络ABSTRACTWiththerapiddevelopmentofcomputertechnology,internetanddatabasesystem,moreandmoreapplicationsarecombinedwithmulti.valuedandmulti.1abeleddatasets.Hence,multi.valuedandmulti.1abeledclassificationhasbecomeahottopicforresearchersi
7、ndataminingandmachinelearning.Atpresent,mostoftheexistingresearchesaredoneonmulti.1abeledclassificationwithoutconsiderationaboutmulti.valuedproblem.Meanwhile,thecorrelationsbetweendifferentlabelsarenotstudiedadequately.Mlatismore.1ackoflabeledsampleresuksinins
8、u伍cientinformationtolearnduringthetrainingstage.Allthesearisenewchallengestotraditionalclassifiers.Therearethreecontributionsofthisthesis.Firstly,itputsforwardanewlearningfi'amewor
此文档下载收益归作者所有