基于标准特征属性和互邻居的多标签分类算法研究.pdf

基于标准特征属性和互邻居的多标签分类算法研究.pdf

ID:51990463

大小:3.08 MB

页数:61页

时间:2020-03-21

基于标准特征属性和互邻居的多标签分类算法研究.pdf_第1页
基于标准特征属性和互邻居的多标签分类算法研究.pdf_第2页
基于标准特征属性和互邻居的多标签分类算法研究.pdf_第3页
基于标准特征属性和互邻居的多标签分类算法研究.pdf_第4页
基于标准特征属性和互邻居的多标签分类算法研究.pdf_第5页
资源描述:

《基于标准特征属性和互邻居的多标签分类算法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、OnMulti—LabelClassificationAlgorithmsBasedonLabel—SpecificFeaturesandMutualN-,.hborThesisSubmittedtoZhejiangNormalUniversityInpartialfulfillmentoftherequirementForthedegreeofMasterofScienceinEngineeringbyHua-qiaoQu(ComputerSoftwareandTheory)ThesisSupervisor:ProfessorF

2、a—rongZhongandShi'chaoZhangMay,2012基于标签特征属性和互邻居的多标签分类算法研究摘要随着Internet、信息检索等新技术的不断出现及快速发展,各种应用所积累的数据量急剧增长。这些数据背后通常隐藏了反映事物变化规律的信息或知识。为了能够有效利用这些数据,需要从中挖掘有用的信息和知识,并应用于商务管理、生产控制、市场分析、工程设计和科学探索等领域。这种需求的剧增,推动数据挖掘研究的蓬勃发展。分类作为一种数据分析方法,是数据挖掘中研究最活跃的课题之一。它可以用于提取描述重要数据类或预测未来的数据趋势的

3、模型。根据样本拥有标签的数量,分类问题主要分为单标签分类问题和多标签分类问题。在实际应用中遇到的分类大多是较为复杂的多标签分类问题,鉴于多标签分类问题本身的理论意义和广泛的应用价值,使其得到了越来越多研究者广泛的关注和重视。随着相关研究的不断深入,多标签分类的重要程度及其应用价值已逐步显现出来。目前,人们通过与各种学习技术相结合,提出不同类型的多标签分类算法,解决各种不同实际问题。尽管如此,类别标签与属性之间的相互依赖关系及其对多标签分类性能的贡献、影响多标签分类算法效率的因素等的认识仍然不够深入,例如大多数多标签分类算法在处理多

4、标签数据时,没有充分考虑不同的属性集对于各个类标签的贡献度是不同的;虽然k近邻在多标签分类中颇受欢迎,但其本身仍有几个问题有待进一步解决,如容易受噪声数据的干扰,且最优k值难以确定等。这些问题的有效解决,不仅对数据分类技术的理论研究,而且还对多标签分类的实际应用都具有重要的研究意义和实际参考价值。本文研究多标签分类,主要研究内容及贡献包括:●针对类别标签与属性之间的相互依赖关系及其对多标签分类性能的贡献,提出了一种基于标签特征属性的多标签分类算法。在该算法中,首先在每个类标签的正、负样本集中计算每个属性的属性密度,然后分别从中选取

5、mt个密度值最大的属性,取其交集的属性集作为相应类标签的标签特征属性,最后在标签特征属性的基础上进行多标签分类。●基于k近邻的思想,提出了一种基于足互邻居的多标签分类算法。该算法采用互邻居概念,探讨邻居的重要性程度,区分真假邻居,在此基础上获取待分类数据样本的真实、可靠邻居信息,剔除虚假邻居信息,最后基于这些可靠邻居信息进行预测未标签样本的标签集。同时,通过计算每个样本的互邻居来鉴别并剔除原始数据集中的噪声数据,从而有效提高了数据的质量,更利于从中训练出强健的分类器。●在算法的仿真实验部分,在多个测试数据集上进行仿真实验,并与经典

6、的多标签分类算法进行比较,以验证所提出算法的有效性。基于属性的多标签分类算法的实验结果表明:本算法不仅在分类性能方面明显优于现有的多标签分类算法,还可以确定哪些属性能真实反映各类标签的特性。基于k互邻居的多标签分类算法的实验结果表明:本算法不仅在分类性能方面优于传统的多标签分类算法,而且可以利用互邻居概念从原始数据集中有效识别噪声数据,从而增加预测标签集的可信度。关键词:多标签分类;标签特征属性;互邻居;噪声数据IIoNMUI』rI.LABELCLASSIFICATIoNALGoRITHMSBASEDLABEL—SPECIFICF

7、E√虹URESANDMUTUALNEIGHBoRABSTRACTWiththecontinuousadventandrapiddevelopmentofIntemet,informationretrievalandothernewtechnologies,datahasbeenaccumulatedgreatlyinrealapplications,whichusuallyhidessomeinformationandknowledgethatreflectbackthechangelawsofthings.Tomakeuseof

8、thesedatageneratedinavarietyofapplicationeffectively,usefulinformationandknowledgeisnecessarytObeminedfromthesedatagenerated

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。