多标记数据特征提取方法的核改进.pdf

多标记数据特征提取方法的核改进.pdf

ID:53022668

大小:559.45 KB

页数:7页

时间:2020-04-12

多标记数据特征提取方法的核改进.pdf_第1页
多标记数据特征提取方法的核改进.pdf_第2页
多标记数据特征提取方法的核改进.pdf_第3页
多标记数据特征提取方法的核改进.pdf_第4页
多标记数据特征提取方法的核改进.pdf_第5页
资源描述:

《多标记数据特征提取方法的核改进.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、JournalofComputerApplicationsISSN1001.90812015.07-10计算机应用,2015,35(7):1939—1944,1954C0DENJYIIDUhttp://www.joca.cn文章编号:1001—9081(2015)07—1939—06doi:10.11772/j.issn.1001-9081.2015.07.1939多标记数据特征提取方法的核改进李华,李德玉,王素格。,张晶(1.山西大学计算智能与中文信息处理教育部重点实验室,太原030006;2.石家庄铁道大学数理系,石家庄050043;

2、3.山西大学计算机与信息技术学院,太原030006)(}通信作者电子邮箱lidy@sxu.edu.el1)摘要:针对多标记数据特征提取方法中输出核函数没有准确刻画标记间的相关性的问题,在充分度量标记间相关性的基础上,提出了两种新的输出核函数构造方法。第一种方法首先将多标记数据转化为单标记数据,并使用标记集合来刻画标记间的相关性;然后从损失函数的角度出发定义新的输出核函数。第二种方法是利用互信息来度量标记间的两两相关性,在此基础上进一步构造新的输出核函数。3个多标记数据集上2种分类器的实验结果表明,与原有核函数对应的多标记特征提取方法相比,

3、基于损失函数的输出核函数对应的特征提取方法性能最好,5个评价指标的性能平均提高了10%左右,尤其在Yeast数据集上,Coverage指标下降幅度达到了30%左右;基于互信息的输出核函数次之,性能平均提高了5%左右。实验结果表明,基于新的输出核函数的特征提取方法能够更加有效地提取特征,并进一步简化分类器的学习过程,提高分类器的泛化性能。关键词:多标记学习;特征提取;核函数;损失函数;互信息中图分类号:TP391;TP181文献标志码:AKernelimprovementofmulti.1abelfeatureextractionmetho

4、dLIHua2L1Deyu,WANGSuge,ZHANGJing’(1.ta.y6DrⅢ0ofComputationalIntelligenceandChi~seInformationProcessing,Minist~ofEducation(ShanxiUniversity),TaiyuanShanxi030006,China2.DepartmentofMathematicsandPhysics,ShifiazhuangTiedaoUnive~ity,ShijiazhnangHebei050043,China;3.SchoolofCom

5、puterandInformationTechnology,ShanxiUniversity,TaiyuanShanxi030006,China)Abstract:Focusingontheissuethatthelabelkernelfunctionsdonottakethecorrelationbetweenlabelsintoconsiderationinthemulti—labelfeatureextractionmethod.twoconstructionmethodsofnewlabelkernelfunctionswerep

6、roposed.Inthefirstmethod,themulti-labeldataweretransformedintosingle—labeldata,andthusthecorrelationbetweenlabelscouldbecharacterizedbythelabelset;thenanewlabelkernelfunctionwasdefinedfromtheperspectiveoflossfunctionofsingle.1abeldata.Inthesecondmethod.mutualinformationwa

7、susedtocharacterizethecorrelationbetweenlabels,andanewlabelkernelfunctionwasproposedfromtheperspectiveofmutualinformation.Experimentsonthreereal—lifedatasetsusingtwomulti—labelclassifiersdemonstratedthatthebestmethodofallmeasureswasfeatureextractionmethodwith1abelkernelfu

8、nctionbasedoflossfunctionandtheperformanceoffiveevaluationmeasuresonaverageincreasedby10%:especi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。