欢迎来到天天文库
浏览记录
ID:58139706
大小:315.15 KB
页数:4页
时间:2020-04-24
《基于奇异值分解—偏最小二乘回归的多标签分类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、JournalofComputerApplicationsISSN10o1.90812014.07..10计算机应用,2014,34(7):2058—2060,2089CODENJYIIDUhttp://www.joca.cn文章编号:1001-9081(2014)07—2058—03doi:10.11772/j.issn.1001—9081.2014.07.2058基于奇异值分解一偏最小二乘回归的多标签分类算法马宗杰,刘华文(1.浙江师范大学数理与信息工程学院,浙江金华321004;2.中国科学院数
2、学与系统科学研究院,北京100055)(通信作者电子邮箱hwliu@zjnu.edu.ca)摘要:针对多标签数据的标签相关性和高维问题,提出一种基于奇异值分解一偏最小二乘回归的多标签分类算法,该算法可以对多标签数据进行维数约简和回归分析。首先,将类别标签集合作为整体处理,对标签相关性进行考察;其次,利用奇异值分解(SVD)技术得到样本和标签空间的得分向量,实施降维;最后,在偏最小二乘回归(PLSR)的基础上构建多标签分类模型。实验结果表明,在四种维数较高的真实数据集上,该算法可以获得有效的分类结果。关
3、键词:多标签分类;奇异值分解;偏最小二乘回归;维数约简;标签相关性中图分类号:TPI81文献标志码:AMulti-·labelclassificationbasedonsingularvaluedecomposition-partialleastsquaresregressionMAZongjie.LIUHuawen,(1.CollegeofMathematics,PhysicsandInformationEngineering,ZhejiangNormalUniversity,JinhuaZheji
4、ang321004,China;2.AcademyofMathematicsandSystemsScience,ChineseAcademyofSciences,Beijing100055,China)Abstract:Totacklemulti-labeldatawithhighdimensionalityandlabelcorrelations,amulti—labelclassificationapproachbasedonSingularValueDecomposition(SVD)·Part
5、ialLeastSquaresRegression(PLSR)wasproposed,whichaimedatperformingdimensionalityreductionandregressionanalysis.Firstly,thelabelspacewastakenintoawholeSOastoexploitthelabelcorrelations.Afterthat,thescorevectorsofboththeinstancespaceandlabelspacewereobtain
6、edbySVD,whichwasusedfordimensionalityreduction.Finally,themodelofmulti—labelclassificationwasestablishedbasedonPLSR.Theexperimentsperformedonfourrealdatasetswithhigherdimensionalityverifytheefectivenessoftheproposedmethod.Keywords:multi·labelclassificat
7、ion;SingularValueDecomposition(SVD);Pa~ialLeastSquaresRegression(PLSR);dimensionalityreduction;labelcorrelation性判别分析(LinearDiscriminantAnalysis,LDA)技术进行扩0引言展用于多标签数据降维。这两种方法可以有效地对样本空间传统分类学习中,每个样本只能被一个类别标签标注。实施维数约简,但是当标签数目较多时,算法时间复杂度较而在真实世界中,一个样本可以对应多个类别标
8、签。例如,一高。Tai等运用奇异值分解(SingularValueDecomposition,幅风景画可以贴上“青山”、“绿水”和“蓝天”等多个标签;一SVD)技术将原始标签空间转换为低维的线性子空间,然而该则关于奥运的新闻报道可以同时标注为“运动会”“奥运精算法不能对样本空间进行降维,同时忽略了标签相关性。神”和“荣誉”等。这类问题属于多标签分类学习领域。假设为考察标签相关性,Tsoumakas等对经典的LabelA=(a。,a,⋯,a)表示n个样本的
此文档下载收益归作者所有