一种基于随机游走模型的多标签分类算法

一种基于随机游走模型的多标签分类算法

ID:33325977

大小:535.76 KB

页数:9页

时间:2019-02-24

一种基于随机游走模型的多标签分类算法_第1页
一种基于随机游走模型的多标签分类算法_第2页
一种基于随机游走模型的多标签分类算法_第3页
一种基于随机游走模型的多标签分类算法_第4页
一种基于随机游走模型的多标签分类算法_第5页
资源描述:

《一种基于随机游走模型的多标签分类算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第33卷第8期计算机学报Vol.33No.82010年8月CHINESEJOURNALOFCOMPUTERSAug.2010一种基于随机游走模型的多标签分类算法郑伟王朝坤刘璋王建民(清华大学软件学院北京100084)(清华信息科学与技术国家实验室北京100084)(信息系统安全教育部重点实验室北京100084)摘要在数据挖掘领域,传统的单分类和多分类问题已经得到了广泛的研究.但是多标签数据的普遍存在性和重要性直到近些年来才逐渐得到人们的关注.在多标签分类问题中,由于标签相关性的存在,传统的单分类和多分类问题的解决方法,无法简单地应用于多标签分类问题.文中提出了一种基于随机游走模型的多标签分类算

2、法,称为多标签随机游走算法.首先,将多标签数据映射成为多标签随机游走图.当输入一个未分类数据时,建立一个多标签随机游走图系列.而后,对图系列中的每个图应用随机游走模型,得到遍历每个顶点的概率分布,并将这个点概率分布转化成每个标签的概率分布.最后,基于多标签随机游走算法,文中给出了一种新的阈值学习算法.真实数据集上的实验表明,多标签随机游走算法可以有效地解决多标签分类问题.关键词多标签;分类算法;随机游走;阈值学习中图法分类号TP181犇犗犐号:10.3724/SP.J.1016.2010.01418犃犕狌犾狋犻犔犪犫犲犾犆犾犪狊狊犻犳犻犮犪狋犻狅狀犃犾犵狅狉犻狋犺犿犅犪狊犲犱狅狀犚犪狀犱狅犿

3、犠犪犾犽犕狅犱犲犾ZHENGWeiWANGChaoKunLIUZhangWANGJianMin(犛犮犺狅狅犾狅犳犛狅犳狋狑犪狉犲,犜狊犻狀犵犺狌犪犝狀犻狏犲狉狊犻狋狔,犅犲犻犼犻狀犵100084)(犜狊犻狀犵犺狌犪犖犪狋犻狅狀犪犾犔犪犫狅狉犪狋狅狉狔犳狅狉犐狀犳狅狉犿犪狋犻狅狀犛犮犻犲狀犮犲犪狀犱犜犲犮犺狀狅犾狅犵狔,犅犲犻犼犻狀犵100084)(犓犲狔犔犪犫狅狉犪狋狅狉狔犳狅狉犐狀犳狅狉犿犪狋犻狅狀犛狔狊狋犲犿犛犲犮狌狉犻狋狔,犕犻狀犻狊狋狉狔狅犳犈犱狌犮犪狋犻狅狀,犅犲犻犼犻狀犵100084)犃犫狊狋狉犪犮狋Thereareextensiveliteraturesrelatedtotr

4、aditionalsingleclassandmulticlassclassificationproblems,inwhicheachdatapointisassignedtoonecategory.Butinmanyapplications,adatapointmaybelongtomorethanonecategory.ThiskindofproblemiscalledtheMultiLabelClassification(MLC)problem.Duetotheexistingoflabelrelevance,thetraditionaldataminingmethodscan

5、notbedirectlyappliedtotheMLCproblems.ThispaperproposesanovelMLCalgorithmbasedontherandomwalkmodel,calledMultiLabelRandomWalk(MLRW)algorithm.Firstly,amultilabelrandomwalkgraphisbuiltonthetrainingset.Asanunlabeleddataarrives,amultilabelrandomwalkgraphsystemwillbebuilt,onwhichtherandomwalkprocess

6、ingiscarriedout.Afterthat,aprobabilitydistributionamongalllabelsisobtained.Atlast,athresholdlearningalgorithmisproposedbasedontheMLRWalgorithmsothatthefinalpredictiononeachlabelispresented.ExperimentalresultsonactualdatasetshowthattheMLRWalgorithmprovidesaneffectivesolutiontotheMLCproblems.犓犲狔狑狅狉犱

7、狊multilabel;classification;randomwalk;thresholdlearning收稿日期:20100611.本课题得到国家自然科学基金(60803016)、国家“九七三”重点基础研究发展规划项目基金(2007CB310802,2009CB320706)和国家“八六三”高技术研究发展计划项目基金(2008AA042301,2007AA040602)资助.郑伟,男,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。