基于概念权重向量的mimlsvm改进算法

基于概念权重向量的mimlsvm改进算法

ID:9144787

大小:99.00 KB

页数:9页

时间:2018-04-19

基于概念权重向量的mimlsvm改进算法_第1页
基于概念权重向量的mimlsvm改进算法_第2页
基于概念权重向量的mimlsvm改进算法_第3页
基于概念权重向量的mimlsvm改进算法_第4页
基于概念权重向量的mimlsvm改进算法_第5页
资源描述:

《基于概念权重向量的mimlsvm改进算法》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、基于概念权重向量的MIMLSVM改进算法环天郝宁牛强中国矿业大学计算机科学与技术学院针对多示例多标记学习算法MIMLSVM只从包层面构造聚类,而忽略了伍内示例分布对分类造成影响这-不足,提出一种基于概念权重向量的MIMLSVM改进算法一一I-MIMLSVM算法。首先从示例层面构造聚类,挖掘出示例屮的潜在概念簇,运用R-PATTERN算法计算每个概念簇的概念权重;然后利用TF-IDF算法计算每个概念簇在各个示例包中的重耍度;最后将示例包表示为概念权重向量,向量的每一维即为概念簇的概念权重与其在该中的重要度的乘积。将该算法在含2000幅图像的自然数据集上

2、进行实验验证,结果表明改进的算法在分类性能上整体优于原算法,尤其在llammingloss,Coverage和Averageprecision这3个测评指标上较为明显。关键词:MTMLSVM;聚类;R-PATTERN;TF-TDF;但是传统监督学习的局限在于无法有效处理歧义性对象,造成这种局限的主耍原因是其采用单示例单标记的形式描述现实对象,无法准确完整地刻画出对象的真实信息,因此需要一种新型的学习框架来处理歧义性对象。多示例多标记(MIML)学习Ill是基于对象的歧义性而提出的一种学习框架,是对多示例学习和多标记学习的扩展III。miml学习采用多

3、个示例和多个标记的形式描述对象,它虽然和对于单示例单标记更加复杂,但符合现实对象的语义特征,有利于学习任务的完成和实际运用。目前,已经出现了多种MTML学习算法,如具有高效率的MTMLfast算法边1、基于正则化和最大化间隔的D-MIMLSVMlil以及MMIML算法、棊于多视图的MlM-Lmix[10]算法、基于多模态阁像标注的M3LDA[11]算法等。其中M1MLSVM是一种基于多标记学习退化策略的算法IM,该算法先将示例包集合划分为若干个聚类,然后用示例伍和各个聚类中心的距离重新表示每个示例伍,从而多示例多标记样本就可以转化为单示例多标记的样本

4、;最后利用文献[13]中的MLSVM算法对转化后的样本进行学习求解。实验证明,该算法在场景分类和文档分类问题中取得了良好的分类效果。2MIMLSVM算法分析给定MIML样本(X:,YJ,设Zi=O(XJ,®:2->Z,4>:ZXY-{+1,-1},对yGY,有巾(Zi,y)=+1当且仅当yEYb否则(zby)=-lo首先,MTML样本(Xu,Yu)屮的示例包Xu被统一归入到集合A屮。然后,对集合A运用k-medoids聚类算法,这里利用Hausdorff_[J4l刻画集合间的距离。给定不•例包A={aha2,…,aj,B={bbb2,•••,bnB}

5、,则A和B的Hausdorff距离可定义为:其屮,IIa~bII表示示例a和b间的Euclidean距离[15]。聚类之后,集合A被分为k个类,聚类中心为Mt(t=l,2,…,k),基于构造性聚类将示例包Xu转化为一个k维的数值向量zu,zu的每一维即为1到各个聚类中心的距离。这样,原MIML样木(X„,YJ(U=l,2,…,m)即可转化为单示例多标记样本(zu,YJ。最后,利用MLSVM算法学习得到fMlx,则fMIMUX)(z)。虽然以上转化会丢失部分信息,但MIML相对于其他框架可以获得比对象更多的原始信息,因此M1MLSVM仍会取得良好的学习

6、效果。假设X为给定的新样木,则MIMLSVM算法的具体过程如下:⑴对于MTML样本(Xu,Yu)(li=1,2,…,m),设集合A={X」u=l,2,…,m};(2)从A中随机选择k个元素作为初始聚类中心Mt(t=l,2,…,k),重复以下步骤,直到所有的K不再改变:2)对于每个Xue(A-{Mt

7、t=l,2,k}),分别计算⑶将(X,uYJ转化为多标记样木(zu,YJ(u=l,2,…,m),其中Zu=(Zul,Zu2,•••,Zuk)=(dH(Xu,Ml),dH(Xu,M2),•••,dH(Xu,Mk));(4)对于yGY,可得到数据集Dy={(z

8、u,(1)(zu,y))

9、u=l,2,…,m},然后训练得到分类器hy=SVMTrain(Dy);(5)得到,其中z二(d„(X,M:),dH(X,M2),…,dH(X,Mk))。3算法分析与改进虽然MIMLSVM算法取得了良好的实验效果,但其转化过程涉及到的构造性聚类方法原先是从示例层聚类将多示例样本转化为单示例样本,而这里却从包层面对MIML样本进行转化,没有考虑示例包的内在结构,忽略丫示例分布对包标记的攒在影响。本文结合文本处理中的R-PATTERN算法[17]以及TE-1DE算法[18],提出了一种新的示例表示方法。首先,通过对示例空间中的所

10、有示例进行聚类,得到能够反映示例潜在概念的簇;然后,利用R-PATTERN计算每个概念簇的权重,再利用TF-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。