欢迎来到天天文库
浏览记录
ID:36620323
大小:899.05 KB
页数:8页
时间:2019-05-13
《基于最大间隔理论的组合距离学习算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第10卷第6期智能系统学报Vol.10№.62015年12月CAAITransactionsonIntelligentSystemsDec.2015DOI:10.11992/tis.201504027网络出版地址:http://www.cnki.net/kcms/detail/23.1538.tp.20151111.1633.006.html基于最大间隔理论的组合距离学习算法郭瑛洁,王士同,许小龙(江南大学数字媒体学院,江苏无锡214000)摘要:从已知数据集中学习距离度量在许多机器学习应用中都起着重要作
2、用。传统的距离学习方法通常假定目标距离函数为马氏距离的形式,这使得学习出的距离度量在应用上具有局限性。提出了一种新的距离学习方法,将目标距离函数表示为若干候选距离的线性组合,依据最大间隔理论利用数据集的边信息学习得到组合距离中各距离分量的权值,从而得到新的距离度量。通过该距离度量在模糊C均值聚类算法中的表现来对其进行评价。在UCI数据集上,与其他已有的距离学习算法的对比实验结果证明了该文算法的有效性。关键词:距离学习;组合距离;最大间隔;FCM;模糊聚类;聚类算法;距离;学习算法中图分类号:TP181文献
3、标志码:A文章编号:1673⁃4785(2015)06⁃0843⁃08中文引用格式:郭瑛洁,王士同,许小龙.基于最大间隔理论的组合距离学习算法[J].智能系统学报,2015,10(6):843⁃850.英文引用格式:GUOYingjie,WANGShitong,XUXiaolong.Learningalinearcombinationofdistancesbasedonthemaximum⁃margintheory[J].CAAITransactionsonIntelligentSystems,2015,
4、10(6):843⁃850.Learningalinearcombinationofdistancesbasedonthemaximum⁃margintheoryGUOYingjie,WANGShitong,XUXiaolong(SchoolofDigitalMedia,JiangnanUniversity,Wuxi214000,China)Abstract:Learningadistancemetricfromgiventrainingsamplesisacrucialaspectofmanymachi
5、nelearningtasks.ConventionaldistancemetriclearningapproachesoftenassumethetargetdistancefunctiontoberepresentedintheformofMahalanobisdistance,andthemetrichaslimitationsforthisapplication.Thispaperproposesanewmetriclearningapproachinwhichthetargetdistancef
6、unctionisrepresentedasalinearcombinationofseveralcandidatedistancemetrics.Thismethodobtainsanewdistancemetricbylearningweightsfromsideinformationaccordingtothemaximum⁃margintheory.ThenewdistancefunctionisappliedtofuzzyC⁃meansclusteringforevaluation.Theexp
7、erimentswereperformedusingUCIdata,andacomparisonoftheresultswiththoseofotherapproachesrevealstheadvantagesoftheproposedtechnique.Keywords:metriclearning;hybriddistancemetric;maximum⁃margintheory;fuzzyC⁃means;fuzzyclustering;clusteringalgorithm;metric;lear
8、ningalgorithm如何表示2点之间的距离是模式识别中的基础特征空间中超球结构的数据集,对于超立方体结构、[1]问题。一个好的距离度量能够根据数据的结构与分超椭球结构的数据集效果不太理想。除了欧氏布适用于不同的应用。欧氏距离是众多数据挖掘应距离,余弦距离是另一个应用广泛的距离度量。尽用中使用最多的距离度量,但是欧氏距离仅适用于管余弦距离在文本检索中有优秀的表现,但是其预[2]先假设了数据集每一维度都是等权重的,这一特收稿
此文档下载收益归作者所有