欢迎来到天天文库
浏览记录
ID:58210784
大小:349.91 KB
页数:5页
时间:2020-04-27
《基于主动学习的动态模糊聚类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、计算机与现代化2014年第5期JISUANJIYUXIANDAIHUA总第225期文章编号:1006-2475(2014)05-0024-04基于主动学习的动态模糊聚类算法张静,聂章龙(常州信息职业技术学院软件学院,江苏常州213164)摘要:聚类问题是近几年来机器学习和数据挖掘领域研究的热点问题,由于获取大量监督信息费时费力,目前国内外研究的重点是如何获得少量但对聚类性能提高显著的监督信息,再加上实际问题中存在的动态模糊性,故本文提出一种结合主动学习的动态模糊聚类算法DF.DBSCAN,通过引入动态模糊等价关系、动态模糊信任测度和动态模
2、糊似然测度这3个约束信息来指导DBSCAN的聚类过程,以提高聚类的性能。实验结果表明,DF—DBSCAN算法不仅解决了实际问题中存在的动态模糊性数据的描述和表示问题,而且能够高效地进行数据聚类,显著地提高聚类性能。关键词:主动学习;聚类算法;动态模糊集;动态模糊关系;动态模糊测度中图分类号:TPl81文献标识码:Adoi:10.3969/j.issn.1006-2475.2014.05.OO6DynamicFuzzyDataClusteringAlgorithmBasedonActiveLearningZHANGJing,NIEZhang
3、—long(SoftwareSchool,ChangzhouCollegeofInformationTechnology,Changzhou213164,China)Abstract:Dataclusteringhasrecentlybecomeatopicofsignificantinteresttodataminingandmachinelearningcommunities.Be—causeachievingsuperviseddatamaybeexpensive,theresearchfocusesonattainingthesu
4、pervisedinformationformlittleinforma-tionbutCansignificantlyimprovetheclusteringperformance.Moreover,therearemanydynamicfuzzyproblemsintherealworld.Thispaperpresentsadynamicfuzzydataclusteringalgorithmbasedonactivelearning,andintroducesthreeconstraintswhichin—cludedynamic
5、fuzzyequivalencerelation,dynamicfuzzytrustmeasureanddynamicfuzzylikelihoodmeasuretoguidetheclusteringprocessofDBSCAN,aimingatimprovingclusteringperformance.Experimentalresultsshowthatthisproposedapproachiseffectiveindataclustering;alsoitCandescribethedynamicfuzzydataofthe
6、clusteringproblembetter.TheclusteringperformanceofactiveDF-DBSCANhasbeendramaticallyimprovedwiththreeconstraintsandbetterthanthethreerepresentativemethods.Keywords:activelearning;clusteringalgorithm;dynamicfuzzysets;dynamicfuzzyrelation;dynamicfuzzymeasure实际聚类问题中,训练样本需完整地
7、表示所含类别的0引言统计属性,而训练样本的获取不仅费时、费力,而且训聚类问题是将物理或抽象对象划分成由类似的练集包含大量的冗余样本J。为了尽可能地减小训对象组成的若干类或簇,且在同一簇中的对象之间彼练集及标注成本,在机器学习领域中,提出了主动学此相似,而不同簇中的对象彼此相异的过程。现实问习方法。文献[3]给出了一种结合主动学习的聚类题中,存在着很多的对象并没有严格界定的属性,它算法,但并没有解决实际问题中存在的动态性和模糊们在性态和类属方面存在着动态性和模糊性。1965性。鉴于此,本文提出一种结合主动学习的动态模糊年,Zadeh教授提出
8、了模糊集合理论,为解决聚类问聚类算法DF—DBSCAN,能够不使用专家知识,自主处题中存在的模糊性提供了强有力的分析工具,但是它理训练样本集的信息,将主动学习、动态模糊关系与并不能解决实际问题
此文档下载收益归作者所有