一种基于语料特性的聚类算法

一种基于语料特性的聚类算法

ID:34272187

大小:2.00 MB

页数:12页

时间:2019-03-04

一种基于语料特性的聚类算法_第1页
一种基于语料特性的聚类算法_第2页
一种基于语料特性的聚类算法_第3页
一种基于语料特性的聚类算法_第4页
一种基于语料特性的聚类算法_第5页
资源描述:

《一种基于语料特性的聚类算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、曾依灵等:一种基于语料特性的聚类算法2813ISSN1000-9825,CODENRUXUEWE-mail:jos@iscas.ac.cnJournalofSoftware,Vol.21,No.11,November2010,pp.2802-2813http://www.jos.org.cndoi:10.3724/SP.J.1001.2010.03677Tel/Fax:+86-10-62562563©byInstituteofSoftware,theChineseAcademyofSciences.Allrightsreserved.一种基于语料特性的聚类算法*Supportedb

2、ytheNationalNaturalScienceFoundationofChinaunderGrantNo.60933005(国家自然科学基金);theNationalBasicResearchProgramofChinaunderGrantNos.2007CB311100,2004CB318109(国家重点基础研究发展计划(973));theNationalHigh-TechResearchandDevelopmentPlanofChinaunderGrantNo.2007AA01Z441(国家高技术研究发展计划(863))Received2008-10-22;Revised

3、2009-03-05;Accepted2009-07-07曾依灵1,2+,许洪波1,吴高巍1,白硕11(中国科学院计算技术研究所网络重点实验室,北京100190)2(中国科学院研究生院,北京100049)ClusteringAlgorithmBasedontheDistributionsofIntrinsicClustersZENGYi-Ling1,2+,XUHong-Bo1,WUGao-Wei1,BAIShuo11(KeyLaboratoryofNetworkScienceandTechnology,InstituteofComputingTechnology,TheChines

4、eAcademyofSciences,Beijing100190,China)2(GraduateUniversity,TheChineseAcademyofSciences,Beijing100049,China)+Correspondingauthor:E-mail:zengyiling@software.ict.ac.cn,http://www.ict.ac.cnZengYL,XuHB,WuGW,BaiS.Clusteringalgorithmbasedonthedistributionsofintrinsicclusters.JournalofSoftware,2010,2

5、1(11):2802-2813.http://www.jos.org.cn/1000-9825/3677.htmAbstract:Infindingaflexibleapproachtosolvethemodelmisfitproblem,aclusteringalgorithmbasedonthedistributionsofintrinsicclusters(CADIC)isproposed,whichimplicitlyintegratesdistributioncharacteristicsintotheclusteringframeworkbyapplyingrescal

6、ingoperations.Intheclusteringprocess,asetofdiscriminativedirectionsarechosentoconstructtheCADICcoordinate,underwhichthedistributioncharacteristicsareanalyzedinordertodesignrescalingfunctions.Alongeveryaxis,rescalingfunctionsareappliedtoimplicitlynormalizethedatadistributionsuchthatmorereasonab

7、leclusteringdecisionscanbemade.Asaresult,thereliabilityofclusteringdecisionsisimproved.ThetimecomplexityofCADICremainsthesameasK-meansbyusingaK-means-likeiterationstrategy.Experimentsonwell-knownbenchmarkevaluationdatasetsshowthatthefra

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。