基于kolmogorov复杂性的聚类方法研究

基于kolmogorov复杂性的聚类方法研究

ID:34666397

大小:3.43 MB

页数:81页

时间:2019-03-08

基于kolmogorov复杂性的聚类方法研究_第1页
基于kolmogorov复杂性的聚类方法研究_第2页
基于kolmogorov复杂性的聚类方法研究_第3页
基于kolmogorov复杂性的聚类方法研究_第4页
基于kolmogorov复杂性的聚类方法研究_第5页
资源描述:

《基于kolmogorov复杂性的聚类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中图分类号:TP182论文编号:102870913-s050学科分类号:120100硕士学位论文基于Kolmogorov复杂性的聚类方法研究研究生姓名陶小雷学科、专业管理科学与工程研究方向管理信息系统与企业信息化指导教师胡正华副教授南京航空航天大学研究生院经济与管理学院二О一三年三月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofEconomicsandManagementStudyofKolmogorovComplexityBasedClusteringAlgorithmsA

2、ThesisinManagementScienceandEngineeringByTaoXiaoleiAdvisedbyAssociateProfessorHuZhenghuaSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofManagementMarch,2013承诺书本人声明所呈交的硕士学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京航空航天大学或其他教育机构的学位或证书而

3、使用过的材料。本人授权南京航空航天大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本承诺书)作者签名:日期:南京航空航天大学硕士学位论文摘要聚类算法思想在人工智能,数据分析及企业商业机会发现等诸多领域有着重要应用。然而,传统聚类算法的应用一个重要步骤是需要先提取出数据对象的特征属性。由于待聚类对象的多样性和复杂性,对具体某种对象提取哪些特征由人工确定,因此需要领域专家的支持,可以说传统聚类算法是领域相关的方法。当处于新的领域或对待聚类领域不了解的情况下,传统聚类算法则很难快速应用

4、,需要经过长时间的学习新领域知识。论文针对领域无关的聚类要求,集中于建立和完善基于Kolmogorov复杂性思想的聚类方法的研究,从二进制角度来计算对象之间的相似性,避免了人工定义和提取待聚类对象的数据特征这一模糊的过程,从而即使对待聚类对象完全不了解,也可以获得较好的聚类效果。论文研究具有普适性的聚类算法,使聚类算法能够解决领域无关的聚类问题,具有重要的现实意义。论文重点研究的是基于Kolmogorov复杂性思想来计算对象之间的相似度,完善依此建立的准则函数并进行聚类分析。首先,分析传统的聚类算法在实际应用中的不足,从而引入基于Kolmogorov复杂性的方法。其次,

5、基于Kolmogorov复杂性的思想,从二进制角度分析同一个对象内部以及不同对象之间的规律性,以信息距离和压缩距离作为准则函数,计算不同对象之间的相似度,并不断改进压缩距离的稳定性。再次,尽管在统计学方法中,数据预处理是很重要的步骤,但是由于Kolmogorov复杂性具有普适性,所以目前基于Kolmogorov复杂性的研究普遍忽略了预处理,论文提出并证明了对象预处理对基于Kolmogorov复杂性的方法同样具有重要意义。最后,论文设计了基于Kolmogorov复杂性的具体聚类算法。为了验证本文基于Kolmogorov复杂性的聚类方法是领域无关的,本文实现了基于Kolmo

6、gorov复杂性的聚类算法,用多种不同类型的数据进行了实验,最终验证了论文提出的聚类算法在不同领域应用时的稳定性和有效性。本课题的研究给领域无关的聚类算法的研究及应用提供了新的思路,实验证明基于Kolmogorov复杂性的聚类算法具有良好的普适性。综上所述,论文的研究成果具有较高的理论意义和实用价值。关键词:聚类算法,Kolmogorov复杂性,压缩距离,数据预处理i基于Kolmogorov复杂性的聚类方法研究ABSTRACTClusteringisanimportantbranchofDataMining,whichhasgottenmoredepthresearch

7、becauseofitsuniqueknowledgediscoveryfunctions.Today,therearelotsofefficientclusteringalgorithmswhichhavebeenwidelyusedinmanyareaservices.However,withexpansionofareas,clusteringalgorithmsencounteredanumberofuniversalproblems.Forinstance,Textclusteringalgorithmcannotbeusedi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。