欢迎来到天天文库
浏览记录
ID:33405451
大小:2.23 MB
页数:62页
时间:2019-02-25
《一种改进的cobweb算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:——UDC:密级:编号:工学硕士学位论文一种改进的COBWEB算法研究硕士研究生:指导教师:学位级别:学科、专业:所在单位:论文提交日期:论文答辩日期:学位授予单位:于洋张健沛教授工学硕士计算机软件与理论计算机科学与技术学院2010年1月6日2010年3月哈尔滨工程大学●3lIClassifiedIndex:U.D.C:ADissertationfortheDegreeofM.EngResearchOnanImprovedCOBWEBAlgorithmCandidate:Supervisor:Academ
2、icDegreeAppliedfor:Speciality:DateofSubmission:DateofOralExamination:University:YuYangProf.ZhangJianpeiMasterofEngineeringComputerSoftwareandTheoryJanuary,2010March,2010HarbinEngineeringUniversity“◆叶r■、◆0哈尔滨工程大学学位论文原创性声明本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观
3、点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者(签字):a洱日期:Ⅵ0年,月/乡日哈尔滨工程大学学位论文授权使用声明本人完全了解学校保护知识产权的有关规定,即研究生在校攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨工程大学有权保留并向国家有关部门或机构送交论文的复印件。本人允许哈尔滨工程大学将论文的部分
4、或全部内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文,可以公布论文的全部内容。同时本人保证毕业后结合学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈尔滨工程大学。涉密学位论文待解密后适用本声明。本论文(口在授予学位后即可乜在授予学位12个月后口解密后)由哈尔滨工程大学送交有关部门进行保存、汇编等。作者(签字):百≥著日期:wf矿年≥月/杉日导师(签字)切f口年;月∥日t公bI’哈尔滨丁程大学硕士学侍论文摘要数据挖掘中的聚类分析一直是近年来应用极为广泛的技术之一。所谓聚类,
5、是物理或抽象对象的集合分成由类似的对象组成的多个类的过程。而随着信息技术的发展,数据的形式也逐渐多样化,很多数据集中都包含有不确定的属性,这类数据被称为不确定数据。在生物、医学等领域,这种不确定数据更为常见。传统的模型聚类算法并不能提供一个有效的方法来处理此类数据。本文针对经典的COBWEB算法,给出了一种基于不确定数据的聚类算法来解决原算法不能处理不确定因素的问题。本文首先分析研究了数据挖掘的相关理论与技术、数据挖掘中聚类分析一般步骤和经典算法,特别针对基于模型的聚类算法进行认真研究和分析。其次,在认真研究了原
6、COBWEB算法的基础上,就其在应用过程中存在不能处理不确定数据的问题,给出了一种改进算法。改进算法以不确定数据作为输入源,采用经典的信息熵、欧氏距离和相似性度量理论改进了原算法的分类效用函数,新函数对于实例有更全面的解释和表达,同时也模型化了新分类树。最后通过仿真实验来对比两种算法,结果表明新算法能够有效地处理不确定数据,而且在不降低时间复杂度的基础上提高了聚类的质量和聚类准确率。。关键词:数据挖掘;聚类分析;COBWEB算法;分类效用;相似性度量;,t.~一t_■‘-AbstractClusteringana
7、lysisisaveryimportantmethodindataminingresearcIlingarea.TheSO.calledclustering,istheprocessofdividingrelateddataintoasameclass.Inrecentyears,Withthedevelopmentofinformationtechnology-,formsofdatagraduallyintendtodiversify.Manyrealdatasetshaveuncertaincmegofic
8、alattributevaluesthatareonlyapproximatelymeasuredorimputed.Inthebiological,nledical龇ldotherfields,theseuncertaindataaremorecommon.Currently,traditionalconceptualclusteringalgorithmscallno
此文档下载收益归作者所有