欢迎来到天天文库
浏览记录
ID:33157729
大小:2.05 MB
页数:67页
时间:2019-02-21
《一种基于变长编码的遗传k均值算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、洳}:锵蛐Z挚硕1.学位论文⑧论文题口二拙墓±变量缠型曲塑佳K塑值簋这盟塑作旨姓名————撞,∞&卫指导教师学科(专业)所在学院提交乃埘———直班』蛙L——————一——j删至攫——————一丑‘鹱扭量熟盐堂瞳———垫Ⅲ=£丝———————一浙江大学硕士学位论文摘要数据之间复杂的联系使数据背后隐藏着的模式难以被人们发现,数据所表征的对象的归类就是这样一种模式。当前,数据挖掘理论已经发展了种类繁多的聚类分析算法用于分析这一模式,它们各有其利弊,同时也有不少算法已经付诸实践。K均值就是其中一种简便易行的算法,但是它却存
2、在着很多弊端。为了使K均值更加有效,许多学者都提出了K均值的改进型算法。遗传算法在求解组合优化和函数最值等问题方面,被证明是行之有效的。遗传算法的机理同样适用于改进K均值聚类分析。虽然已有许多遗传算法被提出来用于优化K均值聚类的初始中心选择,或用于学习最佳的聚类数K,但都没能使二者完美地结合在一起。受到这些算法的启发,文中提出了一种基于变长编码的遗传机制将二者有机地结合起来,并取得了良好的效果。基于变长编码的遗传K均值算法,不但能够优化聚类的初始中心,根据适值动态地学习K值,而且有时候还能够识别一些孤立点,有效地减
3、轻了孤立点对K均值算法的影响。这都有赖于良好的K值学习机制,以及良好的适值度量函数的选取。关于K值的学习,本文提出了向“榜样”个体看齐的思想,使得K值动态地变化,摆脱了K值必须由用户指定的弊端。为了更好地理解这一算法,本文在前半部分重点阐述了数据挖掘和遗传算法的基本原理,同时为了期望算法能够应用于实际问题中,文中设计了一个原型软件并用Java语言进行了编码实践。关键词数据挖掘,知识发现,遗传算法,变长编码,聚类,K均值,商务智能浙江大学硕士学位论文AbstractThecomplexrelationshipsamo
4、ngdatacoverpatternsthatpeopleCallhardlydiscover.OneofthosepatternsiStoclassifyobjectsthedatarepresents.Recently,dataminingtheoryhasbeendevelopedforawiderangeofclusteringanalysisalgorithmtoanalyzedatatouncoverthepattern.TheyalIhaveadvantagesanddisadvantages.and
5、severalofthemhavebeenputintopractice.Forexample.K—McansalgorithmiSasimpleandeffectivemethod,butithasmanydisadvantages.Toavoidthese,researchershaveraisedtheimprovedK-meansalgorithm.Asweknow,geneticalgorithmfGAlhasbeenprovedeffectivetosolveproblemslikecombinatio
6、noptimizeandextremesofafunction.ItsmechanismiSfitforimprovingK.Mcansclusteringaswell.AlthoughtherearemanyGAmethodsbeingusedtoimproveinitiaicentersselectionofclustering。ortolearnthebestValueofknoneoftllemcallperfectlycombinebotIlofthemtogether.Beingenlightened.
7、anewGAmethodbasedonvariable-lengthencodingiSputforwardforpurpose。andreceivedagoodeffect.ThegeneticK-Mcansalgorithm(OKA)basedonvariable—lengthencodingnotonlyoptimizedtheinitialcenters。anddynamicallylearnedthevalueofkbutalSOrecognizedSomeisolatedpoints.So.itredu
8、cedtheimpactofisolatedpointstoK.Means.A11thisdependsonagoodmechanismoflearningK.andanexcellentfitnessfunction.InordertoIearnktheindividualofbestfitnessWastakenastheexample;everynew
此文档下载收益归作者所有