欢迎来到天天文库
浏览记录
ID:34769444
大小:1.53 MB
页数:53页
时间:2019-03-10
《改进k-means算法及在i型糖尿病血糖值的聚类应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、北京交通大学硕士学位论文改进K-MEANS算法及在I型糖尿病血糖值的聚类应用姓名:戴金申请学位级别:硕士专业:交通信息工程及控制指导教师:李国斌201011中文摘要摘要:在以前的研究中,更多的数据挖掘的算法应用于II型糖尿病中。这个研究的目标是设计和实现一个数据挖掘的算法,帮助医生更好的诊断和分析I型糖尿病病人的病情。为了完成这个目标,首先是收集记录I型糖尿病人的血糖值。然后是学习了解主流的数据挖掘算法,通过阅读文献比较这些算法。最初选取的是尽means算法应用到I型糖尿病中去聚类病人的血糖值。然而,尽mealls算法有三个主要的缺点。第一,尽means算法的执行结果非常的依
2、赖于数据输入的顺序。第二,尽means算法对孤立点非常敏感,并且会降低聚类的准确率。第三,很难对落在重叠区域的数据样本很好的聚类。因此,使用分层分类的方法解决第一个问题,使输出的结果不依赖于数据属于的顺序。使用分层抽样的方法解决第二个问题,将孤立点从数据集中分离,避免孤立点对聚类结果的影响。提出使用模糊逻辑和尽means算法相结合解决第三个缺点,使得落在重叠区域的数据样本不会丢失转变信息。对于解决每个缺点的方法,都用实验验证了算法的可行性。关键词:数据挖掘;尽means算法;孤立点;模糊逻辑;糖尿病;血糖值;中心;聚类j錾塞童逼太堂亟主堂僮途塞.△L苎!塞△.£!ABSTRA
3、CTABSTRACT:MostofpreViousstudieswereconce腑atedondataminingalgorithr【lsfor够pe2diabetespatients.Thisstudyaimst0designaIldimplementadataIIliningalgonmmtoassistdoctorstodiagnoseandaIlalyze咖eldiabetespatients’condition.IIlordert0achieVemeaimoftllisstudy,dataof91ucoseof廿1ediabetespatientshaVebeen
4、c01lectedfirst.Mains仃e锄datarniningalgoritlll:11shavebeenmenstudiedandcomparedthrou曲literaturesreView.jomeansalgorithmhasbeeninitiallyselectedt0beappliedtodealwimdiabetespatientS’data.HoweVer,therearemreedisadvalltagesofK-meansalgorithm.a)thepe—’omaIlceofK-meansalgorimmti曲tlyreliesontheorder
5、ofi印utdata.b)Outlierscandecreasetheperfomanceofmealgorithm.c)Thedatas锄pleswhichfallmtotheoVerlaparedi伍culttodealwim.Therefore,如zzylogichasbeenin仃oducedtocollaboratiVelyworkwitll尽meansalgoritlull.Experimentsaretobec2urryingoutinordert0testandVe^母theproposedalgorithmaRertlleimplementationoft1
6、1eso脚2Lre.Tllepr叩osedalgoritlⅡna11dtheso胁arearegoingtobeoptiIllizedinmene2Lrlyfhture.KEYWORDS:dataIIlining;尽meansalgorithIn;outlier;血珂logic;diabetes;glucose;cen缸.0id;clustering1V致谢本论文的工作是在我的导师戴胜华老师和蒋大明老师的悉心指导下完成的,戴胜华老师和蒋大明老师严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来戴胜华老师和蒋大明老师对我的关心和指导。戴胜华老师和蒋大明老师
7、悉心指导我们完成了实验室的科研工作,在学习上和生活上都给予了我很大的关心和帮助,在此向戴胜华老师和蒋大明老师表示衷心的谢意。戴胜华老师和蒋大明老师教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷心的感谢。在实验室工作及撰写论文期间,刘梦婕、冉娜娜、敖俊秋、朱兆俊、侯铁竹、梁志勇等同学对我论文中的研究工作给予了热情帮助,在此向他们表达我的感激之情。另外也感谢家人,他们的理解和支持使我能够在学校专心完成我的学业。己l言丁l口数据挖掘是一门很广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、
此文档下载收益归作者所有