欢迎来到天天文库
浏览记录
ID:46584712
大小:2.18 MB
页数:62页
时间:2019-11-25
《数据挖掘研究及其在中医药数据挖掘中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、南京理工大学硕士学位论文关联规则算法研究及其在中医药数据挖掘中的应用姓名:马丽伟申请学位级别:硕士专业:计算机应用技术指导教师:陆建峰20090601硕士论文关联规则算法研究及其在中医药数据挖掘中的应用摘要数据挖掘可以发现蕴藏在海量数据中的潜在知识,是当今最活跃的研究应用领域。关联规则是数据挖掘中的一个主要研究分支,侧重于寻找数据之间的依赖关系。关联规则挖掘的核心问题是如何提高挖掘算法的效率,以及如何更好的应用于特定领域中。中国传统医学是我国优秀的民族文化遗产,中医理论在长期的医疗实践中积累了大量数据信息,挖掘出其中蕴含的宝贵经验,是一项
2、极有价值的研究工作。本文重点是对关联规则挖掘算法的研究,基于直接频繁闭超集改进算法的设计以及在中医药数据挖掘领域中的应用。论文研究的主要问题及相关成果如下:在算法研究方面,本文研究了频繁项集和频繁闭项集的挖掘算法。频繁项集的算法研究中,分析并实现了关联规则频繁项集挖掘的算法—一Apriori算法和FP.growth算法。针对频繁项集挖掘效率低且数量大的问题,研究了频繁闭项集的挖掘算法,并引入直接频繁闭超集的概念,在CHARM算法的基础上,设计了一种能够快速检测候选频繁闭项集闭合性的改进算法——C认BD算法,最后在标准数据集上进行实验比较,
3、表明了CIABD算法的快速有效性。在算法应用方面,利用中医疫病医案信息资源,经过数据预处理,分别采用关联规则中频繁项集与频繁闭项集算法进行中医药挖掘实验,发现频繁闭项集算法在中医药数据挖掘中相对更有优势。通过对关联规则结果的分析,表明挖掘的结果符合中医相关理论,具有较好的临床参考价值。关键词:数据挖掘,关联规则,中医药,频繁项集,频繁闭项集,直接频繁闭超集垒竺塑竺—————————一————.一堡圭丝塞———————————————————————————_—————————————-—————————————‘—————————————
4、————一一一一。~ru^AbstractDataMiningCallfindoutthepotentialvaluableinformationfrommassivedata.Itisoneofthemostactiveresearchfields.AssociationRuleisamainbranchinthedataminingfield,whichfocusesonfindinginterestingdependentrelationsbetweenitemsofdatabase.ThemainissuesofAssociati
5、onRulearehowtoimprovetheefficiencyofminingalgorithmsandhowtoapplyitinspecificapplicationarea.TraditionalChineseMedicine(TCM)istheoutstandingculturalheritageoftheChinesenation,containingvaluableexperienceandtheoreticalknowledge.Chinesemedicinetheoryhasaccumulatedalargeamou
6、ntofdatainformationinlong.termmedicalpractice.It,Sverymeaningfultominethepreciousclinicalknowledgebyapplyingdataminingintoabovedata.Thispaperstudiesthealgorithmsforminingassociationrules,designsafasterandmoreefficientAlgorithmbasedondirectfrequentclosedsupersets,andapplie
7、sassociationrulesinthefieldofTCM.MainworkiSasfollows:Foralgorithmresearch,thispaperanalyzesalgorithmsforminingfrequentitemsetsandfrequentcloseditemsets.Firstlycomparetwoclassicalalgorithmsforminingfrequentitemsets,namelyApfioriAlgorithmandFP-growthAlgorithm.Andthenanalyze
8、miningalgorithmsforminingallfrequentcloseditemsets.InordertoimprovetheperformanceofCHARMAlgorith
此文档下载收益归作者所有