欢迎来到天天文库
浏览记录
ID:32804970
大小:2.28 MB
页数:57页
时间:2019-02-15
《序列模式挖掘在医疗保险上应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要lIIIIlllllllllllIIIIIIIY1929646要随着社会医疗保险的发展,参保人员的医疗信息数据快速膨胀,如何从曰益庞大医疗数据库中提取有价值的内容来分析医疗保险的现状正成为迫切需要。本文将序列模式挖掘算法与医疗保险数据库结合起来,将基于周期时间约束的序列模式挖掘算法在医疗保险数据库中进行应用。首先分析了目前主流序列模式挖掘算法的内容,针对其特点说明了目前流行的类Apfiofi算法和基于模式增长的算法对基于周期约束的时间数据有一定的局限性,然后借鉴并改进PCSmine算法,并用社会
2、医疗保险医疗数据库进行验证,表明算法有较高效率。本文主要工作有以下几个方面:1.对数据挖掘的准备工作——数据预处理进行了深入学习研究,对主流的多数据源和单数据源整合清洗算法有了详细了解。并结合郑州市社会医疗保险软件neucleaning算法对多元数据库进行整合清洗实践。2.在分析的基于约束的序列模式挖掘各种类型的基础上,重点研究基于时间粒度的序列模式挖掘算法PCSmine,并修改优化了算法中的一个HP.CSB数据结构,使用neucleaning算法预处理过的医疗保险数据库中进行效率验证,表明算法运行
3、效率有了一定的提高。关键词:序列模式挖掘;医疗保险;数据清洗;,’AbstractWiththedevelopmentofsocialhealthinsurance,themedicalinformationdataoftheinsuredexpandrapidly.Howtoextractthevaluablecontentsfromtheincreasinglylargemedicaldatabasesandanalyzethehealthinsurancestatusbecomeurgentr
4、equirements.Thispapercombinesthesequentialpattemminingalgorithmwiththehealthinsurancedatabase,andappliesthecycletimeconstraintbasedsequentialpatternminingalgorithminthehealthinsurancedatabase.Atfirst,thispaperanalyzesthecontentsofcurrentmainsequentialp
5、atternminingalgorithm,andforitscharacteristicsthispaperillustratesthelimitationsthatthecurrempopularClassofApriorialgorithmandthealgorithmbasedonpattem—growthwoulddotothecycleofconstraintsbased011timedata.ThenlearnandtoimprovePCS—minealgorithm,anduseth
6、esocialhealthinsurancemedicaldatabasetoverifythatthealgorithmhashigherefficiency.Themainresearchworkhasthefollowingaspects.1.Deepstudyingandresearchingonpreparationfordatamining-Datapreprocessing,understandingmoreaboutthemainstreammultipledataSOurCeSan
7、dcleaningalgorithmsingledatasourceintegration.ThenwithNEU_cleaningAlgorithmusedbysocialhealthinsuranceinZhengzhouCity,thispapercleansthedatafromintegratemultipledatabases.2.Intheanalysisofconstraint—basedsequentialpatternminingonthebasisofvarioustypes,
8、Thispaperfocusesontime-basedsequentialpatternminingalgorithmgranularityPCSmineandoptimizesthealgorithmtomodifyaHP·CSBdatastructure,Finally,itisverifiedbyhealthinsurancedatabase,toshowthatthealgorithmefficiencyhasbeenimprovedtosomeextent
此文档下载收益归作者所有