医保异常检测的分类集成算法研究

医保异常检测的分类集成算法研究

ID:35049298

大小:6.63 MB

页数:81页

时间:2019-03-17

医保异常检测的分类集成算法研究_第1页
医保异常检测的分类集成算法研究_第2页
医保异常检测的分类集成算法研究_第3页
医保异常检测的分类集成算法研究_第4页
医保异常检测的分类集成算法研究_第5页
资源描述:

《医保异常检测的分类集成算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、‘甲一IP;‘‘一^賓蕊纖端獨iiH皮夫著IUNIVERSITYOFELECTRONICSCIENCEANDTE巳HNOLOGYOFCHINA硕壬学化论文IASTERTHESIS.1'fM獲:豪於'!/f3"\’:I::,\¥\—‘'、""'.\/./3se^—'■■'V■i'■s-、j';?;.;-i;''’'T:V";rV江-,:.VV'r-;论文题目医保异常检测

2、的分类集成算法佛宛 ̄ ̄^—.-—….―...一 ̄皆:..?必‘SJ学科专业计算机软件与理论学号2013210602%作者姓名李秀丽__:'指导教师陈端兵副教授独创性声明本人声明所呈交的学位论文是本人在导师指导下迸行的研巧了作及取得的研究成果。据我所知,除了文中特别加L乂标注和致谢的地方夕h,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我

3、一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并衷示谢意。作者签名:杀綱日期:义月三日7论支使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文允的规许定论文,有被权普保留并向国家有关部口或机构送交论丈的复印件和磁盘,部或阅和借阅。本人授权电子科技大学可将学位论文的全等部分内容编入有关数据库进行检索,可拭采用影印、缩印或扫描复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:i赛明导师签名:粟诚7麥、

4、P日期:^//年月曰马分类号密级注1UDC学位论文医保异常检测的分类集成算法研究(题名和副题名)李秀丽(作者姓名)指导教师陈端兵副教授电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士学科专业计算机软件与理论提交论文日期2016.03论文答辩日期2016.05学位授予单位和日期电子科技大学2016年06月答辩委员会主席评阅人ResearchontheclassificationensemblealgorithmformedicalinsuranceanomalydetectionAMaste

5、rDissertationSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:ComputerSoftwareandTheoryAuthor:LiXiuliAdvisor:Prof.ChenDuanbingSchool:SchoolofComputerScience&Engineering摘要摘要随着我国医疗保险制度的不断发展,医保欺诈行为也是层出不穷,由于欺诈的形式多样,而且操作隐蔽,加上我国缺少反欺诈的相关经验,所以现

6、阶段医保反欺诈工作面临着很大的挑战。另一方面我国的医院信息化系统积累了大量病人的就诊记录,然而其中的信息并没有得到充分的利用。因此通过将数据挖掘技术应用到医保异常检测,挖掘病人就诊记录中的潜在价值,给医保异常检测的研究提供了新思路。本文主要研究了如何将数据挖掘的分类集成算法应用到医保异常检测领域,提高其异常检测能力。由于医保样本具有不平衡性,因此对医保数据进行分析之前,首先对数据集进行平衡化处理,然后在相对平衡的数据上进行分类集成。本文主要工作包括:(1)基于非平衡的医保数据,提出一种新的混合抽样方法

7、,该方法结合了基于K-means聚类的欠抽样和smote抽样方法。(2)基于选择性集成的理论对随机森林模型进行改进,首先将基分类器按照其分类效果的F-measure进行排序,根据设定的top-percent百分比筛选掉分类性能差的基分类器,然后再根据不一致性度量衡量基分类器的相似性,在相似性高的基分类器中,将F-measure值低的基分类器去掉,进而保证待集成基分类器的准确性和差异性。(3)使用两种方案进行医保异常检测实验,一是先对非平衡的医保数据利用混合抽样方法进行平衡化处理,然后用基于选择性集成改

8、进的随机森林在相对平衡的医保数据上进行医保异常检测;二是直接在非平衡的医保数据上用基于选择性集成改进后的随机森林进行异常检测,但在随机森林的每次迭代过程中使用smote抽样对医保数据进行平衡化处理。经过进行相关实验以及集成算法之间的对比分析,发现两种改进方案都提高了随机森林对医保异常检测的效果,而基于smote抽样的随机森林改进算法具有更好的异常识别性能。由于改进后的算法在提高异常检测能力的同时,也增加了训练模型的运行时间,因此在下一步工作中将致力于缩小

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。