基于贝叶斯的防病患欺诈模型研究-论文.pdf

基于贝叶斯的防病患欺诈模型研究-论文.pdf

ID:53744313

大小:481.20 KB

页数:3页

时间:2020-04-22

基于贝叶斯的防病患欺诈模型研究-论文.pdf_第1页
基于贝叶斯的防病患欺诈模型研究-论文.pdf_第2页
基于贝叶斯的防病患欺诈模型研究-论文.pdf_第3页
资源描述:

《基于贝叶斯的防病患欺诈模型研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、现代商贸工业NO.1O,2O14ModernBusinessTradeIndustry2014年第1O期基于贝叶斯的防病患欺诈模型研究潘芳(1.南京中医药大学,江苏南京210023;2.东南大学经济管理学院,江苏南京210096)摘要:为避免病患欺诈给我国相关部门带来的极大经济损失,甚至会危害到我国医疗的进一步发展,采用贝叶斯分类对防病惠欺诈模型进行了研究,并对其性能进行测试。测试结果表明所建模型性能良好。研究成果可为相关部门防范病患欺诈提供理论支持。关键词:贝叶斯;病患;欺诈;异常检测;社会稳定中图分类号:F27文献标识码:A文章编号:1672-3

2、198(2014)10-0080-030引言.者的手续已趋于简单化,一般只需提供证件号码和地址即目前社会上存在着一些不法分子在履行参保缴费义务可办理,所以现在相关部门所拥有的客户基本信息已经很上虚构事实,隐瞒真相,以骗取医保权益,或在医疗行为上简单,很难从中发现对欺诈分析有价值的信息。而动态数虚构事实,隐瞒真相,以骗取医保基金或医保待遇。这类欺据反映的是具体行为,往往可能隐藏一些行为特征,所以应诈行为在各个国家普遍存在。美国联邦政府多次表示,打从动态数据中进行挖掘,尝试从中发现欺诈行为的一些规击医疗保险诈骗案,是医疗保险改革议程的重要组成部分。律和特

3、征。通过对欺诈行为的具体分析,本文得出贝叶斯分类模型所需要的训练样本集的各属性(如表1)。这些违法行为已经给我们国家带来了极大的经济损失,严表1illI练样本集属性重影响我国医疗行业的进一步发展。我国虽还没有完整的社会医疗保险欺诈统计数据,但防病患欺诈已经成为引起学者重视的社会问题。就目前业界人士认为,防范欺诈的手段有两个,一是政策调控.采用行政手段,依靠法律和行业互助来限制这种不良行为;二是利用技术手段,防范于未然。两者相比,利用技术手段是目前最佳的防范欺诈手段。实践证明较为有效模型建立如下:的有NCR公司开发的Teradata数据仓库。Tanig

4、uchi等学(1)每个数据样本用一个n维特征向量X一者也提出了三种欺诈侦测方法。国内对这种防病患欺诈主{x1,X2,⋯x)表示,分别描述对n个属性AI,A2,⋯,A要采用的还是行政手段。夏宏等认为要加强法律法规建样本的n个度量,即为病患设定的基本属性例如年龄、出生,消费金额等。设.完善医疗保险制度等措施。李连友等梳理了相关制度,(2)假定有1T1个类C1,Ce,⋯C。给定一个未知的数据指出应该做一些实证研究。杨鹤标等提出了基于概率分布样本X(即没有类标号),分类法将预测X属于具有最高后的异常检测模型,但该模型只能应用于已结束治疗且有医验概率(条件X下

5、)的类。即贝叶斯分类将未知的样本分配疗欺诈嫌疑的情况。给类Ci当且仅当P()>P(),1≤j≤m,j≠i。综上可知,国内对防病患欺诈问题的研究处于起步阶段.需要一种技术为作为重要手段来解决目前存在的病患则,最大化e(Ci一)。其P(簧)最大的类ci称为最大欺诈问题。与此同时,贝U-斯分类以其简单,高效与准确等后验假定。可得:特点。在一些实际的事例里得到了广泛的研究与应用。本文尝试运用贝叶斯的相关理论与方法建立防病患欺诈模P(簧)一㈩型,对未知类别属性的患者进行预测,识别有欺诈趋向的病(3)由于P(X)对于所有类为常数,只需要P(XJCi)P(Ci)最

6、大即可。如果类的先验概率未知,则通常假定这些类患。为相关医疗部门有针对性地采取处理措施,防范病患是等概率的,即P(c1)一P(Ce)~·一P(CⅡ.)。并据此只对欺诈行为的发生,减少欺诈行为带来的经济损失提供理沦Pf会1最大化。否则,最大化P(xlC。)P(C.)。类的先验概支持。l模型构建率可以用P(Ci)一计算,其中s是类Ci中的训练样本客户的数据主要包括两种:静态数据和动态数据。静数,而s是iJil练样本总数。态数据指的足通常不会改变的数据.如客户的基本信息等。(4)给定具有许多属性的数据集·计算I(舍)的开销可动态数据指的是经常或定期改变的数

7、据信息,如每月消费金额.交费记录等。由于社会对人的隐私权的尊重,现在患能非常大。为降低计算P()的1:销,在下面的模型中我一一Rf)——现代商贸工业No.10,2O14ModernBusinessTradeIndustry2O14年第lO期们做了类条件独立的假定。给定样本的类标号,假定属性首先计算先验概率P(Ci),i=l,2。值相互条件独立,即在属性问,不存在依赖关系。这样,P(C1)一P(IsFraud=”yes”)一7/15—0.47—P(C2)=P(IsFraud一”no”)8/15—0.54(荟)一"rIXk)然后计算P(XlCi),i一1

8、,2。为了计’算它,需要计算以概率P(),p(X2一),⋯P()可以由训练样本估值,下条件概率:P(X1lC

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。