数据整合与数据挖掘技术在医疗保险信息系统的研究与应用

数据整合与数据挖掘技术在医疗保险信息系统的研究与应用

ID:33583405

大小:239.43 KB

页数:5页

时间:2019-02-27

数据整合与数据挖掘技术在医疗保险信息系统的研究与应用_第1页
数据整合与数据挖掘技术在医疗保险信息系统的研究与应用_第2页
数据整合与数据挖掘技术在医疗保险信息系统的研究与应用_第3页
数据整合与数据挖掘技术在医疗保险信息系统的研究与应用_第4页
数据整合与数据挖掘技术在医疗保险信息系统的研究与应用_第5页
资源描述:

《数据整合与数据挖掘技术在医疗保险信息系统的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、实践与经验数据整合与数据挖掘技术在医疗保险信息系统的研究与应用简伟光(广州市劳动保障信息中心,广州510000)摘要:通过分析医疗保险管理信息化深入发展的需求,从技术的角度提出医疗保险信息系统数据整合及数据挖掘的总体解决方案,并对医疗保险信息系统的数据仓库的设计、数据整合的方案以及数据挖掘的技术和应用进行概要的分析和论述,并用关联规则挖掘算法实证研究医保信息挖掘的可能性与必要性。利用编码、解码技术和SQL的聚集函数,实现基于SQL的FP-Growth算法,从而突破机器内存对数据挖掘的处理效率,实现对海量数据挖掘的高效挖掘。关键词:医疗保险信息系统;数据整合;数据仓库

2、;数据挖掘;关联规则0引言管理决策、医保政策的制定、调整和医保科学化管理提供有力支持。这都是国内医疗保险业务管理亟需解决随着计算机技术的不断发展,计算机管理已经逐的问题。渐步入各个行业,而职工福利待遇体系中十分重要的数据仓库与数据挖掘技术的产生和发展为这个问医疗保险行业则更为迫切地需要借助计算机对繁杂的题的解决提供了理论和方法指导。对于数据仓库和数日常事务进行处理。数据库技术的不断发展及医疗保据挖掘技术在医疗保险领域中的应用,国内研究主要险信息系统的应用,产生和收集数据的能力已经迅速体现在以下两个方面:一方面,如何将数据仓库和数据提高。目前的数据库系统可以高效地实现

3、数据的录入、挖掘技术应用到医疗保险业务管理方面的应用研究;查询、统计等功能,但无法发现数据中存在的关系和规另一方面,展开数据仓库与数据挖掘技术理论研究。但则,无法根据现有的数据预测未来的发展趋势。缺乏挖总体来说,数据仓库应用已有所展开,主要应用于一般掘数据背后隐藏的知识手段,导致了数据爆炸但知识的汇总与分类统计,没有开展深层次的统计分析。对于贫乏的现象。数据挖掘在医疗保险中的应用,目前大多数的文献仍1问题提出停留在理论研究的层面,具体实现的较少,针对海量数据的特定医保主题挖掘甚少。因此,从整体而言,数据目前,医疗保险信息系统还是由相对独立的业务仓库技术与数据挖掘技术

4、在医保系统中的应用还处于子系统所组成(例如医疗保险子系统、工伤保险子系理论研究探讨阶段。统、生育保险子系统等),各业务子系统数据彼此独立,本文接下来从两个方面来论证医保信息数据整合数据结构差异较大,因此如何将这些分散的数据进行的必要性与数据挖掘技术在医保领域应用的可行性。整合,形成一个整体的、统一的医保信息库,并在此基础上,利用先进的数据挖掘技术从基础性数据和医保2数据整合技术在医疗保险信息系统中的信息中,挖掘有利于医保业务发展的相关业务规则,为收稿日期:2010-09-27修稿日期:2010-10-15作者简介:简伟光(1973-),男,广东广州人,本科,计算机应

5、用工程师,研究方向为电子政务和信息工程现代计算机2010.10趧趹实践与经验应用的分析主题。由于医疗保险信息系统的数据仓库涉及了多个分析主题,因此医疗保险信息系统的数据仓库2.1数据整合技术应用的可行性应采用事实星型模式(GalaxySchema)进行建模。数据医疗保险信息数据整合(DataIntegration)技术有粒度应根据分析需要设定。为了满足业务的需要,医疗多种,本文所指的整合技术主要是数据仓库技术。保险信息系统的数据仓库支持最小粒度的详细数据的医保数据仓库技术应用中有三个基本概念:ETL、存储(即存储所有账户的历史交易明细数据,基于业务OLAP和数据仓库

6、模型。的要求,数据一般要求系统存储至少一年以上),以支目前比较流行的数据仓库设计模型有以下三类:持各类的查询、分析处理。①概念模型。它描述的是从客观世界到主观认识的映物理模型设计的指导思想是提高数据仓库的性能射,它是用于为一定的目标设计系统、收集信息而服务与数据存储管理。医疗保险信息系统的数据仓库中最的一个概念性的工具;②逻辑模型。它描述了数据仓库大数据量的表主要是账户信息表和交易明细表,而且的主题的逻辑实现,即每个主题所对应的关系表的关这两个表也是数据处理最核心的表,其存储的结构和系模式的定义。目前最流行的数据仓库数据模型是多索引的策略直接关系到系统的整体性能和效

7、率。维数据模型,主要包括了星形模式、雪花模式和事实星(2)数据集市设计型模式三种;③物理模型。数据仓库的物理模型是逻辑由于医保信息管理系统的数据仓库的数据量巨模型在数据仓库中的实现,例如数据存储结构、数据的大,如果直接在上面进行数据挖掘或OLAP处理,其效索引策略、数据的存储策略以及存储分配优化等。率将存在很大问题,因此为提高数据挖掘和OLAP的2.2数据整合技术应用的实证分析处理效率,就需要建立专门的数据挖掘数据集市和O-目前,医疗保险信息系统数据一般分布在不同的LAP数据集市。为了提高数据处理的效率和节省数据系统中,如果要统一医疗保险所有的业务数据,就必须存

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。