健康体检数据仓库的构建及相关数据挖掘

健康体检数据仓库的构建及相关数据挖掘

ID:36538800

大小:2.60 MB

页数:58页

时间:2019-05-11

健康体检数据仓库的构建及相关数据挖掘_第1页
健康体检数据仓库的构建及相关数据挖掘_第2页
健康体检数据仓库的构建及相关数据挖掘_第3页
健康体检数据仓库的构建及相关数据挖掘_第4页
健康体检数据仓库的构建及相关数据挖掘_第5页
资源描述:

《健康体检数据仓库的构建及相关数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、大连理工大学硕士学位论文健康体检数据仓库的构建及相关数据挖掘姓名:刘淼申请学位级别:硕士专业:计算机应用技术指导教师:王秀坤20081218大连理工大学硕士学位论文摘要随着信息化的不断发展以及人们对健康的日益重视,健康体检数据库中积累了大量宝贵的数据,但是还没有得到充分利用。如何充分利用已有的体检数据更好的辅助医生及管理人员为客户提供更好的医疗检查就是本文的研究重点。首先,由于历史数据逐年增多,慈铭健康体检集团规模不断扩大,原有的数据库系统已经无法负荷急剧增长的数据量,也无法从整个企业的角度进行统计分析,构建数据仓库是必经之路。因此,本文结合公司的实际情况

2、,给出了一个分布式数据仓库的模型,描述了其体系结构设计、逻辑模型设计及数据更新方法,并进行了相应的数据分析。其次,针对如何合理制定体检项目组合的问题,本文研究了水平加权关联规则。其中权值的设计借鉴了传统瓜领域的TF*IDF的权值定义思想,给出了科室的权值定义公式。通过结合权值归一化思想,使加权支持度不大于1,更易于理解。最后通过比较加权关联规则算法与传统非加权关联规则算法在本文中的应用效果,证明了加权关联规则在本文中的适用性,完成了制定体检项目组合的任务。最后,为了辅助客服医生针对每个客户特点为其推荐合适的体检项目组合,本文研究了基于粗糙集的关联规则挖掘方

3、法,并着重研究了其中的求核算法。由于本文中预处理后的决策表存在大量的不相容记录,并且这些不相容记录属于客观事实,无法进行简单删除,原有的求核算法不再适用。针对这个问题,本文给出了纵向加权求核方法:根据数据的不相容程度,对记录进行纵向加权,删除权值低于给定权值的记录,并再次根据记录的权值计算核属性的权值,最后根据核属性权值决定保留的核属性。实验表明,该方法具有很好的灵活性,通过医生的配合,实现了项目的需求。本文结合北京慈铭健康体检集团的实际数据库,运用上述数据挖掘方法进行相应需求的数据挖掘,并得到了挖掘结果,达到了辅助决策的目的。关键词:数据仓库;加权关联规

4、则;粗糙集;健康体检健康体检数据仓库的构建及相关数据挖掘KeyWords:DataWarehouse:WeightedAssociationMining;RoughSet;HealthCheck—up—IV—大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关

5、法律责任。学位论文作者签名大连理工大学硕士研究生学位论文大连理工大学学位论文版权使用授权书本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印、或扫描等复制手段保存和汇编本学位论文。学位论文题作者签名:导师签名:大连理工大学硕士学位论文1绪论1.1课题的来源及研究背景本文选题来自于北京慈铭健康体检集团的实际项目。北京慈铭健康体检集团是经过中国医师协会权威认

6、证的,中国最大的体检连锁机构。目前的业务系统是一套专业的体检软件,其功能包括市场开发管理、客户关系管理、销售管理、体检流程管理、体检结果管理、服务跟踪管理等。北京慈铭健康体检集团在北京就有8家分院,由于业务的扩展,原有的体检系统已经不能很好的适应业务的发展,主要表现为:总公司和各分院间的信息交换困难、基于C/S模式的业务系统在公司业务扩展后其可扩展性不够、系统的维护成本较高、系统与财务系统接口困难、大量的医学数据没有充分利用等。由于当初设计开发HIS时的主要目的仅在于满足日常的业务处理,并没有考虑到对数据的分析与挖掘。HIS运行几年以后,积累了大量的数据,

7、数据项繁杂,收集的海量数据被沉淀,变成了难以利用的数据档案,而这些宝贵的医学信息资源对体检机构的管理、决策和医疗诊断都具有极高的价值。因此,建立合适的数据仓库并改进其对应的业务管理系统及数据分析系统是增强企业竞争力的必经之路。1.2国内外研究现状目前,数据仓库技术在国外各个领域的应用已经十分广泛,许多大企业应用数据仓,库都取得了良好的效果,国外卫生领域中也已开始应用,并获得了很大的效益。国内数据仓库的应用主要在证券、金融、税务、保险等行业中,在体检行业近几年才刚刚起步。由于医疗体检具有很强的实践性、实验性、统计性,体检机构管理也是一门复杂的管理学科,浩瀚的

8、医学资源要用现代技术去组织、去分析、去利用,探索数据仓库与数据挖掘

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。