医学信息数据库的建立与数据挖掘论文

医学信息数据库的建立与数据挖掘论文

ID:25168370

大小:54.50 KB

页数:7页

时间:2018-11-18

医学信息数据库的建立与数据挖掘论文_第1页
医学信息数据库的建立与数据挖掘论文_第2页
医学信息数据库的建立与数据挖掘论文_第3页
医学信息数据库的建立与数据挖掘论文_第4页
医学信息数据库的建立与数据挖掘论文_第5页
资源描述:

《医学信息数据库的建立与数据挖掘论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、医学信息数据库的建立与数据挖掘论文.freeledicalinformatics),进而成为生物医学工程学的重要支柱.医学信息涵盖了医学活动中产生的文字、图像、声音以及电磁波、光波、压力、温度等多媒体物理数据,这些数据在计算机和数据库技术的支持下,已成为医学技术领域实施科学管理和科学研究的重要资源.数据仓库(dataining,DM)技术的出现[1],为医务管理人员、科研工作者分析、利用这些数据资源进行科学管理、决策和开展大规模、高水平医学研究提供了有力的技术工具.数据仓库与数据挖掘技术已在国外一些大型企业

2、中得到了成功应用.freel,ES),其数据资源仅仅是某一方面的专家知识,涉及的数据量很小,覆盖面也很窄.那么,摆在我们面前这个巨大的医学资源宝库究竟能为我们做些什么呢?例如,医院信息系统(hospitalinformationsystem,HIS),它是医学信息学的一个分支,分为管理信息系统(managementinforma-tionsystem,MIS)和临床信息系统(clinicalinformationsys-tem,CIS).前者主要处理医院内部管理方面的信息如人事、财务和设备管理等,而后者是以

3、处理患者为中心的信息系统,如患者入院、住院、治疗、检查、病历、出院等一系列与患者有关的信息.那么,这两类系统能否满足下列要求呢?①如果医院明年利润目标要增长5%,哪些前提条件变化才能达到这一目标?此外还需采取哪些措施来实现这些变化?②未来某段时间内哪些药品使用的频度最高或最低?以及与治疗疾病间的关系?③未来某段时间内哪些疾病是常发病或发病率最高?使用的药物主要有哪些?如何组织急需药品的供应?④环境、气候、地理位置与流行病间的关系?利用现有信息系统要回答这些问题是困难的,有些甚至是不可能的.然而,利用数据仓库

4、与数据挖掘技术就可以轻而易举地找到问题的答案.因此,建立数据仓库与利用数据挖掘技术对于开展科学研究,提高医学技术水平是很有必要的.2数据仓库的建立所谓数据仓库是支持管理决策过程的、面向主题的、集成的、与时间有关的、持久的数据集合,它以传统的数据库技术作为存储数据和管理资源的基本手段,以统计分析技术作为分析数据和提取信息的有效方法,以人工智能技术作为挖掘知识和发现规律的科学途径,是与网络通信技术、面向对象技术、并行技术、多媒体技术、人工智能技术等相互浸透、互相结合与综合应用的技术.创建基于HIS的数据仓库,是

5、从已有数据出发的数据仓库的设计方法,称之为“数据驱动”的系统设计方法,它的基本思路是:利用以前建设的数据库系统的数据,按照分析领域对数据及数据之间的联系重新考虑,组织数据仓库中的主题,利用数据模型有效地识别数据和数据仓库中的主题的数据的“共同性”(即建立主题间相互联系的属性).其创建的基本方法如Fig1所示[2].图1略从图中看出,数据仓库的设计是一个动态的、循环的过程,在系统设计初级阶段,人们对系统的分析需求不能预先作出规范说明,只能给出一个抽象的模糊的描述,数据仓库的内容、结构、粒度、分割以及其他物理设

6、计根据用户反馈信息再不断地调整和完善.2.1主题抽取数据仓库中数据的组织是面向主题的[3].它是在较高层次上对分析对象的数据的一个完整的、一致的描述,能完整、统一地刻画各个分析对象所涉及的各项数据以及数据之间的关系.可以说,主题定义的过程就是数据仓库模型建立的过程.2.1.1系统边界确定由于数据仓库建立初期很难获得明确而又详细的需求,系统设计人员只能得到一些基本的方向性的需求信息,如决策的类型、决策者感兴趣的问题、解决这些问题需要哪些信息,这些信息需要包含原有数据库系统的哪些部分的数据等等.这就是数据仓库设

7、计过程中的需求分析,称之为系统边界界定,以此作为确定主题的基本依据.2.1.2主题的确定根据有关军卫1号工程设计思想和实施细则的报道,HIS几乎涵盖MIS和CIS的方方面面,涉及范围广泛,内容丰富全面,可以从管理角度、从科学研究的角度,确定若干个主题如患者、药品、门诊、检验等,作为管理决策和科研分析的数据来源.例如:患者:患者固有信息:患者标识号,住院号,姓名,性别,出生年月,文化程度,身份证号,住址,电话……患者住院信息:患者标识号,入院科室、职业、身份、费别、在职标志、医保类别、医疗保险号、工作单位、门

8、诊医师……药品:药品固有信息:药品编码,药品名称,规格、单位、剂型、毒理分类、标准剂量、材质分类、用药梯次、价格系数……药品采购信息:药品编码、药品名称、规格、单位、剂型、市场批发价、市场零售价、货源足缺、包装规格……2.2数据组织数据仓库中的数据分为早期细节级、当前细节级、轻度综合级和高度综合级4个级别,各个级别的数据根据需要划分为不同的粒度[4].所谓粒度是对数据仓库中数据的综合能力的度量,它既影响仓库中数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。