医院数据仓库的设计心得

医院数据仓库的设计心得

ID:36027832

大小:30.50 KB

页数:5页

时间:2019-04-29

医院数据仓库的设计心得_第1页
医院数据仓库的设计心得_第2页
医院数据仓库的设计心得_第3页
医院数据仓库的设计心得_第4页
医院数据仓库的设计心得_第5页
资源描述:

《医院数据仓库的设计心得》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、医院数据仓库的设计心得曲阜市人民医院孔敏摘要:数据仓库是为数据分析而设计的开发工具,使用OLAP工具进行联机分析处理。本文叙述了曲阜市人民医院的数据仓库的设计和开发过程,介绍了数据仓库在医疗工作中的应用以及如何从数据库中抽取有用信息,为领导决策、医院运行监控、绩效评估等业务系统的运行提供数据环境。关键字:数据仓库;多维数据集,数据分析我院从1995年开始使用HIS系统,到目前已经积累了上万条的门诊与住院病人信息记录。为了从中挖掘有用信息,我院进行了信息系统数据仓库建设,对本次的设计与实施的过程特写此文供同行们参考。首先我们先了解一下数据

2、仓库与数据挖掘方面的知识。数据仓库:目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作《BuildingtheDataWarehouse》一书中给予如下描述:数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据

3、库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。数据挖掘:数据挖掘是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。数据挖掘为探查和分析新的数据类型以及用新方法分析旧有数据类型提供了令人振奋的有用信息。数据挖掘的意义是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探查大型数据库,发现先前未知的有用模式。数据挖掘还具有预测未来观测结果的能力,并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,则是信

4、息检索领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。理解了数据仓库与数据挖掘的含义后,我们才能开始下面的具体实施步骤1.开发联机分析系统的第一步是需求分析。因缺乏数据在线分析实践,故难以进行有效的需求调研。我们一开始是从医疗统计出发,确定的目标是:(1).要满足“医院评审标准”、“医院医疗费用统计的有关规定”和卫生行政部门要求的常规报表和统计的规定;(2).制定医院HIS数

5、据库的扩充统计信息;3.根据病种和治疗的特点,建立新的统计单位和指标。2.联机分析的基础是医疗HIS的有关数据,第二步进行的是数据源分析。曲阜市人民医院是一家有近七百张病床的二级甲等综合性医院,有10多年的应用HIS系统管理经验。其主要的HIS数据源有:门诊挂号信息,病人住院信息,门诊和住院费用明细,药品管理信息,及其它辅助信息。表中数据包含了:(a)病人信息和疾病属性;(b)门诊住院治疗时间、单位、医生;(c)疗效;(d)医疗业务收入;(e)各项检查、治疗、护理项目的名称、数量、时间和费用;(f)药品及耗材。3.制定多维数据集。根据数

6、据源分析,我们定义了病人、门诊、住院和费用四个多维数据集,原数据库中具有统计意义的字段统统被定义为维度或量度。4.制定新的统计单位和指标。HIS系统中最复杂的数据是住院治疗费用。它们在数据库中按照“住院号(关键字)-关联-相关费用明细”的结构组织存储。这种结构产生以住院号为单位的统计指标:年度出院人次数、平均住院日、平均住院费用和治愈率。对于综合性的医院,不能正确地反映疾病和治疗与疗效和费用间的关系,也缺乏横向、纵向的可比性。因此统计的工作量、疗效、费用的单位应该是实际病人数和汇总后的治疗次数,而不是住院次数。我们比较了我院指标的具体数

7、值,发现10多年来住院病人的平均费用有所下降,而人均年费用却不变或略增。显然前者是假象,只不过将整个治疗过程分为多一些的住院次而已。可见新指标具有较好的统计价值。5.确定数据结构。新指标需要增加统计后的实际病人信息和治疗维度。根据上述多维数据集,按照各维度的各种合理组合,建立了病人特征、医疗收入、门诊数据、住院数据、费用疗效、潜在问题、药品和耗材等主题组,定制数据仓库的固定主题。从数据仓库的角度看,统计量就是病人、工作量、疗效和费用等度量,统计指标就是这些度量在规定维度下的成员属性,报表就是指定两个或多个维度下统计量或统计指标的交叉表。

8、通过多维数据集可以使管理者们既能评审结局,也能分析过程;从而判断现象背后可能的业务趋势、潜在的利益或问题。数据仓库建设完毕后,还要进一步规范数据的采集和确保数据保障渠道的畅通,必须完善各种规章制度。例如:1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。