数据挖掘在医学方面的应用

数据挖掘在医学方面的应用

ID:12748849

大小:42.50 KB

页数:4页

时间:2018-07-18

数据挖掘在医学方面的应用_第1页
数据挖掘在医学方面的应用_第2页
数据挖掘在医学方面的应用_第3页
数据挖掘在医学方面的应用_第4页
资源描述:

《数据挖掘在医学方面的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据挖掘在医学方面的应用摘要:着信息技术的发展,采集、存储和管理数据的手段日益完善。数据挖掘学科应运而生。本文介绍数据挖掘的概念和应用,以及国内医学方面数据挖掘的应用现状及展望。关键字:数据挖掘医学Abstract:Thedisciplineofdataminingemergeswiththedevelopmentoftechnologyandmaturationofmethodsofdatacollection,storageandmanagement.Thepaperintroducestheconceptofdat

2、amining.Thispaperintroducesdataminingconceptsandapplications,aswellasdomesticmedicaldataminingapplicationstatusanditsprospect.KeyWords:datamining;biomedical1引言随着数据库技术的飞速发展,信息技术已渗透到包括医学在内的各种领域。很多大中型医院都相继建立了自己的医院信息系统(HIS),随着HIS的应用和不断发展,数据库中的数据量迅速膨胀,数据库规模逐渐扩大,复杂程度日益

3、增加。但是尽管积累了大量的业务数据,真正能将这些数据的价值挖掘出来,并运用到医院的临床辅助诊断和日常管理决策中去的却很少。提出了建立基于HIS系统的医学信息数据仓库,在此基础上,对数据仓库中的医疗数据进行疾病监测、预测、医院管理辅助决策等方面的数据挖掘。为医务工作者、临床管理人员、科研人员提供辅助决策与综合分析的工具。在医疗方面具有重要的意义。2.数据挖掘技术介绍2.1数据挖掘额的概念数据挖掘是商务智能应用中较高层次的一项技术,是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又

4、是潜在有用的信息和知识的过程1。利用数据挖掘用户将可以更加方便地发现数据的规律,用户可以利用这些规律对某些符合特征的数据作出预测。数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。先未知是指数据挖掘所得到的信息应该是先前不能凭直觉或一般的技术方法所能得到的信息,挖掘到的住处越是出乎意料就可能越有价值。在这方面的一个典型例子就是一家连锁商店通过数据挖掘发现小孩尿布和啤酒之间有着惊人的联系。而有效和可实用是数据挖掘的目的所在。数据挖掘的分析方法有很多种,针对不同的用途就有不同的分析方法,比较常见的分析方法有一下集几种:

5、分类、预测、相关性分组活关联规则、聚类、估值、描述和可视化、复杂数据类型挖掘,包括文本数据挖掘。WEB数据挖掘、图形图像数据挖掘、视频和音频数据挖掘。2.2数据挖掘的过程数据挖掘的过程一般由三个主要的阶段构成:数据准备、开采操作、结果表达和解释,对知识的发现可以描述为这三个阶段的反复过程。(1)数据准备这个阶段又可进一步分成三个子步骤:数据集成,数据选择、数据预处理。数据集成将多文件和多数据库运行环境中的数据进行组合,解决语义模糊性,处理数据中的遗漏和清洗无效数据等。数据选择的目的是辨别出需要分析的数据集合,缩小处理范围

6、,提高数据挖掘的质量。预处理是为了克服目前数据挖掘工具的局限性。(2)数据挖掘这个阶段进行实际性分析工作,包括的要点是:先决定如何产生假设,是让数据挖掘系统为用户产生假设,还是用户自己对数据库中可能包含的知识提出假设,前一种称为发现型的数据挖掘;后一种称为验证型的数据挖掘。再选择合适的工具进行发掘知识的操作,最后进行证实。(3)结果表述和解释根据用户的需求对提取的信息进行分析,挑选出有效信息,并且通过决策支持工具进行移交。因此,这一步骤的任务不仅是把结果表达出来(例如采用信息可视化方法),还要对信息进行过滤处理,如果不能

7、令用户满意,需要重复以上数据挖掘的过此,这一步骤的任务不仅是把结果表达出来(例如采用信息可视化方法),还要对信息进行过滤处理,如果不能令用户满意,需要重复以上数据挖掘的过程。2.3数据挖掘的功能(1)自动预测趋势和行为:数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。(2)关联分析:数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联

8、网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。(3)聚类:数据库中的记录可被划分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。(4)概念描述:概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。