欢迎来到天天文库
浏览记录
ID:36570681
大小:3.08 MB
页数:94页
时间:2019-05-12
《基于数据挖掘技术的医疗设备绩效预测方法的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、南方医科大学博士学位论文基于数据挖掘技术的医疗设备绩效预测方法的应用研究姓名:伍平阳申请学位级别:博士专业:生物医学工程指导教师:林意群20080510中文摘要备信息进行录入、修改、查询、统计等简单功能的实现,停留在基于数据库技术支持的操作型事务处理的水平上。对医疗设备购置前的可行性论证的决策支持和投入使用后的设备使用、维护等信息的深层次加工较少,如何充分利用这些宝贵的信息资源来为医院的管理者和决策者实施对医疗设备的高效管理和科学决策提供准确、可靠的依据,提高医疗设备的社会效益和经济效益,促进医
2、院的快速健康发展,已成为人们关注的焦点。数据挖掘(DataMining,DM)也称为数据库知识发现(KnowledgeDiscoveryinDatabase,KDD),这一术语出现于1989年,是从数据库中识别出有效的、新颖的、潜在有用的、并且最终可理解的模式的非平凡过程。数据挖掘技术在90年代有了突飞猛进的发展,数据挖掘从理论和技术上继承了知识发现领域的成果,同时,它还借鉴了许多其它领域的理论和算法,如数据库系统、机器学习、模式识别、人工智能、数据可视化、信息检索以及统计学等。数据挖掘本质上可
3、归类为深层次的数据分析方法。数据分析本身已经有很多年的历史,不过由于以往计算能力的局限性,限制了对大量数据进行分析的复杂数据分析方法的应用。近年来,由于电子信息技术的发展及应用的普及,商业、医疗及其它领域都产生了大量的业务数据,分析这些数据可以为决策提供真正有价值的信息,因此具有重要的意义。数据挖掘的结果通常表示为概念、规则、规律、模式、约束、可视化等形式。通过数据挖掘所获得的知识可以直接用于辅助决策或修正已有的知识体系,也可作为新的知识存储于应用系统中。数据挖掘的原始数据可以是结构化的;也可以
4、是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现的知识可以被用于信息管理、查询优化、决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单统计、查询,提升到从数据中挖掘知识,提供决策支数据挖掘需要良好的数据组织和纯净的数据,数据的质量直接影响数据挖掘的效果,而数据仓库的特点恰恰最符合数据挖掘的需求,它从各类数据源中H博士学位论文抽取数据,经过清洗、集成、选择、转换等处理,为数据挖掘所需要的高质量数据提供了保证。数
5、据仓库是数据库技术发展的高级阶段,它是面向主题的、集成的、内容相对稳定的、随时间变化的数据集合,可以用来支持管理决策的定制过程。数据仓库系统允许将各种应用系统、多个数据库集成在一起,为统一的历史数据分析提供坚实的平台,其主要目的是为决策提供支持,为OLAP、数据挖掘等深层的数据分析提供平台。可以说,数据挖掘为数据仓库提供了有效的分析处理手段,数据仓库为数据挖掘准备了良好的基础。SQLServer2005IntegrationServices(SSlS)是用于创建高性能的数据集成解决方案的平台,它
6、能够执行抽取(extraction),转换(transformation)和加载(10ad),缩写为ETL,用于为数据仓库提供服务。SSIS提供了工作流环境,可以使用该环境来构建数据转换包。可以从不同的数据源中提取数据,然后对该数据执行一系列操作。由于医学数据库是一个复杂数据库,而目前数据挖掘技术主要应用于以结构化数据为主的关系数据库、事务数据库和数据仓库,对复杂类型数据的挖掘尚处在起步阶段。结合医学信息自身具有的特殊性和复杂性,处理好挖掘过程中的关键技术,医学数据挖掘将有广阔的应用前景。分类和
7、预测是数据挖掘的两种数据分析形式,通常的算法有粗糙集理论、决策树、人工神经网络、渐近计算等,各有优点。应该注意的是大部分算法都不是专业为解决某个问题而特制的,算法之间也并不互相排斥。一般来说并不存在所谓的最好的算法,在最终决定选取哪种算法之前,有可能对各种算法都试一下,然后再选取一个较好的。在实际应用中,可对这些方法进行适当的修改、扩充和优化,从而能在各种特殊的医学数据库中进行分类和预测。本文重点研究决策树算法的原理及方法。决策树算法最基本的原理是递归地将数据拆分成子集,以便每一个子集包含目标变
8、量类似的状态,这些目标变量是可预测属性。每一次对树进行拆分,都要评价所有的输入属性对可预测属性的影响。当这个递归的过程结束时,决策树也就创建完成了。比较有名的决策树算法有ID3算法、ID4算法、ID5R算ln中文摘要法、C4.5算法。当今先进的数据挖掘工具都提供多种可供选择的数据挖掘算法。这是因为一种算法不可能完成所有不同类型的数据挖掘任务。本次挖掘任务可分为两部分的任务:分类任务和回归任务。分类任务是:对不同条件下的设备使用情况进行分类。假设疾病例数和设备使用情况存在线性关系:Y=锻+b,其中
此文档下载收益归作者所有