资源描述:
《数据挖掘在科研试验中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2002年10月 第13卷第5期装备指挥技术学院学报JournaloftheAcademyofEquipmentCommand&TechnologyOctober 2002Vol.13 No15数据挖掘在科研试验中的应用研究白红莉 赵 芳 (装备指挥技术学院基础部,北京101416) (装备指挥技术学院研究生部,北京101416) 侯 妍 涂耀文 王 伟 (装备指挥技术学院试验指挥系,北京101416) (装备指挥技术学院测量控制系,北京101416) 摘 要:为了高效、迅速地完成科研试验任务,充分发挥数据的潜力,重点研究了数据挖掘概念及SAS数
2、据挖掘系统;并结合科研试验,从堆积如山的数据中分析、挖掘出隐藏的科研试验规律,减少风险,提高试验质量,缩短试验周期,以形成更具智慧的科研试验决策。关 键 词:数据挖掘;科研试验;应用研究中图分类号:O212.1文献标识码:A 文章编号:CN1123987/G3(2002)0520047203 高技术武器的飞速发展,对科研试验提出了·数据库或数据仓库信息库;越来越高的要求:要求试验质量高,周期短,而且·知识库;在试验次数少的情况下,希望获得尽可能多的有·数据挖掘引擎;科学价值的信息。要对科研试验数据,用先进科·模式评估模块;学的方法去发现有用的知识,将数据转换成有价·图形用户界
3、面。值的信息,这就要求对科研试验数据进行挖掘。也有人建议定义数据挖掘为一种分析具体数对数据挖掘而获得的信息,真实地反映出科研试据并萃取和展现可付诸行动的、隐含的和新颖的验运作的本质及规律性,是支持正确科研试验决信息,以解决业务问题的流程。策的基础。1.2 数据挖掘分类1 数据挖掘数据挖掘属于交叉学科领域。它受数据库系统、统计学、机器学习、可视化和信息科学、神经网1.1 数据挖掘定义络、模糊理论、粗糙集理论、知识表示等学科的影数据挖掘就是从大量的数据中挖掘出有用的响,因而有不同类型的数据挖掘系统。一般分类
信息。到目前为止,尚未见统一的数据挖掘定义,如下[1]:一般认为数据挖掘是从大量
4、数据中提取或“挖掘1)按数据库类型分:它又可根据数据模型、知识”。数据和信息之间的鸿沟要求系统地开发数据或所涉及的应用类型来分,如根据数据模型数据挖掘工具,将数据转换成知识“金块”[1]。分,可分为关系的、事物的、面向对象的、数据仓库从广义观点看,数据挖掘是从存放在数据库、的数据挖掘。数据仓库或者其他信息仓库中的大量数据中挖掘2)按数据挖掘的知识类型分:有特征化区出有用知识的过程。典型的数据挖掘系统主要构分、关联、分类、聚类、孤立点分析和演化分析、偏成有:差分析、类似性分析等。·数据库、数据仓库或其他信息库;3)按所用技术分:有数据仓库技术、机器学 收稿日期:2002204228 作
5、者简介:白红莉(1977-),女,助教.4装备指挥技术学院学报 2002年8习、统计学、模式识别、神经网络等。的综合软件;4)按应用分:有的数据挖掘特别适用于金·利用SAS软件工具SAS/EM进行数据挖融、电信、股票市场、科研试验等。掘。1.3 数据挖掘功能[2]SAS/EM是一个图形界面,菜单驱动功能模数据挖掘功能为用于指定数据挖掘任务中要块对用户界面非常友好,是功能强大的数据挖掘找的模式类。数据挖掘任务一般分为描述型和预集成软件。它集成了数据挖掘获取工具、数据取测型。描述型任务为数据的一般特性,描述型的样工具、数据筛选工具、数据变量转换工具、数据结果是
6、指通过数据挖掘清楚地了解科研试验现挖掘数据库、数据挖掘过程(多种形式的回归工状。预测型任务是在当前数据基础上进行推断、具,建立决策树的数据剖分工具、决策树浏览工预测。数据挖掘系统一般具有关联分析、分类、预具,人工神经元网络)、数据挖掘评价工具。测、聚类分析、孤立点分析、演变分析等功能。SAS统计分析系统具有强大的数据分析能[3]2 SAS数据挖掘系统力,在数据处理和统计分析领域被誉为国际上的标准软件和最权威的优秀统计软件包。其提供的有很多数据挖掘系统产品的选择主要取决于主要分析功能包括统计分析、经济计量分析、时间系统硬件平台、兼容性、鲁棒性、可伸缩性、价格和序列分析、决策分析、运筹学
7、研究、财务分析和全服务。而评价一个数据挖掘系统应从数据类型、面质量管理工具等。数据源、数据挖掘的功能和方法、可伸缩性、查询语言和图形用户接口等方面综合考虑。目前,有3 数据挖掘在科研试验中的应用的数据挖掘系统只提供一种数据挖掘功能,如决由于数据挖掘是一门具有广泛应用的新兴学策树分类法;有的能提供多种数据挖掘功能,可为科,尽管其一般原理与针对特定应用领域需要的科研试验应用服务。SAS/EnterpriseMiner是有效数据挖掘工具之间还存在一定差距。但该技