数据挖掘技术分析与研究

数据挖掘技术分析与研究

ID:46858268

大小:55.00 KB

页数:7页

时间:2019-11-28

数据挖掘技术分析与研究_第1页
数据挖掘技术分析与研究_第2页
数据挖掘技术分析与研究_第3页
数据挖掘技术分析与研究_第4页
数据挖掘技术分析与研究_第5页
资源描述:

《数据挖掘技术分析与研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据挖掘技术分析与研究学院专业研究方向学生姓名学号任课教师姓名任课教师职称2013年6月23H数据挖掘技术综述摘要:随着信息技术的迅速发展,数据库的规模不断扩人,产生了人暈的数据。但人量的数据往往无法辨别隐藏在其中的能对决策提供支持的信息,而传统的查询、报表工具无法满足挖掘这些信息的需求。因此,需耍一种新的数据分析技术处理大量数据,并从中抽取有价值的潜在知识,数据挖掘(DataMining)技术由此应运而牛:。本文主要介绍了数据挖掘的基本概念、数据挖掘的过程、数据挖掘所需的工具、数据挖掘的任务、数据挖掘未来的研

2、究方向、数据挖掘的应用领域和未来发展所面临的一些问题。关键字:数据挖掘数据挖掘工具QUESTDBMiner网站数据挖掘研究方向应用领域»引言数据是知识的源泉。但是,拥有人量的数据与拥有许多有川的知识完全是两回事。过去儿年中,从数据库中发现知识这一领域发展的很快。广阔的市场和研究利益促使这一领域的飞速发展。计算机技术和数据收集技术的进步使人们可以从更加广泛的范围和儿年前不可想彖的速度收集和存储信息。收集数据是为了得到信息,然而大量的数据本身并不意味信息。尽管现代的数据库技术使我们很容易存储大量的数据流,但现在还没

3、有-•种成熟的技术帮助我们分析、理解并使数据以可理解的信息表示岀來。在过去,我们常用的知识获取方法是由知识工程师把专家经验知识经过分析、筛选、比较、综合、再提取出知识和规则。然而,由于知识工程师所拥冇知识的冇局限性,所以对于获得知识的可信度就应该打个折扣。hl前,传统的知识获取技术面对巨型数据仓库无能为力,数据挖掘技术就应运而生。数据的迅速增加与数据分析方法的滞后之间的才盾越來越突出,人们希望在对已有的大量数据分析的基础上进行科学研究、商业决策或者企业管理,但是冃前所拥有的数据分析丄具很难对数据进行深层次的处理

4、,使得人们只能望“数”兴叹。数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的。目前,在需要处理大数据量的科研领域中,数据挖掘受到越来越多的关注,同吋,在实际问题屮,大量成功运用数据挖掘的实例说明了数据挖掘对科学研究具冇很大的促进作川。数据挖掘可以帮助人们对大规模数据进行高效的分析处理,以节约时间,将更多的精力投入到更高层的研究屮,从而提高科研工作的效率。>数据挖掘技术一、数据挖掘的概念数据挖掘是指从数据集合屮白动抽取隐藏在数据屮的那些有用信息的非平凡过程,这些信息的表现形式为:规则、概

5、念、规律及模式等。它可帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为。数据挖掘的过程也叫知识发现的过程。二、数据挖掘的过程数据挖掘是指一个完整的过程,该过程从人型数据库屮挖掘先前未知的、有效的、可实用的信息,并使用这些信息做岀决策或丰富知识。下图描述了数据挖掘的基木过程和主要步骤三、数据挖掘的工具在数据挖掘技术口益发展的同时,许多数据挖掘的商业软件工具也逐渐问

6、

7、

8、爲数据挖掘工具主要有两类:特定领域的数据挖掘工具和通用的数据挖掘工具。下而简单介绍两种数据挖掘工具:1.Q

9、UESTQUEST是IBM公司Almaden研究中心开发的一个多任务数据挖掘系统,忖的是为新一代决策支持系统的应用开发提供高效的数据开采棊本构件。系统具有如下特点:♦提供了专门在大型数据库上进行各种开采的功能:关联规则发现、序列模式发现、时间序列聚类、决策树分类、递增式主动开采等。♦各种开采算法具有近似线性(O(n))计算复杂度,可适用于任意人小的数据库。♦算法具有找全性,即能将所有满足指定类型的模式全部寻找出來。(4)为各种发现功能设计了相应的并行算法。2.DBMinerDBMiner是加拿人SimonFra

10、ser人学开发的一个多任务数据挖掘系统,它的前身是DBLearno该系统设计的目的是把关系数据库和数据开采集成在一起,以而向属性的多级概念为基础发现各种知识。DBMiner系统具冇如下特色:♦能完成多种知识的发现:泛化规则、特性规则、关联规则、分类规则、演化知识、偏离知识等。♦综合了多种数据开采技术:面向属性的归纳、统计分析、逐级深化发现多级规则、元规则引导发现等方法。♦实现了基于客户/服务器体系结构的Unix和PC(Windows/NT)版木的系统。♦提出了一种交互式的类SQL语言——数据开采杏询语言DMQL

11、o卩4、数据挖掘技术的任务数据挖掘技术主婆有四种开采任务:♦数据总结是对数据进行浓缩,给出它的紧凑描述。数据挖掘是从数据泛化的角度来讨论数据总结。♦分类发现这是一项非常重耍的任务,分类是运用分类器把数据库中的数据项映射到给定类别中的某一个,用于对未來数据进行预测。♦聚类是把一纽个体按照相似性归成若干类别,它的目的是使得属于同一类别的个体之间的距离尽可能的小,而不同类别的个体间的距离尽可

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。