浅谈数据挖掘技术及其相关问题解析_许芳芳

浅谈数据挖掘技术及其相关问题解析_许芳芳

ID:34542032

大小:167.83 KB

页数:4页

时间:2019-03-07

浅谈数据挖掘技术及其相关问题解析_许芳芳_第1页
浅谈数据挖掘技术及其相关问题解析_许芳芳_第2页
浅谈数据挖掘技术及其相关问题解析_许芳芳_第3页
浅谈数据挖掘技术及其相关问题解析_许芳芳_第4页
资源描述:

《浅谈数据挖掘技术及其相关问题解析_许芳芳》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数字技术设计开发与应用浅谈数据挖掘技术及其相关问题解析许芳芳丁雷道(郑州大学河南郑州450001)摘要:数据挖掘(DataMining,简称DM),又称数据库中的知识发现(KnowledgeDiscoveryinDatabase,简称:KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、特殊的及有潜在应用价值的信息或模式。本文在了解数据挖掘的定义和市场前景的基础上,结合当今企业对数据挖掘技术的重视和数据挖掘技术对企业发展带来的巨大效益的现状,从众多方面提出和分析了数据挖掘技术在发展和应用过程中面临的主要问题。并且结合开放网格

2、服务体系(OGSA)的思想,采用分层描述的方法,围绕功能、结构、调度成本和网格服务目标等,设计了一种五层的网格数据挖掘体系结构(GDMA)。该体系结构以服务为核心,通过统一的网格服务接口屏蔽资源的异构性,并针对用户的特殊需求,设计了基于工作流和Web服务的数据挖掘客户端。关键词:网格数据挖掘体系结构开放网格服务体系数据挖掘网格计算中图分类号:TP311文献标识码:A文章编号:1007-9416(2014)04-0141-04数据挖掘,顾名思义就是从大量的、不完全的、有噪声的、模糊的,先前未知的,对决策有潜在价值的。随着计算机技术和

3、信息技术的数据中挖掘出有用的信息和知识的过程。这些信息和知识是隐含应用的越来越广泛,企业每年都要积累大量的数据,运用数据挖掘技术在这些大量数据当中我们可以找出有价值的知识、规则或高层知识次的信息为决策提供依据,从而使数据仓库成为一个丰富可靠的资源为企业决策者服务。数据挖掘技术主要又分成“关联规则”、“时间序列”、“聚集”、“分类”、“估值”等这几类。应用解释/评估/预测有效运用数据挖掘技术有助于企业分析关键因素,发现业务规律,揭示隐藏趋势,预测未知结果,达到增收节支的目的,处于更有数据建模/算法执行利的竞争位置。人类进入信息化时代

4、以后,短短的数年时间,积累了大量的数据,步入了“大数据时代”,使人类以前所未有的速度、厚数据收集/预处理度、细度和准确度对信息的掌握成为可能。面对大量的数据,基于充足的数据基础,对数据进行挖掘与分析,并将其运用于企业的精细管理,也就不仅成为可能而且势在必行。数据集成以数据网格为基础,构建分布式数据挖掘体系,对于解决海量图2-1数据挖掘过程示意图数据挖掘问题具有重要的理论意义和实用价值。目前网格挖掘体系结构主要存在两方面的问题:(1)网格挖掘体系结构标准不一,采用表2-1常用数据挖掘软件调查结果的技术也不同。目前几种主流的网格挖掘体

5、系结构都是针对不同的软件名称用户数量应用而设计的。(2)网格中间件不够成熟。网格中间件实际上是一种SPSSClementine135网格操作系统,网格操作系统、网格应用与计算机操作系统和计算SPSS96机应用软件相比,存在很大的差距。只有当网格中间件与网格应用Excel78像目前计算机的系统软件和应用软件一样方便时,才能展现网格的CART/MARS/TreeNet/RF69真正优势。目前还没有一种网格体系结构能适应所有的应用,应借SAS53鉴已有网格体系结构的优点,设计适用于网格数据挖掘的体系结SASEnterpriseMiner

6、49构。网格体系结构从最开始的五层沙漏体系(FLSGA),发展到开放Yourowncode39网格服务体系(OGSA),再发展到Web服务资源框架(WSRF)。Otherfreetools34InsightfulMiner/S-Plus321数据挖掘的概念StatsoftStatistica30数据挖掘(DataMining,简称DM),又称数据库中的知识发现Weka30(KnowledgeDiscoveryinDatabase,简称:KDD),是指从大型数ThinkAnalytics26据库或数据仓库中提取隐含的、未知的、特殊的

7、及有潜在应用价值C4.5/C5.0/See525的信息或模式,它是数据库研究中的一个很有应用价值的新领域,R25融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技MicrosoftSQLServer23术[2]。这些数据可以是结构化的,如关系数据库中的数据,也可以是Othercommercialtools23MATLAB16半结构化的,如文本,图形,图像数据,甚至是分布在网络上的异构Mineset(PurpleInsight)16型数据。这些知识可以表示为概念、规则、规律、模式等形式。发现知Xelopes16识的方法可以

8、是数学的,也可以是非数学的,可以是演绎的,也可以OracleDataMining10是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支Gornik8持、过程控制等,还可以进行数据自身的维护。KXEN7随着数据挖掘技术的发展,数据挖掘的重要性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。