数据挖掘技术概述及前景展望

数据挖掘技术概述及前景展望

ID:45740834

大小:4.53 MB

页数:72页

时间:2019-11-17

数据挖掘技术概述及前景展望_第1页
数据挖掘技术概述及前景展望_第2页
数据挖掘技术概述及前景展望_第3页
数据挖掘技术概述及前景展望_第4页
数据挖掘技术概述及前景展望_第5页
资源描述:

《数据挖掘技术概述及前景展望》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据挖掘技术概述及前景展望DataMiningandProspect商业智能研讨沙龙-上海站ITPUBChinaUnixIXPUB主办数据挖掘由来产生背景随着数据库技术的飞速发展,快速增长的海量数据收集、存放在大量数据储存库中理解他们已经远远超出人的能力数据坟墓——难得再访问的数据档案数据爆炸,但知识缺乏人们被数据淹没,却饥饿于知识商业智能研讨沙龙-上海站ITPUBChinaUnixIXPUB主办数据挖掘的原由可怕的数据数据存储成本越来越低,数据库越来越大……数据挖掘有价值的知识商业智能研讨沙龙-上海站ITPUBChinaUnixIXPUB主办数

2、据挖掘技术的由来“要学会抛弃信息”“如何才能不被信息淹没,而是从中及时发现有用的知识、提高信息利用率?”“需要是发明之母”-数据挖掘:海量数据的自动分析技术数据开采和知识发现(DMKD)技术应运而生GartnerGroup的一次高级技术调查将数据挖掘和人工智能列为“未来三到五年内将对工业产生深远影响的五大关键技术”之首网络之后的下一个技术热点商业智能研讨沙龙-上海站ITPUBChinaUnixIXPUB主办数据挖掘技术的由来从商业数据到商业信息的进化进化阶段商业问题支持技术产品厂家产品特点数据搜集(60年代)“过去五年中我的总收入是多少?”计算机

3、,磁带和磁盘IBM,CDC提供历史性的、静态的数据信息数据访问(80年代)“在新英格兰的分部去年三月的销售额是多少?”关系数据库(RDBMS),结构化查询语言SQL),ODBC,Oracle,Sybase,Informix,IBM,MicrosoftOracle,Sybase,Informix,IBM,Microsoft在记录级提供历史性的、动态数据信息数据仓库;决策支持(90年代)“在新英格兰的分部去年三月的销售额是多少?波士顿据此可得出什么结论?”联机分析处理(OLAP),多维数据库,数据仓库Pilot,Comshare,Arbor,Cogn

4、os,Microstrategy在各种层次上提供回溯的、动态的数据信息数据挖掘(正在流行)“下个月波士顿的销售会怎么样?为什么?”高级算法,多处理器计算机,海量数据库Pilot,Lockheed,IBM,SGI,其他初创公司提供预测性的信息商业智能研讨沙龙-上海站ITPUBChinaUnixIXPUB主办数据挖掘概念的提出现在数据挖掘概念的首次国际学术会议1989年8月在美国底特律召开的第11届国际联合人工智能学术会议(IJCAI-89)上,GregoryPiatetsky-Shapiro组织了“数据库中的知识发现”(KDD:KnowledgeD

5、iscoveryinDatabase)专题讨论会,该讨论会的重点是强调发现(Discovery)的方法以及发现的是知识(Knowledge)两个方面。相继开展的专题讨论会随后在1991、1993和1994年都举行了KDD专题讨论会,来自各个领域的研究人员和应用开发者集中讨论了数据统计、海量数据分析算法、知识表示和知识运用等问题。商业智能研讨沙龙-上海站ITPUBChinaUnixIXPUB主办数据挖掘概念的提出第一届KDD国际学术会议随着参与科研和开发人员的不断增加,国际KDD组委会于1995年把专题讨论会发展成为国际年会。在加拿大的蒙特利尔市召

6、开了第一届KDD国际学术会。其会议名称全称为“ACMSIGKDD(SpecialInterestedGrouponKnowledgeDiscoveryinDatabases)InternationalConferenceonKnowledgeDiscoveryandDataMining”在这次会议上“数据挖掘”(DataMining)概念第一次由UsamaFayyad提出。UsamaFayyad对数据挖掘概念的界定数据挖掘指的是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、有效的、新颖的、潜在有用的、并且最终可理解的模式的

7、非平凡过程。SAS软件研究所对数据挖掘所下的定义是:数据挖掘是按照既定的业务目标,对大量的企业数据进行探索、揭示隐藏其中的规律性并进一步将之模型化的先进、有效的方法。商业智能研讨沙龙-上海站ITPUBChinaUnixIXPUB主办数据挖掘的定义数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。技术上的定义及含义商业智能研讨沙龙-上海站ITPUBChinaUnixIXPUB主办数据挖掘的定义数据源必须是真实的、大量的、含噪声的;发现

8、的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题技术上的定义及含义商业智能

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。