讲义1:数据挖掘介绍课件.ppt

讲义1:数据挖掘介绍课件.ppt

ID:57034791

大小:534.00 KB

页数:57页

时间:2020-07-27

讲义1:数据挖掘介绍课件.ppt_第1页
讲义1:数据挖掘介绍课件.ppt_第2页
讲义1:数据挖掘介绍课件.ppt_第3页
讲义1:数据挖掘介绍课件.ppt_第4页
讲义1:数据挖掘介绍课件.ppt_第5页
资源描述:

《讲义1:数据挖掘介绍课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘介绍1数据挖掘是信息技术自然演化的结果信息技术是当今发展最快的技术之一2Datamining第一章引言一、数据挖掘技术的由来1、信息技术的下一个技术热点2、数据爆炸但知识贫乏3、支持数据挖掘技术的基础3我们已经生活在一个网络化的时代,通信、计算机和网络技术正改变着整个人类和社会如果用芯片集成度来衡量微电子技术,用CPU处理速度来衡量计算机技术,用信道传输速率来衡量通信技术,那么摩尔定律告诉我们,它们都是以每18个月翻一番的速度在增长,这一势头已经维持了十多年1、信息技术的下一个热点是什么?4在美国,广播达到5000万户用了38年;电视用了13年;Internet拨号上网达到50

2、00万户仅用了4年。全球IP网发展速度达到每6个月翻一番,国内情况亦然。网络的发展导致经济全球化,在1998年全球产值排序前100名中,跨国企业占了51个,国家只占49个。1、信息技术的下一个热点是什么?5有人提出,对待一个跨国企业也许比对待一个国家还要重要。在新世纪钟声刚刚敲响的时候,回顾往昔,人们不仅要问:就推动人类社会进步而言,历史上能与网络技术相比拟的是什么技术呢?有人甚至提出要把网络技术与火的发明相比拟。火的发明区别了动物和人,种种科学技术的重大发现扩展了自然人的体能、技能和智能,而网络技术则大大提高了人的生存质量和人的素质,使人成为社会人、全球人。1、信息技术的下一个热点是

3、什么?6现在的问题是:网络之后的下一个技术热点是什么?让我们来看一些身边俯拾即是的现象:《纽约时报》由60年代的10~20版扩张至现在的100~200版,最高曾达1572版;《北京青年报》也已是16~40版;市场营销报已达100版。然而在现实社会中,人均日阅读时间通常为30~45分钟,只能浏览一份24版的报纸。7大量信息在给人们带来方便的同时也带来了一大堆问题:第一是信息过量,难以消化;第二是信息真假难以辨识;第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。8人们开始提出一个新的口号:“要学会抛弃信息”人们开始考虑:“如何才能不被信息淹没,而是从中及时发现有用的知识、提高信

4、息利用率?”面对这一挑战,数据挖掘和知识发现(DataMiningandKnowledgeDiscovery)技术应运而生,并显示出强大的生命力92、数据爆炸但知识贫乏随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。数据的丰富带来了对强有力的数据分析工具的需求,快速增长的海量数据、存放在大型和大量数据库中,没有强有力的工具,理解这些数据已远远超出了人的能力数据爆炸但知识贫乏102、数据爆炸但知识贫乏目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无

5、法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。11数据挖掘数据库越来越大可怕的数据有价值的知识12苦恼:淹没在数据中;不能制定合适的决策!数据知识决策模式趋势事实关系模型关联规则序列目标市场资金分配贸易选择在哪儿做广告销售的地理位置金融经济政府POS.人口统计生命周期数据爆炸,知识贫乏133、支持数据挖掘技术的基础数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在计算机的数据库中的,然后发展到可对数据库进行查询和访问,进而发展到对数据库的即时遍历。143、支持数据挖

6、掘技术的基础数据挖掘使数据库技术进入了一个更高级的阶段,它不仅能对过去的数据进行查询和遍历,并且能够找出过去数据之间的潜在联系,从而促进信息的传递。现在数据挖掘技术在商业应用中已经可以马上投入使用,因为对这种技术进行支持的三种基础技术已经发展成熟,他们是:海量数据搜集强大的多处理器计算机数据挖掘算法数据库技术的演化15数据挖掘逐渐演变的过程数据挖掘其实是一个逐渐演变的过程,电子数据处理的初期,人们就试图通过某些方法来实现自动决策支持。当机器学习成为人们关心的焦点.机器学习的过程就是将一些已知的并已被成功解决的问题作为范例输入计算机,机器通过学习这些范例总结并生成相应的规则,这些规则具有

7、通用性,使用它们可以解决某一类的问题.随着神经网络技术的形成和发展,人们的注意力转向知识工程,知识工程不同于机器学习那样给计算机输入范例,让它生成出规则,而是直接给计算机输入已被代码化的规则,而计算机是通过使用这些规则来解决某些问题。专家系统就是这种方法所得到的成果,但它有投资大、效果不甚理想等不足。16数据挖掘逐渐演变的过程80年代又在新的神经网络理论的指导下,重新回到机器学习的方法上,并将其成果应用于处理大型商业数据库。随着在80年代末一个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。