数据挖掘课件2011new

数据挖掘课件2011new

ID:34471945

大小:1.23 MB

页数:42页

时间:2019-03-06

数据挖掘课件2011new_第1页
数据挖掘课件2011new_第2页
数据挖掘课件2011new_第3页
数据挖掘课件2011new_第4页
数据挖掘课件2011new_第5页
资源描述:

《数据挖掘课件2011new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘技术简介20112011年年55月月大纲•数据挖掘的产生•什么是数据挖掘•数据挖掘的挖掘过程•数据挖掘应用领域•数据挖掘算法介绍•案例-数据挖掘在数字图书馆中的应用第一部分:数据挖掘的产生数据挖掘的产生数据挖掘的产生自二十世纪80年代开始,数据挖掘技术逐步发展起来。数据挖掘技术的迅速发展,得益于目前全世界所拥有的巨大数据资源以及对将这些数据资源转换为信息和知识资源的巨大需求。对信息和知识的需求来自各行各业,从商业管理、生产控制、市场分析到工程设计、科学探索等。数据挖掘可以视为是数据管理与分析技术的自然进化产物。数据收集与数据库

2、创建(60年代或更早)基础文件处理数据库管理系统(70年代)网络和关系数据库系统数据建模工具索引和数据组织技术查询语言和查询处理用户界面与优化方法在线事务处理先进数据库系统数据仓库和数据挖掘(80年代中期至今)(80年代后期至今)先进数据模型(扩展关系、先进数据模型(扩展关系、面向对象、对象关系)面向对象、对象关系)面向应用(空间、时间、多面向应用(空间、时间、多媒体、知识库)媒体、知识库)新一代信息系统(2000年以后)数据挖掘的演化过程第二部分第二部分什么是数据挖掘什么是数据挖掘什么是数据挖掘什么是数据挖掘数据挖掘(DataMin

3、ing,简称DM),又称为数据库中知识发现(KnowledgeDiscoveryFromDatabase,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。什么是数据挖掘什么是数据挖掘•通过采用自动或半自动的手段,在海量数据中发现有意义的行为和规则的探测和分析活动。•数据挖掘能够帮助你选择正确瞄准潜在目标,向现有的客户提供额外的产品,识别那些准备离开的好客户。一个典型数据挖掘系统可视化用户接口模式知识评估应用相关领域的知识库数据挖掘引擎数据库或数据仓库服务器数据清洗数据过滤数据集成数据库数据仓库•

4、数据库、数据仓库或其它信息库库,它表示数据挖掘对象是由一个(或组)数据库、数据仓库、数据表单或其它信息数据库组成。通常需要使用数据清洗和数据集成操作,对这些数据对象进行初步的处理;•数据库或数据仓库服务器,这类服务器负责根据用户的数据挖掘请求,读取相关的数据;•知识库,此处存放数据挖掘所需要的领域知识,这些知识将用于指导数据挖掘的搜索过程,或者用于帮助对挖掘结果的评估。•数据挖掘引擎,这是数据挖掘系统的最基本部件,它通常包含一组挖掘功能模块,以便完成定性归纳、关联分析、分类归纳、进化计算和偏差分析等挖掘功能;•模式评估模块,该模块可根

5、据趣味标准,协助数据挖掘模块聚焦挖掘更有意义的模式知识。若数据挖掘算法能够与知识评估方法有机结合将有助提高其数据挖掘的效率;•可视化用户界面,该模块帮助用户与数据挖掘系统本身进行沟通交流。一方面用户通过该模块将自己的挖掘要求或任务提交给挖掘系统,以及提供挖掘搜索所需要的相关知识;另一方面系统通过该模块向用户展示或解释数据挖掘的结果或中间结果;第三部分第三部分数据挖掘的挖掘过程数据挖掘的挖掘过程数据挖掘过程数据挖掘过程•数据清洗(datacleaning),其作用就是清除数据噪声和与挖掘主题明显无关的数据;•数据集成(datainteg

6、ration),其作用就是将来自多数据源中的相关数据组合到一起;•数据转换(datatransformation),其作用就是将数据转换为易于进行数据挖掘的数据存储形式;•数据挖掘(datamining),它是知识挖掘的一个基本步骤,其作用就是利用智能方法挖掘数据模式或规律知识;•模式评估(patternevaluation),其作用就是根据一定评估标准(interestingmeasures)从挖掘结果筛选出有意义的模式知识;•知识表示(knowledgepresentation),其作用就是利用可视化和知识表达技术,向用户展示所挖

7、掘出的相关知识。第四部分数据挖掘应用领域•电信:流失、欺诈•银行:客户信用评分(聚类)•百货公司/超市:购物篮分析(关联规则)•保险:流失(原因分析)•信用卡:欺诈探测•电子商务:网站日志分析•税务部门:偷漏税行为探测•警察机关:犯罪行为分析•医学:医疗保健数据挖掘都干了些什么?GUS日用品零售商店需要准确的预测未来的商品销售量,降低库存成本。。。。。。通过数据挖掘的方法使库存成本比原来减少了3.8%数据挖掘都干了些什么?汇丰银行需要对不断增长的客户群进行分类,对每种产品找出最有价值的客户。。。。。。营销费用减少了30%数据挖掘都干了

8、些什么?美国国内税务局需要提高对纳税人的服务水平。。。。。。合理安排税务官的工作,为纳税人提供更迅捷、更准确的服务通过数据挖掘您可以发现最有价值的客户通过数据挖掘您可以使组合销售更有效率通过数据挖掘您可以用更小的成本发现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。