快速数据挖掘平台rapidminer 01

快速数据挖掘平台rapidminer 01

ID:27737225

大小:1.62 MB

页数:31页

时间:2018-12-05

快速数据挖掘平台rapidminer 01_第1页
快速数据挖掘平台rapidminer 01_第2页
快速数据挖掘平台rapidminer 01_第3页
快速数据挖掘平台rapidminer 01_第4页
快速数据挖掘平台rapidminer 01_第5页
资源描述:

《快速数据挖掘平台rapidminer 01》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据挖掘基本知识及RapidMiner工具介绍RapidMiner开源数据挖掘工具第1课DATAGURU专业数据分析社区RapidMiner开源数据挖掘工具讲师郭振未15901239872QQ:47647730RapidMiner工具简介RapidMiner官网地址:www.rapidminer.comRapidMiner插件下载地址:http://marketplace.rapid-i.com/UpdateServer/DATAGURU专业数据分析社区RapidMiner开源数据挖掘工具讲师郭振未1590123

2、9872QQ:47647730RapidMiner简介图片引用地址:http://www.kdnuggets.com/2014/06/kdnu ggets-annual-software-poll-rapidminer-continues-lead.htmlDATAGURU专业RapidMiner开源数据挖掘工具讲师郭振未15901239872QQ:4764773RapidMiner各周课程内容:n1.数据挖掘基本知识、RapidMiner工具介绍、软件安装、数据导入与导出方法2.数据预处理:条件过滤、处理缺失值

3、、采样、分割、合并、排序数据集、正则表达式的用法等。3.宏、循环、分支判断、异常处理,执行:sql、预定义流程、脚本、程序4.关联分析、关联规则5.K-Means聚类、辨别分析6.线性回归、逻辑回归7.决策树、神经网络8.模型评估-交叉验证、模型优化9.文本挖掘10.WEB挖掘(上)-网站信息爬取11.WEB挖掘(下)-网页元素值获取、数据入库12.协同过滤、推荐13.时间序列分析14.异常检测(离群点分析)、RapidminerServer使用介绍、命令行执行流程、源码调试启动RapidMinerDATAGUR

4、U专业数据分析社区RapidMiner开源数据挖掘工具讲师郭振未15901239872QQ:47647730本节课学习目标n理解数据挖掘基本概念、术语含义n了解常用挖掘算法种类及应用场景n理解数据挖掘的流程n熟悉RapidMiner工具平台界面功能组成DATAGURU专业数据分析社区RapidMiner开源数据挖掘工具讲师郭振未15901239872QQ:47647730什么是数据挖掘?n数据挖掘(从数据中发现知识)–从大量的数据中挖掘哪些令人感兴趣的、隐含的、先前未知的和可能有用的模式或知识–挖掘的不仅仅是数据

5、(所以“数据挖掘”并非一个精确的用词)n数据挖掘的替换词–数据库中的知识挖掘(KDD)–知识提炼–数据/模式分析–数据考古–数据捕捞、信息收获等等。DATAGURU专业数据分析社区RapidMiner开源数据挖掘工具讲师郭振未15901239872QQ:47647730数据挖掘:数据库中的知识挖掘(KDD)n数据挖掘的核心––知识挖掘模式评估数据挖掘任务相关数据选择数据仓库数据清理数据集成DATAGURU专业数据分析社区数据库RapidMiner开源数据挖掘工具讲师郭振未15901239872QQ:4764773

6、0数据挖掘的作用n作为一门学科,数据挖掘对于世人来说在很大程度上是透明的。我们在大多数时间都从未注意到它的发生。但每当我们办理商店购物卡、使用信用卡购物或在网上冲浪时,都在创建数据。这些数据以大数据集形式存储在我们每天与之打交道的公司所拥有的功能强大的计算机上。存在于这些数据集之内的便是模式-表明我们的兴趣、习惯和行为。数据挖掘可让人们找到并解读这些模式,从而帮助人们作出更明智的决策,并更好地为客户服务。n数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和

7、模式识别等诸多方法来实现上述目标。DATAGURU专业数据分析社区RapidMiner开源数据挖掘工具讲师郭振未15901239872QQ:47647730KDD的步骤lCRISP-DM(Cross-IndustryStandardProcess-DataMining)商业理解数据理解数据准备数据发布模型建立模型模型评估DATAGURU专业数据分析社区RapidMiner开源数据挖掘工具讲师郭振未15901239872QQ:47647730在何种数据上进行数据挖掘n数据库数据 n数据仓库 n事务数据n其他类型的数

8、据–时间相关或序列数据(如历史记录、股票交易、时间序列、生物学序列) –空间数据库(如地图)–数据流(视频监控、传感器数据)–工程设计数据(如建筑、系统部件或集成电路) –超文本和多媒体数据(如文本、图像、音频、视频) –图和网状数据(如社会和信息网络、微博传播路径) –万维网DATAGURU专业数据分析社区RapidMiner开源数据挖掘工具讲师郭振未159012398

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。