Clementine数据挖掘入门及实战sysu.pdf

Clementine数据挖掘入门及实战sysu.pdf

ID:52956177

大小:11.58 MB

页数:169页

时间:2020-04-03

Clementine数据挖掘入门及实战sysu.pdf_第1页
Clementine数据挖掘入门及实战sysu.pdf_第2页
Clementine数据挖掘入门及实战sysu.pdf_第3页
Clementine数据挖掘入门及实战sysu.pdf_第4页
Clementine数据挖掘入门及实战sysu.pdf_第5页
资源描述:

《Clementine数据挖掘入门及实战sysu.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据挖掘与SPSSModelerClementine数据挖掘(Clementine)使用入门及实战■Shanghai(8621)53060345■Guangzhou(8620)382403850目录实战练习建模技术CLEM基本操作数据挖•可初步开展数据挖掘工作掘概述•掌握CLEM常用建-购物蓝分析模技术-时序购买分析•掌握CLEM的基本-药品使用规则分-基本建模技术操作析-神经网络•从整体上了解解-CLEM简介-规则归纳-····数据挖掘-读取数据文件*根据前面的数据,练-模型比较与合并-数据质量习

2、数据分析挖掘过程-数据挖掘介绍-KOHONEN网络-数据处理介绍-数据挖掘价值-关联规则-寻找数据之间的关-数据挖掘产品-时序分析系数据挖掘概述数据挖掘介绍数据挖掘价值数据挖掘产品什么是数据挖掘?•不同的定义–从大量数据中发现非平凡的、先前不知道的、有价值的规律的过程–从大量数据中自动化(或者半自动化)的发现有价值规律的过程–按既定业务目标,对大量的企业数据进行探索,揭示隐藏其中的规律性,并进一步将其模型化的先进、有效的方法。•数据挖掘的其他名称–数据库内知识发现(KDD-Knowledgedisc

3、overyindatabases)–数据/模式分析–商业智能–人工智能–……数据挖掘的起源•来源于机器学习/人工智能、模式识别、统计学和数据库•传统技术的局限性–巨量的数据–高维数据–数据分布不理想机器学习/统计学模式识别数据挖掘数据库系统为什么进行数据挖掘?商业观点•业务中产生了大量的数据,这些数据存储在业务系统中却不能创造价值–客户信息数据–客户交易行为数据–客户反馈数据–网络数据–……•计算机变得越来越便宜、功能却越来越强大•商业竞争越来越激烈,对客户了解越多就意味着机会越大为什么进行数据挖掘

4、?技术观点•业务中的数据量呈现指数增长(GB/小时)•传统技术难以从这些大量数据中发现有价值的规律•数据挖掘可以帮助我们从大量数据中发现有价值的规律4,000,0003,500,0003,000,000TheData2,500,0002,000,000Gap1,500,000Totalnewdisk(TB)since1,000,0001995Numberof500,0000analysts19951996199719981999From:R.Grossman,C.Kamath,V.Kumar,“Da

5、taMiningforScientificandEngineeringApplications”一个市场营销的例子女性对市场活动做出回应,男性对市场活动不做出回应,和年龄无关在数据中发现有价值的规则或者模式一个市场营销的例子数据变的复杂会如何?女性对市场活动做出回应,老年男性也可能对市场活动做出回应一个市场营销的例子通过数据挖掘发现回应的5条规则:1、如果收入大于29622,有孩子,并且孩子的数量小于等于2,那么对市场活动会回应……通过数据挖掘发现不回应的5条规则:1、如果收入小于12640.3,并

6、且有一个孩子,那么对市场活动数据挖掘可以从异常复杂的数据中发现规律不会回应……数据挖掘技术的分类数据挖掘描述预测分类统计回归时间序列预测可视化聚类决策树关联规则神经网络顺序关联汇总数据挖掘概述数据挖掘介绍数据挖掘价值数据挖掘产品数据挖掘效果模拟分析目的:发现新客户(使响应率从1%提高到1.2%)数据挖掘以前数据挖掘以后差别投入减少发信的数量1,000,000750,000(250,000)成本$1,000,000$750,000($250,000)响应的数量10,0009,000(1,000)每个响

7、应的收入$125$125$0总收入$1,250,000$1,125,000($125,000)净利润$250,000$375,000$125,000建模的费用040,000$40,000最终的利润$250,000$335,000$85,000收益增加数据挖掘收益分析向60%的客户发信,得到了90%的收益数据挖掘的意义利润分析图盈亏平衡加速亏损超额利润成功案例面临问题:怎样扩展和现有客户关系?怎么控制营销费用提升利润?解决方案:建立关联预测模型来发现交叉销售和"翻滚"销售机会。应用效果:产品销售提高5

8、0%营销费用减少30%面临问题:每天都要面临客户流失,怎样减少客户流失,特别是大客户的流失?解决方案:建立流失预警模型,提前识别出有流失倾向的客户,及时采取措施应用效果:降低了15-20%的客户流失率;增长10-20%的底线利润数据挖掘概述数据挖掘介绍数据挖掘价值数据挖掘产品SAS简介SAS(StatisticalAnalysisSystem)是世界上最著名的统计分析系统之一,具有完备的数据访问、管理、分析和呈现功能,被誉为国际标准统计分析系统。功能(30多个模块):

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。