资源描述:
《数据挖掘与clementine使用培训》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据挖掘与Clementine使用培训数据挖掘与Clementine使用培训北京瑞斯泰得数据技术开发有限公司2<01<0-1-22一、数据挖掘概述??什么是数据挖掘??数据挖掘的实现路线和流程??数据挖掘方法论——CRISP-DM.broadtarget4>>1BeijingStatsDataMiningCo.Ltd.■Beijing(861<0)51722<052■Shanghai(8621)53<06<0345■Guangzhou(862<0)3824<0385为什么进行数据挖掘?商业观点??业务中产生了大量的数据,这些数据存储在业务系统中却不能创造价值–客户信息数据
2、–客户交易行为数据–客户反馈数据–网络数据–……??计算机变得越来越便宜、功能却越来越强大??商业竞争越来越激烈,对客户了解越多就意味着机会越大.broadtarget>2BeijingStatsDataMiningCo.Ltd.■Beijing(861<0)51722<052■Shanghai(8621)53<06<0345■Guangzhou(862<0)3824<03854,<0<0<0,<0<0<03,5<0<0,<0<0<03,<0<0<0,<0<0<0为什么进行数据挖掘?技术观点2,5<0<0,<0<0<0??业务中的数据量呈现指数增长(GB/小时)2,<0<
3、0<0,<0<0<0??传统技术难以从这些大量数据中发现有价值的规律??数据挖掘1可,以5帮<0助<0我,们<0从<0大量<0数据中发现有价值的规律1,<0<0<0,<0<0<0TheData5<0<0,<0<0G<0apTotalnewdisk(TB)since1995<0Numberof19951996199719981999analystsFrom:R.Grossman,C.Kamath,V.Kumar,―DataMiningforScientificandEngineeringApplications‖.broadtarget>3BeijingStatsDataM
4、iningCo.Ltd.■Beijing(861<0)51722<052■Shanghai(8621)53<06<0345■Guangzhou(862<0)3824<0385一个市场营销的例子女性对市场活动做出回应,男性对市场活动不做出回应,和年龄无关在数据中发现有价值的规则或者模式.broadtarget>4BeijingStatsDataMiningCo.Ltd.■Beijing(861<0)51722<052■Shanghai(8621)53<06<0345■Guangzhou(862<0)3824<0385一个市场营销的例子数据变的复杂会如何?女性对市场活动做出回
5、应,老年男性也可能对市场活动做出回应.broadtarget>5BeijingStatsDataMiningCo.Ltd.■Beijing(861<0)51722<052■Shanghai(8621)53<06<0345■Guangzhou(862<0)3824<0385一个市场营销的例子通过数据挖掘发现回应的5条规则:1、如果收入大于29622,有孩子,并且孩子的数量小于等于2,那么对市场活动会回应????通过数据挖掘发现不回应的5条规则:1、如果收入小于1264<0.3,并且有一个孩子,那么对市场活动不会回应数据挖掘可以从异常复杂的数据中发现规律????.broadt
6、arget>6BeijingStatsDataMiningCo.Ltd.■Beijing(861<0)51722<052■Shanghai(8621)53<06<0345■Guangzhou(862<0)3824<0385数据挖掘收益分析向6<0%的客户发信,得到了9<0%的收益数据挖掘的意义.broadtarget>7BeijingStatsDataMiningCo.Ltd.■Beijing(861<0)51722<052■Shanghai(8621)53<06<0345■Guangzhou(862<0)3824<0385利润分析图.broadtarget>8Beiji
7、ngStatsDataMiningCo.Ltd.■Beijing(861<0)51722<052■Shanghai(8621)53<06<0345■Guangzhou(862<0)3824<0385数据挖掘效果模拟分析目的:发现新客户(使响应率从1%提高到1.2%)数据挖掘以前数据挖掘以后差别发信的数量1,<0<0<0,<0<0<075<0,<0<0<0(25<0,<0<0<0)成本$1,<0<0<0,<0<0<0$75<0,<0<0<0($25<0,<0<0<0)响应的数量1<0,<0<0<09,<0<0<0(1,<0<0<