欢迎来到天天文库
浏览记录
ID:6822654
大小:2.15 MB
页数:95页
时间:2018-01-27
《clementine实用举例》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、FJELITETELClementine应用图解CRM研究中心Clementine应用图解作者:数据挖掘技术研究小组第三部分应用实例一、市场购物篮问题分析1.Businessanddataunderstanding目标:客户细分,发现购买相似的客户群,用人口统计学特征进行描述。方法:关联规则建模数据集:baskets包括字段:Candid:该购物篮使用者的忠诚卡识别字Value:付款总额Pmethod:付款方法持卡者详细的个人资料sex:性別homeown:持有信用卡的人是否是有自己的住房income:收入age:年齡购物篮內容:fruitveg
2、水果蔬菜freshmeat新鲜肉品dairy牛奶cannedveg罐装蔬菜cannedmeat罐装肉品frozenmeal冷冻肉品beer啤酒wine酒softdrink苏打饮料fish鱼confectionery糖果过程:2.Explore使用web图和GRI节点来观察客户购买的商品之间的联系。首先要在type节点中定义变量类型和方向,将candid设置为typeless,个人资料字段设置为none,其他购物篮内容设置为both(即可以作为输入也可作为输出)流程如下:作者:数据挖掘技术研究小组第95页FJELITETELClementine应用
3、图解CRM研究中心图3.1.1GRI输出结果:图3.1.2从上面的结果中看出:肉类、啤酒、罐装蔬菜关联性比较大。提高此web图的门槛值,只留下最强的连接。操作步骤如下:(1)移动工具栏上的滑标,设置只有到达50个的连接才显示出来。滑标上的工具提示目前的连接强度。(2)选择显示若连接还是强连接。单击工具条上的黄色箭头按钮,扩展对话方框来显示web输出概要和控制项。(3)选择显示强/正常/弱的大小。这将启动下面的滑标控制项。(4)使用滑标或在文本框中指定一个数来设置低于90的弱连接。(5)使用滑标或在文本框中指定一个数来设置高于100的强连接。作者:
4、数据挖掘技术研究小组第95页FJELITETELClementine应用图解CRM研究中心图3.1.3从web和GRI分析结果来看可以找出三组强连接:(1)beer、cannedveg、frozenmeal(2)wine、confectionery(3)fruitveg、fish从而可以归纳出三类客户,通过derive节点生成一个标记字段来区别这三类客户,在derive节点中增加一个set类型字段,如下:图3.1.4更正:上式中3对应得条件应为('frozenmeal'=='T'and'beer'=='T')and('cannedveg'=='T
5、'and'beer'=='T')and('cannedveg'=='T'and'frozenmeal'=='T')作者:数据挖掘技术研究小组第95页FJELITETELClementine应用图解CRM研究中心图3.1.5另一种方法:把鼠标放在连线上,线变成红色后点击右键的generatederivenodeforlink这时就生成了一个二分变量。由web显示器生成三个二分变量来标记三种客户:图3.1.63.model欲描述这些客户群的特征,我们可以通过关联规则或决策树来观察,增加一个type节点,把关于客户资料的一些变量设置为in,beer_b
6、eans_pizza设置为out,其他的为none,通过C5.0节点,运行得到结果,可以看出,属于这类群的客户特征:收入低于16900的女性作者:数据挖掘技术研究小组第95页FJELITETELClementine应用图解CRM研究中心图3.1.74.Modelassessment通过节点analysis来评价模型,可以使用另一个数据集来进行验证模型,这里继续使用原数据来看模型的效果。在analysis节点中选择coincidencematices图3.1.8最后得到的效果如下:Correct96796.7%Wrong333.3%Total100
7、0作者:数据挖掘技术研究小组第95页FJELITETELClementine应用图解CRM研究中心二、客户流失下面的试验是对客户流失预警的模拟,数据资料来源于05年1月份以前,我们要做的是在试验当月(12月份)根据客户11月份及以前的数据,预测用户1月份的流失状态。按如下规则抽样:选取在网时长大于90天,11月份mou值大于零,且倒数第二位号码为0的客户10000人。用户流失状态按如下定义:1月份mou值为零则定义为流失,赋值输出变量为0,否则为不流失,赋值输出变量为1。1.用节点SQL读取数据并编辑字段属性我们选用SQL节点从oracle中读取
8、数据。如图1在SQL节点编辑中首先需要建立数据源和clementine的连接,在datasource下选择addnew就会弹出图3.2.
此文档下载收益归作者所有