欢迎来到天天文库
浏览记录
ID:9214761
大小:342.33 KB
页数:7页
时间:2018-04-23
《决策树模型在客户关系管理系统中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、http://www.paper.edu.cn决策树模型在客户关系管理系统中的应用刘浩熙北京邮电大学计算机系,北京(100876)E-mail:boeagle@163.com摘要:中国打开国门以来,市场的重要性越来越为广大人民所深知。抓住市场就是要抓住客户,如何才能利用有限的资源最多的抓住客户成为人们最想解决的问题之一。数据挖掘的出现给了人们一条能够实现抓大放小的途径。本文正是利用数据挖掘中的决策树方法在客户分类方面做了一些尝试,期望在发现忠诚客户更有效利用企业资源上可以有所帮助。关键词:数据挖掘;决策树;客户关系管理;中图分类号:TP301.61引言改革开放以来,历经二十年的经济
2、发展,中国的经济形态正逐渐由稀缺经济向过剩经济过度,但这种过剩是低层次的过剩,产品的技术差别很小,同质化现象很严重,企业习惯的营销思维仍是以产品的推销为主,一次又一次地祭起“价格战”的大旗,结果是消费者逐渐麻木,并开始怀疑产品的品质,同时又严重削弱了企业的资本积累、科研开发及后续发展的能力。21世纪,对于任何企业而言,有两个方面最为重要,一是企业品牌,二是客户的满意度,但客户的满意和忠诚不是通过简单的削价可以换来,也不是通过折扣、积分等暂时的经济利益可以买来的,要靠数据库和客户关系管理(CRM)系统,从与客户的交流互动中更好地了解客户需求来实现。如果能够争得所有客户的忠诚固然是最好
3、的,但是随着客户的增多,就出现了两个不可回避的问题。一是留住客户所需要付出的边际成本在迅速上升,使得花费了巨大精力留住的客户带给企业的可能并不是利益而是负担;二是企业在一定时期内的资源是有限的,也就使得同时完全满足所有客户的要求变得不可能。如何才能在众多客户中区分关键客户、普通客户、垃圾客户并能及时发现那些忠诚度可能发生变化的客户并及时引导他们维持在有利于企业的方向上就显得非常关键了。下面就对利用决策树模型分类客户进行些简单的探讨。2决策树模型的基本理论[1,2]决策树算法是一种以决策树这种数据结构为基础的分类算法。决策树是一个类似于流程图的树结构,其中每个内部结点表示一个属性上的
4、测试(该属性被称为测试属性或决策属性),每个分枝代表一个测试输出,而每个树叶结点代表一个类或类分布。在给未知的样本分类时,由树根开始对该样本中对象的属性按照顺序逐个测试其值,并且沿着符合条件的分枝向下走,直至到达某个叶结点,这个叶结点代表的类则为该对象所属的类。-1-http://www.paper.edu.cn图1为一棵简单的决策树,给出了客户的消费情况。这个例子假定是要按照客户是否购买电脑将客户进行分类。该客户集合中用来描述客户特征的属性有年龄,性别和月收入。每个内部结点(矩形框)代表客户的属性(例如有年龄,性别,月收入);每个叶子结点(椭圆形框)代表该客户属于的类别(有买电脑
5、和不买电脑两类);每个分支代表该属性向下需要满足的条件(如年龄在15到35之间)。最左下的叶子结点即表示:如果客户年龄在15到35之间,性别为女性,而月收入大于5000的时候,认为该客户会购买电脑。图1一棵简单的决策树2.1决策树的生成决策树生成的过程中,输入为训练样本数据集,决策树为最终输出结果。决策树的每一个决策结点对应元组进行分类的一个决策属性(测试属性),分枝对应着元组按该属性进一步划分的取值特征,叶子代表类或类的分布。首先,根据用户的实际需要选择类别标识属性和决策树的决策属性集,决策属性集是指在候选属性(除了类别标识属性之外的所有属性)中选择的属性集,然后开始构造决策树。
6、决策树归纳的基本算法是贪心算法,是以自顶向下递归的各个击破的方式生成决策树。算法的基本步骤如下:ò树以代表训练样本的单个结点开始(步骤1)。ò如果样本都在同一个类,则该结点成为树叶,并对该类标号(步骤2和3)。ò否则,选择一个属性(步骤6)。该属性成为该结点的“测试”或“判定”属性(步骤7)。在算法的该版本中,所有的属性都是分类的,即离散值。连续属性必须离散化。ò对测试属性的每个已知的值,创建一个分枝,并据此划分样本(步骤8-10)。ò算法使用同样的过程,递归地形成每个划分上的样本决策树。一旦一个属性出现在一个结点上,就不必该结点的任何后代上考虑它(步骤13)。ò递归划分步骤仅当下
7、列条件之一成立停止:ò给定结点的所有样本属于同一类(步骤2和3)。ò没有剩余属性可以用来进一步划分样本(步骤4)。在此情况下,使用多数表决(步骤5)。这涉及将给定的结点转换成树叶,并用样本中的多数所在的类标记它。替-2-http://www.paper.edu.cn换地,可以存放结点样本的类分布。ò分枝test_attribute=a没有样本(步骤11)。在这种情况下,以samples中的多数j类创建一个树叶(步骤12)。算法:Generate_decision_tr
此文档下载收益归作者所有