欢迎来到天天文库
浏览记录
ID:9630761
大小:49.50 KB
页数:3页
时间:2018-05-04
《数据挖掘技术在crm中的应用》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、数据挖掘技术在CRM中的应用 摘要:本文阐述了CRM的内涵和外延及数据挖掘技术常用的算法和分析方法,并在此基础上重点分析了数据挖掘技术在CRM中的功能和应用。 关键词:数据仓库;数据挖掘;知识发现;客户关系管理 一、CRM的概念 经过20多年的发展,市场经济的观念已深入人心,一些先进企业的经营理念正在经历着从以产品为中心向以客户为中心的转移。在这种背景下,企业有必要对客户的各种活动和信息进行集成,实现对客户的全面管理,这就是所谓的“客户关系管理”(CRM)。 客户关系管理(CRM)源于以客户为中心的商业模式,其通过对客户关系的有效管理,以鉴别、获得、保持为企业带来利润的客户
2、,是一种新型的管理机制。到目前为止,CRM还没有统一的定义,最早提出CRM概念的GartnerGroup认为,客户关系管理是为企业提供全方位的管理视角,赋予企业更完善的客户交流能力,从而实现客户收益率的最大化。根据企业资源管理研究中心(AMT)的定义,CRM是一种以客户为中心的经营策略,它以信息技术为手段对相关业务功能进行重新设计,并对相关工作流程进行重组,以达到留住老客户、吸引新客户、提高客户利润贡献度的目的。笔者认为,客户关系管理(CRM)是现代企业管理的核心思想,它贯彻以客户为中心的经营理念,利用信息技术来充分把握和了解客户,在适当的时候,把适当的产品,通过适当的途径,提供给
3、适当的客户。CRM为企业提供了一个收集、分析和利用各种客户信息的系统,帮助企业充分利用其客户管理资源,也为企业在电子商务时代从容应对不同的客户提供了科学的手段和方法。 二、数据挖掘技术 1.数据挖掘常用的算法。 (1)决策树(decisiontree)决策算法。决策树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性上的测试,每个分枝代表一个测试输出,而每个树叶节点代表类或类分布。决策树算法包括树的构造和树的剪枝,有两种常用的剪枝方法:先剪枝和后剪枝。 (2)神经网络(NeuralNets)。遗传算法根据适者生存的原则,形成由当前群体中最适合的规则组成新的群体,以及
4、这些规则的后代。遗传算法用于分类和其他优化问题。 (4)粗糙集方法。粗糙集方法基于给定训练数据内部的等价类的建立。它将知识理解为对数据的划分,每一被划分的集合称为概念,利用已知的知识库来处理或刻画不精确或不确定的知识。粗糙集用于特征归约和相关分析。 (5)模糊集方法。基于规则的分类系统有一个缺点:对于连续属性,他们有陡峭的截断。将模糊逻辑引入,允许定义“模糊”边界,提供了在高抽象层处理的便利。 其它还有贝叶斯网络、可视化技术、临近搜索方法和公式发现等方法。 2.数据挖掘常用的分析方法。 (1)分类和预测。分类和预测是两种数据分析形式,可以用于提取描述重要数据类的模型或预测
5、未来的数据趋势。数据分类(dataclassfication)是一个两步过程,第一步,建立一个模型,描述预定的数据类集或概念集,通过分析有属性描述的数据库元组来构造模型。第二步,使用模型进行分类。首先评估模型的预测准确率,如果认为模型的准确率可以接受,就可以用来对类标号未知的数据远祖或对象进行分类。 预测是构造和使用模型评估无标号样本类,或评估给定样本可能具有的属性值或值区间。分类和预测具有广泛的应用,如信誉证实、医疗诊断、性能预测和选择购物。分类和预测常用的算法包括决策树归纳、贝叶斯分类、贝叶斯网络、神经网络、K-最临近分类、遗传算法、粗糙集和模糊集技术。 (2)聚类分析。聚
6、类是将数据对象分组成为多个类或簇(cluster),在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。作为统计学的一个分支,聚类分析已被广泛的研究了许多年,现在主要集中在基于距离的聚类分析,基于k-means(k-平均值)、k-medoids(k-中心点)和其他的一些聚类分析工具也有不少的应用。 (3)关联规则。关联规则挖掘给定数据集中项之间的有趣联系。设I={i1,i2,…im}是项的集合,任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合,使得T包含于I。关联规则是形如A=>B的蕴涵式,其中A∈I,B∈I,并且A∩B为空。关联规则的挖掘分成两步
7、:①找出所有频繁项集,这些项集出现的频繁性至少和预定义的最小支持计数一样。②由频繁项集产生强关联规则,这些规则必须满足最小支持度和最小置信度。 (4)序列模式。序列模式分析和关联规则分析类似,也是为了挖掘数据项之间的联系,不过序列模式分析的是数据项在时间维上的先后序列关系,如一个顾客在购买了计算机半年后可能再购买财务分析软件。 (5)孤立点分析。孤立点是度量错误或固有的数据变异性的结果。许多数据挖掘算法都试图使孤立点的影响最小,或排除它们。一个人的噪声可能是另一个
此文档下载收益归作者所有