基于数据挖掘技术的客户细分模型研究

基于数据挖掘技术的客户细分模型研究

ID:28031835

大小:100.50 KB

页数:37页

时间:2018-12-07

基于数据挖掘技术的客户细分模型研究_第1页
基于数据挖掘技术的客户细分模型研究_第2页
基于数据挖掘技术的客户细分模型研究_第3页
基于数据挖掘技术的客户细分模型研究_第4页
基于数据挖掘技术的客户细分模型研究_第5页
资源描述:

《基于数据挖掘技术的客户细分模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于数据挖掘技术的客户细分模型研宄杨登吉林化工学院132022摘要客户细分是客户关系管理中的首要任务,数据挖掘技术是实施客户细分的关键技术。木文介绍如何将SOM祌经网络算法和k均值算法相结合,构建一种客户细分模型。关键词客户细分SOM神经网络算法k均值算法细分模型1.介绍对于现代企业而言,相互之间的竞争已从产品的样式和质量上的竞争转移到争夺客户的竞争上来了。面对日益激烈的市场竞争,企业逐渐意识到维系与顾客之间的长久关系的重要性。数据挖掘技术可以企业在海量数据中同时更好地理解客户,找出高价值或者至少有利润的客户,并将这些客户进

2、行适当的分类,由此决策者便能够对每一类客户提供有针对性的个性化服务。国外诸多学者从人统计、客户行为、价值、利益、忠诚等角度出发,获得了一些不同的细分方法。这些细分方法在实际运用中都取得了一定成效,而目前占据主流地位的还属基于行为和价值的客户细分方法。基于行为的细分方法认为行为变量是构建细分市场的最佳起点,通过对客户行为的测量,对客户进行分类;而基于价值的细分方法则认为客户的价值是构建细分市场的最佳起点,通过分析不同客户给企业带来的盈利,来对客户分类。目前客户终身价值的研宄还不成熟,客户细分更多采用基于行为的分类方法。木文介绍

3、的客户细分模型也是基于行为分类,在选定了特定的行为变量后,比较了SOM神经网络算法和k均值算法的优缺点,结合两个算法构建一个客户细分的模型。2.模型实现的方法2.1行为变量的选取木文在选取细分的行为变量时,在客户价值矩阵的两个变量基础上,增加了一个反应客户忠诚度的变量--客龄。客龄等于客户的开户日期与最近购买曰期的吋间差,单位为天数。也就是说,一共选取了三个行为变量,分别为平均购买金额A,购买次数F和客龄D。2.2算法的设计2.2.1K-均值的优缺点K-均值算法的优点是简单、快速、冇效。该算法的缺点是①不同初始值会导致不同的

4、聚类结果;②要求事先输入聚类数0;③陷入局部极优;④对“噪声”和孤立点数据比较敏感。2.2.2SOM算法的优缺点SOM算法的优点是①由于不需要映射内的相互结合,计算量少;②算法中不需要微分计算,数学上非常简单。SOM的缺点是①SOM不能提供分类后精确的聚类信息,②缺乏具体的目标函数,使得不MJSOM聚类的结果难以进行比较;③必须设定初始邻域宽度、初始学率、网络类型、邻域函数这许多的参数。2.2.3结合算法K-均值需要指定聚类的个数,且初始的聚类质心是随机赋予的;而SOM只需输入向量就能产生分类。可将两种算法结合起来,形成一个

5、结合算法。第一步,先执行SOM算法,输出聚类数gN和聚类质心Z={Z1,Z2,?,Zc}。第二步,将SOM输出的结果N,Z={Z1,Z2,?,Zc},用做K-均值算法的初始化条件,得到最后的聚类的结果。将两个算法结合起来后,因为得到合适初始值,K-均值算法的局部搜索能力变强,收敛速度提高。2.3数据准备客户信息表:共有9876条记录,经筛选保留字段为客户号、性别、年龄、受教育程度、婚否、未成年孩子的个数、职业、收入、房产、汽车、注册日期等。商品数据表:有1561条记录,经筛选保留字段为商品号、商品名和商品属类标识。交易记录表

6、:有97425条记录,经筛选保留字段为商品号客户号、单价、数量、小计、日期。建模的样本数据集由上述基本表融合而生成,新增变量平均购买金额、购买频率、客龄,在数据清理后,采用最小一最大标准将属性值标准化到[0,1],形成我们的挖掘数据库。1.模型评估3.1基于SOM网络的聚类质心经过预定次数的训练之后,客户被自动分为了5类,所得各簇的聚类质心如表1所示:表1SOM聚类质心C1C2C5平均购买额0.3340.2410.2350.235购买次数0.1130.0760.1140.080.119客龄0.7820.6270.5240.4

7、180.2723.2基于K-均值的聚类质心为了进行比较,对样本数据指定K=5,执行k-均值后所得各簇的聚类质心如表2所示:表2K-均值聚类质心ClC2C3C4C5平均购买额0.3450.4190.3070.325购买次数0.580.0870.091客龄0.5530.530.5093.3基于结合算法的聚类质心样本数据采用结合算法后,所得各簇的聚类质心如表3所示:表3结合算法聚类质心C1C2C3平均购买额0.3620.4130.1540.337购买次数0.0780.0670.0470.0660.293客龄0.4450.8030.

8、5333.4三种方法的比较三种算法的结果对比可以看出,类内距离标准方差对比如表4所示:表4三种聚类法簇内方差簇内距离:方差(SOM)簇内距离:方差(K-)簇内距离:方差(结合)购买额次数客龄购买额次数客龄购买额次数客龄C1Cl0.0890.0450.101Cl0.0950.0420.111

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。