基于空间定位的聚类算法在电信业客户划分中的应用.pdf

基于空间定位的聚类算法在电信业客户划分中的应用.pdf

ID:52954354

大小:1.25 MB

页数:6页

时间:2020-04-03

基于空间定位的聚类算法在电信业客户划分中的应用.pdf_第1页
基于空间定位的聚类算法在电信业客户划分中的应用.pdf_第2页
基于空间定位的聚类算法在电信业客户划分中的应用.pdf_第3页
基于空间定位的聚类算法在电信业客户划分中的应用.pdf_第4页
基于空间定位的聚类算法在电信业客户划分中的应用.pdf_第5页
资源描述:

《基于空间定位的聚类算法在电信业客户划分中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第8卷第1期2008年1月科学技术与工程Vol.8No.1Jan.2008167121819(2008)120207206ScienceTechnologyandEngineeringZ2008Sci.Tech.Engng.基于空间定位的聚类算法在电信业客户划分中的应用3常晓磊闫仁武杨苏宁(江苏科技大学电子信息学院,镇江212003)摘要随着电信市场竞争的不断加剧,电信企业传统的营销模式正在向主动、精确营销模式转变。因此,客户划分显得至关重要。采用数据挖掘中聚类的方法对电信业的客户进行划分,在比较了现有聚类算法计算复杂度普遍较高的的基

2、础上,采用了一种基于空间定位的方法,将客户数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任意数据,通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程。为了适合电信业客户的特殊性质,改进对客户属性数据的处理过程。通过电信客户的数据实验结果表明,算法的时间复杂度降至0(N)级别。关键词数据挖掘聚类客户划分空间定位电信业中图法分类号TP311.52;文献标志码A随着各种现代生产管理手段和技术的发展,企种,其中比较典型的有关联分析、预测分析、聚类分业之间产品的差别越来越难以区分,产品同质化的析等。趋势越来越明显,通过产品差

3、别来细分市场,从而数据挖掘主要应用在CRM中大量的客户数据[1,2]创造企业的竞争优势也就变得越来越困难。随分析,以及客户价值的挖掘方面。作用主要有新客着市场态势从卖方市场向买方市场的转变,如何确户的获取和保持、个性化营销、客户忠诚度分析以[3]定高价值和忠诚度高的客户,对企业的发展有着非及客户市场划分等。常重要的作用。为此许多企业开始实施客户关系本文在已有的基于空间定位的聚类算法的基管理(CustomerRelation2shipManagement,CRM)。础上,把该算法具体应用到网通客户的划分上,为客户划分作为CRM中的重要组

4、成部分,对CRM的了适合网通的客户特性,并改进了该算法的数据处成功实施有着重要的作用。理过程。本文的数据来源于网通电信增值业务服面对海量的各种客户、销售等数据,为了对客务商的无锡汇隆信息技术有限公司近年来的客户户进行有效的划分,为经营者实施更具有针对性的数据库。销售措施提供理论依据,有必要依赖于数据挖掘(DataMining,DM)的强大数据分析能力。数据挖1基于空间定位的聚类分析掘作为一种工具,是从大量的数据中抽取潜在的、有价值的知识、模型或规则。数据挖掘方法有多聚类将数据对象分组为多个类或簇,使同一个簇中的对象之间的相识度最高,而

5、不同簇中的对象2007年9月17日收到其相识性最低。由于大型数据库中存放了大量的第一作者简介:常晓磊(1983—),男,汉族,江苏镇江人,硕士研数据,聚类分析已经成为数据挖掘研究领域的一个究生,研究方向:智能信息处理。E2mail:changxiaolei1133@非常活跃的课题。但是,面对电信行业的海量数163.com。据,就一般的聚类算法而言,算法的复杂度制约了3通信作者简介:闫仁武(1962—)男,,副教授,研究方向:智能这些算法的商业应用价值。目前占有最多市场份信息处理、数据挖掘。208科学技术与工程8卷额的商业数据挖掘软件的

6、聚类算法仅仅是有限的高的问题。几种:K2means算法、高斯混合算法和基于SVM的本算法解决以上两个问题的方法是:按照包含算法等。元素数的多少,选取出所有大于总元素数一定比例1.1算法思路Q的所有类(称为有效类),对无效类包含的所有元目前的聚类算法时间复杂度高的主要原因是素,予以重新分配。事先指定的比例Q是这样确定需要计算任意两个点之间的距离。从另外一个角的:根据无锡市网通的具体情况和业务发展要求,度出发,聚类算法的核心思想就是用某种机制划分在业务开展实践中,公司比较理想的客户群数量是数据空间,划分完毕后,该子空间内的所有数据点4~6

7、个,根据用定位法进行聚类计算的经验,要达即为一类。因此,只要能把数据映射成是空间中的到以上的业务要求,Q的取值范围必须在2.5%~一点,然后划分空间中的点集,得到的每个子空间5%之间。Q值越大,类数就会单调减少,聚类更加就可以看作是一个簇(正交框架等名词的定义请参集中;反之Q越小,类数会单调增大,聚类越分散。阅参考文献[4])。重新分配的方法是计算有效类的中心。由于有效1.1.1属性归一化类中心已经是空间立方体内密度最大点之一,因为了能把元素映射到空间立方体和便于距离此,以这些中心作为最终聚类中心,对所有元素点的计算,首先要把对元素属

8、性进行归一化处理,即进行重新竞争,再次遍历数据集,所有元素都归入把元素的M个属性都转换成[0,1]区间的值。从而距离最近的有效类中心的类中,则聚类计算完毕。完成元素到空间立方体的映射。对于数值型属性对类有效性的判决,解决

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。