欢迎来到天天文库
浏览记录
ID:42069381
大小:2.47 MB
页数:37页
时间:2019-09-07
《数据挖掘在电信业的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据挖掘技术在电信用户分析与保持中的应用北大2013公安班数据挖掘第13小组2013年11月北大2013公安班数据挖掘第13小组成员名单黄锡锋:1301220570张 佶:1301220690赵 征:1301220706徐 良:1301220670周 健:1301220713张 峰:1301220686■序言□用户流失挖掘的主要方法□用户流失挖掘中应注意的问题□用户流失挖掘过程□建议与结论用户流失的数据挖掘电信运营商之间竞争激烈两有:市场占有率,用户保有量ARPU:每用户月平均收入提升电信运营商
2、之间竞争激烈运营商的年ARPU值ARPU值逐年下降,应努力调整业务结构以适应形势变化。电信运营商之间竞争激烈运营商年ARPU值市场占有率用户保有量留住一个用户所需要的成本是争取一个新用户成本的1/5□序言■用户流失挖掘的主要方法□用户流失挖掘中应注意的问题□用户流失挖掘过程□建议与结论用户流失数据挖掘相关分析主要分析变量之间联系的密切程度;回归分析主要基于观测数据与建立变量之间适当的依赖关系。相关分析与回归分析均反映的是数据变量之间的有价值的关联或相关联系,因此两者又可统称为关联分析。(一)相关
3、分析和回归分析时间序列分析与关联分析相似,其目的也是为了挖掘数据之间的内在联系,但不同之处在于时间序列分析侧重于数据在时间先后上的因果关系,这点与关联分析中的平行关系分析有所不同。(二)时间序列分析分类与预测用于提取描述重要数据类的模型,并运用该模型判断新的观测值分类或者预测未来的数据趋势。(三)分类与预测分析聚类分析就是将数据对象按照一定的特征组成多个类或者簇,在同一个簇的对象之间有较高的相似度,而不同的簇之间差异则要大很多。在过程上看,聚类分析一定程度上是分类与预测的逆过程。(四)聚类分析□
4、序言□用户流失挖掘的主要方法■用户流失挖掘中应注意的问题□用户流失挖掘过程□建议与结论用户流失的数据挖掘从实际情况上看,国内电信企业每月的用户流失率一般在1%~3%左右,如果直接采用某种模型(比如决策树、人工神经网络等)可能会因为数据概率太小而导致模型的失效,因此我们需要加大流失用户在总样本中的比例,但是这种过度抽样必须谨慎小心,要充分考虑它的负面效应。(一)抽样在实际运用的过程中,可能存在用户被判断具备流失倾向,但当数据返回到用户服务前台的时候用户已经流失的情况,其原因可能存在于不同业务部门之
5、间协调工作的时延过长或者数据采集间隔太长等,这使得流失判定预警丧失了原有的意义。(二)模型的有效性数据挖掘在用户流失管理中的重要应用不仅仅应包括对用户流失的提前预警,还应包括用户流失后的原因分析。按照不同的用户信息维度,查找最容易流失的用户群,同业务部门人员配合,辅以相关调查,力求发现用户流失的症结所在。(三)流失后分析□序言□用户流失挖掘的主要方法□用户流失挖掘中应注意的问题■用户流失挖掘过程□建议与结论用户流失的数据挖掘28%的用户是重入网或反复入网引起的;流失用户的91.6%是在半年内流失
6、(低网龄用户)。用户流失类型(一)重入网、反复入网用户挖掘NN+1N-6N-4N-5N-2N-3N-1新入网激活月新入网激活后第1月新入网激活月前半年的存量用户历史IMEI库或身份证库N月在网用户,区分新增和存量用户判断重入网用户判断新入网用户的有效IMEI或身份证号码N月新入网用户中的重入网和反复重入网用户名单剔除无效IMEI或身份证号码生成、维护历史有效IMEI库或身份证号库识别规则:通过对新入网用户使用手机的IMEI号(或身份证号码)与存量用户的IMEI号历史库(或身份证号码历史库)进行分
7、析识别出重入网和反复重入网用户。重入网新用户IMEI或身份证号与历史IMEI或身份证号码能够匹配(6个月以内)。反复重入网重入网用户在6个月以内重入网2次及2次以上的用户。(一)重入网、反复入网用户挖掘识别过程为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如下:用户在N月入网并激活(有话单产生),则在N+1月(计算月)对N月入网并激活的所有用户进行重入网分析。产品/价格促销/宣传不同品牌及资费存在内部竞争,没有考虑体系间的平衡问题;预存费用低,用户
8、入网门槛不高,使其可以轻易弃卡。新入网促销活动优惠力度过大;品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足。追求经济收益,受入网优惠的吸引;换取吉祥号码;欠费停机后选择重入网。竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网内部原因外部原因用户原因渠道/服务渠道迫于指标压力或利益驱动,自身养卡或诱导用户换卡;补卡成本高且手续复杂。(一)重入网、反复入网用户为了保证数据的完整性和可用性1、数据准备(二)低网龄用户挖掘数据提取
此文档下载收益归作者所有