欢迎来到天天文库
浏览记录
ID:28344295
大小:70.50 KB
页数:4页
时间:2018-12-09
《浅谈电信行业客户重入网分析方案》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浅谈电信行业客户重入网分析方案【摘要】电信行业客户重入网会带来大量营销资源的无效消耗,同时带来离网率过高和用户虚增等异常现象,为此,业务分析人员通过建立模型识别出重入网客户加以管理,但是识别的准确率一直不够理想。本文总结重入网建模经验,结合大数据IT建设成果,分析各种识别方法的优劣,为模型优化提供参考。【关键词】重入网模型大数据一、背景及研究现状分析重入网客户行为指的是己拥有某电信运营商的A地市分公司一个移动号码的客户,由于某种原因乂新买了该运营商A地市分公司的另一个同类终端产品(手机、数据卡、上网本、MIFI)的号码入网。由此消耗的营销资源包括号卡资源以及渠道销售成本,还冇客户在重入网
2、后对前一号卡进行弃卡,引发恶意欠费等现象。传统的重入网识别技术是基本信息识别、IMEI识别和社交匹配度识别,这三种技术或单独或交叉使用,但是这些识别技术准确率低,例如基于用户资料的移动用户身份识别准确率仅为42%,有待改进:1、客户基本信息在实名制还未普及的情况下,很多信息是错误的;2、IMEI识别受山寨机的影响,存在错误;3、可引入大数据实现信令数据的采集,对用户的位置信息进行定位和跟踪,从而分析两个用户是一个客户的可能性。二、客户重入网识别方法优化方案介绍以下介绍三种模型优化的方法。2.1客户基木信息校验客户基本信息主要包括姓名、家庭住址和身份证,先对客户信息的有效性进行验证,仅在信
3、息有效的客户中识别重入网用户:1、姓名识别,剔除:以下一个或多个词语的用户:“预开”、“营业厅”、“开户”、“直邮”、“套卡”、“代销”、“中心”、“批量”、“批开”、“直供”;中文字符小于2个的。2、家庭住址识别:剔除中文字符小于2个的。3、身份证有效性识别,为防止客户乱填,号码有效性识别如下:参数1:取前17位数字,以i表示其所在位数,从左向右依次为17、16、15...2、1;参数2:每一位上的身份证号码数字记为Ai参数3:计算MOD(21,11),记为Wi;参数4:将每一个Ai与对应位置上的Wi相乘。将参数4得到的17个数值求和,然后除以11求余数,得到一个数值n通过n在下面的对
4、应表中进行查表,得到最终的校验位字符:计算值n012345678910校验码10X987654322.2IMEI信息有效性校验采用IMEI识别之前,先判定客户的唯一有效IMEI,主耍分为以下两种判定方式:1、剔除1个IMEI对应多个号码的情况,即山寨机:IMEI号对应3个以上号码;IMEI长度小于14个字符;IMEI字符全是0或者空的。2、剔除1个号码对应多个IMEI的情况,这类客户可能存在频繁换机情况:IMEI号对应3个及以上号码;用户2个IMEI号,取一个月内使用天数最多的标识为用户的唯一有效IMEI。三、引入用户位置轨迹匹配同一个客户的上班地点、住宅地点相对固定,而且该客户出现在这
5、类地点的时间遵循一定的规律,所以,通过比较两个用户在上班地点和住宅地点,来识别两个用户是一个客户的可能性。首先,按照工作日白天、工作日晚上、休息日白天、休息日晚上来划分时段;其次,A口信令数据在客户进行位置移动、开机、关机、通话吋等操作会产生数据,无以上操作时,将按照一定的时间间隔进行采集,由此可以计算出客户在该基站下的逗留时长;最后,匹配客户在这四个时段的相同位置的逗留时长,即可评估两个用户是同一客户的可能性。四、总结及下一步发展经过对比测试,对客户基本信息和IMEI信息进行校验后,分别有30%和38%的信息正确可用,只针对信息有效的用户识别,重入网准确率达到75%;其余客户基本信息和
6、IMEI信息错误的用户,采用交往圈和位置轨迹匹配的方案提升重入网客户识别的覆盖率,这部分用户通过外呼确认,准确率为48%。总体而言,通过三种方法的引入,能有效提升模型识别的准确率。通过加强社会渠道的管控,随着实名制的普及和携号转网业务的发展,重入网客户可在业务办理时即得到识別和控制。参考文献[1]温瑞军.移动代理商渠道养卡套利行为识别与治理[J].电子技术与软件工程,2015(3):54-55.[2]罗亚.移动电话用户重入网识别及营销建议.北京邮件大学硕士论文,2010.[3]王征,包磊.基于网络访问项序的移动用户重入网身份识别方法[J].大连理工大学学报,2015(2):016.[4]
7、日发帖赵丽莎.基于数据挖掘的电信客户重入网预测系统的研究.昆明理工大学硕士论文,2014.
此文档下载收益归作者所有