基于数据挖掘的家庭客户识别模型

基于数据挖掘的家庭客户识别模型

ID:11716268

大小:420.50 KB

页数:12页

时间:2018-07-13

基于数据挖掘的家庭客户识别模型_第1页
基于数据挖掘的家庭客户识别模型_第2页
基于数据挖掘的家庭客户识别模型_第3页
基于数据挖掘的家庭客户识别模型_第4页
基于数据挖掘的家庭客户识别模型_第5页
资源描述:

《基于数据挖掘的家庭客户识别模型》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于数据挖掘的家庭客户识别模型研究1背景1.1现状分析随着各电信运营商进入全业务运营时代,竞争对手利用其全业务优势,围绕宽带和固定电话推出捆绑服务,利用移动在这两块业务非常薄弱的弱点,实施差异化的竞争战略,积极渗透移动业务,市场竞争日趋激烈。为适应新形势下市场竞争的要求,移动必须积极拓展家庭客户市场,立足于移动通信的先发优势和规模优势,重点发展和推广家庭业务,增加客户对移动业务的粘性。这样不仅能防范个人客户被蚕食的风险,更能在传统语音业务和数据业务基础上取得进一步发展。然而当前移动在拓展家庭市场上存在如下几个问题:ü家庭客户的识别缺少依据,

2、缺乏有效的手段来支撑家庭客户的精确营销;ü传统的三户模型以单个客户为单位进行管理和分析,但在真实社会中,家庭是组成社会组织的基本单位,当前移动的用户管理模型中尚未以家庭为单位对全量用户进行划分,缺乏对客户的深入理解和通信需求的深度挖掘;1.2研究目标及演进移动对于家庭客户的理解及研究尚处于起步阶段,计划通过以下三个阶段的研究来逐步加深对家庭客户的了解,从而更好地为家庭客户市场的发展提供技术支撑:ü第一阶段:建立家庭客户识别模型通过对家庭客户成员和非家庭客户成员之间的对比分析,找到家庭客户成员之间的一些显著特征,帮助我们更好地了解家庭客户成员

3、之间的通信行为,并利用数据挖掘模型进行分析,从而找到识别家庭客户的一些规律;ü第二阶段:利用家庭客户识别模型,对全量用户以家庭为单位进行划分利用第一阶段得到的成果,识别出浙江移动全量用户中的家庭客户,并将浙江移动的全量用户以家庭为单位进行划分,建立以家庭为单位的客户模型;ü第三阶段:以家庭为单位进行分析,深度挖掘家庭客户的潜在需求根据第二阶段得到的成果,以家庭作为基本研究对象,分析整个家庭的通话行为与消费特征,发掘家庭客户的潜在需求,为家庭客户的营销提供技术支撑;本文的研究目的是解决第一阶段的问题,即通过数据挖掘的方式识别出存在家庭关系的两

4、个独立的移动用户。1.3假设与约定本文中用到的一些基本假设如下:ü本文假设办理了家庭套餐业务的户主和成员之间存在家庭关系;ü本文假设家庭成员之间必然存在通信联系,例如电话或者短信,如果家庭成员之间不存在任何通信联系,这种情况不在我们的考虑范围之内;2家庭客户识别模型2.1数据准备表1为本模型中使用到的所有输入变量,涉及到语音、短信、终端、小区位置信息等15个指标,除了表中的15个输入变量之外,同时还有一个输出目标变量“是否家庭关系”,我们将同一家庭套餐内的两个成员号码定义为存在家庭关系,将不在同一家庭套餐内且有过通话的两个号码定义为不存在家

5、庭关系,各个变量的角色及数据类型如图1所示。以“是否家庭关系”为目标变量,其它15个变量为输入变量,分别选取杭州地区存在家庭关系和不存在家庭关系的号码对5000个,共10000个样本,最终形成含有号码对,及号码对之间15个统计指标的数据集,数据集的格式如下:{号码A,号码B,是否家庭关系,指标1,指标2,…,指标15}图1变量的角色及数值类型配置图序号变量名称备注1号码A与号码B夜间通话最为频繁的小区位置信息是否一致取用户在夜间产生的本地市通话详单,统计用户各小区(CELL_ID)的通话次数,取通话次数占比超过50%的小区,判断两用户的小区

6、是否存在重叠2号码A对号码B的闲时通话次数占号码A总闲时通话次数的比例号码A对号码B的闲时通话次数/号码A总闲时通话次数3号码A对号码B的闲时通话时长占号码A总闲时通话时长的比例号码A对号码B的闲时通话时长/号码A总闲时通话时长4号码A对号码B闲时有过通话的天数 5号码A对号码B的下班高峰时间通话次数占号码A总下班高峰时间通话次数的比例号码A对号码B在下班高峰的通话次数/号码A总下班高峰通话次数6号码A对号码B的下班高峰时间通话时长占号码A总下班高峰时间通话时长的比例号码A对号码B在下班高峰的通话时长/号码A总下班高峰通话次数7号码A对号码

7、B的上班高峰时间通话次数占号码A总上班高峰时间通话次数的比例 8号码A对号码B的上班高峰时间通话时长占号码A总上班高峰时间通话时长的比例 9号码A对号码B的午间休息时间通话次数占号码A总午间休息时间通话次数的比例 10号码A对号码B的午间休息时间通话时长占号码A总午间休息时间通话时长的比例 11号码A对号码B在周末的通话次数占号码A总周末通话次数的比例周末:星期六+星期天12号码A对号码B的下班高峰时间短信次数占号码A总下班高峰时间短信次数的比例 13一方漫游一方本地的情况下闲时是否有通话 14是否属于同一统一支付帐号号码A和号码B在同一个

8、统一支付帐号下则为true,否则为false15最近三月内是否曾经使用过同一终端根据IMEI使用记录,如果号码A和号码B曾经使用过同一个终端则为true,否则为false表1输入

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。