基于logistic回归模型的大数据精准营销应用

基于logistic回归模型的大数据精准营销应用

ID:28144841

大小:47.50 KB

页数:5页

时间:2018-12-07

基于logistic回归模型的大数据精准营销应用_第1页
基于logistic回归模型的大数据精准营销应用_第2页
基于logistic回归模型的大数据精准营销应用_第3页
基于logistic回归模型的大数据精准营销应用_第4页
基于logistic回归模型的大数据精准营销应用_第5页
资源描述:

《基于logistic回归模型的大数据精准营销应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于logistic回归模型的大数据精准营销应用摘要:随着移动互联网的发展,电信运营商的传统语音和短信收入快速下降,同时流量价值也不断向云端结合的OTT服务商转移,挤压运营商收入增长空间。文章通过研究电信运营商大数据能力优势及精准营销需求,基于logistic回归模型,提出了电信运营商流量经营的大数据精准营销应用,有效提升客户的满意度,快速提高运营商效益。关键词:logistic回归模型;大数据应用;运营商;流量经营随着移动互联M的发展,流量已成为客户的核心需求,能否顺利从以“话务量”为中心的经营

2、转向“流量经营”转型,能否通过流量经营提升公司的价值,已成为运营商战略转型的关键。移动互联网时代的流量经营与语音和宽带业务的经营有很大不同:客户使用的终端多样性,流量承载的内容性丰富,客户流量使用行为的数据的复杂性,仅通过传统的“暴力营销”极易引起客户的反感和投诉。基于logistic回归模型的大数据精准营销应用将有效解决提升客户满意度及运营商效益提升问题。1基于logistic回归模型的大数据精准营销应用的解决方案1.1基本思路根据用户的特征,判别哪些是诱发用户订购流量包的因素,使用logist

3、ic回归分析出其影响权重,从而预测哪些用户是潜在的订购用户。1.2logistic模型根据样木数据可以通过最似然估计法计算出模型参数。1.3抽取数据抽取五大类11子项数据作为分析颗粒度。1.4数据描述本模型使用部分流量包订购数据,它有94455个样本观测,每个观测包括12个变量:用户号码(phone)、使用流量(current_flow)、套餐类型(taocantype)、终端类型(os)、用户类型(utype)、订购状态(order)、套餐消耗比(main_rate)、F1均使用流量(avg_d

4、ay_flow)、闲时消耗比(free_rate)、活跃度(day_log_count)>APP个数(client_count)和潜力值(big_client_pv)o1.4.1观测样本套餐划分情况:3G套餐包括A/B/C/iPhone/wopai,占比为36%;2G套餐根据流量分为流量卡(占比28%)和非流量卡(占比35%)。1.4.2观测样本终端情况Android操作系统用户占比达51%,iOS操作系统用户占比为9%。1.4.3观测样本流量使用情况把观测样木用户使用流量划分成8个区间,对流量需

5、求旺盛用户开展流量包营销非常必要。(图3)1.4.4观测样本流量饱和度情况极大部分用户都出现了流量超套行为,占一半用户以上,进行合适的流量包推送很在必要。(图4)2基于logistic回归模型的人数据精准营销应用的模型建立2.1数据随机抽取80%的数据(75564条)建立一个logistic模型,再用余下20%的数据(18891条)进行预测。2.2方法多元logistic模型,使用stepwise选择变量。2.3变量涉及多个分类变量-用户类型、终端类型和套餐类型,设置哑变量处理,并设置相应的参照水

6、平-3G用户、Andriod终端和A套餐。2.4影响因素参数估计2.4.1整体显著性检验假设:HO:bl=b2〜.=bn=0;Hl:bl,b2,…bn不全为0。检验的结果如下所示:从表4中可以看到p-value〈0.0001,拒绝原假设,说明回归系数对模型有显著性的影响,这个模型整体上比空模型更显著。2.4.2参数估计从表5中可以看到9个因素的回]/R系数都通过了WaldChi-Square检验,说明各系数在统计上是显著的。2.5模型结论闲时消耗率、终端类型、套餐类型为此模型中诱发订购行为的最重要

7、的三个因素。(表6)2.6参数意义回归的系数给出了概率的对数变化一个单位对应的预测变量的增加。OR比是取幂的系数,可以解释为乘法概率增加一单位预测变量的变化。3G用户相对于2G用户:订购概率的对数增加1.7443;订购的概率相对不订购的概率增加0.175。Current_flow增加1M:订购概率的对数增加0.00116;订购的概率相对不订购的概率增加1.001。(表7)2.7模型描述预测模型:3基于logistic回归模型的人数据精准营销应用监测及实施案例(1)对18891个用户数据进行预测,R

8、0C曲线如下:?订购覆盖率Sensitivity^LE确预测到的订购数/实际订购总数?未订覆盖率SpeCificity=正确预测到的未订数/实际未订总数?ROC曲线是在不同阈值下,Sensitivity和1-Specificity的组合。随着阈值的减小(更多的用户就会被认为订购),Sensitivity和1-Specificity也相座增加。?ROC曲线与45度线偏离越大,AUC值越大,模型的效果就越好。?阈值e=0.5时,Sensitivity=75.24%Specificity

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。