欢迎来到天天文库
浏览记录
ID:51932528
大小:6.21 MB
页数:62页
时间:2020-03-19
《数据挖掘在流量经营中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、数据挖掘在流量经营中的应用摘要在移动互联网的新形势下,电信运营商需要做出由话务量经营向流量经营的经营思维方式的转变,以适应未来流量业务发展的需要,以解决运营商的“管道化"危机和“量收剪刀差”难题。流量经营的基础是流量规模,但是在规模提升下却存在着流量资源分布的严重失衡的问题,比如:XX移动2012年7月流量用户占全用户的比率是56%,而流量用户中48.57%是月流量在5M及以下的低流量用户,它们只消耗了1.44%的流量资源。为了解决该问题,文章基于精确营销的思路:寻找合适的用户,在合适的时机,向其推荐合适的产品。文章重
2、点解决如何找到合适的用户这个问题。建立决策树模型的对低流量用户群中的潜在高流量用户进行预测。建模包括明确业务目标、变量设计、数据准备和数据理解、模型构建和模型评估这几步。明确要解决的业务问题后设计出建模宽表并通过SQL实现它,然后根据宽表数据选择聪明变量和探索聪明变量与目标变量的关系,确定导入决策树模型的变量。基于训练集数据建立决策树模型后把该模型给测试集打分,对模型效果进行评估。通过该模型我们可以通过10%的用户预测出45%的潜在高流量用户。为了实现更好的营销效果,文章提出建立用户流量使用行为的统一视图,该视图需要包
3、含更多的用户流量使用行为数据。这个视图的建立可以为合适的时机分析和合适的产品推荐提供数据支持。关键词:数据挖掘;流量经营;精确营销;决策树;分类DATAMINlNGINTHETRAFFICMANAGEMENTABSTRACTUnderthenewsituationofthemobileInternet,telecomoperatorsneedtomaketheshiftfromtrafficoperatorstodatatrafficmanagement,whichaccommodatestheneedsoffutur
4、edatatra伍Cbusinessdevelopmentandsolvesthecrisisofthetrafficpipelineandquantity-pricescissorsproblem.Withdatatrafficscaleupgradingthereisaseriousimbalanceofthedatatrafficresources,forexample:the56%ofusersofXXmobileoperatorinJuly2012havethedatatraffic,nearly50%oft
5、hemmonthlydatatrafficin5Mbelowandtheyconsumeonly1.44%ofTosolvetheproblem,thearticleisbasedonprecisionmarketingwhichrecommendssuitableproductstothetightusersatthetighttime.Th,articlefocusessolvinghowfindth(Lppropriateusers.Deci,,"1heartlclefocusesonSOIvinghowtoli
6、ndtheaPpropnateUSersDecision●trccmodelpredictsthepotentialhigh—trafficusersinthelow—trafficusers.Creatingadecisiontreemodelincludescleatingthebusinessobjective,designingvariables,datapreparation,understandingdata,buildingthemodelandmodelevaluationsteps.Afterclea
7、tingthebusinessproblem,wedesignthewidetableofmodelingrequiresandimplementthewide㈣0Ⅲ7㈣2Ⅲ2㈣9洲2㈣2洲YtablethroughSQL.Thenwechoosesmartvariablesandexploretherelationshipofthesmartvariablesandtargetvariabletodeterminetheimportofthedecisiontreemodelvariables.Weestablish
8、themodelthroughtrainingsetandthenscorethetestsetbythemodeltoassesstheeffectofthemodel.Withthemodelwecailpredict45%ofpotentialhigh—trafficusersthrough10%users.Inordert
此文档下载收益归作者所有