欢迎来到天天文库
浏览记录
ID:17361949
大小:1.90 MB
页数:57页
时间:2018-08-30
《基于数据挖掘的陌生人社交APP用户流失预测模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、专业硕士学位论文基于数据挖掘的陌生人社交APP用户流失预测模型研究培养单位:统计学院专业名称:应用统计学作者姓名:钟文鑫指导教师:裴艳波副教授1ResearchontheSupervisionofStockMarketbasedontheProtectiontheInterestsofMediumandSmallInvestorsCandidate:ZhongWenxinSupervisor:Prof.PeiYanboCapitalUniversityofEconomicsandBusiness,Beijing,China23摘要随着移动互联网的深入发展,人们的上网
2、方式逐渐由PC端转移到了移动端,手机成为人们生活中的必备产品,成为人类新的器官。同时手机应用市场变的日益火爆,各类APP之间为了争夺用户流量展开了激烈的竞争。激烈的竞争一方面促进了各类手机应用的开发,丰富了用户的选择,同时也提高了用户流失的概率。用户对于互联网企业而言,是最重要的资源,有了用户企业就有了流量,有了生命力,防止用户流失是企业必须要考虑的一个问题。企业为了确保在激烈的市场竞争中不被淘汰,不仅要不断的对产品进行迭代保持对用户的吸引力,让自身产品保持竞争力,同时也要深入了解用户的偏好,发现用户行为与流失之间的隐藏联系。新用户拉新成本较高,流失特征不明显,流失
3、率也不低,如果能对用户是否流失做出准确预测,对不同流失概率的用户有针对性的设计挽留策略,保持用户留存,对于企业来说有着重大的意义。数据挖掘中的模型预测可以很好的满足需求。本文基于数据挖掘对陌生人社交领域的用户流失预测模型进行研究,介绍了用户流失的研究背景和现状,使用探索性数据分析方法探索用户不同属性及不同行为与用户流失之间的关系,对比了决策树模型、随机森林模型、逻辑斯蒂回归模型与XGBoost模型四种预测模型在用户流失领域的预测性能,最后选择性能最佳XGBoost模型输出特征重要度及所有用户在预测期的流失概率。为流失用户的挽回提供决策依据。关键词:数据挖掘;用户流失
4、;XGBoost;分类器模型4AbstractWiththerapiddevelopmentofthemobilenetwork,theclients'demandforInternetaccesshasbeendramaticallygrowingbothonmobileterminalsaswellasonthePC/wapends.Gradually,mobilephoneshaveplayingakeyroleasoneoftheessentialsinpeople'slivesandsomehowbecomeanew'organ'ofourbodies.S
5、imultaneously,withtheapplicationsonmobileendsmarketbeingincreasinglypopular,inordertoobtainmoreoftheusers'resources,varioustypesofAPPslaunchedfiercecompetition.Ononehand,thesituationsinacertainratehavereverselypropelledtheprosperofthemarket,enrichingthechoicesofcustomers;Andatthesameti
6、me,italsoincreasedtheprobabilityofuserchurn.UsersarethemostvaluableresourcesforInternetenterprises,withwhichtheyareabletomaintaintheflowandthevitality.Therefore,preventingusersfromlosingisacriticalandfirst-lineissuethatalltheparticipantsmustconsider.Tostayawayfrombeingeliminatedintheco
7、mpetition,itisnecessarynotonlytocontinuouslyiterativelypreservetheappealoftheproducttotheusers,butalsotocomprehendtheuser'spreferencesindepthandtodiscovertheimpliedcausalitybetweentheuserbehaviorandthelossitself.Meanwhile,factsarethatthecostsfornewuserssolicitingishigh,yetthelosschar
此文档下载收益归作者所有