欢迎来到天天文库
浏览记录
ID:9940007
大小:707.58 KB
页数:18页
时间:2018-05-16
《第4组_职场新人手机用户精准识别》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、A职场新人手机用户精准识别福州大学数学与计算机科学学院11级研究生福州大学第八届数学建模竞赛A题职场新人手机用户精准识别参赛组号:4参赛人员:何立鹰110320051(组长)陈丽珠110320038陈赛英110320020-18-A职场新人手机用户精准识别福州大学数学与计算机科学学院11级研究生福州大学第八届数学建模竞赛A题职场新人手机用户精准识别摘要本文基于统计的思想,并利用数据挖掘技术,对职场新人手机用户识别的方法进行了研究,并设计出一套用户识别的模型体系,该体系能够对职场新人手机用户进行有效识别。这个模型体系主要包括六个步骤:数据预处理
2、、数据分析、模型建立、结果输出、模型验证、用户识别。将已知数据导入SPSS统计软件中,并在SPSS软件环境下对数据进行预处理、相关性分析,得出各个特征的相关性系数,从而进行特征降维,并从中获取决策特征:用户级别、套餐档次、消费金额、是否3G用户、资费变更次数、手机操作系统类型。根据分析结果建立模型,采用比例标度法对上述六个决策特征进行权重计算,并对用户的特征数据进行数据标准化处理。最后使用特征指数计算模型进行得分计算,根据输出结果和参考信息进行用户识别。本建模对于问题一,利用SPSS对影响本网用户是否为职场新人手机用户的最重要的六个特征等进行
3、了统计分析,对相关量的平均值、最大最小值以及方差进行了计算,并进行相关性分析,得出了判断是否为职场新人手机用户的准则。关键词:职场新人、用户识别、SPSS、层次分析法、比例标度法一、问题重述随着移动通信、互联网业务的迅速发展,手机已经从生活奢侈品变成了生活日用品,是人们日常生活中不可缺少的一部分。人们随时随地使用手机打电话、发短信、上网,而用户的这些行为以及其个人基本信息均在运营商中有所记录。职场新人,通常指处于毕业前的实习阶段或刚毕业离开校园(专科或专科以上学历)工作不到一年的年轻群体。他们虽然收入不高,但暂时也没有太多压力,经常追求新鲜事
4、物、乐于且敢于消费。他们有着各自的职业追求,是社会的潜在精英,将成为运营商未来的高端用户。下面给出某城市某运营商的手机公众用户数据,其中:l用户资料表:本城市本运营商2012年2月时在网的所有手机公众用户的个人基本信息、终端信息、套餐情况、费用情况等数据;l通话清单表:记录了上述手机号码在2012年2月份每天的通话情况,包括主叫、被叫以及市话、长途和漫游通话;-18-A职场新人手机用户精准识别福州大学数学与计算机科学学院11级研究生l短信清单表:记录了上述手机号码在2012年2月份每天的短信发送和接收情况。为了便于针对不同用户推出合适的产品和
5、服务,需要精准地识别用户类型。请结合以上三张表,识别该城市的职场新人。二、基本假设1)假设本网手机用户的行为特征在相当长的一段时间内没有太大的变化。2)本网手机用户的等级是相对固定的。3)手机用户定时缴纳话费及相关费用。4)假设获取的用户信息都是真实的、准确的。5)假设用户信息可以准确量化。6)假设身份证归属地、性别、号码办理日期对分析是否是职场新人没有影响。三、符号说明G目标层PROB_LEVEL套餐档次C准则层CUST_LEVEL用户级别P方案层OS_TYPE操作系统类型A判定矩阵IS_3G是否3G用户W权重向量CONSUME_AMT消费
6、金额SCORE加权得分OFR_CHANGE_CNT资费变更次数四、问题分析根据搜到的相关资料以及对数据的分析,我们给出职场新人的相关定义:1)年龄基本上在20岁以上,28岁以下。2)经常追求新鲜事物、乐于且敢于消费,具有较高的消费倾向。3)需求多样化,个性化和高档化,喜欢高质量高价值的品牌商品。由于数据量大,因此小组决定采用SPSS[1]数据统计软件进行数据处理。经过初步数据分析后,发现数据中99.9%的用户停机次数为零,因此该特征对决策的贡献不大,将不作为决策特征。用户信息中的身份证、性别特征与用户是否为职场新人关系粘滞度较弱,因此SPSS
7、统计时不对这两个特征进行分析。经过对问题分析后,小组制定出本次建模的基本处理流程,如下图1所示:-18-A职场新人手机用户精准识别福州大学数学与计算机科学学院11级研究生图1五、模型建立及求解5.1数据分析及特征降维针对所给数据中的用户特征字段,包括本网手机号码、城乡标识、身份归属地、是否3G等25个用户特征字段,进行数据分析前先进行数据预处理,如将操纵系统类别映射为0-2区间值,用户年龄为空或者值非法将其置为0等。手机操作系统类型预处理,如图2所示:图2首先,将数据导入SPSS软件后,使用分析->描述统计->描述,功能统计字段的均值、方差、
8、最大和最小值等,分析样本数据数据分布情况,统计结果如图3所示(图中特征字段代表意义见附录一):-18-A职场新人手机用户精准识别福州大学数学与计算机科学学院11级研
此文档下载收益归作者所有