欢迎来到天天文库
浏览记录
ID:43605506
大小:391.83 KB
页数:17页
时间:2019-10-11
《【精品】通话数据的分析模型》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、寻找对客户的最优分类是现代企业发展的重要课题,对客户群体进行有效的分类管理,选择正确的客户服务策略,对于企业的发展具有重大的战略意义。这就要求所给分类算法耍具有科学性、可行性和高效性。本题是一个典型的聚类分析问题,以此分类方法为基础,利用K-均值聚类算法和SPSS软件建模寻找出一种较为合理的分类方法,从而得出合理决策,对通信业务推广和设施规划具有一定的改进和指导意义。对于问题一,采用聚类分析模型,从所给通话记录的信息中选出关键因子,并以此为基准,通过SPSS软件进行K—均值聚类分析,得到了特征较明显的五个分类及其具体数据。
2、对于问题二,根据问题一的分类结果,结合每类客户的消费习惯和新业务的特征,合理选择了部分用户作为首推消费人群,给出推荐建议。对于问题三,通过对每个基诂侮天最大同时连接用户数來判断基站的负荷情况来讨论其建设是否合理。认为基站11、22、28、29、30负荷较重,应在其附近增加新的基站,而基站3、5、26负荷较轻,应与附近基站合并或拆除。最后,作者在对模型阐述及模型验证方面做了较为详细的阐述,旨在说明模型的正确性和实用价值,便于更好运用模型解决实际问题。关键词:聚类分析SPSS软件通话数据的分析模型1・引言通信技术的不断发展拉近
3、了人与人之间的距离。电话作为主要的通信工具之一悄无声息地将我们联系在一起,形成一个巨大的社交网络。这个巨大的社交网络对当前的通信设备和业务提出了更高的要求。对客户样体进行有效的分类管理,选择正确的客户服务策略,实现以客户为中心的业务流程,对于企业的发展具有重大的战略意义。如何利用现有的通话记录数据进行概括分析,以便做出合理的决策,进而改善通信设施、拓展新的通信业务,这就是通话数据分析应研究的问题。因此首先要实现对通话数据的有效分类。聚类是分析数据并从屮发现有用信息的一种有效手段,使用SPSS软件实现K—均值聚类,建立一个基
4、于通话数据因了的分类模型,以减少运算量并得到近似最优的分类结果。考虑每个基站的通话负荷情况,并对其分布提出优化意见。2.问题重述现有一家通信公司公布的2009年6刀份某地300个用户10天内的通话记录,试完成以下问题:①请根据这些通话记录信息建立数学模型以对用户分类。②如果需要推出一款新的通信业务,如何合理选择部分用户作为首选推广人群。说明你的理由,并撰写一份不超过两页的给公司经理的建议。③该地现有的通信设施(如基站等)建设情况是否合理。如需改进,请给出合理的建议。3•问题分析这是一个典型类型划分问题,由于所要求划分的类是
5、未知的,应采用聚类方法,即基于“物以类聚”的思想,它将对象数据分组成为若干个类或簇,使在同一个簇中的对象之间具有较高的和似度,而不同簇中的对象羌别很大。用SPSS分析软件进行聚类分析可有效较小复杂度,捉高效率。从数据中提取岀主要因子,并对其进行无量纲化处理。聚类分析方法和分类数日要具体进行讨论,尽量获得最优分类。根据客户的分类,将新业务的特点与之结合,即可得到首选的推广人群的特征,实现双赢。合理的布局与分工可以使每个基站的负荷不至于过大,同时也不会被因闲置得不到充分利用。而衡量基站的负载情况,很重要的一个指标就是每天的最大
6、负载量,即同时连接该基站的通话数,以此判断基站分布是否合理。4.模型的假设①每个客户的通话记录都是独立的,与其他客户的信息无关;②该地区在2009年6月1口至10日,除了周末外无其他节假口。③所有用户通话均正常,无通话失败现象岀现(如占线、无法接通、网络繁忙等)。④将通话时间单位由秒化为分钟时,一律向人进一,而不是四舍五入,即坚持作保守估计的原则。⑤对跨日期通话记录,只考虑其对前一天的影响。⑥认为每一个通话记录的持续时间为闭区间[a,b],即在考试时刻与结束时刻基站都处在工作状态。5.模型的分析和理论5.1问题一的模型分析
7、和理论我们选用聚类分析中的K—均值算法,其本身有严格的理论基础。1)聚类分析:聚类的严格数学描述如下:被研究的样本集为E,类C定义为E的一个非空子集,即CuE,且CG0,聚类就是满足下列两个条件的类G,C2,……,5的集合:a)GuC?uCk=Eb)Gee,H0(对Shj)出第一个条件可知,样本集E中的每个样本必定属于某一个类;出第二个条件可知,样本集E屮的每个样本最多只属于一个类。[1]2)K—均值算法:传统的聚类分析计算方法主耍有以下儿种:划分方法、层次方法、基于密度方法、基于网格方法、基于模型方法等,依据本题所给数据
8、,显然应选择划分聚类方法进行分析。划分方法(PAM:PArtitioningmethod)是由一个初始划分开始,给定要构建的划分数目K,通过优化一个评价函数把数据划分成若干子类,因此事实上已经把聚类问题转化成了优化问题,划分聚类方法输岀的是多个互不相交的聚类集。这里我们选择K—均值算法,其算法思想是:给
此文档下载收益归作者所有