资源描述:
《【精品】通话数据分析 易.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、通话数据分析摘要现代生活中,电话作为最主要的通信工具之一将我们紧密联系在一起拉近了人与人之间的距离。这个巨大的社交网络对当前设备和业务提出了更高的要求。笫一问,根据某地300个用户10天通话的总时长(主叫和被叫时间之和),我们建立抽样分析模型,用Excel分析数据,以通话的总时长为标准对数据进彳亍分类。第二问,我们考虑按加权的方法从各分类中选取部分用户,通话时间总长越长的权值越大,通话吋长0〜4999之间用户选10%,5000〜9999之间的用户选20%,以此类推,超过20000的全部选定作为首选推广人群。第三问,列出各基站10天内主叫总时长,判断最小主叫时长与最大主叫时长比值M,M值
2、越接近1,该地现有的通信设施就越合理。题中M值为0.01130044458,所以该地区现有通信设施不是很合理,可以在工作量小的几个基站中减少设施,在工作量大的基站范围适当的增加设施。关键字:抽样分析、加权法问题重述现代生活中,电话作为最主要的通信工具之一将我们紧密联系在一起拉近了人与人之间的距离。这个巨大的社交网络对当前设备和业务提出了跟高的耍求。如何利用现有的数据(某地300个用户10天的通话数据)进行概括分析,做出合理决策,进而改善通信设备,拓展新的通信业务,依然是很多通信公司面临的难题。1、根据通话记录信息建立数学模型对用户分类。2、如果需要推出一款新的通信业务,如何选择部分用户
3、作为首选推广人群,说明你的理由,并撰写一份不超过两页的给公司经理的建议。3、该地现有的通信设施(如基站等)是否合理?如需改进,请给出建议。二、模型假设1、假设基站在理想状况下工作,不考虑外界干扰和是否损坏。2、每个基站在同一时间内可处理的通话个数在本题屮不受限。三、符号说明M最小主叫时长与最大主叫时长比值U!、模型建立与求解4.1抽样分析模型首先对抽样的数据用Excel进行数据有效性分析,剔除异常数据(图一),得到6220组有效数据。编号4270壬叫舌被叫者主叫时冋通话时B壬叫者听属基站1765420090607-91847591041120090608-2426图一以用户主叫和被叫通
4、话的总吋长为标准,判断用户活跃程度。(其中X轴为通话时间从短到长的排列序号)所有通话时长X轴平莒卑!®l图二从上图可看出用户通话总吋长主要分布在20000以下,故将通话总吋长在20000以下用户单独考虑得到图三:20000以下通话时长次轴平甘姐IF图三综合图二图三我们将用户分成五类:首先对抽样的数据用Excel进行数据有效性分析,剔除异常数据(图一),得到6220组有效数据。编号4270壬叫舌被叫者主叫时冋通话时B壬叫者听属基站1765420090607-91847591041120090608-2426图一以用户主叫和被叫通话的总吋长为标准,判断用户活跃程度。(其中X轴为通话时间从短
5、到长的排列序号)所有通话时长X轴平莒卑!®l图二从上图可看出用户通话总吋长主要分布在20000以下,故将通话总吋长在20000以下用户单独考虑得到图三:20000以下通话时长次轴平甘姐IF图三综合图二图三我们将用户分成五类:第一类:不活跃用户,通话总时长在0-4999之间;第二类:较活跃用户,通话总时长在5000-9999之间;第三类:活跃用户,通话总时长在10000-14999之间;第四类:非常活跃用户,通话总时长在15000-19999之间;第五类:超级活跃用户,通话总时长大于20000o各类用户的人数分布如图四:(各类的具体用户见附录一)0-49995000-10000-1500
6、0->2000099991499919999通话时长区间通话吋长区间人数分布图OOOOOOOOOO864208642蘇Y图四4.2、加权法选取推广人群关于如何选择用户作为新通信业务推广人群建议根据模型一我们将用户分为五类,从这五类用户中按一定比率随机抽取人群(采用加权法),通话时间总长越长的权值越大,超过通话时间总长的全部选定作为首选推广人群。比如根据选定的300个用户10天通话的数据,将通话时间总长超过20000的用户全部作为新通信业务推广人群,通话吋长在20000以下的用户我们以5000通话时长为单位,将其分成4组,通话时长20000以下通话吋长半2卑赠0〜4999N间的取10%的
7、用户作为推广人群,通话时长在5000〜9999之间的取20%的用户作为推广人群,通话时长在10000〜14999之间的取渤30%的用户作为推广人群,通话吋长在15000〜19999之间的取40%的用户作为推广人群。以第一类用户为列,对88个用户进行编号,分别为1,2,3……,87,88,mMATLAB产生分布于1到88之间的9个随机数,64,91,145,171,175,225,232,240,243。以此9个数所对应的用户作为第一类用户中的推