安徽联通用户流量分析模型

安徽联通用户流量分析模型

ID:40229236

大小:187.03 KB

页数:8页

时间:2019-07-27

安徽联通用户流量分析模型_第1页
安徽联通用户流量分析模型_第2页
安徽联通用户流量分析模型_第3页
安徽联通用户流量分析模型_第4页
安徽联通用户流量分析模型_第5页
资源描述:

《安徽联通用户流量分析模型》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、深圳天源迪科信息技术股份有限公司版本:1.0安徽联通用户流量分析模型2012年01月12日8深圳天源迪科信息技术股份有限公司文件建立/修改记录日期版本建立/修改内容建立/修改人审核人批准人2012-01-121.0建立孙宏方                                    8深圳天源迪科信息技术股份有限公司一、工具选择与算法选择选用Clementine建模工具里面的决策树算法C5.0对本网用户的流量使用情况进行分析,类别划分。二、决策树算法介绍决策树算法构造决策树来发现数据中蕴涵的分类规则.如何构造精度高、规模小的决策树是决策树算法的核心内容。决

2、策树构造可以分两步进行。第一步,决策树的生成:由训练样本集生成决策树的过程。一般情况下,训练样本数据集是根据实际需要有历史的、有一定综合程度的,用于数据分析处理的数据集。第二步,决策树的剪技:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数扼集(称为测试数据集)中的数据校验决策树生成过程中产生的初步规则,将那些影响预衡准确性的分枝剪除。  1)树以代表训练样本的单个结点开始。  2)如果样本都在同一个类.则该结点成为树叶,并用该类标记。  3)否则,算法选择最有分类能力的属性作为决策树的当前结点.  4)根据当前决策结点属性取值的不同

3、,将训练样本数据集tlI分为若干子集,每个取值形成一个分枝,有几个取值形成几个分枝。匀针对上一步得到的一个子集,重复进行先前步骤,递4'I形成每个划分样本上的决策树。一旦一个属性出现在一个结点上,就不必在该结点的任何后代考虑它。  6)递归划分步骤仅当下列条件之一成立时停止:  ①给定结点的所有样本属于同一类。8深圳天源迪科信息技术股份有限公司  ②没有剩余属性可以用来进一步划分样本.在这种情况下.使用多数表决,将给定的结点转换成树叶,并以样本中元组个数最多的类别作为类别标记,同时也可以存放该结点样木的类别分布,  ③如果某一分枝tc,七砰如恤卜a*没有样本,则以样.

4、本的多数类创建一个树叶。决策树构造的输入是一组带有类别标记的例子,构造的结果是一棵二叉树或多叉树。二叉树的内部节点(非叶子节点)一般表示为一个逻辑判断,如形式为a=aj的逻辑判断,其中a是属性,aj是该属性的所有取值:树的边是逻辑判断的分支结果。多叉树(ID3)的内部结点是属性,边是该属性的所有取值,有几个属性值就有几条边。树的叶子节点都是类别标记。  由于数据表示不当、有噪声或者由于决策树生成时产生重复的子树等原因,都会造成产生的决策树过大。因此,简化决策树是一个不可缺少的环节。寻找一棵最优决策树,主要应解决以下3个最优化问题:①生成最少数目的叶子节点;②生成的每个

5、叶子节点的深度最小;③生成的决策树叶子节点最少且每个叶子节点的深度最小。三、数据预处理及准备首先关联本网用户资料信息表,联通用户资料半年汇总表,3G业务资料表,统计出用户收入,用户增值费用,用户年龄,用户在网时长与用户使用流量的关系,及按流量使用量,套餐内流量使用情况,套餐内流量剩余流量将用户分档统计(详细见附件)。后将用户资料11月份数据清洗(除去离网用户,测试卡用户,上网卡用户)后作为模型数据来源。取数sql如下:8深圳天源迪科信息技术股份有限公司createtablespss_flowas(selecta.user_id,a.phone_no,a.online_

6、dura,(a.addval_fee+a.call_fee+a.month_fee)asarpu,a.addval_fee,NVL(A.net_flow,0)/(caseWHENtrim(a.prodt_cde)='42221'THEN150ELSEp.RUN_COUNT_INEND)asshiyonglv,((caseWHENtrim(a.prodt_cde)='42221'THEN150ELSEp.RUN_COUNT_INEND)-NVL(A.net_flow,0))/(caseWHENtrim(a.prodt_cde)='42221'THEN150ELSEp.R

7、UN_COUNT_INEND)asshengyulv,b.age_level_code,a.net_flowfromtb_b_ft_prd_instpartition(p201111)aleftjointb_b_dim_prd_3gpontrim(p.offer_id)=trim(a.PRODT_CDE)leftjointb_b_ft_prd_inst_bnbontrim(a.user_id)=b.user_idwherea.online_user_flag='1'anda.ceshi_user_flag<>'1'ANDA.PRODT_CDENOTI

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。