基于sas的决策树方法应用综述

基于sas的决策树方法应用综述

ID:24835891

大小:71.50 KB

页数:4页

时间:2018-11-16

基于sas的决策树方法应用综述_第1页
基于sas的决策树方法应用综述_第2页
基于sas的决策树方法应用综述_第3页
基于sas的决策树方法应用综述_第4页
资源描述:

《基于sas的决策树方法应用综述》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于SAS的决策树方法应用综述王拓荣首都经济贸易大学摘要:决策树作为数据挖掘技术中一种重要的分类研宄方法,其出色的数据分析效率、直观易懂的结果展示,倍受广大用户的青睐。在此过程中,往往需要借助一些数据挖掘工具如:SAS的EnterpriseMiner。本文对基于SAS的决策树方法的行业应用进行综述。关键词:SAS;数据挖掘;决策树;作者简介:王拓荣(1991-),女,汉族,河南新乡人,就读于首都经济贸易大学,研宄方向:业务流程管理、数据挖掘。一、前目随着科学技术飞速的发展,在各个领域产生了大量的数据,

2、如人类对太空的探索,银行每天的巨额交易数据。怎么样从这人量数据中挖掘冇价值的信息,成为了巨大的挑战,数据挖掘就是在这种情况下应运而生的。在数据挖掘的过程中,往往需要借助一些数理统计分析工具。SAS工具具有完备的数据访问、管理、分析、呈现及应用开发功能,并能运用统计分析、时间序列、运筹决策等科学方法进行质量控制、财务管理、生产优化、风险管理、市场调査和预测。二、相关知识(一)SAS/EM数据挖掘方法论SAS/EM是SAS软件也中的一个组件,是一个图形化界面、菜单驱动的、拖拉式操作、对用户非常友好功能强大

3、的数据挖掘集成环境。SAS的数据挖掘方法论是SEMMA,其包括5个步骤:Sample(数据抽样)、Explore(数据探索)、Modify(数据修改)、Model(建立模型)、Assess(模型评估)。(二)决策树原理及相关算法决策树(DecisionTree)是一种主要解决实际应用中分类问题的数据挖掘方法。其基木思路是找出最有分辨能力的属性,把数据划分为许多子集(对应树的一个分枝),构成一个分枝过程,然后对每一子集递归调用分枝过程,直到所有子集包含同一类型的数据。目前比较流行的决策树算法主要有C4.

4、5、CART、CHAID,其中较常用的C4.5算法是通过SAS/EM工具,根据数据的特点建立相应的函数来尽可能地正确分类所有的观察。表2.1各软件包含的决策树算法及其相关功能的差别下载原表从表2.1我们可以看出:所列出的软件尽管都具有决策树功能,但各个软件所采用的算法又各有所侧重,以便其在同类软件的比较和竞争中具有一定的优势。通过上面的比较来看EnterpriseMiner、MineSet拥有较为全面的决策树算法。三、国内外文献综述(一)医疗卫生领域数据挖掘是近年来刚刚兴起的一门新技术,国外已有不少成

5、功应用的案例,但其在医疗卫生领域的应用尚处于起步阶段。侯晓智(2004)XU运用数据挖掘工具SASEnterpriseMiner,利用决策树技术建立模型,研宄Y数据挖掘在肝胆恶性肿瘤单病种医疗费用方面的应用。朱宝(2012)利用SAS9.1进行决策树分析,构建病例组合模型,找到控制重点,为今后制定眹疗费用控制政策提供依据。陈龙(2014)位1利用SAS软件的决策树模型,对高血压患者住院费用进行DRGs分组的方法学探索,得出在当地进行DRGs的相关研宄总体上可行的结论。(二)客户流失问题客户流失,指某企

6、业现有的客户中止继续购买其商品或服务,转而购买其竞争对手的商品或服务。据统计电信运营商每年高达35%~50%的客户流失,造成约数百亿美元的经济损失;而获取1位新客户的成木是保留1位老客户的5~6倍。因此,国内外学者对客户流失问题展开了大量研究。Chiu-PingWei(2002)以1开发了以决策树方法为基础、可以在合同水平上识别潜在流失者的分类组合预测技术;熊国民(2014)以分析决策树等理论和分类为原则,运用SAS9.2进行Logistic逐步1H]归运算,得出流失概率值,从中选取部分客户为预测流失

7、概率值较大的作为最终流失客户。毛躍霖(2015)£6lffl过研究客户流失预测算法在其他行业中的应用情况,创新的设计了决策树与LOGISTIC回归模型和结合的方法对汽车服务企业进行建模,在SAS挖掘平台下建立了流失预测模型。(一)银行客户信用评分问题信用评分法将借款人的特征进行量化,形成一套指标体系,克服丫主观随意性的风险。现代信用评分广泛运用统计学、运筹学、决策树、神经网络等技术,不断提高信用评分的精度。在国外学者的研究中,Makowski(1985)第一次将决策树算法应用于个人信用评分。近来,Le

8、e等(2006)运用决策树技术研宄最小化信用风险问题。国内对信用评分的研究也经历丫从定性到定性和定量相结合的过程。姜明辉(2003)m较早引入决策树技术应用于个人信用评估。赵静娴等(2009)M把神经网络技术和决策树方法和结合,提高了信用评估的效率和客观性。随着农村金融的重要性H益突出,在信用风险评估的研宄中,以农户小额信用贷款为研究对象的居多。蔡丽艳等(2011)m把决策树算法引入到农户小额贷款信用风险评估屮,构建评估模型并对信用评估模型进行实证。沈术

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。