欢迎来到天天文库
浏览记录
ID:51414105
大小:327.80 KB
页数:4页
时间:2020-03-23
《决策树方法在煤炭物流客户分析中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、co唧啪r西画船e矗昭觎dApp肠m如船计算机工程与应用2010,46(10)245决策树方法在煤炭物流客户分析中的应用段富,曾祥东,牛保宁DUANFu,ZENGXiang-dong,NIUBao—ning太原理工大学计算机与软件学院,太原030024CouegeofComputer锄dScience,rI'aiy咖UniVers畸ofTechnolog)r,Tai”粕030024,ChimE.mail:xian酣ongzeng@163.comDUANFu,zENG】
2、【iang—do赡。NIUBao一血gIAppIi姐ti伽o
3、fd∞isi明缸雠in锄d灿ofc砌logis觚customer.ComputerEng.m∞ringandAl'Imcatio璐。20lO。46(10):245—248.Abstract:Thereare10tsofhistoricalcustofnerdatainlo舀sticsenterprises.Tbu石lizetIlesedatae丘_ectively,customercl鹪s访cationusingdataminingisver)rimportantinCRM.Decisionh_ieeiso∞ofthemostp
4、叩lll盯toolst0class访cation衄ddatalIlining.Thi8thesismailllydiscusseshowtobuildadecisiontreeofcoallogisticscustomerallalysisbyu8ingC4.5algorithm蛐dthe印plica-ti彻ofmlestocustomercl鹪smcationinlogisticsente叩rise.Theexperimentre8uhshow$tIIatthemethodh聃greatvaluein印一plication.K
5、eywords:deci8iontree;c4.5algorithm;pmne;customeranaly8is摘要:目前物流企业中积累了大量的客户历史数据,为了有效利用这些数据,使用数据挖掘方法对客户进行分类管理和服务是CRM中非常重要的一方面。而决策树是进行分类分析与数据挖掘的常用方法。研究了运用C4.5算法对煤炭物流客户信息构造决策树,并把提取到的规则应用到公路煤炭物流公司的客户关系管理中,结果证明具有较好的应用价值。关键词:决策树;C4.5算法;剪枝;客户分析DoI:lO.3778/j.issn.1002—8331.20
6、10.10.076文章编导:1002—8331(2010)10-0245—04文献标i只码:A中图分类号:7I鹳111引言。·数据挖掘(DataMiniIlg)是从大量数据中提取或“挖掘”知识【ll。决策树作为数据挖掘中的一种重要分类方法,已在很多领域得到成功应用,但在煤炭物流业中的应用研究却比较少。随着地区经济的快速发展,煤炭需求量日益增加,并且呈现出行业需求的明显差异性。根据经济学中“20%的客户创造80%的利润”的原则,煤炭物流公司要实现经济利润最大化,就有必要对其客户进行分类管理和服务,利用数据挖掘技术挖掘出20%的大客
7、户群体所隐含的固有特征。将决策树C4.5算法应用到山西省煤炭运销总公司公路公司CRM系统中。帮助企业深入了解客户行为,制定恰当的营销策略。2决策树决策树是以实例为基础的归纳算法,着眼于从一组无次序、无规则的事例中推理出决策树表示形式的分类规则。构造决策树,需要由训练样本数据集作为输入。训练集由一组数据记录(元组)组成,每条记录由多个特征属性和一个类别属性构成。—个样本可以形式化地表示为(A,,A2,⋯,A。,c),其中,A;表示特征属性;c表示类别属性。常见的决策树算法有ID3,c4.5,CART,suQ等,其中,c4.5算法是
8、J.R.QtlirIl锄于1993年提出的一种对ID3的改进算法,利用信息增益率来寻找树节点上具有最大信息量的属性,它弥补了ID3在应用中只能处理离散型的描述性属性的不足,加进了对连续型属性和属性值空缺情况的处理。在煤炭物流客户分析中应用c4.5算法生成决策树的过程如图l所示。图l决策树生成的过程模型基金项目:山西省自然科学基金(theNaturalscienceFoundationofshan】£iPr嘶n∞0fcIli艇underG啪tNo.2008011039);山西省科技攻关计划(theKey1k}IIlol晒e8R&D
9、Pmg阻mofSIlanxjPm“nce,ChinaunderGrantNo.2007031129)。作者简介:段富(1958一),男,博士,教授,主要研究方向:软件开发环境与工具、软件理论与算法等;曾祥东,男,硕士研究生。主要研究方向:数据挖掘;牛保宁,男,博
此文档下载收益归作者所有