欢迎来到天天文库
浏览记录
ID:33103538
大小:3.83 MB
页数:67页
时间:2019-02-20
《基于粗糙集的决策树算法研究及在crm中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Y1318925分类号!£3Q!:互UDC..........................—.硕士学位论文基于粗糙集的决策树算法研究及在CRM中的应用王志强学科专业筐堡挝堂皇王程指导教师昌匮进数援论文答辩日期2QQ815:2生学位授予日期答辩委员会主席盆尚遘熬援论文评阅人。奎壁强麴援萱雪兰副数援基于粗糙集的决策树算法研究及在CRM中的应用摘要数据挖掘是一种能够从海量数据中提取有价值信息的技术。它可用于发现隐藏在数据中的聚类模式、关联模式、分类模式等,以辅助人们决策。其中,分类是数据挖掘的一项重要任务,而决策树就是一种能有效用于
2、数据分类的方法。决策树结构简单、容易产生规则、易于理解,在实际中应用极为广泛。’首先,本文基于粗糙集理论改进决策树算法。先利用粗糙集理论进行决策表的属性约简,再进行基于粗糙集的决策树构建。经典粗糙集存在着处理噪声数据能力差的不足。为此,本文基于变精度粗糙集的思想对蒋芸博士等(2004)提出的决策树算法进行改进,提出变精度加权平均粗糙度的决策树构造算法。实验结果表明改进后算法构造的决策树结构简洁,泛化能力更强。其次,本文还将提出基于属性区分度的决策树构造算法。其主要思想是决策树的每一次分枝都尽可能使属于不同决策类的数据分开,而使属于
3、同一决策类的数据集中在一起。同样,仿真实验结果表明该算法在多数数据集上构造的决策树比经典的ID3算法要好。最后,本文以电信业客户关系管N(CRM)为背景,基于数据挖掘的基本流程,在一个电信客户流失数据集上分别以ID3算法以及本文改进和提出的决策树算法构建一个客户流失预警模型。模型结果比较表明后两者构建的模型均优于前者。关键词:数据挖掘粗糙集决策树CRM客户流失THERESEARCHONDECISl0NTREEALGORITHMBASEDONROUGHSETANDAPPLICATlONINCRMABSTRACTDatamimngis
4、akindoftechnologythatcallextractthevaluableinformationfromthemassivedata.Itcanbeusedtofindtheclusterpattern,theassociationpattern,andtheclassificationpattern,hiddeninthedata,inordertohelppeopledecision—making.Theclassificationisallimportanttaskofdatamining,andthedecis
5、iontreeisamethodusedeffectivelyfordataclassification.Thestructureofthedecisiontreeissimple.Thedecisiontreeiseasytoproducerulesandtobeunderstood.Itisusedwidelyinpracticalapplications.Firstly,thispaperimprovesthedecisiontreealgorithmbasedonroughsettheory.Basedonroughset
6、theory,itreducesattributesofthedecision-makingtableandthenconstructsthedecisiontree.Thecapacityofhandlingthenoisedatabasedonclassicroughsetisinsufficient.Therefore,basedonthevariableprecisionroughsetthinking,thispaperproposesthedecisiontreealgorithmbasedonthevariablew
7、eightedaverageroughness,whichimprovethealgorithmspresentedbyDr.JiangYunetal(2004).Theexperimentalresultsshowthatthedecisiontreebasedontheimprovedalgorithmissimplerinthestructureanditsextensiveabilityisstronger.Secondly,thispaperwillpresentdecisiontreealgorithmbasedont
8、hediscerndegreeofattributes.ThemainideaisduringeverybranchofthedecisiontreethedatabelongtodifferentcategoriesSeparateasmucha
此文档下载收益归作者所有