基于粗糙分类度的决策树算法

基于粗糙分类度的决策树算法

ID:45783534

大小:68.09 KB

页数:9页

时间:2019-11-17

基于粗糙分类度的决策树算法_第1页
基于粗糙分类度的决策树算法_第2页
基于粗糙分类度的决策树算法_第3页
基于粗糙分类度的决策树算法_第4页
基于粗糙分类度的决策树算法_第5页
资源描述:

《基于粗糙分类度的决策树算法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于粗糙分类度的决策树算法吴明泉1,刘童璇1,陈晓伟1(中国石汕大学(华东)计算机与通信工程学院东营257061)1摘要在构造决策树的过程中,属性分裂标准直接影响分类的效果。木文针对1D3算法对属性分类精度强调不足问题,基于粗糙集理论提llJTffl糙分类度的概念,将粗糙分类度作为选择分离属性的标准。该方法充分考虑了属性分类精度对分类结果造成的影响,兼顾了条件屈性与决策屈性的依赖性。经实验证明,相比传统的基于信息爛方法构造的决策树,有效的提高了分类的准确率。关键诃分类精度;局性相关程度;粗箍集:决策树

2、;信息增益中图分类号:TP182文献标识码:AAnAlgorithmforDecisionTreeConstructionBasedonDegreeofRoughClassificationZHANGQiong-sheng1,WUMing-quan1,LIUTong-xuanl,CHENXiao-weil,(CollegeofComputerandCommunication,ChinaUniversityofPetroleum,Dongying257061,China)lAbstractInthepr

3、ocessofdecisiontreeconstruction,propertydivisionstandardsdirectlyaffecttheclassificationresults・AimedatweaknessofID3innicetyofgrading,weprovidetheconceptofdegreeofroughclass讦icationasselectcriteriaofseparationofproperty.Themethodtookintoaccountnicetyofg

4、radinganddependencybetweenconditionattributesanddecisionattributes.Comparedwithtraditionaldecisiontreebasedentropy,theexperimentprovedthatthedecisiontreeconstructedinourmethodeffectivelyimprovestheclassificationresults・KeywordsClassificationAccuracy;Att

5、ributeRelevanee;RoughSet;DecisionTree;InformationGain1引言决策树学习是以示例学习为基础的归纳推理算法,着眼于从一组无次序、无规则的事例推出决策树表示形式的规则。在解决分类问题的各种方法中,决策树方法是运用最广泛的一种,它采用自顶向下、分而治之的方法将搜索空间分为若T个互不相交的子集,形成一种类似于流程图的树状结构,这种方法速度快、易于转换成简单而便于理解的分类规则。1D3[2]算法是一种基于信息爛的决策树学习算法,是决策树算法的代表,但是基于信息爛

6、的方法只考虑了属性Z间的互信息,即属性对决策结果的影响,而没有考虑构建决策树的分类精度,从而降低了分类的效率和效果。基金项目:屮国石汕化工股份有限公司基金项目(P02049)作者简介:张琼声(1968-),女,副教授,主要研究领域为软件T程、智能系统,操作系统等;吴明泉(198?)男,硕士研究牛,主要研究领域为操作系统、智能系统•刘童璇(1985-),男,硕士研究生,主要研究领域为操作系统.、软件工程。陈晓伟(1985-),女,硕士研究生,主要研究领域为专家系统、软件工程;E-mail:zqsheng

7、@upc.edu.cn粗糙集理论是波兰数学家乙Pawlak在1982年提出的一种分析数据的数学理论,主要用来处理不确定和不精确信息。其特点是不需要预先给定某些特征和属性的数量描述,而是直接从给定问题的描述集合出发,找出该问题的内在规律,英某本思想更接近现实情况。现己有部分研究将粗集理论应用于决策树中,如文献[1]先对样本集进行属性约简,然后根据核构建决策树,该方法构建的决策树通过使用属性约简示去除了噪声和兀余属性。文献[6]定义了分辨率,使用分辨率作为分裂属性的标准来构建决策树。文献[7]使用粗糙集中

8、的属性分类粗糙度作为分裂属性的标准,根据属性分类粗糙度构建决策树,另外文屮提出使用变精度粗糙集去除噪声的方法。文献[8][9]都使用了边界域作为分裂属性的标准,其中[9]为避免决策树过于细化而引入了抑制因了,当抑制因子小于一定值后,决策树不再扩展。文献[12]提出使用核属性和辨明矩阵来选择对分类贡献最大的属性。文献[13]中提出了使用决策属性对条件属性的依赖度作为启发信息來选择属性。本文提出使用粗糙分类度来构建决策树。基于粗糙分类度的决策树是以属性分类精

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。