资源描述:
《多值决策表的最小决策树生成》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、ComputerScienceandApplication计算机科学与应用,2016,6(10),617-628PublishedOnlineOctober2016inHans.http://www.hanspub.org/journal/csahttp://dx.doi.org/10.12677/csa.2016.610076MinimalDecisionTreeGenerationforMulti-LabelDecisionTablesYingQiao,MeilingXu,FarongZhong,JingZeng,YuchangMoZhejiangNorma
2、lUniversity,JinhuaZhejiangthrdthReceived:Oct.5,2016;accepted:Oct.23,2016;published:Oct.28,2016Copyright©2016byauthorsandHansPublishersInc.ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY).http://creativecommons.org/licenses/by/4.0/OpenAccessAbstractDecisi
3、ontreeisawidelyusedclassificationindatamining.Itcandiscovertheessentialknowledgefromthecommondecisiontables(eachrowhasadecision).However,itisdifficulttododataminingfromthemulti-labeldecisiontables(eachrowhasasetofdecisions).Inamulti-labeldeci-siontables,eachrowcontainsseveraldecision
4、s,andseveraldecisionattributesarerepresentedusingaset.Bytestingtheexistingheuristicalgorithms,suchasgreedyalgorithms,theirperfor-manceisnotstable,i.e.,thesizeofthedecisiontreemightbecomeverylarge.Inthispaper,weproposeadynamicprogrammingalgorithmtominimizethesizeofthedecisiontreesfora
5、multi-labeldecisiontable.Inouralgorithm,themulti-labeldecisiontableisdividedintoseveralsub-tables,andthedecisiontreeisconstructedbyusingallsubtablesofthemulti-labeldecisiontable,thenusefulinformationcanbediscoveredfromthemulti-labeldecisiontables.KeywordsMulti-LabelDecisionTables,Dec
6、isionTrees,DynamicProgrammingAlgorithm多值决策表的最小决策树生成乔莹,许美玲,钟发荣,曾静,莫毓昌浙江师范大学,浙江金华收稿日期:2016年10月5日;录用日期:2016年10月23日;发布日期:2016年10月28日文章引用:乔莹,许美玲,钟发荣,曾静,莫毓昌.多值决策表的最小决策树生成[J].计算机科学与应用,2016,6(10):617-628.http://dx.doi.org/10.12677/csa.2016.610076乔莹等摘要决策树技术在数据挖掘的分类领域应用极其广泛,可以从普通决策表(每行记录包含一个决策
7、值)中挖掘有价值的信息,但是要从多值决策表(每行记录包含多个决策值)中挖掘潜在的信息则比较困难。多值决策表中每行记录包含多个决策值,多个决策属性用一个集合表示。针对已有的启发式算法,如贪心算法,由于性能不稳定的特点,该算法获得的决策树规模变化较大,本文基于动态规划的思想,提出了使决策树规模最小化的算法。该算法将多值决策表分解为多个子表,通过多值决策表的子表进行构造最小决策树,进而对多值决策表进行数据挖掘。关键词多值决策表,决策树,动态规划算法1.引言多值决策表每行记录的多个决策被标记为一个决策集,在现实生活中这样的表很常见,因为没有足够多的属性值去标记单独的行,
8、因此就有条件属性值相同而