决策树C45论文

决策树C45论文

ID:45580298

大小:222.54 KB

页数:29页

时间:2019-11-15

决策树C45论文_第1页
决策树C45论文_第2页
决策树C45论文_第3页
决策树C45论文_第4页
决策树C45论文_第5页
资源描述:

《决策树C45论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、摘要数据挖掘(DM)是当前涉及统计学、人工智能、数据库等学科的热门的研究领域,是从数据屮提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。分类是数拯挖掘的一个重要分支,分类能找岀描述数据类或概念的模型,以便能使用模型预测类标记未知的对彖类。最早的决策树算法是由Hunt等人于1966年提出的CLS。当而最有影响的决策树算法是Quinlan于1986年提出的ID3和1993年提出的C4.5。TD3只能处理离散型描述属性,它选择信息增益最大的属性划分训练样木,其目的是进行分枝时系统的爛最小,从而提高算法的运算速度和精确度。

2、ID3算法的主要缺陷是,用信息增益作为选择分枝屈性的标准时,偏向于取值较多的属性,而在某些情况下,这类属性可能不会提供太多有价值的信息。C4.5是TD3算法的改进算法,不仅口J以处理离散型描述属性,还能处理连续性描述属性。C4.5采用了信息增益比作为选择分枝属性的标准,弥补了ID3算法的不足。本文研究的是基于决策树的分类技术。运用了C4.5算法将一组数据进行分类并生成决策树,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。关键词:数据挖掘;分类技术;决策树;C4.5AbstractDatami

3、ning(DM)isrelevanttostatistics,artificialintelligence,databaseandotherdisciplineshotresearchfield,isextractedfromthedataofinterest,potential,theavailableknowledge,andunderstandableform.Classificationisanimportantbranchofdatamining,classificationcanfindtodescribethedat

4、atypeorconceptualmodel,soastousethemodeltopredicttheclasslabelunknownobjectclass.TheearliestdecisioakingalgorithmsisCLS-1966,byHuntetatThemostinfluentialdecisiontreealgorithmisID3proposedbyQuinlanin1986and1993,theC4.5.ID3canhandleonlyadiscretedescriptionofproperty,itc

5、hoosestheinformationtogainthegreatestattributedividedtrainingsamples,thepurposeiscarriedbranchingentropyofthesystem,therebyimprovingthecomputationalspeedandaccuracyofthealgorithm.ThemajordrawbackoftheID3algorithm,informationgainasthechoiceofbranchespropertiesofthestan

6、dard,biasedinfavorofthemorethevalueoftheproperty,andinsomecases,thesepropertiesmaynotprovidemuchvaluableinformation.C4.5istheID3algorithm,theimprovedalgorithmcanhandlenotonlythediscretedescriptionofproperty,canhandlecontinuousdescriptionoftheproperty.C4.5usesinformati

7、ongainratioasthestandardtoselectthebranchingproperty,tomakeupforthelackofID3algorithm.Ofthisstudyisbasedondecisiontreeclassificationtechniques.UseofasetofdataclassificationandgeneratesadecisiontreealgorithmC4.5,thefirstdataprocessing,theuseofrulesanddecisiontreeinduct

8、ionalgorithmtogeneratereadable,andthenusethedecision-makingtoanalyzethenewdata.Keywords:Datamining;classification;decisiontr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。