一种基于密度的改进决策树算法

一种基于密度的改进决策树算法

ID:35035837

大小:4.92 MB

页数:49页

时间:2019-03-16

一种基于密度的改进决策树算法_第1页
一种基于密度的改进决策树算法_第2页
一种基于密度的改进决策树算法_第3页
一种基于密度的改进决策树算法_第4页
一种基于密度的改进决策树算法_第5页
资源描述:

《一种基于密度的改进决策树算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、乂至鍵?^义葦DALIANUNIVERSTYOFTECHNOLOGYII福损±享恆巧又MASTERALDISSERTATION幽-种基于密度的改进决策树算法工程领域趕M主霉曹遵重作者姓名指导教师______站唾畫_举趕266与答辩日期_与1鱼_ii硕:t学位论文-种基于密度的改进决策树算法Animroveddecision化eealgorithmbasedondensitpy作者姓名:曹博宇

2、学科、专业:控制工程学号:31409037指导教师:刘晓东完成日期;2016年06月06日乂連巧义丈緣DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体己经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果一。与我同工作的同志对本研究所做

3、的贡献均己在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。一学位论文题目:种基于密度的改进决策树算法7^61年6月谷曰作者签名:营傳窜日期:大连理王大学硕±学位论文摘要分类问题是机器学习领域的重要研究内容,分类是指对己知类别的数据集进行高度抽象,,提取规则,构建预测模型从而使用该模型对未知类别的样本数据进行归类。决策树是各种分类算法中最常见的算法,它相对于其他算法模式简单、分类速度快、准确率高,且,具有更强的可解释性

4、生成的规则可用语意表示。然而实际数据集中常常伴随着噪声或者孤立点,这会使决策树出现只包含极少量样本的叶子节点,产生不必一要的分支,进而使决策树规模变大。针对这问题,本文提出了基于密度的决策树构建一思想,即在决策树的构建过程中将划分区域内的样本密度作为个衡量标准,使生成的一决策树中不存在或者仅少量存在上述不必要分支,精简了决策树规模,同时在定程度上避免了过拟合现象,本文将基于密度的构建思想推广到了,提高了预测精度。同时RandomForest、B巧ging和AdaBoost为

5、代表的集成算法中,这;种算法虽然相较于单个决策树己经可W表现出较强的分类能力,但是同样面临基分类器在训练结果中存在不必要分支的问题,而基于密度的集成学习算法则表现出了更强的分类能力,可レッ明显缩小建树规模,提高分类准确性。I本文在多组UC数据集上进行了多次实验,将本文方法与传统方法在树的平均节点个数和分类准确性上进行了对比。实验表明,本文方法可普遍减小决策树节点个数,同时降低过拟合程度,提高预测准确性,使得由本文方法构建的分类器具有更佳的分类,,泛化能力强性能,而且结构

6、简单语文明了。关键词:决策树;集成算法;密度;过拟合--1一种基于密度的改进决策树算法AnimproveddecisiontreealgorithmbasedondensityAbstractClassificationisahottopici打machinelearning.Itisahighlyabstracttothedatasetwi化inknowncateoriesfurtherextractinrules

7、andbuildinredictivemodelsoastog,ggp,cssteunabeededatantosecccateoreslaifyhllsamlipifii.pgDecisiontreeisthemostcommonclassi打cationalorithm.Comaredtotheothergpa.Florithmsdecisio打treeisra化ersimleandfastwi化hihacc

8、uracurthermore化erulesg,pgy,CO打struc.l:edbydecisiontreecanexpressmoresemanticmeaningthusbein化rpretableCo打sideringthatthedataseti打practicalalwasCO打tai打snoiseorisolatedoints,therewillypalwaysbesomeleaf打odeswith

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。