欢迎来到天天文库
浏览记录
ID:35035837
大小:4.92 MB
页数:49页
时间:2019-03-16
《一种基于密度的改进决策树算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、乂至鍵?^义葦DALIANUNIVERSTYOFTECHNOLOGYII福损±享恆巧又MASTERALDISSERTATION幽-种基于密度的改进决策树算法工程领域趕M主霉曹遵重作者姓名指导教师______站唾畫_举趕266与答辩日期_与1鱼_ii硕:t学位论文-种基于密度的改进决策树算法Animroveddecision化eealgorithmbasedondensitpy作者姓名:曹博宇
2、学科、专业:控制工程学号:31409037指导教师:刘晓东完成日期;2016年06月06日乂連巧义丈緣DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体己经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果一。与我同工作的同志对本研究所做
3、的贡献均己在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。一学位论文题目:种基于密度的改进决策树算法7^61年6月谷曰作者签名:营傳窜日期:大连理王大学硕±学位论文摘要分类问题是机器学习领域的重要研究内容,分类是指对己知类别的数据集进行高度抽象,,提取规则,构建预测模型从而使用该模型对未知类别的样本数据进行归类。决策树是各种分类算法中最常见的算法,它相对于其他算法模式简单、分类速度快、准确率高,且,具有更强的可解释性
4、生成的规则可用语意表示。然而实际数据集中常常伴随着噪声或者孤立点,这会使决策树出现只包含极少量样本的叶子节点,产生不必一要的分支,进而使决策树规模变大。针对这问题,本文提出了基于密度的决策树构建一思想,即在决策树的构建过程中将划分区域内的样本密度作为个衡量标准,使生成的一决策树中不存在或者仅少量存在上述不必要分支,精简了决策树规模,同时在定程度上避免了过拟合现象,本文将基于密度的构建思想推广到了,提高了预测精度。同时RandomForest、B巧ging和AdaBoost为
5、代表的集成算法中,这;种算法虽然相较于单个决策树己经可W表现出较强的分类能力,但是同样面临基分类器在训练结果中存在不必要分支的问题,而基于密度的集成学习算法则表现出了更强的分类能力,可レッ明显缩小建树规模,提高分类准确性。I本文在多组UC数据集上进行了多次实验,将本文方法与传统方法在树的平均节点个数和分类准确性上进行了对比。实验表明,本文方法可普遍减小决策树节点个数,同时降低过拟合程度,提高预测准确性,使得由本文方法构建的分类器具有更佳的分类,,泛化能力强性能,而且结构
6、简单语文明了。关键词:决策树;集成算法;密度;过拟合--1一种基于密度的改进决策树算法AnimproveddecisiontreealgorithmbasedondensityAbstractClassificationisahottopici打machinelearning.Itisahighlyabstracttothedatasetwi化inknowncateoriesfurtherextractinrules
7、andbuildinredictivemodelsoastog,ggp,cssteunabeededatantosecccateoreslaifyhllsamlipifii.pgDecisiontreeisthemostcommonclassi打cationalorithm.Comaredtotheothergpa.Florithmsdecisio打treeisra化ersimleandfastwi化hihacc
8、uracurthermore化erulesg,pgy,CO打struc.l:edbydecisiontreecanexpressmoresemanticmeaningthusbein化rpretableCo打sideringthatthedataseti打practicalalwasCO打tai打snoiseorisolatedoints,therewillypalwaysbesomeleaf打odeswith
此文档下载收益归作者所有