欢迎来到天天文库
浏览记录
ID:33301278
大小:1.32 MB
页数:39页
时间:2019-02-23
《一种模糊决策树中样例挑选算法的研究及其理论分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、河北大学硕士学位论文一种模糊决策树中样例挑选算法的研究及其理论分析姓名:闫建辉申请学位级别:硕士专业:计算机应用技术指导教师:王熙照20070601摘要!iIIImIiIII!!!曼曼!!皇詈!暑!!!!!!!!!!!曼曼要一般学习算法使用全体训练样例去构造分类器,全体训练样例中往往包含噪音数据,冗余数据。但足有的算法对噪音数据特别敏感,有的算法对于大数据集效率特别低。样例挑选算法是依照某种原则从原始数据集中挑出有用的、具有代表性的样例予集,用这个子集中的样例训练出来的分类器的性能并不低于用全体样例训练得到的分类器。机器学习中的数据集的冗余数据和噪
2、声数据会影响分类器的泛化能力和训练速度,而样例挑选算法具有压缩冗余和排除噪声的能力,对于提高分类器的泛化能力和提高训练速度有一定的意义。以往的增量决策树归纳中的样例顺序都是给定的,本文研究了一利-在增量模糊决策树中的样例挑选方法,使得增量归纳过程的样例不再是数据集给定的顺序,用于生成最终决策树的样例也不再是数据集·1,的全体样例。该方法每次都选取当前决策树最不能确定其分类的样例增量加入决策树。本文给出了该方法的详细描述,并对该方法进行了较深入的理论分析。关键词样例挑选;模糊决策树;样例测试;信息熵;冗余数据;泛化能力AbstractAbstract
3、Insampleselectionalgorithm,suedandrepresentativeinstanceswhicharepickedoutfromoriginaldatasetaccordingsomestrategyareconsistedasubset.Theclassifiertrainedbythesubsetcanachievenolowergeneralizationcapabilitythantheclassifiertrainedbytheoriginaldataset.Thegeneralizationcapabilit
4、yofclassifierswillprobablybedegeneratedwhenitisbuiltbyadatasetwithredundancyandnoisedata.Sampleselectionalgorithmisabletocompressredundancyandfilternoise.Theorderofinstancesisgivenintheincrementalinductionofdecisiontrees.Inthispaper,proposedsampleselectionmethodwhichisbasedoni
5、ncrementalinductionoffuzzydecisiontree.Thentheorderofinstancesisnotthesamewiththedatasetandtheinstanceswhichareusedtotraindecisiontreearenotalltheinstancesoftheoriginaldataset.Themethodselectssuchinstanceswhichthecurrentdecisiontreecannotdecideitsclasstoaddtodecisiontreeincrem
6、entally.Thedetailofalgorithmanditstheoreticalanalysesisgiveninthispaper.Keywords:Sampleselection;Fuzzydecisiontree;Sampletest;Informationentropy;Redundancydata;Generalizationcapability.河北大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰
7、写的研究成果,也不包含为获得河北大学或其他教育机构的学位或证二B所使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了致谢。作者签名:!虱重鉴塾吼4年上月上同学位论文使用授权声明本人完全了解河北大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。学校可以公嘶i论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。本学位沦文属于1、保密口,在——年——月——同解密后适用本授权声明。2、不保密牺。(请在以上相应方格内打“√”)作者签名:i翌
8、建盏塾导师签名:Et期:羔L年』月上闩期:丑年jL月上闩醐:丝扯年』月上R第1章绪论1.1研究背景第1章绪论学习足人类获得
此文档下载收益归作者所有