基于变精度粗糙集的决策树分类算法研究.pdf

基于变精度粗糙集的决策树分类算法研究.pdf

ID:57744672

大小:2.50 MB

页数:76页

时间:2020-03-27

基于变精度粗糙集的决策树分类算法研究.pdf_第1页
基于变精度粗糙集的决策树分类算法研究.pdf_第2页
基于变精度粗糙集的决策树分类算法研究.pdf_第3页
基于变精度粗糙集的决策树分类算法研究.pdf_第4页
基于变精度粗糙集的决策树分类算法研究.pdf_第5页
资源描述:

《基于变精度粗糙集的决策树分类算法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、分类号UDC密级——单位代码!Q!§!基于变精度粗糙集的决策树分类算法研究颜文娟指导教师刘智职称副教授学位授予单位大连海事大学申请学位级别工学硕士学科(专业)计算机科学与技术论文完成日期2011.06答辩日期2011.07答辩委员会主席ResearchonClassificationAlgorithmofDecisionTreeBasedonVariablePrecisionRoughSetAthesisSubmittedtoDalianMaritimeUniversityInpartialfulfillmentofthe

2、requirementsforthedegreeofMasterofDegreebyYanWenjuan(ComputerScienceandTechnology)ThesisSu[PfessorLiuZhilleslsSupervlsor:rotessOrlULlllrJuly2011大连海事大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果,撰写成博/硕士学位论文:基王变糙廑狃蕉篡数迭筮挝筮耋篡法婴塞:.。除论文中已经注明引用的内容外,对论文的研究做出重要贡

3、献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公开发表或未公开发表的成果。本声明的法律责任由本人承担。学位论文作者签名:一学位论文版权使用授权书本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学位论文的规定,即:大连海事大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。同意将本学位论文收录到《中国优

4、秀博硕士学位论文全文数据库》(中国学术期刊(光盘版)电子杂志社)、《中国学位论文全文数据库》(中国科学技术信息研究所)等数据库中,并以电子出版物形式出版发行和提供信息服务。保密的论文在解密后遵守此规定。本学位论文属于:保密口在——年解密后适用本授权书。不保密口(请在以上方框内打“√")导师签名2叼场加I(年7月中文摘要摘要数据挖掘自上世纪80年代后期出现以来,经过二十多年的发展,现在已成为机器学习和人工智能这两大热门领域的重要研究内容。特征属性提取、冗余属性约简、分类精度和算法效率的提高以及相关算法针对某特定领域或背景的改

5、进和应用都是目前数据挖掘的研究重点。在数据挖掘的所有方法中,决策树分类算法以其计算量小、容易理解、运行结果直观易懂等优点,受到众多学者关注。所以,本文通过对相关领域现有算法的深入研究,针对属性约简和决策树分类存在的不足,做出相应的改进,并选择多个UCI数据集做对比实验,取得不错的效果。具体来说,主要研究内容包括以下三个方面:(1)在进行属性约简时,现有算法所采用的重要属性选择标准倾向于选择取值个数较多的属性,而没有考虑属性取值的有效性。因此,本文提出了一种新的重要属性选择标准,该标准使用了支持度对属性的有效取值进行统计,并

6、将有效取值个数和13逼近精度综合作为衡量属性重要性的标准。(2)本文针对现有决策树分类算法存在的对噪声数据敏感和分裂属性选择困难等不足,结合变精度粗糙集能够容忍噪声数据的优点,提出了一种新的分裂属性选择标准,该标准从变精度明确区和信息论的角度进行综合考虑,使得改进算法构造的决策树既能有效抵抗噪声数据又具有较高的正确分类率。另外,通过引入置信度和支持度的概念实现在决策树构建过程中的预剪枝,可以有效降低树的规模;将匹配度应用到对测试数据的类标号预测中,提高分类精度。(3)将经过属性提取、数据预处理等步骤的冠心病中医诊疗病例作为

7、实验数据。首先进行属性约简,挖掘出对冠心病有影响的因素;然后使用约简后的数据构建决策树,提取决策规则,实现对冠心病病例样本的中医症型分类。关键词:变精度粗糙集;属性约简;决策树;冠心病英文摘要ABSTRACTAfter觚呻yearsofdevdopment,datamininghasbecomeakeyresearchtopicinareasofmachinelearningandartificialintelligencesinceitfirstappearedinthelate80s.Atpresent,feature

8、extraction,attributereduction,improvementofalgorithmefficiencyandclassificationaccuracyandapplicationofrelevantmethodsinthespecificareasarethefocusofdat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。