探析决策树id3算法的改进和应用研究

探析决策树id3算法的改进和应用研究

ID:34804097

大小:8.72 MB

页数:78页

时间:2019-03-11

探析决策树id3算法的改进和应用研究_第1页
探析决策树id3算法的改进和应用研究_第2页
探析决策树id3算法的改进和应用研究_第3页
探析决策树id3算法的改进和应用研究_第4页
探析决策树id3算法的改进和应用研究_第5页
资源描述:

《探析决策树id3算法的改进和应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、桂林工学院硕士学位论文决策树ID3算法的改进和应用研究姓名:辛立章申请学位级别:硕士专业:计算机应用技术指导教师:陈春香20080401桂林工学院硕士学位论文摘要近年来我国高等院校的学生就业问题不断突现,原因不仅包括经济改革、高等院校扩招、教育资源紧缺、就业模式不健全等,还包括高等教育模式不适应社会要求、学生就业期望值偏高、高校对学生的就业指导偏重于书本和经验,缺少科学的就业指导等重要因素。除了深化高等教育改革、改进高校学生培养模式外,对学生进行科学合理的就业指导已刻不容缓。本文通过数据挖掘技术,发现学生的教育属性和就业属性之间的关联性,建立毕业生就业指导决

2、策支持系统,提高对毕业生就业指导的实效性,实现毕业生更快更好的就业。决策树方法是数据挖掘的重要方法,通常用来形成分类器和预测模型。决策树方法包含多种不同的算法,其中ID3算法是决策树方法的典型代表,是决策树生成最常用的具体实现方法。但是,目前的ID3算法存在着偏向于选择属性取值较多的属性,可能导致从数据集中归纳出错误的规则,使决策树的性能下降。因此,本文提出了一种避免多值偏向问题的ID3改进算法一一BetterTree算法,弥补了ID3算法选择测试属性时偏向取值较多的不足。在通过掌握实际的学生信息基础上,测试了该方法的有效性,并建立了一个基于关联规则的就业指

3、导决策支持系统。本文的就业指导系统由两部分构成,数据库处理和数据挖掘算法执行。数据库处理包括数据的读取、查询、统计、更新以及前台的简单系统界面等,采用SQLServer2000。数据挖掘算法执行就是采用我们改进后的BetterTree算法,将实际学生就业数据作为输入处理,得出很多有意义的信息,这些知识在帮助高等院校更好的对学生进行就业指导,提高学生就业率和就业质量具有重要的现实意义。关键词:数据挖掘;决策树;ID3算法;就业指导桂林工学院硕士学位论文AbstractTheemploymentofhighereducationinstitutionbecome

4、smoreandmoreseriousinrecentyears.ThereasonsforthatiSnotonlyincludingeconomicreform,increasingenrollment,thescarcityofeducationresources,inadequateemploymentpatterns,butalsounsuitedtothedemandsofhighereducationmodel,highexpectationsofstudentsemployment,studentemploymentguidanceempha

5、sizesonbooksandexperience,thelackofscientificandemploymentguidanceandSOon.Inadditiontodeepenthereformofhighereducation,improvetheefficienttrainingmodelforstudents,thestudent’Sscientificandreasonableemploymentguidancebrooksnodelay.Thispaperfindsthelinkagesbetweentheeducationattribut

6、esandemploymentattributesthroughdataminingtechnology,setupthegraduatedemploymentguidingdecisionsupportsystem,enhancetheeffectivenessofemploymentguidanceandachievefasterandbetterjobsforstudents.Dataminingdecisiontreemethodisanimportantmethodthatisusuallyusedtoclassifierandprediction

7、models.Decisiontreemethodincludesawidevarietyofalgorithms,whichID3algorithmisatypicalrepresentativeandthemostcommonlyusedmethodsofdecisiontree.However,theexistingID3algorithmthereisabiasinthechoiceofhighattributevaluesofproperties,whichmayleadtothedatasummarizedfromthewrongrulesand

8、declinetheperformanceofthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。