改进c4.5决策树算法的研究及在高考成绩预测的分析中应用论文

改进c4.5决策树算法的研究及在高考成绩预测的分析中应用论文

ID:34391957

大小:1.96 MB

页数:51页

时间:2019-03-05

改进c4.5决策树算法的研究及在高考成绩预测的分析中应用论文_第1页
改进c4.5决策树算法的研究及在高考成绩预测的分析中应用论文_第2页
改进c4.5决策树算法的研究及在高考成绩预测的分析中应用论文_第3页
改进c4.5决策树算法的研究及在高考成绩预测的分析中应用论文_第4页
改进c4.5决策树算法的研究及在高考成绩预测的分析中应用论文_第5页
资源描述:

《改进c4.5决策树算法的研究及在高考成绩预测的分析中应用论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广西大学硕士学位论文改进的C4.5决策树算法研究及在高考成绩预测分析中的应用姓名:周琦申请学位级别:硕士专业:计算机技术指导教师:顾平201204改进的C4.5决策树算法研究及在高考成绩预测分析中的应用摘要近年来,数据挖掘引起了信息产业界和整个社会的极大关注,其主要原因是存在可以广泛使用的大量数据,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,如市场分析、顾客保有、科学探索等。其中数据分类是数据挖掘领域研究的重要课题。目前用于分类的方法有很多种,其中决策树分类方法以其算法理论清晰、易被理解

2、以及容易转换成分类规则等优点被广泛研究与应用。本文以“学生成绩管理系统’’为研究背景,目的是研究如何将数据挖掘技术与现有的数据库系统相结合,从大量的数据中提取出隐藏在数据之中的有用信息,为学校的管理者提供综合分析。通过对数据挖掘基本原理、基本算法的研究开发了基于决策树算法的高考成绩预测分析模块。以改进的决策树C4.5算法为基础,根据学生成绩数据库中的信息建立一个决策树成绩预测模型,对学生高考成绩进行综合分析预测。通过对几种典型的决策树算法进行分析比较,本文提出了改进的C4.5算法。该算法是将高等数学中的一些原理与C4.5算法相

3、结合,对算法中的信息熵及分裂信息量公式进行化简,以达到提高算法运行效率的目的。最后利用程序分别实现改进前后的C4.5算法并进行对比实验,经过理论分析和实验结果表明,改进后的C4.5算法提高了决策树的构建速度,减少了算法的运行时间。本文提出的改进算法改善了原始决策树C4.5算法的性能,表现出了良好的分类效果。关键词:决策树改进的C4.5算法信息增益率信息熵高考成绩预测STUDYONTHEIMPROVEDC4.5DECISIONTREEALGORITHMANDITSAPPLICArrIoNoNTHESTUDENTPERFoRMAN

4、CESPREDICTIONABSTRACTInrecentyears,datamininghascausedtheinformationindustryandthegreatattentionofthesociety,themainreasonisthepresenceoflargeamountsofdatacarlbewidelyused,andisinurgentneedofthesedataintousefulinformationandknowledge.AccesstoinformationandknowledgeC

5、allbewidelyusedinV撕OUSapplications,suchasmarketanalysis,customerretention,scientificresearch,etc.Inthisprocess,thedataclassificationisanimportanttopicondatamining.Currentlytherearenumbersofdataclassificationmethods;thedecisiontreemethod,duetoitsclarityontheory,easil

6、ytounderstandandtransfertoclassification—rules,iswidelybestudiedandapplied.Inthisarticle,wepresenta“studentperformancemanagement'’system;westudiedhowtoapplythedataminingtechnologyonourrecentlyavailabledatabasesystem,abstracttheusefulinformationthathidingamongthehuge

7、data,andprovidetheschoolmanagersacompleteanalysis.Basedon01.11"studiedondatamining,wedevelopedamoduleforstudentperformanceprediction;inthismodule,thewithimprovedC4.5algorithm,wedevelopedadecisiontree01"1thestudentperformancedatabase,andpredictedthestudentscoresforth

8、ecollegeentranceexan'1.Byanalyzingseveraltypicaldecisiontreealgorithmanalysisandcomparison,inthisarticleputsforwardanimprovedC4.5algorithm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。