欢迎来到天天文库
浏览记录
ID:34391957
大小:1.96 MB
页数:51页
时间:2019-03-05
《改进c4.5决策树算法的研究及在高考成绩预测的分析中应用论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广西大学硕士学位论文改进的C4.5决策树算法研究及在高考成绩预测分析中的应用姓名:周琦申请学位级别:硕士专业:计算机技术指导教师:顾平201204改进的C4.5决策树算法研究及在高考成绩预测分析中的应用摘要近年来,数据挖掘引起了信息产业界和整个社会的极大关注,其主要原因是存在可以广泛使用的大量数据,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,如市场分析、顾客保有、科学探索等。其中数据分类是数据挖掘领域研究的重要课题。目前用于分类的方法有很多种,其中决策树分类方法以其算法理论清晰、易被理解
2、以及容易转换成分类规则等优点被广泛研究与应用。本文以“学生成绩管理系统’’为研究背景,目的是研究如何将数据挖掘技术与现有的数据库系统相结合,从大量的数据中提取出隐藏在数据之中的有用信息,为学校的管理者提供综合分析。通过对数据挖掘基本原理、基本算法的研究开发了基于决策树算法的高考成绩预测分析模块。以改进的决策树C4.5算法为基础,根据学生成绩数据库中的信息建立一个决策树成绩预测模型,对学生高考成绩进行综合分析预测。通过对几种典型的决策树算法进行分析比较,本文提出了改进的C4.5算法。该算法是将高等数学中的一些原理与C4.5算法相
3、结合,对算法中的信息熵及分裂信息量公式进行化简,以达到提高算法运行效率的目的。最后利用程序分别实现改进前后的C4.5算法并进行对比实验,经过理论分析和实验结果表明,改进后的C4.5算法提高了决策树的构建速度,减少了算法的运行时间。本文提出的改进算法改善了原始决策树C4.5算法的性能,表现出了良好的分类效果。关键词:决策树改进的C4.5算法信息增益率信息熵高考成绩预测STUDYONTHEIMPROVEDC4.5DECISIONTREEALGORITHMANDITSAPPLICArrIoNoNTHESTUDENTPERFoRMAN
4、CESPREDICTIONABSTRACTInrecentyears,datamininghascausedtheinformationindustryandthegreatattentionofthesociety,themainreasonisthepresenceoflargeamountsofdatacarlbewidelyused,andisinurgentneedofthesedataintousefulinformationandknowledge.AccesstoinformationandknowledgeC
5、allbewidelyusedinV撕OUSapplications,suchasmarketanalysis,customerretention,scientificresearch,etc.Inthisprocess,thedataclassificationisanimportanttopicondatamining.Currentlytherearenumbersofdataclassificationmethods;thedecisiontreemethod,duetoitsclarityontheory,easil
6、ytounderstandandtransfertoclassification—rules,iswidelybestudiedandapplied.Inthisarticle,wepresenta“studentperformancemanagement'’system;westudiedhowtoapplythedataminingtechnologyonourrecentlyavailabledatabasesystem,abstracttheusefulinformationthathidingamongthehuge
7、data,andprovidetheschoolmanagersacompleteanalysis.Basedon01.11"studiedondatamining,wedevelopedamoduleforstudentperformanceprediction;inthismodule,thewithimprovedC4.5algorithm,wedevelopedadecisiontree01"1thestudentperformancedatabase,andpredictedthestudentscoresforth
8、ecollegeentranceexan'1.Byanalyzingseveraltypicaldecisiontreealgorithmanalysisandcomparison,inthisarticleputsforwardanimprovedC4.5algorithm
此文档下载收益归作者所有