欢迎来到天天文库
浏览记录
ID:35061491
大小:3.15 MB
页数:75页
时间:2019-03-17
《基于决策树的教学信息挖掘系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、;10183分类号:TP311单位代码研究生学号;201353W180密级:公开參古林大学硕古学位论文专化聲化()基于决策树的教学信息挖掘系统的研究与实现ResearchandImplementationofTeachingInformationMiningSstemBasedonDecisionTreey作者姓名:何化类别:工程硕±领域(方向):软件工程指导教师:冯铁副教授培养单位:软件学驗2016年6月未经本论文作者的书面授权,依法收存和保管本论文书面
2、版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担侵权的法律责任。吉林大学硕±学位论文原创性声明本人郑重声明:所呈交的硕古学位论文,是本人在指导教师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中W明确方式标明。本人完全意识到本声明的法律结果由本人承担。巧 ̄
3、/学位论文作者签名:个[1日期:2016年5月29日基于决策树的教学信息挖掘系统的研究与实现ResearchandImplementationofTeachingInformationMiningSystemBasedonDecisionTree作者姓名:何江领域(方向):软件工程指导教师:冯铁副教授类别:工程硕士答辩日期:2016年5月29日摘要基于决策树的教学信息挖掘系统的研究与实现在社会进入信息时代的今天,信息技术已经成为生活中不可缺少的一部分。而随着信息技术运用的深入和广泛普及,产生了大量需要存储和再利用的数据,这就引出了一个
4、崭新的“大数据时代”。面对如此巨大的数据,就出现了数据挖掘技术,该技术就是为了找到数据与数据之间的联系和数据内部隐藏的秘密。在我国数据挖掘起步较晚但进步较快,一些大企业、高科技企业已经做了比较深入的研究和初步的商业运用,取得了许多成绩。在大数据和数据挖掘背景下,义务教育阶段的中小学等初级教育单位应对却有些滞后,每年的大量投入还是花在硬件装备的更新上,很少会去分析数据更不要说数据挖掘。而现代学校要想发展,就必须要有新技术的变革,靠传统的教育模式已经落后,而数据挖掘技术的出现正可以为现代教育变革的强大引擎。首先,本文从大数据的产生背景和数据挖掘技术
5、发展历程入手,通过对数据挖掘技术的ID3、C4.5、CART三种常用算法的工作原理的研究及其优缺点的比较分析,论证了该技术在教学信息系统中应用的可行性。根据所在学校的现状,完全可以运用数据挖掘技术来推进学校的办学质量。其次,分析了学校的数据特点,一般数据量不会太大,特征值也不会太多的情况,结合数据挖掘技术,抽取少量样本数据对ID3、C4.5进行比较,在生成效果差不多的情况下,决定采用相对复杂度不高的ID3算法来构建学校的决策树模型。但是ID3算法本身也存在缺点:它通过信息增益选择特征时,一般选出的都是属性值多的特征作为分割特征,但这些特征不一定
6、就是最好的选择;另外信息增益的计算太过于复杂,当样本量比较大时给计算带来不小的负担。针对这此问题本文对ID3算法进行了小的改进,设计了采用等价无穷小和用户兴趣度概念来简化计算公式和特征取值的偏向问题。通过实际样本测试改进后的新算法对比ID3算法实现了在选报特征值一样的情况下,信息增益的快速计算并且特征值选取也符合预期。I再次,针对学校特点采用B/s结构对系统进行设计,数据库mysql,编程语言python。系统分为登陆、数据输入、学生管理、班级管理、数据预处理、决策树生产模块。对各模块的功能和结构进行了详细的分析。最后,本文选择了2012年入学
7、的两个班学生三年的样本数据,抽取了学生入学情况、初一期末成绩、初二期末成绩、初三中考成绩、班级学生管理、教师配备初三中考、提优补差等特征进行数据的泛化处理,然后通过改进后的ID3算法得到决策树,通过计算过程的演示,可以看出这种改进算法提高了决策树的生成速度,避免了特征选择时选报偏向的问题。关键词:数据挖掘,ID3,决策树IIAbstractResearchandImplementationofTeachingInformationiningSystemBasedonDecisionTreeAttheinformationera,informat
8、iontechnologyhasbecomeanindispensablepartoflife.Withtheapplicationofinforma
此文档下载收益归作者所有