欢迎来到天天文库
浏览记录
ID:24070225
大小:51.00 KB
页数:4页
时间:2018-11-12
《决策树算法在高职院校成绩分析中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、决策树算法在高职院校成绩分析中的应用研究摘要:高职院校的学生的成绩是一项重要的数据,它不仅是对学生学习情况的评价,也是对教师教学质量的检查。本文研究了使用决策树算法对学生的成绩进行挖掘分析,分析学生的毕业设计成绩与基础类课程、专业类课程以及专项实践类课程之间隐藏的内在联系,指导教师在今后的教学中加强学生实践操作能力的训练,进而提高教学质量。关键词:决策树;ID3算法;数据挖掘;学生成绩分析1.引言高职院校在多年的教学和管理工作中,积累了大量的教学管理数据,这些数据中蕴含了很多有价值的信息。如果利用数据挖掘
2、技术对学院教务管理系统中教师和学生的数据进行挖掘,可以使教师更好的把握学生、把握教学过程,实现教学过程动态化管理,为学校合理设置课程、优化教育资源配置、提高教学质量提供可靠的数据依据,同时对提高学校教学和管理水平也有一定的帮助。[1]数据挖掘(DataMining),即数据库中的知识发现,就是对庞大的数据集或数据库进行分析,挖掘出隐含的、未知的、用户可能感兴趣的和对决策有潜在价值的知识和规则,可以为用户提供决策的依据[2]。决策树算法是数据挖掘的核心算法之一,决策树方法以树型结构表达最终分类结果的,也能生
3、成If-Then形式的规则,便于使用者理解。在教务管理系统中,学生的成绩是一项重要的数据,它不仅是对学生学习情况的评价,也是对教师教学质量的检查。本文中研究使用决策树算法对学生的成绩进行挖掘分析,全面地分析学生的毕业设计成绩与实践类课程、专业类及基础类课程中隐藏的内在联系,体现出学生课程之间有一定的相互关联关系,可以及时指导教师在以后的教学工作中采取恰当的方法,加强学生实践操作能力的训练,指导学生进行专业、基础类课程的学习,提高教学质量。2.决策树算法2.1决策树算法基本概念决策树是一种常用的、直观的分类
4、归纳算法。决策树是一种类似流程图的树状结构,根据层次的不同,结点分为根结点、内部结点和叶结点三种类型。[3]每个结点对应一个样本集,树的最高层结点就是根结点,对应整个样本集,内部结点对应一个类标志。根结点和内部结点都包含一个对样本属性的测试,根据测试的结果将样本集划分为两个或多个子集,每个子集生成一个分支,分支用测试属性值来标识。叶结点包含一个类标志,表示对应样本集的类别。决策树的中间结点通常用矩形表示;而叶子结点常用椭圆表示。决策树的构造包括两个步骤,一是生成决策树,二是进行剪枝。决策树的生成是从一个根
5、结点开始,从下到下的递归过程,通过不断地将训练样本分割成子集来构造决策树,从根结点开始对该样本的属性进行测试,根据测试结果确定下一个结点,直至到达叶结点为止。决策树的剪枝是对树结构进行修剪,删除多余分支的过程,得到一棵最小期望错误率的决策树。2.2ID3算法ID3算法是决策树学习算法中最有影响力、使用最广泛的一种决策树算法。ID3的基本思想是自顶向下递归地使用搜索训练样本集,是一种典型的贪心算法,在决策树的每个结点处测试每一个属性,用信息增益作为属性的选择标准,选择信息增益最大的属性作为决策树结点,从而构
6、建决策树。[4]在算法中,在决策树结点属性的选择上使用信息论中熵(Entropy)的概念来完成。2.2.1信息熵信息熵是各自信息量的期望,用信息熵可以用来度量整个信息源X整体的不确性。设样本数据集为X,n是信号源所有可能的符号数,ai是可能取到的值,P(ai)是取值为ai的概率。其信息熵如下:2.2.3平均信息增益信息增益表示两个信息量之间的差值,在进行分类属性的选择时,应该选择最大的信息增益作为分类属性。信息增益如下:Gain(XY)=H(X)-H(XY)3.决策树算法在教学质量分析中的应用学生的毕业设
7、计通常是学生对三年来所学的各种基础素养类课程、专业类课程、专项实践类课程的综合掌握,是体现一个学生的综合素质的重要依据,也是教师培养学生的教学质量的重要体现。因此,通过对学生的毕业设计和各种基础课、专业课及专业实践课的考试成绩的挖掘,分析出其中的关系,为今后教师调整教学方案提供依据。决策树算法对学生成绩进行分析,是将决策树的相关算法应用于学生成绩挖掘,对大量的考试成绩数据进行分析,从而更好的分析和预测成绩数据。[5]其主要过程如下:3.1数据收集数据收集阶段主要工作是从教务管理系统中收集与挖掘相关的学生成
8、绩数据,并进行简单的统计分析,检查这些学生成绩数据是否完整。在进行数据挖掘之前,主要收集了我院2008级软件技术专业0801班42名学生不同学期的课程成绩作为原始数据,一共选择了9门课程。学生成绩表的主要内容包括学号及各门课程成绩。进行分类整理后,得到学生成绩数据表。学号计算机X络基础C语言程序设计].北京:科学出版社.2006.[4]廖芹,郝志峰,陈志宏.数据挖掘与数学建模[M].北京:国防工业出版社.2010.[5]邢晓宇
此文档下载收益归作者所有