欢迎来到天天文库
浏览记录
ID:23390427
大小:106.00 KB
页数:5页
时间:2018-11-07
《数据挖掘在高校学生学习成绩分析中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据挖掘在高校学生学习成绩分析中的应用 摘要:在高校教务管理工作中,对学生的成绩进行管理分析是基础与核心。通过对学生成绩的分析,得出学生实际学习状况与教师的教学情况,反映高校的教学质量。近年来,教育事业不断改革与发展,学生人数逐年增多,每年高校都将学生的信息进行存放,而这些信息一般只用于核对与备案,造成严重的信息浪费。利用数据挖掘技术,对学生的成绩进行挖掘分析,进而得到潜在影响学生成绩的因素,并以其指导高校管理工作,指导教师教学工作,意义重大。本文针对数据挖掘在高校学生学习成绩分析中的应用进行了探究,旨在提高高校教学质量。 关键词:数据挖掘成绩分析教务管理工作 在我国高校的教务
2、管理中,采用的基本都是基于数据库的系统软件。教务软件中存有大量的学生数据,但一直没有发挥数据的作用,可利用数据挖掘技术,从中挖掘出隐藏的重要信息,用以指导教学工作。随着数据挖掘技术的成熟,应用的范围不断扩大,越来越多的高校采用数据挖掘技术指导教务的管理工作,为教学工作提供参考。 一、数据挖掘技术涵义 (一)数据挖掘的概念5 数据挖掘是一种数据处理技术,一般是指在大量数据中,通过算法发现数据中隐藏信息的过程,从属于数据库的知识发现。数据库利用统计、情报检索、专家系统、在线分析处理、机器学习等方法与工具,对繁杂的数据进行分析、归纳与总结,通过搜索数据的内部信息,为高校的教务管理提供
3、决策依据。 (二)数据挖掘的过程 数据挖掘过程是一个需要循环往复的过程,要做到精益求精,如果经过一次的数据挖掘没有得到有效的信息,就要重新进行数据的选择和处理,直到得出对我们有用的信息为止。一般情况下数据挖掘分为五个阶段:一是了解数据挖掘的概念,明确其目的;二是做好数据挖掘的准备工作;三是数据挖掘有很多种方法,依据实际情况选择合适的算法,对要处理的数据进行数据挖掘;四是对数据挖掘得出的信息进行分析,给予用户能够接受的知识;五是将通过数据挖掘得到的信息运用到对应的领域中,发挥数据挖掘的指导与参考作用。 (三)数据挖掘常用的方法 聚类分析法、统计分析法、模糊集方法、关联规则方法、
4、神经网络方法、决策树方法、覆盖正例排斥反例法、粗集理论方法等。 二、成绩分析中应用数据挖掘的方法 (一)关联规则算法 1.应用关联规则算法的内容。关联规则的算法是指在大量的待处理数据中找到各事物之间的联系,是数据挖掘中的重要课题。关联是指在两个事物或者两个以上事物之间必然存在着某些规律性,运用关联规则就是要获取数据之间隐藏的重要信息。在成绩分析中运用关联规则,查找影响成绩的因素,针对试卷得分情况,对学生的成绩进行总结,分析得分情况与课程之间的相关性。5 2.运用关联规则算法的挖掘过程。一是对数据库中的内容进行分析与识别,在进行数据挖掘之前,首先要定义最小的支持度,在最小支持度
5、的基础上进行原始数据的挖掘,得到的项集应不小于最小支持度;二是产生强关联规则,利用频繁项集产生规则,得到的规则的置信度与最小置信度相比,要比最小置信度大或者与最小置信度相等。 3.关联规则的具体应用,下表为应用关联规则中某专业成绩不及格的挖掘规则。 依据上表得出如果最小的支持度为0.55,最小的置信度为0.35,那么1、2、4、5就为强关联规则,在课程1不及格时,课程3与6不及格的概率就会高,这就说明课程一影响课程3与课程6;课程4也受到课程2的较大影响;课程2受到课程5的影响。 4.Apriori算法的数据挖掘。Apriori算法是一种频繁项集算法,用来发掘相关规则。Apri
6、ori算法应用的非常广泛,核心思想是在候选集生成与情节向下的封闭检测的阶段下,进行频繁项集的挖掘。具体内容包括:一是依据数据挖掘的要求,建立相应的事物数据表,对于优秀成绩进行保留,其他的做删除处理;二是建立频繁项集数据表,用A、B表示项目名称并做相应的记录;三是删除表中支持度的计数小于最小的支持度记录,从而得到最终的频繁1项集;四是计算后几个频繁项目集的结果;五是删除最终的频繁项集中比最小的置信度阈值小的记录,进而得到最终的规则信息。 关联规则数据见下表:5 通过置信度的计算,删除小于最小置信度阈值的记录,得到最终的关联规则,见下表。 (二)决策树算法 应用决策树算法是将预测
7、的内容用树的模型表现出来,树的根节点作为数据的结合空间,树的分支表现每一个分类问题,作为单一的属性测试存在,树的叶子节点是数据分割的分类,从根节点到叶子节点的路径就是相应的类别预测。 应用决策树算法要收集学生的基本个人资料、学生出勤情况,以及对课程的喜爱程度、上机练习情况与基础程度等,再结合学生的成绩进行分析,得到的数据用来指导教学工作,以提高教学质量。 高校中影响学生成绩的因素的决策树如下图: 依据决策树得到:上机情况最为影响学生的成绩,造成学生低
此文档下载收益归作者所有