数据挖掘在高校学生学习成绩分析中的应用

数据挖掘在高校学生学习成绩分析中的应用

ID:23390427

大小:106.00 KB

页数:5页

时间:2018-11-07

数据挖掘在高校学生学习成绩分析中的应用_第1页
数据挖掘在高校学生学习成绩分析中的应用_第2页
数据挖掘在高校学生学习成绩分析中的应用_第3页
数据挖掘在高校学生学习成绩分析中的应用_第4页
数据挖掘在高校学生学习成绩分析中的应用_第5页
资源描述:

《数据挖掘在高校学生学习成绩分析中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘在高校学生学习成绩分析中的应用  摘要:在高校教务管理工作中,对学生的成绩进行管理分析是基础与核心。通过对学生成绩的分析,得出学生实际学习状况与教师的教学情况,反映高校的教学质量。近年来,教育事业不断改革与发展,学生人数逐年增多,每年高校都将学生的信息进行存放,而这些信息一般只用于核对与备案,造成严重的信息浪费。利用数据挖掘技术,对学生的成绩进行挖掘分析,进而得到潜在影响学生成绩的因素,并以其指导高校管理工作,指导教师教学工作,意义重大。本文针对数据挖掘在高校学生学习成绩分析中的应用进行了探究,旨在提高高校教学质量。  关键词:数据挖掘成绩分析教务管理工作  在我国高校的教务

2、管理中,采用的基本都是基于数据库的系统软件。教务软件中存有大量的学生数据,但一直没有发挥数据的作用,可利用数据挖掘技术,从中挖掘出隐藏的重要信息,用以指导教学工作。随着数据挖掘技术的成熟,应用的范围不断扩大,越来越多的高校采用数据挖掘技术指导教务的管理工作,为教学工作提供参考。  一、数据挖掘技术涵义  (一)数据挖掘的概念5  数据挖掘是一种数据处理技术,一般是指在大量数据中,通过算法发现数据中隐藏信息的过程,从属于数据库的知识发现。数据库利用统计、情报检索、专家系统、在线分析处理、机器学习等方法与工具,对繁杂的数据进行分析、归纳与总结,通过搜索数据的内部信息,为高校的教务管理提供

3、决策依据。  (二)数据挖掘的过程  数据挖掘过程是一个需要循环往复的过程,要做到精益求精,如果经过一次的数据挖掘没有得到有效的信息,就要重新进行数据的选择和处理,直到得出对我们有用的信息为止。一般情况下数据挖掘分为五个阶段:一是了解数据挖掘的概念,明确其目的;二是做好数据挖掘的准备工作;三是数据挖掘有很多种方法,依据实际情况选择合适的算法,对要处理的数据进行数据挖掘;四是对数据挖掘得出的信息进行分析,给予用户能够接受的知识;五是将通过数据挖掘得到的信息运用到对应的领域中,发挥数据挖掘的指导与参考作用。  (三)数据挖掘常用的方法  聚类分析法、统计分析法、模糊集方法、关联规则方法、

4、神经网络方法、决策树方法、覆盖正例排斥反例法、粗集理论方法等。  二、成绩分析中应用数据挖掘的方法  (一)关联规则算法  1.应用关联规则算法的内容。关联规则的算法是指在大量的待处理数据中找到各事物之间的联系,是数据挖掘中的重要课题。关联是指在两个事物或者两个以上事物之间必然存在着某些规律性,运用关联规则就是要获取数据之间隐藏的重要信息。在成绩分析中运用关联规则,查找影响成绩的因素,针对试卷得分情况,对学生的成绩进行总结,分析得分情况与课程之间的相关性。5  2.运用关联规则算法的挖掘过程。一是对数据库中的内容进行分析与识别,在进行数据挖掘之前,首先要定义最小的支持度,在最小支持度

5、的基础上进行原始数据的挖掘,得到的项集应不小于最小支持度;二是产生强关联规则,利用频繁项集产生规则,得到的规则的置信度与最小置信度相比,要比最小置信度大或者与最小置信度相等。  3.关联规则的具体应用,下表为应用关联规则中某专业成绩不及格的挖掘规则。  依据上表得出如果最小的支持度为0.55,最小的置信度为0.35,那么1、2、4、5就为强关联规则,在课程1不及格时,课程3与6不及格的概率就会高,这就说明课程一影响课程3与课程6;课程4也受到课程2的较大影响;课程2受到课程5的影响。  4.Apriori算法的数据挖掘。Apriori算法是一种频繁项集算法,用来发掘相关规则。Apri

6、ori算法应用的非常广泛,核心思想是在候选集生成与情节向下的封闭检测的阶段下,进行频繁项集的挖掘。具体内容包括:一是依据数据挖掘的要求,建立相应的事物数据表,对于优秀成绩进行保留,其他的做删除处理;二是建立频繁项集数据表,用A、B表示项目名称并做相应的记录;三是删除表中支持度的计数小于最小的支持度记录,从而得到最终的频繁1项集;四是计算后几个频繁项目集的结果;五是删除最终的频繁项集中比最小的置信度阈值小的记录,进而得到最终的规则信息。  关联规则数据见下表:5  通过置信度的计算,删除小于最小置信度阈值的记录,得到最终的关联规则,见下表。  (二)决策树算法  应用决策树算法是将预测

7、的内容用树的模型表现出来,树的根节点作为数据的结合空间,树的分支表现每一个分类问题,作为单一的属性测试存在,树的叶子节点是数据分割的分类,从根节点到叶子节点的路径就是相应的类别预测。  应用决策树算法要收集学生的基本个人资料、学生出勤情况,以及对课程的喜爱程度、上机练习情况与基础程度等,再结合学生的成绩进行分析,得到的数据用来指导教学工作,以提高教学质量。  高校中影响学生成绩的因素的决策树如下图:  依据决策树得到:上机情况最为影响学生的成绩,造成学生低

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。