数据挖掘在学生成绩数据中应用探究

数据挖掘在学生成绩数据中应用探究

ID:6088964

大小:29.00 KB

页数:7页

时间:2018-01-02

数据挖掘在学生成绩数据中应用探究_第1页
数据挖掘在学生成绩数据中应用探究_第2页
数据挖掘在学生成绩数据中应用探究_第3页
数据挖掘在学生成绩数据中应用探究_第4页
数据挖掘在学生成绩数据中应用探究_第5页
资源描述:

《数据挖掘在学生成绩数据中应用探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘在学生成绩数据中应用探究  摘要:针对课程设置与课程成绩之间的关系,通过比较分析可以发现学生成绩背后所隐藏的有价值信息。通过对学生成绩数据的挖掘,可以发现隐藏其中的关联规则,得出有实际价值的规则及结论,从而为教学管理人员优化课程设置提供决策支持。关键词:数据挖掘;关联规则;学生成绩;Apriori算法中图分类号:TP392文献标识码:A文章编号文章编号:1672-7800(2013)012-0133-03作者简介:岳超(1986-),男,西南科技大学计算机科学与技术学院硕士研究生,研究方向为教育技术与知识工程;范太华(1962-),男,西南科技大学计算机科学与技术学院副教授、硕士

2、生导师,研究方向为数据挖掘和系统结构;姬亚利(1988-),女,西南科技大学计算机科学与技术学院硕士研究生,研究方向为网络教育教学设计;衣峰(1987-),男,西南科技大学计算机科学与技术学院硕士研究生,研究方向为网络教育与移动学习。0引言7随着招生规模的不断扩大,教务管理系统中的数据急剧增加,普遍存在的问题是学生成绩数据量过于庞大,但目前对这些数据的处理还停留在初级的数据备份、查询及简单统计阶段,如何利用这些数据理性地分析教学中的成效得失以及找到有关影响学生学习成绩的因素是广大教师共同关心的问题[1]。本文着重讨论了数据挖掘技术在学生成绩这一海量数据中的应用,发现成绩数据中隐藏的课程相

3、关规则或模式,力图通过关联与分类,得出一些有用的知识,对教学质量的提高起到积极的促进作用。1数据挖掘及关联规则数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘是一个循环往复的知识发现过程,通过对挖掘结果的描述、分析与评价,不断优化数据挖掘模型和挖掘算法,最终获得最优化数据挖掘解决方案[2]。1.1数据挖掘流程(1)确定业务对象。清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘

4、则带有盲目性,是不会成功的。7(2)数据准备。①数据的选择:搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据;②数据的预处理:研究数据的质量,为进一步的分析作准备,并确定将要进行挖掘操作的类型;③数据转换:将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。(3)数据挖掘。对所得到的经过转换的数据进行挖掘。除了完善和选择合适的挖掘算法外,其余一切工作都能自动地完成。(4)分析和同化。①结果分析:解释并评估结果,其使用的分析方法一般应视数据挖掘操作而定,通常会用到可视化技术;②知识的同化:将分析

5、所得到的知识集成到业务信息系统的组织结构中去。数据挖掘的过程如图1所示。1.2关联规则简述关联规则挖掘就是在海量的数据中发现数据项之间的关系,关联规则的支持度(support)和置信度(confidence)是规则兴趣度的两种度量。他们分别反映了所发现规则的有用性和确定性。一般地,用户可以定义两个阈值,分别为最小支持度阈值(minsup)和最小置信度阈值(minconf)。当挖掘出的关联规则支持度和置信度都满足这两个阈值时,就认为这个规则是有效的,否则,就是无效的。这些阈值一般可由领域专家设定,也可以进行其它分析,揭示关联项之间的联系。2基于数据挖掘的高校学生成绩分析7对学生成绩的正确分

6、析,是保证教学工作顺利进行的关键,揭示一些“教”与“学”的现象和规则,能更好地指导教师的“教”与学生的“学”,为教育教学的计划和决策提供依据,提高教学的效果和成果。2.1数据采集高质量的数据,是保证数据挖掘成功的前提保证。本研究所需数据取自计算机专业学生的期末考试成绩数据库文件,确定某门课程和其它课程之间的关联性。为减少不必要的影响因素,影响关联规则的产生,删除了英语类、思政类、体育类的课程,将数学类和计算机课程进行分析,最终随机抽取385名学生的《C&C++语言程序设计》、《线性代数》、《离散数学》、《计算机系统原理》、《计算机网络》、《计算机组成原理》、《软件工程》、《数据库原理》、

7、《数据结构》等课程的期末考试成绩。2.2数据预处理数据预处理是数据挖掘的关键阶段,原始数据往往存在不完整的、含噪声的和不一致的数据,不能直接运用于数据的挖掘,需要对其进行数据预处理,包括数据清理、数据集成、数据变换等内容。7(1)数据清理。通过填充缺失值,光滑噪声并识别离群点,纠正数据中的不一致。从数据库中导出字段包括学号、课程名、成绩、备注等信息。对备注中显示补考、重修的成绩填充为50分。对缺失值的填充,我们运用了决策树归纳的方法

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。