欢迎来到天天文库
浏览记录
ID:31777947
大小:57.77 KB
页数:6页
时间:2019-01-18
《基于关联规则挖掘高校成绩研究探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于关联规则挖掘高校成绩研究探究摘要:本文通过对本校某年级学生成绩进行分析,主要应用数据挖掘中的关联规则和Apriori算法,挖掘出一些合理的课程关联规则,将这些规则运用到教学管理中,可以指导学生选课和合理的设置课程,为高校的教学管理提供参考。关键词:数据挖掘;关联规则;成绩管理中图分类号:TP311.13努力提高学生的成绩和学生素质是每一所高校的目标,随着高校的办学规模的扩大、办学层次多样化,随着社会的发展,影响学生学习成绩的因素也越来越多,学生成绩分析就更加重要。目前教务管理系统中收集了大量的
2、学生成绩数据,管理者大都采用传统的统计报表形式,对这些数据的处理还停留在数据录入、简单的数据备份和查询阶段,有很大的局限性。数据挖掘技术在许多领域,如商业、金融业以及企业的生产、市场营销等一些盈利行业都得到了广泛的应用,但在非盈利行业教育领域的应用相对还较少,将数据挖掘技术引入到教务管理信息系统中,对教务管理系统中的学生成绩数据进行分析,从大量数据存在的关系、规则中研究学生成绩,预测成绩发展趋势,从而能够更好地指导教师排课和学生选课,对学生管理工作有的放矢,提高授课和学习效果能起到非常重要的作用。
3、本文主要使用数据挖掘技术中的关联规则进行高校学生成绩分析,以找出课程之间的关联关系,指导学生选课和合理的设置课程。1数据挖掘关联算法1.1数据挖掘数据挖掘是一个应用数据分析工具从大量数据中发现以前未知的和隐蔽的信息,以及数据之间关系的研究领域。这些工具包括统计模型,数学算法和机器学习方法。综合了多学科内容的数据挖掘,把原来对知识的简单应用,比如学生成绩的操作及简单查询等方面扩展到了对知识信息的深度提取运用,比如从现有的学生信息数据库中挖掘对学生成绩有影响的属性信息,帮助学校合理调整教学计划,提高教
4、学质量。出于对此类应用的需求,使数据挖掘这门前沿学科吸引了各个领域的研究者。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有自动预测趋势和行为、关联分析、聚类、概念描述(决策树方法、遗传算法)及偏差检测。本文主要应用了关联规则。1.2关联规则关联规则的挖掘是为了在数据库中发现关联关系,它是数据挖掘最先研究的问题之一,也是数据挖掘的一个主要研究方向,起初是研究超市的顾客交易数据库中的购买商品之间的关联规则的挖掘问题,即货物篮数据的关联规则。关联规则挖掘的目的是找出数据库中不同数据项集之间隐
5、藏的关联关系。设I={il,12,-im}是项的集合。设任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合,使得。每个事务有一个标识符,称作TID。设A是一个项集,事务T包含A当且仅当。关联规则是诸如A=>B的蕴涵式,其中,,并且。规则的支持度和置信度是两个规则兴趣度量值,它们分别表示发现规则的有用性和确定性。Support(A=>B)=P(AUB)confidence(A=>B)=P(B/A)同时满足最小支持度阈值(min_sup)和最小置信度阈值(min_conf)的规则称作强规则,
6、我们用0%和100%之间的值而不是用0到1之间的值表示支持度和置信度。1.3Aprior算法Aprior算法是经典的关联规则挖掘算法,使用一种逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,找出频繁1项目集的集合,该集合记作L1,然后由L1得到L2,由L2得到L3,如此下去,直到不能找到频繁k一项目集。每找一层Lk均需要一次数据库扫描。Apriori算法的在执行过程中存在两个缺点,一个是需要多次扫描事务数据库D,一个是可能产生庞大的候选集。在本文应用中,基于划分的优化方法。使用划分技术,可
7、以只需要对数据库进行两遍扫描,就可以发现全部频繁集,从而大大降低对数据库的扫描遍数。将数据库分成许多区段,在找出频繁项集时,需要经过两步:计算各区段中项集的支持度,以找出各区段中的所有频繁项集:将各区段中所有的频繁项集合结合起来后,再扫描数据库找出真正的频繁项集合。2成绩数据的关联挖掘教务管理系统中收集了大量的学生成绩数据,如学生相关可包含学号、姓名、性别、班级、年级、分数等,教师相关可包含教师号、性别、科目、学历、职称、教龄等,课程相关可包含课程名称、课程号、考试类型、考试难度等数据。采取不同的
8、数据挖掘方法,可进行如图1,不同角度分析,挖掘不同的隐藏信息。挖掘获取的信息是不可预测的,但要探索的问题是有预见的,清晰地定义问题,认清数据挖掘的目的是重要的。图1教务管理系统不同角度分析2.1数据采集、清理与转化大学课程之间有一定的关联和前后顺序关系,因此分析学生成绩与课程之间的关系为本文重点研究的内容。本文分析数据取自本校计算机学院软件工程三本学生121名学生成绩,课程信息如表1,专业必修课选择高级语言程序设计,公共课选取大学计算机基础、高数以及线性代数,同时也取其高考成绩作为
此文档下载收益归作者所有