数据挖掘技术在构建学生成绩预警系统的应用

数据挖掘技术在构建学生成绩预警系统的应用

ID:22330844

大小:52.50 KB

页数:5页

时间:2018-10-28

数据挖掘技术在构建学生成绩预警系统的应用_第1页
数据挖掘技术在构建学生成绩预警系统的应用_第2页
数据挖掘技术在构建学生成绩预警系统的应用_第3页
数据挖掘技术在构建学生成绩预警系统的应用_第4页
数据挖掘技术在构建学生成绩预警系统的应用_第5页
资源描述:

《数据挖掘技术在构建学生成绩预警系统的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘技术在构建学生成绩预警系统的应用:该文运用数据挖掘中关联规则技术,研究了高校学生不及格课程之间的关联性,给出了学生成绩预警系统的理论化模型。为教育工及早发现和帮助问题学生提供了一个范例。  关键词:数据挖掘;预警系统;关联规则  :TP311:A:1009-3044(2011)19-4529-02  随着数据挖掘技术在商业领域获得的成功和广泛应用,近年来,越来越多的教育工开始利用数据挖掘技术对历史积留下来的海量教学数据库进行研究,并获得了许多有价值的成果。仅以学生成绩数据库为例,众所周知,学生的学习成绩并不是一个偶然事件,以前的成绩数据

2、往往预示着该生在后续课程中的成绩走向。例如,一个电磁学不及格的学生,很可能其电动力学也会出现不及格。这种现象给了我们一些启示,能否从大量的学生成绩数据中挖掘课程之间的成绩关联,构建一个成绩预警系统呢?目前,许多高校已开始加强对“学困生”的全面监督和尽力帮扶,如果在此之前,我们能根据一个学生的前期课程的考查结果分析出他本学期有可能出现不及格的课程,从而提早介入对他该课程的学习监管,无疑是一件很有意义的工作。以下就数据挖掘中的关联规则技术来浅要分析其在学生成绩预警系统中的实现。  1关联规则概述  若两个或多个变量的取值之间存在某种规律性,就称为关

3、联。关联规则的挖掘问题可形式化描述如下:设I{i1,i2,…,im}是m个不同项目的集合,D是针对I的交易的集合,每笔交易包含若干项目i1,i2,…,im∈I。则关联规则X=>Y成立的条件是:  1)它具有支持度s,即在交易数据库D中至少有s*100%的交易包含X∪Y。  2)它具有置信度c,即在交易数据库D中包含X的交易至少有c*100%也包含Y。  关联规则的挖掘问题就是在交易数据库D中找出所有具有用户给定的最小支持度minsup和最小置信度minconf的规则来。该问题可以分解成两个子问题:  1)找出存在于交易数据库中的所有频繁项

4、目集。若项目集X的支持度support(X)不小于用户给定的最小支持度minsup,则称X为频繁项目集;否则为非频繁项目集。  2)利用频繁项目集生成项目关联规则。对于每个频繁项目集A,若B∈A,B≠Φ,且support(A)/support(B)≥minconf,则有关联规则B=>(A-B)。  由于子问题2相对来说较容易,因此研究的重点集中在第1个问题,即发现和识别所有的频繁集成为关联算法的核心,而这其中最有名的是Apriori算法。该算法是一种宽度优先算法,通过对数据库的多趟扫描并采用递推的方式来发现所有的频繁项目集。尽管该算法在处

5、理大规模数据集时还存在瓶颈,但通过剪枝和其他改良手段等已经使该算法得到了普遍应用。  2通过预处理建立分析数据源  要对学生的不及格成绩数据进行挖掘,首先要有大量的有效数据。笔者从中国科技大学的学生成绩数据库中取出物理学院05级到07级本科生的原始成绩数据表203.mdb文件来进行挖掘,并对其进行了一系列预处理工作,如图1。  1)删除无用字段和记录  原始数据表(图1)中的字段并非都对挖掘有用,我们只选取感兴趣的xuehao(学号),kc_code(课程号),Score(成绩)三个字段。另外,由于我们只对不及格的必修课程感兴趣,因此要删除所有

6、的选修课记录和全部课程都及格的记录,得到初步预处理后的数据表(图2)。  对照照中国科大物理学院本科培养方案我们挑选出17门主干必修课程来进行挖掘研究,并分别给这17门课程以A~Q的17个字母来标识,如表1所示。  我们只需保留原始数据表中Kc_code值为上述的17个值的记录即可,其余为无用记录可做删除。  2)建立待挖掘数据表  由于表中成绩已经全部是不及格数据,故无需做特别的离散化处理,只需要将对应的不及格成绩的课程在记录中予以简单标记即可。为了清晰起见,我们将Kc_code字段和score字段合成一个字段KS,其值则代表了不及格的课程的

7、对应标识。例如,用A表示“单变量微积分不及格”。此时数据表形式如图3所示。  通过以上预处理虽然可得到形如图3的简单的待处理数据,然而最终待挖掘的数据表应该是按学号不同排列成的事务表。我们可以先创建该表的结构,再将图3所示的数据表内容转换进来。首先创建该表,表名为mydata0,表结构如表2。  再将原先的数据表(图3)中的xuehao字段按相同值归并,并把该xuehao字段对应的所有KS字段值填入表mydata0中。最终生成的表mydata0(图4)即为只含不及格成绩的待挖掘数据表。  3成绩预警系统的模型建立与分析  为简单起见,笔者使用目

8、前较流行的数据挖掘工具软件ydata0进行了挖掘,得出的关联规则结果如表3所示(设minsupp=0.1,minconf=0.4)。以表3得出的关联规

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。