关联规则在高校学生成绩管理中的应用

关联规则在高校学生成绩管理中的应用

ID:23810366

大小:55.00 KB

页数:6页

时间:2018-11-10

关联规则在高校学生成绩管理中的应用_第1页
关联规则在高校学生成绩管理中的应用_第2页
关联规则在高校学生成绩管理中的应用_第3页
关联规则在高校学生成绩管理中的应用_第4页
关联规则在高校学生成绩管理中的应用_第5页
资源描述:

《关联规则在高校学生成绩管理中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、关联规则在高校学生成绩管理中的应用本文将关联规则应用于学生成绩数据中,对学生成绩数据进行深入分析,以期得出相关趋势,并结合数据挖掘结果,对成绩进行分析和预测,为教学管理和学生管理工作中提供相应的决策依据。关键词:关联规则;稀有项;多最小支持度务表。            表2.1学生成绩表            Table2.1gradetable  对成绩的离散化:成绩的筛选条件为大于等于85分,大于等于85分的转化成布尔型数值”1”,而成绩小于85分的转化成布尔型数值”0”。  课程编码:将表2.1学生成绩表中的课程名分别以K1,K2,…编码,如“英语”的编码

2、为K1。  从学生成绩数据库中提取相关属性,为整个数据挖掘模块提供了数据挖掘对象。由于Apriori算法适用于事务库的数据挖掘,所以需要将关系表转换为相应的事务库。  本文将关系表中的除学号外的每个属性视为一个事务。每条记录中每个事物发生的标志为离散化后值为“1”。例如,表2.1中的第二条记录,转化为事务:{K7,K10,K11}3、功能实现3.1利用经典的Apriori[1]算法对数据进行关联性分析。  提供了两个可选项,一是专业的选择,本文只对相同专业的学生成绩进行课程的相关性分析;二是支持度的选择这里我们设了强、中、弱三个支持度供用户选择,强的值为0.5、中

3、的值为0.3、弱的值为0.2,置信度我们统一设定为0.6。  要对上述表中的成绩优秀课程进行关联规则挖掘,需要给出支持度和置信度。我们的实验数据以最小支持度为0.2,置信度为0.6时得出。最后得知为频繁集,且为最大频繁集。  当频繁项集生成以后,对于任一频繁k项集,找出其中所有可能的真子集,作为关联规则的前件,计算相应规则的置信度。当某一规则的置信度大于给定的最小置信度时,输出该规则。由于我们是对学生的成绩进行相关性分析,我们按照课程的开课顺序得到的规则如图3.1所示:            图3.1关联规则结果          Fig3.1theresulto

4、fconnectionrule  联系各个关联规则所代表的意义,可得出如下的知识(规则):a.先学习《C语言》对学习《数据结构》是有好处的,有用性(支持度)为0.20,可靠性高达0.76。而先学《数据结构》再选学《ASP程序设计》及格的可能性大,有用性为0.5,可靠性为0.88。所以,我们可得出有助于同学学习的选课顺序:《C语言》《数据结构》《ASP程序设计》。b.先学习《C语言》对学习《数据结构》是有好处的,有用性(支持度)为0.20,可靠性高达0.76。而先学《数据结构》再选学《微机维护》及格的可能性大,有用性为0.4,可靠性为0.7。所以,我们可得出有助于同

5、学学习的选课顺序:《C语言》《数据结构》《微机维护》。c.先学习《X页》对学习《图形图像》是有好处的,有用性(支持度)为0.23,可靠性高达0.77。而先学《图形图像》再选学《ASP程序设计》及格的可能性大,有用性为0.3,可靠性为0.64。所以,我们可得出有助于同学学习的选课顺序:《X页》《图形图像》《ASP程序设计》。综上所述,可对同学们的选课提出如下建议:《C语言》《数据结构》《ASP程序设计》《C语言》《数据结构》《微机维护》《X页》《图形图像》《ASP程序设计》3.2结果的图形化显示这里我们用图表显示得到的结果。那么我们要明确显示的数据含义。在图3.2中

6、X坐标轴代表课程,Y轴表示该课程的重要性,即该课程在关联规则前项中出现的次数与规则总数的比值。这个比值越大,说明该课程在关联规则的前项中出现的次数越多,进而说明这门课成绩有一优异的同学,其他课程取得优异成绩的可能性较大,该课程在整个课程体系中的重要性越高。这就是我们希望得到的一个信息,即C语言这门课程在整个课程体系占有十分重要的地位,在生成的8条规则中C语言作为规则的前件出现了3次,占规则总数的37.5%。是各门课程中比例最高的,所以认为该课程在整个课程体系占有最为重要的地位。              图3.2规则重要性的图表显示        Fig3.2Th

7、echartofruleimportancesho)。然而,稀有项之间的关联关系对于用户来说也可能是极其重要的。所以我们发现采用统一的最小支持度算法不能很好挖掘最合理的项之间的频繁模式,关联规则挖掘是不充分的,因为这样不能区分不同项之间的固有性质及在事物集中的不同出现频率[2]。不频繁出现的项,称之为稀有项(rareitem)。然而,稀有项之间的关联关系对于用户来说也可能是极其重要的。下面我们就提出了解决稀有项问题[3](rareitemproblem)的方法—多最小支持的关联规则挖掘。定义2.10最小项支持度[4][5]:对于事务集D的集合。定义2.11最小支持

8、度:对项集

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。