欢迎来到天天文库
浏览记录
ID:356548
大小:108.50 KB
页数:9页
时间:2017-07-27
《关联规则在高校选课系统中的应用 毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、关联规则在高校选课系统中的应用摘要:关联规则分析是当前数据挖掘研究的主要模式之一。在介绍关联规则理论的基础上,针对教务管理系统数据的特点,提出了分时挖掘的思想,并对FP—增长算法进行了改进研究。最后是关联规则分析在教务管理系统中的应用实践。关键词:关联规则,教务管理,数据挖掘AssociationRulesAnalysisanditsApplicationintheEducationalAdministrationManagementSystemAbstract:Associationrulesanalysisisanimport
2、antmodeofdatamining.First,introducedthetheoryofAssociationrulesanalysis,thenaimatthecharacteristicsoftheeducationaladministrationmanagementsystemdata,putforwardthethoughtthattime-sharingofmining,andimproveontheFP-growthalgorithm.Finally,asystemofAssociationrulesanalys
3、isfortheeducationaladministrationmanagementsystemwasimplemented.Keywords:Associationrule,Educationaladministrationmanagement,Datamining1.引言随着信息化的到来,高校教务系统进入无纸化的时代,教学数据与学生数据急剧膨胀,如何从大量的存储数据中发现有价值的信息来完善教学管理、提高教学质量是一项非常艰巨的任务。数据挖掘就是从大量不完全的、有噪声的、模糊的和随机的实际应用数据中,提取隐含的、未知的和潜在有
4、用的信息的非平凡的过程。数据挖掘按其功能可划分为:9关联分析、分类和预测、聚类分析、孤立点分析、演变分析等。本文主要讨论关联规则在高校课程选修系统中的应用,通过选课率及相关信息做出正确的决策。2.关联规则的基本概念关联规则挖掘由Agrawal等人对市场购物篮分析时首先提出,该过程通过发现顾客放入购物篮中不同商品之间的联系,分析顾客的购物习惯。关联规则在数据挖掘的研究中开展得最广泛,引用也比较早。关联规则的定义:设I=(I1,I2,⋯Im)是所有项的集合,其中Ik(k=1,2,…m)称为项,项的集合称为项集,包含k个项的项集称为k-
5、项集。一个事务T是一个项集,它的I的一个子集,每个事务与一个惟一标识符Tid相联系。不同的事务构成了事务集D,它构成了关联规则发现的事务数据库。如果项集,则称事务T支持项集X,也称事务T包含项集X。关联规则是这样一种形式的蕴涵,一般用来描述关联规则属性的参数主要有:支持度(Support)、可信度(Confidence)、期望可信度(ExpextedConfidence)和作用度(Lift)。其中支持度与可信度能够比较直观地描述关联规则的性质。2.1支持度(Support)规则X!Y在事务数据库D中的支持度S(Support)是事
6、务集中包含X和Y的事务数与所有事务数之比,记为Support。2.2可信度(Confidence)规则X!Y在事务数据库D中的可信度C(Confidence)是指包含X和Y的事务数与包含X的事务数之比,记为Confidence。关联规则的选择主要基于这两个参数的值,支持度是度量关联规则在事务数据库中出现的概率,可信度是度量关联规则的强度。在事务数据库中,任意的两个项集之间都存在关联规则,若不考虑支持度和可信度,那么在事务数据库中就存在无穷多的关联规则。而实际应用中,人们只会对满足一定支持度和可信度的关联规则感兴趣,因此在进行关联规
7、则发现时,需要确定两个阈值:最小支持度(min_sup)和最小可信度(min_conf)[1]。93.关联规则的发现过程关联规则挖掘可以分为两个过程:找出所有频繁项集:这些项集出现的频率满足最小支持度有频繁项集产生强关联规则:这些规则必须满足最小可信度当然,除了最小支持度和最小可信度外也可以使用附加的兴趣度度量。在这两个子问题中,第二个过程最容易,找出所有频繁项集以后,产生用户感兴趣的强关联规则是直截了当的事情,目前大多数的研究工作主要集中在第一个过程上,关联规则挖掘的总体性能主要由它来决定。在关联规则的研究中,最著名的算法是Ap
8、riori算法、FPgrowth算法等。本文将利用Apriori算法挖掘就出在本学期的选修课中最受欢迎的课程及最受欢迎的老师,以便确定下个学期选修课程的开课安排,为同学和老师带来方便[2]。日前关联规则的算法很多,但所有的采掘算法不论它是采用于l一
此文档下载收益归作者所有