apriori算法优化及其在挖掘学生成绩中应用

apriori算法优化及其在挖掘学生成绩中应用

ID:27932979

大小:267.00 KB

页数:16页

时间:2018-12-07

apriori算法优化及其在挖掘学生成绩中应用_第1页
apriori算法优化及其在挖掘学生成绩中应用_第2页
apriori算法优化及其在挖掘学生成绩中应用_第3页
apriori算法优化及其在挖掘学生成绩中应用_第4页
apriori算法优化及其在挖掘学生成绩中应用_第5页
资源描述:

《apriori算法优化及其在挖掘学生成绩中应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、-摘要随着数据库技术的发展,人们采集数据的能力越来越高,信息快速膨胀,人们急需从这些数据中得到有用的知识,于是数据挖掘技术应运而生。数据挖掘的过程即是从大量的数据中获取有趣知识的过程,而关联规则作为它的一个重要分支,更是为决策过程提供良好的手段。本文则是围绕着这一关联规则这一主题进行探索。首先简单介绍了关联规则的定义、分类、挖掘过程,然后着重介绍了挖掘模型Apriori算法,并提出了一种基于事务压缩的改进算法,最后针对我们信管专业同学的成绩这一成绩作为原始数据,在SPSSClementine这一挖掘平台上进行关联规则的挖掘,以获取不同课程学习之间的一些关系。关键

2、词 数据挖掘关联规则Apriori算法SPSSClementineAbstractWiththedevelopmentofdatabasetechnology,thecapacityfordatacollectionhasadvancedmoreandmorequickly,inducingtherapidexpansionofinformation,Dataminingtechniquesemergedforpeopleneedtogetinterestingknowledgefromthesedata.Dataminingprocessistoobtaini

3、nterestingknowledgefromalargenumberofdata.Associationrulesasanimportantbranchofit,istoprovideagoodmeansofdecision-makingprocess.Thisarticleiscenteredonthethemeofthisassociationrules.First,abriefdefinitionofassociationrules,classificationanddataminingprocess,andthenfocusesontheminingm

4、odelApriorialgorithm,andproposesatransaction-basedcompressionoftheimprovedalgorithm,andfinallyfusesourstudents’scoresastheoriginaldata,makingdataminingaboutassociationruleontheminingplatSPSSClementine,toobtainanumberofdifferentrelationshipsbetweencourses.KeywordsDataMiningassociation

5、AprioriSPSSClementine不要删除行尾的分节符,此行不会被打印.---目录目录摘要IAbstractI第1章绪论31.1课题背景31.1.1学术背景31.1.2商业背景31.2研究内容4第2章关联规则52.1基本概念52.1.1定义52.1.2分类52.1.3过程62.2Apriori算法62.2.1算法思想62.2.2实例分析62.3Apriori算法改进92.3.1改进思想92.3.2实例分析9第3章数据挖掘在学生成绩中的应用113.1数据挖掘工具简介-SPSSClementine113.2建模过程113.2.1数据清洗与集成113.2.2数

6、据选择与转换123.2.3数据挖掘123.3模式评估与表示13附15.---第1章绪论1.1课题背景1.1.1学术背景随着数据库技术的逐渐成熟和计算机网络的迅速普及,人们采集数据的能力得到了极大的提高,导致全球范围的信息急剧膨胀,为了对这些少量信息的隐藏知识进行开发,数据挖掘技术应运而生。数据挖掘(DataMining,DM),是一种决策支持过程,它主要基于人工智能、机器学习、统计学技术,高度自动化地分析企业原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。简单地说:数据挖掘就是指从大量数据中提取知识。从广义上讲,关联分析是数据挖掘的

7、本质。既然数据挖掘的目的是发现潜藏在数据背后的知识,那么这种知识一定是反映不同对象之间的关联。关联知识反映一个事件和其他事件之间的依赖和关联。数据库中的数据一般都存在着关联关系,这种关联是复杂的,有时是隐含的。关联分析的目的就是要找出数据库中隐藏的关联信息。关联分析发现关联规则,这些规则展示属性-值频繁地在给定数据集中一起出现的条件。这些关联并不总是事先知道的,而是通过数据库中数据的关联分析获得的。关联规则挖掘是关联知识发现的最常用方法,它挖掘发现大量数据中项集之间有趣的关联或相关联系。其目的就是从数据库中挖掘出最低支持度和最低可信度的关联规则。其中最为著名的是

8、Agrawal等提出的A

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。