探讨数据库学位论文

探讨数据库学位论文

ID:23307939

大小:72.50 KB

页数:15页

时间:2018-11-06

探讨数据库学位论文_第1页
探讨数据库学位论文_第2页
探讨数据库学位论文_第3页
探讨数据库学位论文_第4页
探讨数据库学位论文_第5页
资源描述:

《探讨数据库学位论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、探讨数据库学位论文探讨数据库学位论文_目前查找国内学位论文可通过以下几个数据库导读:将结果不断与目标比较,以找出满意解为目标。(3)刚开始时仅用少量数据进行试探性挖掘,每一阶段567第一章引论1.1研究背景、内容与方法随着加入WTO的趋势,未来国外大学也能在中国内地设置分校,势必加深国内大学竞争的危机和冲击。因此,国内大学也要强化,透过国外一流大学的激荡,吸收他人的优点,将有利于国内大学体制的提升。各个大学如何在招生越来越强的竞争中脱颖而出,不被社会所淘汰,将成为生存的关键因素。近年来教育改革政策不断提出,目的就是希望能提升教育品质,影响教育品质的因素很多,其中以入学学生素质对

2、教育品质的影响最大,而影响入学学生素质的关键就在于招生事务,如何运用招生资源有效地协助招生作业,挑选入学学生,有效掌握入学学生的素质,才能使学校及各系的竞争力提升。从每年举办的各大学招生宣传会上就能窥探一二,每所大学无不使出浑身解数,以全方位的校园活动,奖学金等吸引学生就读,所以各大学于招生的角色已不在处于被动,而改以具备特色、更丰富及更主动的策略进行招生。往年各大学的招生方式都是以过去的经验进行,但是单凭有限的经验并无法将招生资源做到最大效益的利用,该如何运用有限的资源,招收合适的学生将是重大的挑战。本研究的研究动机起始于对各大学各系招生时无任何依据及指标当作招生指标,对于哪

3、些高考科目应施以高加权来招收所需的学生;对于哪些科目并不需要加权指标等等都没有标准或依据可循。各大学都希望建立自己的特色,如何强化学生这项特征,就必须要了解学生、慎重挑选学生,了解学生具备某科的成绩优势及基础对于入学后在校学习有所帮助并能营造该院系的特色。基于此,我们选取学生的入学高考成绩和其在校成绩,然后运用关联分析技术对此加以分析,从中获得一些信息,作为招生事务的参考资料。1.2论文结构第一章引论简述研究意义、研究内容与研究方法,同时给出论文结构。第二章关联规则概述简述关联规则的基本概念,重点分析挖掘关联规则的步骤。第三章改进Apriori算法提出了对Apriori算法的改

4、进思路,并且通过示例详细描述了改进算法的执行流程。第四章用改进Apriori算法对高考成绩数据进行分析编程实现改进的Apriori算法,并将它用于挖掘高考成绩数据的内部关系。第五章总结总结本论文的贡献。第二章关联规则概述数据挖掘是一个需要经过反复多次处理的过程。如同软件工程在软件开发中的作用,数据挖掘的处理过程模型为数据挖掘提供了宏观指导和工程方法。合理的处理过程模型能将各阶段有机地结合在一起,指导人们更好地开发及使用数据挖掘系统。数据挖掘主要是由以下几个步骤不断反复的过程。该处理模型的特点是(1)尽量利用前面的工作成果来减少数据筛选时间。(2)将结果不断与目标比较,以找出满意

5、解为目标。(3)刚开始时仅用少量数据进行试探性挖掘,每一阶段567探讨数据库学位论文_目前查找国内学位论文可通过以下几个数据库(2)导读:都可以根据试挖掘的结果返回上一阶段,进行调整。它充分体现了数据挖掘需要多次反复,数据筛选应充分利用前次的挖掘结果这一特点,符合循序渐进、螺旋上升的方。2.1关联规则挖掘的基本概念关联规则挖掘是本文的研究重点,为了使后面算法的描述更清晰、准确,现就关联规则挖掘中涉及到的有关约定、基本概念及该问题的正规描述作以简介。事务数据库中的每一个属性称为一个项目(item),每个项目在事物中只有两种情况:出现或不出现。事务数据库中的每个项目分别由i1,i2

6、im来表示。事务数据库中的所有项目组成的集合称为数据库的项目集,记为大写字母I,则I={i1,i2im},│I│=m,其中m为事务数据库中所含项目的总数。为了统一起见,约定用大写字母D来代表事务数据库,│D│为数据库的大小。大写字母T代表其中的一个事务。D是由多个事务组成的集合,每个事务T是由一些项目组成的集合,它表示本事务中所包含的项目。由I中的一些项目所组成的集合X称为项集(itemset),包含K个项的项集称之为K-项集,显而易见XI。设X为I中的一个项集,对给定的事务T:如果有关系XT成立,则称事务T包含项集X或X包含于T。事务数据库D中包含项集X的事务在整个数据库中所

7、占的比例称为项集X的支持度,记作Sup(X),显然有Sup(X)∈[0%,100%]。关联规则是形如X=>Y的蕴涵式,其中XI,I,Y并且X∩Y=。为了在事务数据库中找出有用的关联规则,需要用户确定两个阈值:最小支持度阈值(min_sup)和最小置信度阈值(min_conf)。如果项集X满足最小支持度,则它称之为频繁项集。2.2关联规则之挖掘步骤关联规则挖掘的任务就是要挖掘出D中所有的有充分支持度和置信度的关联规则,可以把关联规则挖掘分为以下两个子问题:(1)根据最小支持度找出D中所有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。