高级数据库原理

高级数据库原理

ID:41122570

大小:81.50 KB

页数:7页

时间:2019-08-17

高级数据库原理_第1页
高级数据库原理_第2页
高级数据库原理_第3页
高级数据库原理_第4页
高级数据库原理_第5页
资源描述:

《高级数据库原理》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、高级数据库原理SJ0821200820212043张东圆一、简答题1、简述数据挖掘的概念以及数据挖掘的分类。答:数据挖掘(DataMining,简称DM),简单地讲就是从大量数据中挖掘或抽取出知识。数据挖掘,又称为数据库中知识发现(KnowledgeDiscoveryfromDatabase,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。整个知识挖掘(KDD)过程是由若干挖掘步骤组成,而数据挖掘仅是其中的一个主要步骤。数据挖掘涉及的学科领域和方法很多,有多种分类方法。从数据分析角度出发

2、,数据挖掘可以分为两种类型:描述型数据挖掘和预测型数据挖掘。根据挖掘任务可以分为:分类或预测模型发现、数据总结与聚类发现、关联规则发现、序列模式发现、相似模式发现、混沌模式发现、依赖关系或依赖模型发现、异常和趋势发现等。根据挖掘对象可以分为:关系数据库、面向对象数据库(Object一orientedDatabase)、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及web等对象的挖掘。根据挖掘方法可以分为:机器学习方法、统计方法、聚类分析方法、探索性分析、神经网络(NeuralNetwork)方法、

3、遗传算法(GeneticAlgorithm)、数据库方法、近似推理和不确定性推理方法、基于证据理论和元模式的方法、现代数学分析方法、粗糙集(RoughSet)方法、集成方法等。根据数据挖掘所能发现的知识可以分为:广义型知识挖掘、差异型知识挖掘、关联型知识挖掘、预测型知识挖掘、偏离型异常知识挖掘、不确定性知识等。当然这些分类方法都从不同角度刻画了数据挖掘研究的策略和范畴,他们是互相交叉而又相互补充的。2、什么是N个事务的一个调度?答:事务是一个操作序列,这些操作“要么不做,要么都做”,是数据库环境中不可分割的逻辑工作单位。事务的

4、执行次序称为调度。当有N个事务要执行时,它的调度有两种方式,一种是串行调度,一种是并行调度。前者是指N个事务依次执行,可有n!种有效调度,其执行结果总是正确的;后者是指系统用分时的方法同时处理N个事务,如果一个并发调度的结果与某一个串行调度执行的结果等价,则称该并行调度是可串行化调度。N个事务的一个调度就是为N个事务指定一种执行方式,让它们按照指定的方式能有效的执行。3、简述Apriori算法的思想,谈谈算法的应用领域并举例。答:Apriori算法:使用候选项集找频繁项集。它是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核

5、心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递推的方

6、法。该算法的应用领域比较广泛,最典型的应用是在超市购物、银行客户等。在超市购物中比较典型的就是“啤酒和尿布”的例子,通过Apriori算法了解到购买尿布的人士一起购买啤酒的概率很大,因此将啤酒和尿布摆在一起有利于买卖。4、在数据库的并发控制中,什么是“封锁的粒度”?封锁的粒度与系统的并发度之间有什么联系?答:封锁的粒度(Granularity)是指封锁对象的大小。封锁对象可以是逻辑单元,也可以是物理单元。封锁粒度与系统的并发度和并发控制的开销密切相关。封锁的粒度越小,并发度越高,系统开销也越大;封锁的粒度越大,并发度越低,系统

7、开销也越小。5、企业面对海量数据,应如何具体实施数据挖掘,使之转换成可行的结果/模型?答:企业对海量数据的数据挖掘应依据不同的问题进行不同的挖掘过程,但总的挖掘过程如下:1、问题定义。首先要明确实际工作对数据挖掘的具体要求,其次是通过对各种算法的对比来确定可用的算法。后续数据准备在此基础上进行。2、数据收集和数据预处理。这个过程可以分为三个子步骤:数据选取、数据预处理和数据变换。数据选取确定数据挖掘任务的操作对象,即目标数据,是用户根据需求从原始数据库中抽取的一组数据;数据预处理一般包括消除数据噪声、补全缺失数据项、确保数据一

8、致性和完成数据类型转换等;数据变换主要目的是消减数据维数,从初始特征中找出真正有用的特征,以减少数据挖掘中需要考虑的变量个数。3、数据挖掘。基于需要执行的数据挖掘任务,这一步骤就是对变换后的数据应用具体算法来产生期望的挖掘结果。如分类、聚类、关联规则发现或序列模式发现等。4、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。