《数据仓库与数据挖掘》复习题.doc

《数据仓库与数据挖掘》复习题.doc

ID:58048701

大小:364.50 KB

页数:30页

时间:2020-04-09

《数据仓库与数据挖掘》复习题.doc_第1页
《数据仓库与数据挖掘》复习题.doc_第2页
《数据仓库与数据挖掘》复习题.doc_第3页
《数据仓库与数据挖掘》复习题.doc_第4页
《数据仓库与数据挖掘》复习题.doc_第5页
资源描述:

《《数据仓库与数据挖掘》复习题.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、《数据仓库与数据挖掘》复习大纲考试时间与地点:课程名称任课老师班级人数考试合班数考试周数周几第几节考试地点数据仓库与数据挖掘吴静12信技1-25421153-4L1208考试题型:一、单项选择题(10×2分=20分二、判断题(10×2分=20分三、简答题(5×6分=30分四、分析计算题(3×10分=30分考试范围:第一讲数据挖掘概述考点:1、数据挖掘、知识发现(KDD基本概念;2、数据挖掘的过程;3、数据挖掘过技术的三个主要部分。复习参考题:一、填空题(1数据库中的知识挖掘(KDD包括以下七个步骤:数据清理、数据集成、数据选择

2、、数据变换、数据挖掘、模式评估和知识表示。(2数据挖掘的性能问题主要包括:算法的效率、可扩展性和并行处理。(3当前的数据挖掘研究中,最主要的三个研究方向是:统计学、数据库技术和机器学习。(4在万维网(WWW上应用的数据挖掘技术常被称为:WEB挖掘。(5孤立点是指:一些与数据的一般行为或模型不一致的孤立数据。二、单选题(1数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于:BA、所涉及的算法的复杂性;B、所涉及的数据量;C、计算结果的表现形式;D、是否使用了人工智能技术(2孤立点挖掘适用于下列哪种场合?DA、目标市场分析B

3、、购物篮分析C、模式识别D、信用卡欺诈检测(3下列几种数据挖掘功能中,(D被广泛的应用于股票价格走势分析。A.关联分析B.分类和预测C.聚类分析D.演变分析(4下面的数据挖掘的任务中,(B将决定所使用的数据挖掘功能。A、选择任务相关的数据B、选择要挖掘的知识类型C、模式的兴趣度度量D、模式的可视化表示(5下列几种数据挖掘功能中,(A被广泛的用于购物篮分析。A、关联分析B、分类和预测C、聚类分析D、演变分析(6根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是(B。A.关联分析B.分类和预测C.演

4、变分析D.概念描述(7帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是(C。A.关联分析B.分类和预测C.聚类分析D.孤立点分析E.演变分析(8假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是(EA.关联分析B.分类和预测C.孤立点分析D.演变分析E.概念描述三、简答题1、何谓数据挖掘?它有哪些方面的功能?答:从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程称为数据挖掘。相关的名称有知

5、识发现、数据分析、数据融合、决策支持等。数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析以及偏差分析等。2、一个典型的数据挖掘系统应该包括哪些组成部分?答:一个典型的数据挖掘系统应该包括以下部分:(1数据库、数据仓库或其他信息库;(2数据库或数据仓库服务器;(3知识库;(4数据挖掘引擎;(5模式评估模块;(6图形用户界面。3、请列举数据挖掘应用常见的数据源。(或者说,我们都在什么样的数据上进行数据挖掘答:常见的数据源包括关系数据库、数据仓库、事务数据库和高级数据库系统和信息库。其中高级数据库系

6、统和信息库包括:空间数据库、时间数据库和时间序列数据库、流数据、多媒体数据库、面向对象数据库和对象-关系数据库、异种数据库和遗产(legacy数据库、文本数据库和万维网(WWW等。4、在哪些情况下,我们认为所挖掘出来的模式是有趣的?答:一个模式是有趣的,如果(1它易于被人理解;(2在某种程度上,对于新的或测试数据是有效的;(3具有潜在效用;(4新颖的;(5符合用户确信的某种假设。5、根据挖掘的知识类型,我们可以将数据挖掘系统分为哪些类别?答:根据挖掘的知识类型,数据挖掘系统可以分为特征分析,区分,关联分析,分类聚类,孤立点分析

7、/演变分析,偏差分析,多种方法的集成和多层级挖掘等类型。第二讲数据的认识及预处理考点:1、什么是数据预处理,为什么要对数据进行预处理?2、数据预处理的方法有哪些?3、在数据预处理过程中度量中心趋势里中位数、众数等如何求取的?4、度量数据离散度时如何求取极差、五数概括(基于四分位数、中间四分位数极差和标准差?5、在消除数据的噪声时,采用的分箱技术中如何对数据进行等频(等深划分,如何进行等宽划分?6、什么是数据变换?如何使用“最小-最大规范化规范化”方法、“z-score规范化”方法以及“小数定标规范化”这三种方法将数据按比例缩放

8、,使之落入一个小的特定区间里。复习参考题:一、填空题(1进行数据预处理时所使用的主要方法包括:数据清理、数据集成、数据变换和数据规约。(2处理噪声数据的方法主要包括:分箱、聚类、计算机和人工检查结合、回归。(3模式集成的主要问题包括:整合不同数据源中的元数据,实体识别问题。(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。