数据挖掘作业02494

数据挖掘作业02494

ID:41738655

大小:99.99 KB

页数:27页

时间:2019-08-31

数据挖掘作业02494_第1页
数据挖掘作业02494_第2页
数据挖掘作业02494_第3页
数据挖掘作业02494_第4页
数据挖掘作业02494_第5页
资源描述:

《数据挖掘作业02494》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、《数据挖掘》作业第一章引言一、填空题(1)数据库屮的知识挖掘(KDD)包括以下七个步骤:、、、、、和(2)数据挖掘的性能问题主要包括:、和(3)当前的数据挖掘研究中,最主要的三个研究方向是:、和(4)在万维网(WWW)上应用的数据挖掘技术常被称为:(5)孤立点是扌旨:二、单选题(1)数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于:A、所涉及的算法的复朵性;B、所涉及的数据量;C、计算结果的表现形式;D、是否使用了人工智能技术(2)孤立点挖掘适用于卞列哪种场合?A、冃标市场分析B、购物篮分析C、模式识别

2、D、信用R欺诈检测(3)下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析A.关联分析B.分类和预测C.聚类分析D.演变分析(4)下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能A、选择任务相关的数据B、选择要挖掘的知识类型C、模式的兴趣度度量D、模式的可视化表示(5)下列几种数据挖掘功能中,()被广泛的用于购物篮分析A、关联分析B、分类和预测C、聚类分析D、演变分析(6)根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()A.关联分析B.分类和预测C.演变分析D

3、.概念描述(7)帮助市场分析人员从客户的基木信息库中发现不同的客八群,通常所使用的数据挖掘功能是()A.关联分析B.分类和预测C.聚类分析D.孤立点分析E.演变分析(8)假设现在的数据挖掘任务是解析数据库中关于客八的一•般特征的描述,通常所使用的数据挖掘功能是()A.关联分析B.分类和预测C.孤立点分析D.演变分析E.概念描述三、简答题(1)什么是数据挖掘?(2)一个典烈的数据挖掘系统应该包括哪些组成部分?(3)请简述不同历史时代数据库技术的演化。(4)请列举数据挖掘应用常见的数据源。(或者说,我们都在什么样的

4、数据上进行数据挖掘)(5)什么是模式兴趣度的客观度量和主观度量?(6)在哪些情况下,我们认为所挖掘岀來的模式是有趣的?(7)根据挖掘的知识类型,我们可以将数据挖掘系统分为哪些类别?第2章数据预处理一、填空题(1)进行数据预处理时所使用的主要方法包括:、、和(2)处理噪声数据的方法主要包括:、、和(3)模式集成的主要问题包括:和(4)数据概化是指:(5)数据压缩可分为:和两种类型。(6)进行数值归约时,三种常用的有参方法是:、和(7)数据离散度的最常用度量是、和二、单选题(1)数据归约的目的是()A、填补数据种的

5、空缺值B、集成多个数据源的数据C、得到数据集的压缩表示D、规范化数据(2)下面哪种数据预处理技术可以用來平滑数据,消除数据噪声?A.数据清理B.数据集成C.数据变换D.数据归约(3)进行数据规范化的目的是()A.去掉数据中的噪声B.对数据进行汇总和聚集C.使用概念分层,用高层次概念替换低层次“原始”数据D.将属性按比例缩放,使Z落入一个小的特定区间(4)数据的噪声是指()A、孤立点B、空缺值C、测量变量中的随即错误或偏差D、数据变换引起的错误(5)那种数据变换的方法将数据沿概念分层向上汇总A、平滑B、聚集C、数

6、据概化D、规范化(6)()通过将属性域划分为区间,从而减少给定连续值的个数。A.概念分层B.离散化C.分箱D.直方图三、多选题(1)下面哪些问题是我们进行数据预处理的原因?A.数据中的空缺值B.噪声数据C.数据中的不一致性D.数据中的概念分层(2)下面的度最屮,哪些是数据离散度的度最?A.中位数B.标准差C.模D.中间四分位数区间(3)数据清理的冃的是处理数据中的(A、空缺值B、噪声数据(4)下列哪些是数据变换可能涉及的内容?A、数据压缩B、数据概化(5)以下哪些原因可能引起空缺值)C、不一致数据D、敏感数据C

7、、维归约D、规范化A、设备异常B、命名规则的不一致C、与其他已有数据不一致而被删除D、在输入时,有些数据因为得不到重视而没有被输入四、简答题(1)常用的数值属性概念分层的方法有哪些?(2)典型的生成分类数据的概念分层的方法有哪些?(3)在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法。(4)常见的数据归约策略包扌舌哪些?第四章数据挖掘原语、语言和系统结构一、填空题(1)概念分层冇四种类型,分别是:、、和(2)常用的四种兴趣度的客观度量是:、、和(3)同时满足和的关联规则称为强关联规则

8、。二、单选题(1)以下DMQL片断:mineassociationsasbuyingHabitsmatchingP(X:customer,W)AQ(X,Y)=>buys(X,Z)所指定的挖掘知识类型是:A、特征化B、区分C、关联D、分类(2)以下哪种数据挖掘系统与数据库/数据仓库系统集成方式将会使数据挖掘系统达到最好的性能?A、不耦合B、松散耦合C、半紧密耦合D、紧密耦合三、多选题(1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。