数据仓库与数据挖掘试题

数据仓库与数据挖掘试题

ID:24405322

大小:67.50 KB

页数:3页

时间:2018-11-14

数据仓库与数据挖掘试题_第1页
数据仓库与数据挖掘试题_第2页
数据仓库与数据挖掘试题_第3页
资源描述:

《数据仓库与数据挖掘试题》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、武汉大学计算机学院2014级研究生“数据仓库和数据挖掘”课程期末考试试题要求:所有的题目的解答均写在答题纸上,需写清楚题0的序号。每张答题纸都要写上姓名和学号。一、单项选择题(每小题2分,共20分)1.下而列出的条目中,()不是数据仓库的基本特征。BA.数裾仓库是而向主题的B.数裾仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的2.数据仓库是随着时间变化的,下面的描述不正确的是()。A.数据仓库随时间的变化不断增加新的数据内容B.捕捉到的新数据会禝盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容CD.数据仓库中包含大量的综合数据,这些综合数据会随

2、着时间的变化不断地进行重新综合3.以下关于数据仓库设计的说法屮()是错误的。AA.数据众库项目的需求很难把握,所以不可能从用户的需求山发来进行数据众库的设计,只能从数据出发进行设计B.在进行数据仓库主题数据模型设计时,应该按面向部门业务应用的方式来设U•数据模型C.在进行数据仓库主题数据模型设计时要强调数据的集成性D.在进行数据仓库概念模型没计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域4.以下关于OLAP的描述中(〉是错误的。AA.—个多维数组可以表示为(维1,维2,…,维打)B.维的一个取值称为该维的一个维成员C.OLAP是联机分析处理D.OLAP是数据仓库进

3、行分析决策的基础5.多维数据模型中,下列()模式不属于多维模式。DA.星型模式B.雪花模式C.星座模式D.网型模式6.通常频繁项集、频繁闭项集和最大频繁项集之间的关系是()。CA.频繁项集c频繁闭项集最大频繁项集B.频繁项集c最大频繁项集o频繁闭项集C.S大频繁项集c频繁闭项集c=频繁项集D.频繁闭项集<=频繁项集(=最大频繁项集1.决策树屮不包含()结点。CA.根结点B.内部结点C.外部结点D.叶结点2.下面选项中t不是s的子序列的是()。CA.s=<{2,4},{3,5,6},{8}>t=<{2},{3,6},{8}>B.s=<{2,4},{3,5,6},W〉t=<{2},{8}

4、〉C.s=<{l,2},{3,4}〉t=<{l},{2}〉D.s=<{2,4},{2,4}>t=<{2},{4}>3.前馈祌经网络用于分类时,以下()是不合理的迭代结束条件。DA.前一周期所有的Auv都很小,小于某个指定的阈值B.前一周期未正确分类的样本百分比小于某个阈值C.超过预先指定的周期数D.学习率小于某个阈值4.以下叙述中,()是错误的。DA.逻辑M归用于分析二分类或有次序的依变量和自变量之间的关系B.SVM是一种基于分类边界的方法C.朴素贝叶斯算法和树增强朴素贝叶斯算法是按照描述属性是否独立來划分的D.以上都不对二、(20分)假设某大型人事部门己有一个人事管理系统,包含如下

5、数裾表:职工(编号,姓名,出生曰期,工作地点,月工资,备注)现要设汁一个人事数据仓库,用于分析各地区(华北、华中、华东、…)、各年龄层次(老、屮、青)的工资水平(高、屮、低)等。回答以下问题:(1)根裾你的思考设计该数裾仓庳的模式阁,包含每个维表和事实表的结构。(10分)(2)指出你设计的数据仓库属于哪种模式。(5分)(3)由[出生日期,工作地点,月工资]的基本方体开始,求华东地区的青年职工中高收入的人数,应当执行哪些OLAP操作?(5分)三、(20分)有一个如表1所示的事务数据库,设最小支持度为40%,最小置信度为80%。表1一个事务数据库TID(编号)Itemset(项集)11,

6、3,422,3,4,531,3,5,742,551,2,4,6,72,4,6回答以下问题:(1)采用Apriori算法求出所有的频繁集。要求给出求解过程。(15分)(2)求出所有与元规则“itemiAitem2—item/’相匹配的强关联规则。(5分)四、(15分)对于如表2所示的决策表(f/,CUD),C={a,b,c、d},D={e},回答以下问题:(1)求WC和(5分)(2)求POSdD),该决策表是否为一致(或协调)决策表?(5分)(3)采用分辨矩阵求其所有条件属性约简和核。(5分)表2—个决策表Uabcde1102112102013120024122105210026211

7、02721211五、(25分)回答以下关于聚类的问题:(1)卜中心点算法和均值算法相比有什么优点?(5分)(2)BIRCH算法是什么类型的聚类算法?通常采用簇的聚类特征为CF=(2V,AS,SS),设置这样的聚类特征有什么好处?(10分)(3)什么是离群点?简述将DBSCAN算法用于离群点检测的基本过程。(10分)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。