南开19春学期(1503、1509、1603、1609、1703)《数据挖掘》在线作业辅导资料

南开19春学期(1503、1509、1603、1609、1703)《数据挖掘》在线作业辅导资料

ID:35795773

大小:16.41 KB

页数:8页

时间:2019-04-18

南开19春学期(1503、1509、1603、1609、1703)《数据挖掘》在线作业辅导资料_第1页
南开19春学期(1503、1509、1603、1609、1703)《数据挖掘》在线作业辅导资料_第2页
南开19春学期(1503、1509、1603、1609、1703)《数据挖掘》在线作业辅导资料_第3页
南开19春学期(1503、1509、1603、1609、1703)《数据挖掘》在线作业辅导资料_第4页
南开19春学期(1503、1509、1603、1609、1703)《数据挖掘》在线作业辅导资料_第5页
资源描述:

《南开19春学期(1503、1509、1603、1609、1703)《数据挖掘》在线作业辅导资料》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、南开19春学期(1503、1509、1603、1609、1703)《数据挖掘》在线作业1、A2、A3、C4、B5、B一、单选题共20题,40分1、数据挖掘经常需要(),即合并来自多个数据存储的数据,存放在一个一致的数据存储中,如存放在数据仓库中。这些数据源可能包括多个数据库、数据立方体或一般文件。A数据集成B数据归约C数据分类D数据聚集正确答案是:A2、()是KDD。A数据挖掘与知识发现B领域知识发现C文档知识发现D动态知识发现正确答案是:A3、数据挖掘是一个基于()的学习过程,一位好的数据挖掘人员必须对新思想持开放态度。A过程B分析C数据D素质正确答案是:C4、熵是为消除不确定性

2、所需要获得的信息量,投掷均匀正六面体骰子的熵是()。A1比特B2.6比特C3.2比特D3.8比特正确答案是:B5、职位可以按顺序枚举,对于教师有:助教、讲师、副教授、教授。职位属性是()。A标称属性B序数属性C数值属性D二元属性正确答案是:B6、关于OLAP的特性:(1)快速性;(2)可分析性;(3)多维性;(4)信息性;(5)共享性,正确的是()。A(1),(2),(3)B(2),(3),(4)C(1),(2),(3),(4)D(1),(2),(3),(4),(5)正确答案是:D7、()使用少量图符表示多维数据值。如:切尔诺夫脸和人物线条画。A数据可视化技术B几何投影技术C基于图

3、符的可视化技术D像素可视化技术正确答案是:C8、()是一种不使用目标变量(至少不明确使用)的数据挖掘。A无指导数据挖掘B有指导数据挖掘C聚类D数据分析正确答案是:A9、()是影响数据质量的因素,反映有多少数据是用户信赖的。A时效性B可信性C可解释性D正确性正确答案是:B10、头发颜色是描述人的一个属性。在我们的应用中,它的可能值为黑色、棕色、淡黄色、红色、赤褐色、灰色和白色,这种属性是()。A标称属性B二元属性C序数属性D数值属性正确答案是:A11、数据仓库和OLAP工具基于多维数据模型。该模型将数据看作()形式。A数据立方体(datacube)B整数C离散D不同正确答案是:A12

4、、如果允许一条记录触发多条分类规则,把每条被触发规则的后件看作是对相应类的一次投票,然后计票确定测试记录的类标号,称为()。A无序规则B穷举规则C互斥规则D有序规则正确答案是:A13、决策树中不包含以下哪种结点?()A根结点(rootnode)B内部结点(internalnode)C外部结点(externalnode)D叶结点(leafnode)正确答案是:C14、以下哪项关于决策树的说法是错误的?()A冗余属性不会对决策树的准确率造成不利的影响B子树可能在决策树中重复多次C决策树算法对于噪声的干扰非常敏感D寻找最佳决策树是NP完全问题正确答案是:C15、簇是数据对象的集合,使得同

5、一个簇中的对象互相(),而与其他簇中的对象相异。A相似B相同C相异D不同正确答案是:A16、()是一种数据变换策略,对数据进行汇总或聚集。例如,可以聚集日销售数据来计算月和年销售量。通常,这一步用来为多个抽象层的数据分析构造数据立方体。A离散化B属性构造C聚集D规范化正确答案是:C17、对于倾斜(非对称)数据,数据中心的最好度量是()。A均值B中位数C众数D中列数正确答案是:B18、下面选项中t不是s的子序列的是()。As=<{2,4},{3,5,6},{8}>,t=<{2},{3,6},{8}>Bs=<{2,4},{3,5,6},{8}>,t=<{2},{8}>Cs=<{1,2}

6、,{3,4}>,t=<{1},{2}>Ds=<{2,4},{2,4}>,t=<{2},{4}>正确答案是:C19、()能降低数据集的规模,而又不损害数据挖掘的结果。A数据集成B数据归约C数据挖掘D数据分类正确答案是:B20、将原始数据进行集成、变换、维度归约、数值归约是在以下()步骤的任务。A频繁模式挖掘B分类和预测C数据预处理D数据流挖掘正确答案是:C二、多选题共10题,20分1、从数据分析的角度看,数据挖掘可以分为两种,即()。A描述性挖掘B预测性挖掘C聚类挖掘D分类挖掘正确答案是:AB2、数据清理过程的第一步是偏差检测(discrepancydetection)。导致偏差的因

7、素可能有多种,包括:()。A具有很多可选字段的设计糟糕的输入表单B人为的数据输入错误C有意的错误D数据退化正确答案是:ABCD3、数据挖掘的预测建模任务主要包括()。A分类B回归C模式发现D模式匹配正确答案是:AB4、现实世界的数据一般是()。数据预处理技术可以改进数据的质量,提高挖掘过程的准确率和效率。A脏的B正确的C不完整的D不一致的正确答案是:ACD5、Web挖掘是数据挖掘技术的应用,从Web中发现()。A模式B错误C结构D知识正确答案是:ACD6、离群点的类型

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。