大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx

大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx

ID:83586889

大小:84.04 KB

页数:13页

时间:2024-09-01

上传者:用户名
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第1页
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第2页
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第3页
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第4页
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第5页
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第6页
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第7页
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第8页
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第9页
大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx_第10页
资源描述:

《大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

大数据分析与可视化智慧树知到课后章节答案2023年下山东交通学院山东交通学院第一章测试1.什么是KDD?()A:领域知识发现B:文档知识发现C:动态知识发现D:数据挖掘与知识发现答案:数据挖掘与知识发现2.数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的、隐含的、以前没有用但是潜在有用信息的)模式和知识。()A:对B:错答案:对3.数据挖掘分析的步骤包括()A:创建数据集B:数据预处理C:算法分析D:模型评估答案:创建数据集;数据预处理;算法分析 ;模型评估1.当今社会,数据挖掘分析被广泛应用。()A:错B:对答案:对2.()是未来大数据分析的发展趋势。A:可视化B:实时性C:简单D:非结构化数据答案:可视化;实时性;非结构化数据第二章测试3.关于描述统计,包括()。A:其余选项都不是B:离中趋势分析C:相关分析D:集中趋势分析答案:离中趋势分析 ;相关分析;集中趋势分析1.以下属于推断统计的是()。A:其余选项都不是B:集中趋势分析C:离中趋势分析D:参数估计答案:离中趋势分析2.在数据特征的测度中,描述分布的形状的值为()A:偏态B:峰态C:众数D:中位数答案:偏态;峰态3.测度集中趋势就是寻找数据水平的代表值或中心值()A:对B:错答案:对 1.四分位数可以用于顺序数据、数值数据和分类数据()A:错B:对答案:错第三章测试2.下面哪个属于映射数据到新的空间的方法?()A:渐进抽样B:维归约C:特征加权D:傅立叶变换答案:傅立叶变换3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A:数据预处理B:分类和预测C:数据流挖掘D:频繁模式挖掘答案:数据预处理4.影响数据质量问题的因素有哪些()A:其余选项都对B:相关性、时效性 C:准确性、完整性、一致性D:可信性、可解释性答案:其余选项都对1.数据预处理的常见方法有()A:数据清洗B:数据变换C:数据集成D:其余选项都不对答案:数据清洗;数据变换;数据集成2.数据预处理是指在对数据进行挖掘分析以前,需要对原始数据进行清理、集合和变换等一系列处理工作()A:错B:对答案:对第四章测试3.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A:1,2,3,5 B:1,2,3,4C:1,2,4,5D:1,3,4,5答案:1,2,4,51.频繁项集、频繁闭项集、最大频繁项集之间的关系是:()A:频繁项集频繁闭项集最大频繁项集B:频繁项集=频繁闭项集最大频繁项集C:频繁项集频繁闭项集=最大频繁项集D:频繁项集=频繁闭项集=最大频繁项集答案:频繁项集频繁闭项集最大频繁项集2.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A:分类B:聚类C:关联规则发现D:自然语言处理答案:关联规则发现3.下面购物篮能够提取的3-项集的最大数量是多少()ID购买项1牛奶,啤酒,尿布2面包,黄油,牛奶3牛奶,尿布,饼干4面包,黄油,饼干 5啤酒,饼干,尿布6牛奶,尿布,面包,黄油7面包,黄油,尿布8啤酒,尿布9牛奶,尿布,面包,黄油10啤酒,饼干A:2B:1C:4D:3答案:31.Apriori算法的计算复杂度受(       )影响。A:事务平均宽度B:支持度阀值C:事务数D:项数(维度)答案:事务平均宽度;支持度阀值;事务数;项数(维度)第五章测试2.以下哪些算法是分类算法,() A:C4.5B:K-MeanC:DBSCAND:EM答案:C4.51.决策树中不包含一下哪种结点,()A:外部结点(externalnode)B:叶结点(leafnode)C:根结点(rootnode)D:内部结点(internalnode)答案:外部结点(externalnode)2.以下哪项关于决策树的说法是错误的()A:决策树算法对于噪声的干扰非常敏感B:冗余属性不会对决策树的准确率造成不利的影响C:寻找最佳决策树是NP完全问题D:子树可能在决策树中重复多次答案:决策树算法对于噪声的干扰非常敏感3.以下关于人工神经网络(ANN)的描述错误的有()A:至少含有一个隐藏层的多层神经网络B:神经网络对训练数据中的噪声非常鲁棒C:可以处理冗余特征D:训练ANN是一个很耗时的过程 答案:神经网络对训练数据中的噪声非常鲁棒1.贝叶斯信念网络(BBN)有如下哪些特点,()A:对模型的过分问题非常鲁棒B:网络结构确定后,添加变量相当麻烦C:构造网络费时费力D:贝叶斯网络不适合处理不完整的数据答案:对模型的过分问题非常鲁棒;构造网络费时费力2.如下哪些不是最近邻分类器的特点,()A:分类一个测试样例开销很大B:最近邻分类器基于全局信息进行预测C:可以生产任意形状的决策边界D:它使用具体的训练实例进行预测,不必维护源自数据的模型答案:最近邻分类器基于全局信息进行预测第六章测试3.()这些数据特性都是对聚类分析具有很强影响的。A:高维性B:噪声和离群点C:规模D:稀疏性 答案:高维性;噪声和离群点;规模;稀疏性1.考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择()的相似度计算方法。A:余弦距离B:直接相似度C:共享最近邻D:平方欧几里德距离答案:共享最近邻2.在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。A:曼哈顿距离B:Bregman散度C:平方欧几里德距离D:余弦距离答案:曼哈顿距离3.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()A:非互斥聚类 B:划分聚类C:模糊聚类D:层次聚类答案:划分聚类1.K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。()A:对B:错答案:错第七章测试2.可视化涉及到的学科包括()A:计算机图形学B:人机交互C:统计分析D:数据挖掘答案:计算机图形学;人机交互;统计分析;数据挖掘3.若有一个数据集,每个数据点有5个属性,以下哪种可视化技术最适用于表示其属性凉凉之间的相关性呢?()A:直方图 B:像素图C:散点图D:坐标系答案:散点图1.下图主要运用了哪一种基本可视化图表?()A:折线图B:走势图C:盒须图D:散点图答案:走势图2.echars可以用来实现大数据可视化大屏()A:对B:错答案:对 1.数据可视化是大数据发展的趋势。()A:对B:错答案:对

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
最近更新
更多
大家都在看
近期热门
关闭