大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx

大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx

ID:83586869

大小:13.66 KB

页数:11页

时间:2024-09-01

上传者:用户名
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第1页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第2页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第3页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第4页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第5页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第6页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第7页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第8页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第9页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx_第10页
资源描述:

《大数据技术基础智慧树知到课后章节答案2023年下东北石油大学.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

大数据技术基础智慧树知到课后章节答案2023年下东北石油大学东北石油大学绪论单元测试1.本课程中关于大数据处理与分析部分的学习内容有:(   )A:大数据分析的常用算法B:Mapreduce的编程模型C:大数据分析过程D:大数据分析分析工具答案:大数据分析的常用算法;Mapreduce的编程模型;大数据分析过程;大数据分析分析工具第一章测试1.大数据的基本特征包括()。A:数据的价值密度但商业价值高B:数据规模大C:数据来源和数据数据类型多样化D:数据增长速度快答案:数据的价值密度但商业价值高;数据规模大;数据来源和数据数据类型多样化;数据增长速度快 1.下面说法正确的是()。A:大数据是第三次信息化浪潮以后产生的数据B:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称C:大数据就是数据容量达到1T以上的数据D:大数据指数据而不包括数据的分析结果答案:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称2.下面哪些技术属于大数据技术。()A:快速传输数据的技术。B:人脸识别技术。C:从各种数据源中采集数据的技术。D:网盘数据存储技术答案:快速传输数据的技术。;从各种数据源中采集数据的技术。;网盘数据存储技术3.如何理解“大数据分析是相关性分析而不是因果分析”。(   )A:发现两个现象的相关性后,经过进一步深入研究,找出因果关系,就会实现技术创新。B:不仅要进行相关分析分析,也要进行因果关系分析。C:不仅要知其然,还要知其所以然。D:相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。 答案:发现两个现象的相关性后,经过进一步深入研究,找出因果关系,就会实现技术创新。;不仅要进行相关分析分析,也要进行因果关系分析。;不仅要知其然,还要知其所以然。;相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。1.大数据的特征Variety是指:(  )A:数据变化多端B:数据格式多样C:数据来源广泛D:数据用途丰富答案:数据格式多样;数据来源广泛第二章测试2.在Python中,语句print(3<5>2)的输出结果为False。()A:错B:对答案:错3.已知x是一个足够大的numpy二维数组,那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。()A:错B:对答案:对4.扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来合并数据。()A:对B:错答案:错 1.已知x=[1,2]和y=[3,4],那么x+y的结果是()。A:7B:[4,6]C:[1,2,3,4]D:3答案:[1,2,3,4]2.Pandas中常用的数据结构包括()。A:SeriesB:PanelC:DataFrameD:List答案:Series;Panel;DataFrame第三章测试3.文件系统的优点不包括()。A:文件的逻辑结构与物理结构脱钩,具有了一定的独立性B:用户的程序与数据可分别存放在外存储器上,实现以文件为单位的数据共享C:数据的组织不存在大量的数据冗余D:操作系统为用户使用文件提供了友好界面答案:数据的组织不存在大量的数据冗余 1.数据仓库的主要特点()。A:相对稳定B:集成性C:面向主题D:分布式存储答案:相对稳定;集成性;面向主题2.NoSQL即“不是SQL”,非关系型数据库,是对不同于传统的关系型数据库的统称。()A:对B:错答案:错3.Hadoop应用在以下方面?()。A:在线旅游B:电子商务C:移动数据D:能源开采答案:在线旅游;电子商务;移动数据;能源开采 1.MongoDB采用BSON(BinaryJSON)来进行文档的存储与编码传输,BSON支持的常见数据类型包括?()。A:TimeB:DoubleC:ObjectIDD:Arrays答案:Double;ObjectID;Arrays第四章测试2.根据处理时间的要求,可以把业务划分为:()A:离线业务B:近线业务C:在线业务D:其余选项都是答案:其余选项都是3.下面哪些技术属于数据融合技术?()A:统一数据编码B:特征编码C:特征离散化D:统一计量单位E:数据规约 F:数据归一化处理答案:统一数据编码;统一计量单位;数据规约;数据归一化处理1.以下不属于聚类分析的算法有:()A:模糊算法B:层次聚类算法C:K-Means算法D:线性回归算法答案:线性回归算法2.HadoopMaReduce中的Map和Reduce阶段的输入输出都是<key,value>键值对形式。()A:对B:错答案:对3.监督学习是最常见的机器学习问题之一,监督学习算法进一步可以分为分类问题与回归问题两大类。()A:错B:对答案:对 第五章测试1.市场上已经出现了很多数据可视化软件和工具,下面不是大数据可视化工具的是()。A:TableauB:PremiereC:EchartsD:Excel答案:Premiere2.科学可视化一般分为()。A:颜色可视化B:大规模数据可视化C:流场可视化D:体可视化答案:大规模数据可视化;流场可视化;体可视化3.可视化是对数据的透彻理解、深入分析和综合采集,主要包括以下哪些环节。()。A:数据获取B:可视化应用C:可视化模式D:数据处理答案:数据获取 ;可视化应用;可视化模式;数据处理1.信息可视化一般适用于大规模非数字型信息资源的可视化表达。()A:错B:对答案:对2.我们没有办法改变标签云的形状。()A:对B:错答案:错第六章测试3.CRISP-DM的方案实施主要工作内容是:()A:固化可重复的分析过程并发布结果B:收集数据并进行数据预处理。C:组织开发阶段开始分析程序的开发D:设计算法和模型,进行大数据分析。答案:固化可重复的分析过程并发布结果4.CRISP-DM适合于什么样的人群?()。A:大数据用户 B:大数据用户和大数据开发的IT人员C:大数据管理人员D:大数据开发的IT人员答案:大数据用户和大数据开发的IT人员1.“全校最热门图书分析”这属于以下哪些主题?()。A:面向读者或图书管理人员的服务B:借阅信息分析C:知识问答D:个性化图书推荐答案:面向读者或图书管理人员的服务;借阅信息分析2.DataFrame.describe函数可以为我们提供哪些信息。()A:通过top可以统计出现次数最多的离散值,直接判断哪些书的借阅次数最多B:通过count提供每一列非空值的数量,各列相互比较就要可以知道是否存在空值C:通过freq可以知道出现次数最多的的值出现的次数D:对数据有一个描述性统计概貌。E:通过unique查看不重复的离散值数目,可以知道是否需要云重复值答案:通过top可以统计出现次数最多的离散值,直接判断哪些书的借阅次数最多;通过count提供每一列非空值的数量,各列相互比较就要可以知道是否存在空值;通过freq可以知道出现次数最多的的值出现的次数;对数据有一个描述性统计概貌。;通过unique查看不重复的离散值数目,可以知道是否需要云重复值 1.关于主题词,下面哪些说法是正确的。()A:如果一个词条在多个分类中都现出,则认为是通用词,不是主题词。B:如果一个词条在某个图书分类中出现的频次很多,而在其它分类中出现的次数很少,这个词条可能是主题词。C:一本文学类书籍可以有多个主题词。D:一本最多只能有2个主题词。答案:如果一个词条在多个分类中都现出,则认为是通用词,不是主题词。;如果一个词条在某个图书分类中出现的频次很多,而在其它分类中出现的次数很少,这个词条可能是主题词。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭