欢迎来到天天文库
浏览记录
ID:83586875
大小:14.43 KB
页数:12页
时间:2024-09-01
《大数据技术与应用智慧树知到课后章节答案2023年下咸阳职业技术学院.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
大数据技术与应用智慧树知到课后章节答案2023年下咸阳职业技术学院咸阳职业技术学院第一章测试1.大数据(BigData),是指可以在一定时间范围内使用常规软件工具进行捕捉、管理和处理的数据集合。()A:错B:对答案:错2.Hadoop之父是()。A:DougCuttingB:KentBeckC:MartinFowler答案:DougCutting3.大数据的起始计量单位至少是P,即()个TA:10000B:10C:50D:1000答案:10004.大数据的特征有()。A:数据量大B:价值密度低C:计算速度快D:数据种类繁多答案:数据量大;价值密度低;计算速度快;数据种类繁多 1.Hadoop核心组件有()A:HDFS(分布式文件存储系统):解决海量数据存储B:YARN(集群资源管理和任务调度框架):解决资源任务调度C:MapReduce(分布式计算框架):解决海量数据计算答案:HDFS(分布式文件存储系统):解决海量数据存储;YARN(集群资源管理和任务调度框架):解决资源任务调度;MapReduce(分布式计算框架):解决海量数据计算第二章测试2.Linux下启动HDFS的命令是()。A:start-dfscmdB:start-dfs.shC:startdfsD:hdfs答案:start-dfs.sh3.生成密钥对的命令是()。A:ssh-keygenB:sshC:ssh-addD:ssh-copy-id答案:ssh-keygen4.查看hadoop版本号的命令是()。A:hadoop-versionB:Hadoop-versionC:Version-hadoop-D:hadoopversion答案:hadoopversion5.Hadoop开发过程中一般采用普通用户登录。()A:错B:对答案:对 1.生效环境变量的命令是( )。A:vi /etc/profileB:vim/etc/profileC:source/etc/profileD:cat/etc/profile答案:source/etc/profile第三章测试2.Client端上传文件的时候下列哪项正确?()A:Client端将文件切分为Block,依次上传B:Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作C:NameNode负责Block复制工作D:数据经过NameNode传递给DataNode答案:Client端将文件切分为Block,依次上传3.下面哪个程序负责HDFS数据存储()。A:DatanodeB:secondaryNameNodeC:NameNodeD:Jobtracker答案:Datanode4.Cloudera提供哪几种安装CDH的方法?()A:TarballB:YumC:ClouderamanagerD:Rpm答案:Tarball;Yum;Clouderamanager;Rpm5.Nagios不可以监控Hadoop集群,因为它不提供Hadoop支持。() A:对B:错答案:错1.Ganglia不仅可以进行监控,也可以进行告警。()A:错B:对答案:对第四章测试2.Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是()。A:1500MB:2000MC:200MD:1000M答案:1000M3.DataNode通过()与NameNode保持通信。()A:短连接B:长连接C:无连接D:超长连接答案:长连接4.下列哪项可以作为集群的管理?()A:ClouderaManagerB:PdshC:ZookeeperD:Puppet答案:Pdsh;Zookeeper;Puppet5.配置机架感知的下面哪项正确:() A:MapReduce会根据机架获取离自己比较近的网络数据B:写入数据的时候会写到不同机架的DataNode中C:如果一个机架出问题,不会影响数据读写答案:MapReduce会根据机架获取离自己比较近的网络数据;写入数据的时候会写到不同机架的DataNode中;如果一个机架出问题,不会影响数据读写1.如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。()A:对B:错答案:错第五章测试2.Yarn各模块组成有:()A:AngularB:Resourcemanager、nodemanager、applicationMasterC:VueD:Json答案:Resourcemanager、nodemanager、applicationMaster3.Yarn附则整个集群的资源管理功能,每个任务都单独有一个“应用服务器”:()A:对B:错答案:对4.以下关于yarn的描述正确的是:()A:对于资源的表示以硬盘为单位。 B:目前可以支持多种计算框架运行在yarn上面,比如MapReduce、storm、spark、fookk等。C:支持多个框架,yarn不再是一个单纯的计算框架,而是一个框架管理器。D:框架升级更容易,在yarn中,各种计算框架不再是作为一个服务部署到集群的各个节点上。答案:支持多个框架,yarn不再是一个单纯的计算框架,而是一个框架管理器。1.以下关于yarn的说法正确的是:()A:Yarn是采用两级式资源分配方案B:存在于Hadoop1.0中C:Spark、stormstreaming、igraph等计算框架不能再yarn上运行,也不能访问hdfs上的数据资源D:Yarn只能运行Hadoop生态下的MapReduce运算框架答案:Yarn是采用两级式资源分配方案2.对新一代资源管理调度框架YARN的理解正确的是:()A:YARN的体系结构包含三个组件:ResourceManager,NodeManager,ApplicationMasterB:MapReduce2.0是运行在YARN之上的计算框架,由YARN来为MapReduce提供资源管理调度服务C:YARN既是资源管理调度框架,也是一个计算框架D:YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架答案:YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架第六章测试3.HDFS为海量的数据提供了存储,而MapReduce为海量的数据提供了计算。() A:错B:对答案:对1.谷歌公司关于MapReduce模型的论文发布于()年A:2004B:2003C:2005D:2006答案:20042.下列关于MapReduce模型的说法错误的是()A:MapReduce模型是一种理论模型,无法实现B:MapReduce模型具有简单易学,使用灵活的特点C:MapReduce模型可实现大规模数据的并行计算D:MapReduce模型的核心思想是“分而治之”答案:MapReduce模型是一种理论模型,无法实现3.大数据的开发和利用,关键在于大数据技术的支撑。其中,MapReduce是分布式数据库。()A:对B:错答案:错4.适合MapReduce框架处理的任何和数据集要求待处理的数据集可以分解为许多小的数据子集,而且每个数据子集的处理不依赖也不影响其他数据子集的处理。()A:对B:错答案:对 第七章测试1.()是一个实时收集、分析、展示、监控数据的分布式数据库,它基于HBase存储和查询监控数据。A:KijiExpressB:KijiMRC:KijiD:OpenTSDB答案:OpenTSDB2.HBase每个行有一个()唯一标识了行的地址。A:列族B:名C:行键D:时间戳答案:行键3.在水平方向,HBase的一张表由一个或多个()组成。A:时间戳B:列C:行D:列族答案:列族4.HBase的每个列族均对应了一个()属性。A:列名B:时间戳C:列键D:行键答案:时间戳5.在垂直方向,HBase的一张表有多个()来组成。A:列B:行族C:列族D:行答案:行族 第八章测试1.下列关于Hive特点总结正确的选项是()。A:Hive支持自由的扩展集群的规模,只需要重启服务即可B:Hive支持自定义函数,用户可以根据自己的需求去定义函数C:Hive适合处理小批量数据D:HiveSQL执行时,需要避免节点出现问题答案:Hive支持自定义函数,用户可以根据自己的需求去定义函数2.Hive的元数据存储在derby和MySQL中有什么区别()。A:数据库的区别B:没区别C:多会话(Moresession)D:支持网络环境答案:多会话(Moresession)3.Hive有四个驱动器,下面那个不是()。A:解释器B:编译器C:策略器(Strategyimplement)D:优化器答案:策略器(Strategyimplement)4.Hive有什么好处()。A:可以存储数据B:可以通过语句自动编译mapreduce(Mapreducecanbeautomaticallycompiledusingstatements)C:可以直接在表中插入数据D:可以使用sql,操作存储在hdfs中的数据答案:可以通过语句自动编译mapreduce(Mapreducecanbeautomaticallycompiledusingstatements)5.下列哪个组件不属于Hive架构() A:ClientB:MySQLC:TaskManagerD:HDFS答案:TaskManager第九章测试1.Flume可以将应用产生的数据存储到任何集中存储器中,比如HDFS,HBase。()A:错B:对答案:对2.Flume的管道是基于事务,保证了数据在传送和接收时的一致性。()A:对B:错答案:对3.Flume是可靠的,容错性高的,可升级的,易管理的,并且不可以定制。()A:对B:错答案:错4.实时性,Flume有一个好处可以实时的将分析数据并将数据保存在数据库或者其他系统中。()A:错B:对答案:对 1.Flume的配置很繁琐,source,channel,sink的关系在配置文件里面交织在一起,便于管理。()A:对B:错答案:错第十章测试2.Sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。()A:错B:对答案:对3.Sqoop核心的功能有导入或迁入、导出或迁出。()A:错B:对答案:对4.Sqoop就是一个工具,需要在两个以上节点上进行安装即可。()A:错B:对答案:错5.Sqoop导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统。()A:错B:对答案:对 1.Sqoop不能自动地完成数据类型的映射与转换。()A:对B:错答案:错
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处