《虚拟化与云计算》模拟试卷.doc

《虚拟化与云计算》模拟试卷.doc

ID:53252062

大小:37.50 KB

页数:4页

时间:2020-04-02

《虚拟化与云计算》模拟试卷.doc_第1页
《虚拟化与云计算》模拟试卷.doc_第2页
《虚拟化与云计算》模拟试卷.doc_第3页
《虚拟化与云计算》模拟试卷.doc_第4页
资源描述:

《《虚拟化与云计算》模拟试卷.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《虚拟化与云计算》模拟试卷姓名:学号:院系:第一部分:选择题(共40分,每题4分)1)Reducer的三个阶段是()A.Shuffle——Sort——ReduceB.Shuffle——Reduce——SortC.Reduce——Shuffle——SortD.Sort——Shuffle——Reduce2)下列关于mapreduce的key/value对的说法正确的是()A.输入键值对不需要和输出键值对类型一致B.输入的key类型必须和输出的key类型一致C.输入的value类型必须和输出的value类型一致D.输入键值对只

2、能映射成一个输出键值对3)下面哪一个选项是mapreduce真正的引擎()A.NamenodeB.DatanodeC.JobTrackerandTaskTrackerD.HDFS4)下列选项中哪个不是GFS中“Masters”的主要功能()A.维护所有文件系统的元数据B.周期性地与chunkservers联系来发送指令和检查状态C.对于读与写,客户端通过与Master联系来获得chunk的位置,然后直接与chunkservers连接D.返回最终的答案给客户端5)下列哪个选项不是我们需要Hive的主要原因()A.我们需要一

3、个容量为PB级别的数据仓库。B.文件是不充分的数据抽象。C.Hadoop在处理作业方面是不够的。D.我们需要一个开发的数据格式。6)下面那个不是云计算的特征()A.虚拟化B.动态可扩展C.管理多设备D.个体自治7)Hadoop用来确保数据准确性的方法不包括下面的哪一个()A.使用校验和来验证数据4B.客户端每512字节计算一次校验和,数据节点存储这些校验和C.客户端从数据节点中检索数据,如果验证失败,客户尝试别的副本D.数据节点中的数据被加密以防止可能的攻击8)关于分布式文件系统的说法,不正确的是()A.分布式文件系统整

4、个集群中有多个namespaceB.文件被分为大的块,通常为128MC.可以通过Java、C或者命令行访问D.非常适合对大文件的流式读取9)以下错误不是Hadoop能很好解决的()A.任务失败B.任务追踪失败C.连接失败D.作业追踪失败10)下列哪个选项能正确地在Hive中返回“查询年龄在18到25岁之间的用户返回的前5页”的结果()A.SELECTp.url,COUNT(1)asclicksFROMusersuJOINpage_viewspON(u.name=p.user)WHEREu.age>=18ANDu.age<

5、=25GROUPBYp.urlORDERBYclicksLIMIT5;B.SELECTp.url,COUNT(1)asclicksFROMusersuJOINpage_viewspWHEREu.age>=18ANDu.age<=25GROUPBYp.urlORDERBYclicksLIMIT5;C.SELECTp.url,COUNT(1)asclicksFROMpage_viewspON(u.name=p.user)ORDERBYclicksLIMIT5;D.SELECTp.url,COUNT(1)asclicksFRO

6、MusersuJOINpage_viewspON(u.name=p.user)WHEREu.age>=18ANDu.age<=25GROUPBYp.urlORDERBYclicks;4第二部分:简答题(共60分,第一大题10分,第二大题20分,第三大题30分)一、简述MapReduce的主要思想和工作原理(可借助下面的例子),并根据例子画出数据流图(例子:使用MapReduce解决求商品价格最小问题,输入为商品名称、商品价格、商品网站,输出为商品名称、最小价格、商品网站。输入样例:Cloudcomputing38.4da

7、ngdang.comCloudcomputing40.5china-pub.comVirtualizationandcloudcomputing35.7amazon.com.cnVirtualizationandcloudcomputing30.8bookschina.comVirtualizationandcloudcomputing36.6360buy.comCloudcomputing35.1amazon.com.cn输出样例:Cloudcomputing35.1amazon.com.cnVirtualizatio

8、nandcloudcomputing30.8bookschina.com)二、当数据量非常大超过单个机器的存储能力时需要将数据存储在不同的机器上,这时就需要分布式文件系统来管理这些数据,请回答关于分布式文件系统的下列问题:(1).在设计分布式文件系统时需要注意哪些方面?(2).原先存储超大文件的分布式文件系统现用来存

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。