基于mapreduce海量教学资源存储模型研究

ID：20156096

大小：73.00 KB

页数：5页

时间：2018-10-08

资源描述：

《基于mapreduce海量教学资源存储模型研究》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、基于MapReduce海量教学资源存储模型研兜摘要：本文在研究了MapReduce算法基本原理及应用的基础上，针对当前海量教学资源存储的需求，应用了一种基于云计算环境下优化的MapReduce计算模型，通过测试比较改进前后的MapReduce算法模型数据处理性能，实验证明了改进型MapReduce算法模型提高了海量教学资源数据存储模型的存储能力和计算性能。本文采集自网络，本站发布的论文均是优质论文，版权和著作权归原作者所有。Abstract:Basedonthestudyofthebasicprincipleandapp

2、licationofMapReducealgorithm，inviewofthecurrentstoragerequirementsofmassiveteachingresources，anoptimizedMapReducecomputingmodelbasedoncloudcomputingenvironmentispresented.ThroughtestcomparisonofdataprocessingperformanceoftheimprovedMapReducealgorithm,theexperimen

3、talresultsshowthattheimprovedMapReducealgorithmimprovesthestoragecapacityandcomputingperformanceofthestoragemodelofmassiveteachingresources.关键词：教学资源；存储；MapReduceKeywords：teachingresources；storage；MapReduce中图分类号:TP391.3文献标识码:A文章编号：1006-4311(2017)08-0247-021教学资源教学资

4、源是指高校在教学信息化过程中为教学活动的必要电子材料。一般来说，教学资源是指在教学过程中教学的所有元素，这些主要包括支持教学的信息化数据以及在教学和服务教学的，资金，素材，信息等等。在本文中，教学资源主要是指教学或学习材料，包括媒体资源、试题库、试卷、课件、在线课程等，可以帮助教师和学习者更好的利用教学以及学习知识的信息化数据。2MapReduce的优化MapReduce算法框架首先是由Google提出来的一个分布式计算体系结构，它能够支持大型分布式海量数据处理和分析。这种架构最初起源于两个函数的map和reduce函数

5、式编程模式，但他们的应用程序在最初的算法架构以及原始模型当中进行使用。一个典型的Map/Reduce过程一般有下列几个阶段，如图1所示。虽然MapReduce算法对海量数据存储以及处理方面的优势很大，但是针对高校的海量数据存储的特点，以及当前海量数据存储的需求，MapReduce在处理数据的时候过于繁琐，例如自动并行化数据处理、负载均衡以及设备资源的管理等都得占用计算?C资源。优化的MapReduce的生成方案中可以分为两个部分，分别是第一次的MapReduce算法计算以及第二次的MapReduce分类存储计算。在第一次

6、的MapReduce算法计算当中，首先是把要上传的数据通过Map函数的这个阶段数据的索引词频率计算出来，然后输出对应的数据流当中去，然后再通过Reduce函数来对相应的数据流进行输入，最后再来把计算好的数据记录生成最终的数据记录集合。这样，在第二次MapReduce计算的过程中，再通过对每个数据进行设计相应的权重阈值作为权值，最后再来通过这个权值阀值来进行二次分类，从而提升数据的存储能力以及大大提升访问的速度。优化的MapReduce算法模型如图2所示。3测试分析3.1测试环境所搭建环境具体需求如下：①硬件环境：Mast

7、er（主节点）1台、Slave（子节点）3台。②软件环境：操作系统：Cent0S6.5，集群的主要软件：lladoopl.2.1、DK1.6.022、Vmwareworkstation和Eelipse3.2O3.2hadoop平台搭建采用四台服务器来搭建hadoop集群并部署存储模型进行功能、性能等测试，主节点服务器（roaster）的IP地址为：192.168.1.2（下面简称master）,子节点1:192.168.1.3（下面简称slavel）,子节点2:192.168.1.4（下面简称slave2），子节点3:1

8、92.168.1.188（下面简称slave3），架构规化如下：master作为NameNode,SecondaryNameNode,JobTracker；slavel、slave2以及slave3用来作为DataNode,TaskTracker。3.3实验结果由于实验条件限制，在搭建Hacloop分布式集群的时候，

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于mapreduce海量教学资源存储模型研究

基于mapreduce海量教学资源存储模型研究

相关文章

相关标签