基于hadoop混合存储解决方案的研究

基于hadoop混合存储解决方案的研究

ID:35056942

大小:5.41 MB

页数:51页

时间:2019-03-17

基于hadoop混合存储解决方案的研究_第1页
基于hadoop混合存储解决方案的研究_第2页
基于hadoop混合存储解决方案的研究_第3页
基于hadoop混合存储解决方案的研究_第4页
基于hadoop混合存储解决方案的研究_第5页
资源描述:

《基于hadoop混合存储解决方案的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP392单位代码:101的:2013544107密巧:公开研究生学号:古林大学硕古学位馀文专A学位()基于Hadoop混合存储解决方案的研究ResearchontheSol加onofHbridStorageyBasedonHadoop作者姓名:余大州类别:工程硕±领域(方向):软件工程指导教腑巧辉巧教巧培养单化软件学院2016年4月基于Hadoop漏合存储解决方案的研究Researchon化eSolutionofHbrid

2、StoraeygBasedonHadoop作者姓名:余大州领域(方向):软件工程指导教师:康辉副教授类别:工程硕±答辩日期:2016年5月28日未经本论文作者的书面授权,化法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担侵权的法律责任。吉林大学硕:t学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教师的指导下

3、,独立进行研究工作所取得的成果。除文中己经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的作品成果。对本文的研。究做出重要贡献的个人和集体,均已在文中明确方式标明本人完全意识到本声明的法律结果由本人承担。学位论文作者签名少,曰期:^八年^月曰y摘要基于化doo泡合存储解决方案的研巧p,平台内容的逐渐丰富随着互联网应用的逐渐普及,越来越多的行业选择与互联网,结合,因此产生了大量的数据。审视现有技术,不难发现所有的技术都是W技术为核屯、。作为用户,我们对多样型媒体的

4、欲望与曰俱増,比如观看的电影和创建并上传到网络的照片和视频等。不仅是数据总量和种类在不断增加,同时数据生成速率也在不断增力口。如何很好地获取,管理送些数据,并选择行之有效的方法分析数据,提取价值是如今最重要的课题。随着数据的爆炸式增长,结构化数据、半结构化数据和非结构化数据的混合存储平台是进行数据分析的基础,经典的数据处理系统扩展方法如向上扩展配置昂贵的大型机,或者向外扩展升级系统硬件可获得更强大的处理能力,但是其成本非常离昂。另外,由于海量数据数据的深度分析技术处于初步阶段,主流的Hadoop

5、和MapReduce在实时一一般,Hadoo,分析方面性能。因此对不同数据源和p的整合应用设计种可W高效连接Hadoop和不同数据产品的混合存储的优化方案是具有价值的。本文从流行的大数据处理框架Hadoop入手,分析现有分布式存储和计算技术原理,一H结合不同类型数据库的特点和Hadoop的集群技术,提出了种基于adoop的混合存储解决方案:。主要的工作包括一1.实现HDFS的数据交互平台,利用这分布式文件存储平台,不同种类数据可H一在adoop和传统的数据库系统中实现共享交互,从而有利于进行更深

6、步的数据分析工作。2一.针对Hadoop的单控制节点和跨机房、跨集群背景下的管理问题,设计了种多,,减少单控制节点负载压力控制节点管理结构从而增强系统可靠性。3.对于非结构化数据存储,利用基于Hadoop的数据存储产品邸ase作为存储数一据库,但是为了应对海量数据进行数据导入时候的效率问题,设计了种文件传输方式,通过转化文件格式适应HBase的存储文件特点,从而加快存储速率。4.对于结构化数据存储分析,利用了基于Hadoop的适用于结构化数据存储的HiveI,作为离线数据仓库提供离线的深

7、度数据分析,。而对于实时查询需求则设计通过传统关系数据库中完成。本文实现了数据通过Hadoop经由关系数据库导入Hive的流程。5.搭建指向HDFS系统的FTP服务器。实现了与Hadoop分布式文件系统的交互,同时也便于多客户端的用户访问和管理数据。关健词:大数据,Hadoo,,p结构化数据非结构化数据,存储IIAbstractResearchon化eSo山杜onofHybridS4;orageBasedonHadoopWiththegradualincreasi

8、ngpopularityofI打化metapplicationsa打dinternetcontents,moreandmoreindustriesselectcombinewiththeInternetwhichresultinalareamountof

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。