基于hadoop分布式文件存储服务平台设计和实现的论文

基于hadoop分布式文件存储服务平台设计和实现的论文

ID:33379277

大小:7.26 MB

页数:67页

时间:2019-02-25

基于hadoop分布式文件存储服务平台设计和实现的论文_第1页
基于hadoop分布式文件存储服务平台设计和实现的论文_第2页
基于hadoop分布式文件存储服务平台设计和实现的论文_第3页
基于hadoop分布式文件存储服务平台设计和实现的论文_第4页
基于hadoop分布式文件存储服务平台设计和实现的论文_第5页
资源描述:

《基于hadoop分布式文件存储服务平台设计和实现的论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江大学硕士学位论文摘要随着互联网应用的飞速发展,互联网上的信息和数据量呈现爆炸性增长,如何高效、安全地组织和存储这些大规模的数据,并最大程度地降低应用成本,引发了国内外越来越多的学术界和企业界的关注。当前,无论在广义的互联网环境中,还是在中等规模企业的内部网中,抑或在小规模的局域网中,都存在着大量高性能且廉价的闲散存储资源。充分利用这些闲散、廉价的存储资源,构建可信、优质的大规模存储池,是解决上述问题的有效手段。分布式文件系统为有效利用分散存储资源提供了一条途径。然而,传统意义上的分布式文件存储系统,如Hadoop项目中的HDFS,是运行在结点性能相似、网络环境高度稳定的集群系统

2、中的。因此,如果直接将传统的分布式文件系统部署在网络环境动态变化、存储结点自由进出的网络中,则存在空间利用率低、网络动态适应性差、存储结点信誉度低等问题。本文以Hadoop开源系统为基础,研究适用于广域网络的广义分布式文件存储服务模型,设计并实现了一个基于高效冗余备份策略及服务品质感知的分布式文件存储服务平台——ODFS。研究工作取得如下成果:(1)将分布式文件存储系统建立在动态网络环境中,充分利用了网络环境中的廉价计算资源,降低了存储服务系统的总体拥有成本;(2)提出了一种基于恢复卷的冗余备份机制,大大减少了文件冗余信息的存储空间,并且降低了文件的维护成本;(3)建立了基于层次化

3、名称结点的树状存储系统模型,解决了不同集群间不可共用一套分布式系统的瓶颈问题:(4)设计了一个文件存取客户端软件,解决了Hadoop客户端在Windows环境中的运行问题。关键词:分布式文件存储,Hadoop,冗余备份,品质感知,云存储浙江大学硕士学位论文AbstractWiththerapiddevelopmentofInternetapplications,informationanddataontheInteractgrowexplosively.HowtoorganizeandstorethemassivedataovertheInternethasbecomeanurge

4、ntissue.Currently,thereexistalargenumberoffreeandcheapstorageresourcesinthenetwork,eitherontheInteractortheIntranet.Makinguseofthenumerousfreestorageresourcesinthenetworkisaneffectivemeansofprovidingalargescalestorageinfrastructure.ThedistributedfilesystemisawaytOmakeuseofdistributedstorageres

5、ources.However,traditionaldistributedfilesystems,suchasHDFSoftheHadoopproject,runonclustersystemswithstableandsimilarnodes.Deployingatraditionaldistributedfilesystemdirectlyonthedynamicnetworkwithfreenodesmayresultinissuessuchaslowstoragespaceutilization,pooradaptabilitytOthenetwork,andlowcred

6、ibilityofstoragenodes.BasedontheHadoopopen—sourceproject,thisthesisstudiesonanoveldistributedfilestoragemodelthatadaptstothedynamicnetworkenvironment,anddesignsandimplementsQDFS,adistributedfilestorageserviceplatformthatemploysadataredundancypolicybasedonrecoveryvolumesandaQoS—awaredataplaceme

7、ntstrategy.Themaincontributionofthethesisincludes:(1)Thedistributedfilestoragesystemisbasedonthedynamicnetworkenvironment.Itmakesuseoffreeandcheapstorageresourcesinthenetworkandhencereducesthetotalcostofownership.(2)Thebackupmechanismis

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。