欢迎来到天天文库
浏览记录
ID:35057073
大小:5.45 MB
页数:53页
时间:2019-03-17
《基于hdfs的文件管理系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:一&I;;。,兰基于HDFS的文件管理系统的设计与实现研究生姓名:孟密密导师姓名:吴国新董永强校外导师:徐文平申请学位类别工程硕±学位授予单位东南大学一20级学科名称软件工程论文答辩日期16年1月14日二级学科名称软件工程学仿授予日期201年月日答辩毒员会主席吉逸评阅人2016年1月28日DESIGNANDIMPLEMENTATIONOFAHDFS-BASED巧LEMANAGEMENTSYSTEM
2、A凡的isSubmited化SoutheastUniversityFor化eAcademicDereeofMaslierofEnineeringggBYMenMimigSupervisedbyProf.WuuoxingandAssoc.Prof.DongYongqiangColleeofSoftwareEnineeringggSoutheastUniversity东南大学学位论文独创性声明本人声明所呈交的学位论文是
3、我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研巧成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明。与我并表示了谢意。研究生签名;娜禹日期;东南大学学位论文使用授权声明东南大学、中国科学技术信息研巧所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可(^采用影印、缩印或其他复制手段保存论文。本人电子文
4、档的内一致容和纸质论文的内容相。除在保密期内的保密论文外,允许论文被查阅和借阅,可W公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权东南大学研究生院办理。N*)-以。入研究生签名;、棘豕导师答名:日期;W占分^摘要随着互联网的发展,各类企业需要保存和处理的数据也急剧増长。通常,中小金业需要对TB甚至PB级别的数据进行存储和分析。传统的工具对于处理如此规模的数省越来越无能为力,分布式文件系统应运而生。D一HadoopistributedFi
5、leSystemHDFS提供了个离容错性和髙呑化量的海量数据()存储解决方案、、低成本的特点,非常适合中小,它具有离扩展性离可靠性、高吞吐量企业使用。但是由于HDFS并没有提供客户端管理工具,没有监控模块和分布式搜索功能、,从而无法满足中小企业希望数据操作简单方便管理维护便捷直观、访问文件快速髙效等实际应用需求。本文在深入理解与分析HDFS的存储技术、读写机制的基础上,基于Hadoop分布一式系统架构,设计并实现了个基于HDFS的在线文件管理系统。论文的主要工作有:一(1)提出了
6、基于HDFS的文件管理系统解决方案,设计实现了个分布式的文件管理系统客户端,使用户能够方便地通过Web页面对存储在HDFS中的海量数据进斤管理。(2)提出了HDFS下载优化方案和小文件存储方案,提高了HDFS的下载效率W及小文件的存储性能。'(3)利用Eiasticsearch分布式搜索技术,对HDFS文件管理系统中的数据创建索,优化和改进索引过程引文件,实现了分布式索引和分布式搜索功能。(4)通过部署和使用Ganglia集群监控系统,对Hadoop集群的节点信息和流量信'
7、息进行监控,加强了HDFS文件管理系统的可管理能力。论文最后对所实现的系统进行了详绩的功能和性能测试。实验结果表明,基于HDFS的分布式文件管理系统能够高效地管理海量文件,满足中小企业的实际应用需求。关键词:HDFS,Elasticsearch分布式文件系统,分布式捜索,1东南大学硕丄-学位论义AbstractWi化化edevelopmentofInternet,allkindsofen化rprisesneedtoprocesslargeamount
8、*fit-Uioliaidlrowndaa.SmallandmediumsizedeierrsesusualstoredataofPBlevelpyggpyandTBlevel.Avarietofdistributed巧lesstemscameintobeintomeetsuchreuirements.yygqTheHadoop
此文档下载收益归作者所有