基于.hadoop的海量教育资源中小文件的存储的研究与实现

基于.hadoop的海量教育资源中小文件的存储的研究与实现

ID:33328104

大小:909.12 KB

页数:70页

时间:2019-02-24

基于.hadoop的海量教育资源中小文件的存储的研究与实现_第1页
基于.hadoop的海量教育资源中小文件的存储的研究与实现_第2页
基于.hadoop的海量教育资源中小文件的存储的研究与实现_第3页
基于.hadoop的海量教育资源中小文件的存储的研究与实现_第4页
基于.hadoop的海量教育资源中小文件的存储的研究与实现_第5页
资源描述:

《基于.hadoop的海量教育资源中小文件的存储的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、ABSTRACTABSTRACTEducationresourceislearningresourcesthatexistinginthenetwork,whichhasmanyforms,suchastext,video,audioandotherforms.Amongthem,textresourcesaccountformorethan80%ofalllearningresources.ThenumberoftextresourcesislargeandsizeoffileisgenerallyforKBlevel,rarelyreachMBlevel,

2、thuscallededucationresources.AttheageofInternet,thescaleofonlineeducationresourcesbecomemoreandmorelarge,calculationprocessingishuge,leadstothattraditionaldistributedfilesystemcan'tmeetthedemandforprocessingmassiveeducationresourcessmallfiles.Hadoopisanopensourcedistributedprocessin

3、gplatform,providingareliable,scalableandefficientmethodtohandlemassivedata.HadoopdistributedfilesystemHDFShasabilityofdatastorageandperformsexcellentlyatlarge-scaledatahandling.Unfortunately,HDFSisdesignedforprocessinglargefiles,whichmeanstherehassomeshortagesinprocessingmassivesmal

4、lfiles.Forinstance,thememoryofNameNodewillbeoccupiedquicklywhenstoremassivesmallfilesonHDFS,whichmaycausethememorybottlenecks.Whenaccessingsmallfilefrequently,itneedstojumpamongseveralDataNode,whichleadingtotheaccessspeedslowly.Comparedwithlargefile’sprocessing,smallfileprocessingsp

5、eedistooslow.InordertosolvethestorageproblemofmassiveeducationresourcessmallfilesonHadoopplatform,thisthesisproposesastorageoptimizationschemeforsmallfiles,whichincludesthefollowingfourparts:1)Classificationoftheassociatedsmallfiles:JudgingthesizeoffilebeforefilesuploadedtotheHDFScl

6、uster,ifit’ssmallfile,classifieditwithclassificationalgorithm,thenassociatedcategorysmallfileswithhierarchicalclusteringalgorithm,generatingassociatedsmallfiles.2)Mergingofsmallfiles:mergeclassifiedofassociatedsmallfilesintoalargefile,uploadlargefiletotheHDFScluster,mergingwillreduc

7、ealotofsmallfiles’metadatatooccupythememoryofNameNode.3)Setupindex:establishtheindexforfilelargefiles,whenretrievingsmallfile,itwillberetrievedrapidlybyindexfile,whichimprovingretrievalspeedofsmallfile.4)Metadatacacheandassociatedsmallfileprefetching:Afterfirstreadingthefile,IIABSTR

8、ACTthefilemetadataa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。