欢迎来到天天文库
浏览记录
ID:51095685
大小:8.12 MB
页数:67页
时间:2020-03-18
《开放可伸缩关系数据模型及数据分区策略研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、AthesissubmittedtoZhengzhouUniversityforthedegreeofMasterResearchonOpenScalableRelationalDataModelandDataPartitionStrategyByZhimengDuSupervisor:Prof.ZhiyunZhengComputerApplicationTechnologyCollegeofInformationandEngineeringMay2014原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已
2、经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者:栅蔫L日期:2DJl}年占月J0日学位论文使用授权声明本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本
3、人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。学位论文作者:沫L培羡日期:20件年孓月70日摘要随着互联网的逐步社会化,各行各业的数据生产能力达到前所未有的高度,大数据(BigData)概念在这一背景下被提了出来,并且吸引了越来越多的关注。随之而来的是各式各样的大数据技术,简言之,大数据技术指从海量形式各异的数据中,快速获取信息价值的能力。其中数据模型和数据存储技术研究是数据科学领域中的一项基础性工作,能够为上层数据库构建、数据存取、数据分析和挖掘提供有力支撑。论文描述了大
4、数据技术的研究背景、研究意义,分析了大数据的特点及主流的数据处理技术,同时给出了大数据模型及相应数据分区策略的研究现状。然后,针对传统关系数据模型数据类型受限,并发查询性能低和横向伸缩性不足的缺陷,提出了一个开放可伸缩关系数据模型,该模型采用类关联数据的方式保留并扩展了传统关系模型的关系描述能力,提供了开放的数据类型支持,并借鉴key-value的思想,提供了完全的横向伸缩特性,迎合了大数据体量庞大、类型多样、增长迅速的特点。在此之上,以构建一个高伸缩性、高可靠性和便于进行跨数据中心部署的存储系统为目标,从具体的数据存储角度出发,针对OSRDM及其它基
5、于key—value的数据模型,在分析现有数据分区与冗余机制的基础上,提出了一个基于一致性哈希的弹性冗余数据分区策略,该策略将一致性哈希算法与数据冗余机制相结合,在最大程度发挥key-value类数据模型高横向伸缩性特点的同时,通过可控冗余保证数据的可靠性,同时提升数据的并发访问性能。对所提模型和策略的评价工作分为定性分析和定量实验两个部分,分别针对开放可伸缩关系数据模型和基于一致性哈希的弹性冗余数据分区策略,从功能特性和性能指标两方面,与主流数据模型及数据分区策略进行分析对比,评价结果显示出了OSRDM和CHAFRAS的优越性。关键词:分布式数据库;
6、NoSQL数据模型;关系数据模型;数据分区;一致性哈希AbstractWiththeIntemetbecominganindispensablepartofthesociety,thegeneratingspeedofdatafromallwalksoflifehasreachedanunprecedentedlevel.TheconceptBigDataisbroughtupuponthisbackgroundandattractsincreasingattention.Infrontofthechallenges,bigdatatechnologi
7、esariseatthehistorymoment.Tosomeextent,bigdatatechnologyisaimedatfetchingvaluableinformationfromvarioustypesofdata.Amongthesetechnologies,databaseandrelatedresearchondatamodelsanddatastoragepatternsaddresstheissuesofhowtodescribe,organizeandstorelargedatasetsefficiently,providin
8、gqualifiedacccsscapacityforapplications.Thiskin
此文档下载收益归作者所有