欢迎来到天天文库
浏览记录
ID:23614419
大小:6.67 MB
页数:70页
时间:2018-11-09
《key-value数据库上连接操作查询处理和优化》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、AThesisinComputerArchitectureQueryProcessingandOptimizationofJoinOperationonKey—ValueDatabaseByWangXiteSupervisor:ProfessorShenDerongNortheasternUniversityJune2011>独创性声明本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说
2、明并表示诚挚的谢意。学位论文作者签名:孟,习柏Et期:加7fl/,y7学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。作者和导师同意网上交流的时间为作者获得学位后:半年口一年√一年半口两年口学位论文作者签名:互目糯签字日期:沙f『、莎,77导师签名:签字日期:\审哆筝l卜烈l。6。胡f东北大学硕士学位论文摘要Key.Value数据库上连接操作的查询处理与优化摘要伴随着互联网
3、技术的高速发展,各种类型的应用层出不穷,在这个云计算的大环境下,数据存储技术出现了新的特点:支持海量的数据和流量,更低的读写延迟,强大的可用性,较低的运营成本等。在过去的几十年中,传统数据库虽然已经在业界占据了不可动摇的地位,但是面对时代的新需求,其扩展困难,读写慢,成本高,支撑容量有限等缺点不断显现出来。为了解决上述问题,NoSQL数据库应运而生。这类数据库在设计支持海量的存储,具有强大的可用性,并且可以运行在普通的PC机构建的集群中,运营成本低,易维护。因为一般都采用key.value的数据模型。所以习惯上又称key.valuedatabase,即KVDB。在key.
4、value数据库中,元组之间并没有传统数据库中的强关联关系。这使得在key—value数据库中的SQL查询变得很难实现,而其中最为复杂的部分就是连接操作。针对此问题,本文通过对目前较为流行的一款环形KVDB:Cassandra进行分析,设计了针对环形架构列值索引,并基于这种索引提出了支持大数据量的预连接操作的查询处理算法,并做了相应的优化。另外作为补充,同时也设计了实时连接算法。本文的内容总结如下:1.首先介绍了NoSQL中的常见数据模型、架构和读写策略等相关知识。2.针对环形架构设计了相应的列值索引,给出了相关算法。并基于这种索引结构,设计并优化了预连接算法。3.设计了
5、实时连接算法。同时针对实时连接算法,设计了双重索引,提高了实时连接算法的效率。4.针对本文提出的算法进行了实验测试,验证了算法的性能。关键词:NoSQL,KVDB,连接操作,查询处理与优化II东北大学硕士学位论文AbstractQueryProcessingandOptimizationofJoinOperationonKey-ValueDatabaseAbstractWiththerapiddevelopmentofInternettechnology,varioustypesofapplicationsemergeoneafteranother.Inthebackgr
6、oundofcloud-computing,datastoragetechnologybecometohavesomenewfeatures:supportingextremelylargeamountsofdata,lowerIOdelay,highavailability,loweroperationandmaintenancecosts.etc.Inthepastfewdecades,traditionalrelationaldatabasehasalreadyoccupiedunshakablestatusinindustry,butitsdrawbacksuch
7、aslowexpansibility,highcost,literacyslow,supportingcapacitylimitbecomemoreandmoreserious.Inordertosolvetheproblemsabove,NoSQLdatabasearisesatthehistoricmoment.Thiskindofdatabaseisdesignedtosupporthugeamountsofdatastorage,hashighavailability,canrunontheclusterwhichis
此文档下载收益归作者所有