集成cpu-gpu架构上的列存储连接优化技术研究

集成cpu-gpu架构上的列存储连接优化技术研究

ID:35101464

大小:2.84 MB

页数:67页

时间:2019-03-17

集成cpu-gpu架构上的列存储连接优化技术研究_第1页
集成cpu-gpu架构上的列存储连接优化技术研究_第2页
集成cpu-gpu架构上的列存储连接优化技术研究_第3页
集成cpu-gpu架构上的列存储连接优化技术研究_第4页
集成cpu-gpu架构上的列存储连接优化技术研究_第5页
资源描述:

《集成cpu-gpu架构上的列存储连接优化技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10255学号:2131529集成CPU-GPU架构上的列存储连接优化技术研究Column-StoresJoinOptimizationonCoupledCPU-GPUArchitecture学科专业:计算机科学与技术作者:李子通指导教师:丁祥武答辩日期:2016年1月东华大学计算机科学与技术学院SchoolofComputerScienceandTechnologyDonghuaUniversity东华大学学位论文原创性声明本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不

2、包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日东华大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密后适用本版权书。本学位论文属于不保密□。学位论文作者签名:指导教师签名:日期:年月日日期:年月日东华大学硕士研究生学

3、位论文摘要集成CPU-GPU架构上的列存储连接优化技术研究摘要随着互联网时代的到来,企业数据爆发式增长。如何更好地支持海量数据的存储、分析,已经成为企业关注的重要问题。数据仓库是用来存储、分析海量数据的重要工具。传统关系型数据库以事务操作为核心,而数据仓库更注重对海量数据的存储、查询与分析。相比于行存储技术,列存储技术因其在读优先环境中的优势,被更多的应用于数据仓库之中。由于列存储系统可以支持列的独立存储、压缩和其他操作,列存储更利于读优化操作。集成多核异构CPU-GPU架构已经成为计算机处理器芯片的发展趋势,在商用计算机中,基于集成多核异构CPU-GPU架构的中央处理器已经得到了较为广

4、泛的应用。在这种趋势下,研究数据仓库软件如何利用集成多核异构CPU-GPU体系架构处理器的性能优势极具价值。本文主要研究集成多核异构CPU-GPU架构处理器上列存储系统的连接原语优化技术,并以我们实验室自主研发的列存储系统为基础,研究了如何利用集成多核异构CPU-GPU架构的计算资源和性能优势优化连接操作。主要工作如下:本文首先研究了基于列存储系统的并行连接算法,针对OpenCL编程框架的特点,设计并实现了基于OpenCL的列存储系统连接算I东华大学硕士研究生学位论文摘要法。除此之外,研究了GPU上的数据分组算法,并针对该算法空间开销较大的问题做了相应改进,提出了一种基于分组数统计的GP

5、U数据分组算法。其次,对使用GPU作协处理器加速数据查询操作的方法进行了研究。之后,深入研究了基于集成CPU-GPU架构的流水线协处理方案,并针对其无法动态改变数据配比的问题,提出了一种动态数据分配策略。再次,研究了实验室自主研发的列存储系统,并对其作出了改进,将本文提出的数据分配策略集成到该系统之上,使其可以充分利用集成CPU-GPU架构处理器的计算资源,优化连接操作。最后,使用SSB测试基准,验证了本文提出的方法有效性。实验结果表明,本文提出的方法使得两表连接效率最大提高了33.2%,SSB测试基准的标准查询语句Q1.1的执行时间缩短了9.81%,Q3.1执行时间最高缩短了7.03%

6、。关键词:异构芯片;数据预取;查询优化;并行连接算法;OpenCLII东华大学硕士研究生学位论文ABSTRACTColumn-StoresJoinOptimizationonCoupledCPU-GPUArchitectureABSTRACTWiththeadventoftheInternetera,enterprises'databurstmodegrowth,howtobettersupporttheanalysisandstorageofmassdata,hasbecomeanimportantissueofconcerntotheenterprise.Datawarehousei

7、sanimportantsoftwaretooltostoreandanalyzemassivedata.Comparedtothetraditionalrelationaldatabase,whichfocusontransactions,datawarehousepaysmoreattentiontothequeryandanalysisofmassivedata.Comparedwiththerowstoragetechnol

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。