gpu上并行数据操作技术优化

gpu上并行数据操作技术优化

ID:26761982

大小:2.37 MB

页数:72页

时间:2018-11-29

gpu上并行数据操作技术优化_第1页
gpu上并行数据操作技术优化_第2页
gpu上并行数据操作技术优化_第3页
gpu上并行数据操作技术优化_第4页
gpu上并行数据操作技术优化_第5页
资源描述:

《gpu上并行数据操作技术优化》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、申请上海交通大学硕士学位论文GPU上并行数据操作技术优化学校:上海交通大学院系:电子信息与电气工程学院班级:B0803391学号:1080339014硕士生:郑超专业:高性能并行计算导师:邓倩妮(副教授)上海交通大学电子信息与电气工程学院2010年12月ADissertationSubmittedtoShanghaiJiaoTongUniversityfortheMasterDegreeofComputerScienceandTechnologyOPTIMIZATIONFORPARALLELDATAOPERATIONONGPUAuthor:ZhengChaoS

2、pecialty:ComputerSystemandArchitectureAdvisor:Asso.Prof.DengQianniSchoolofElectronicsandElectricEngineeringShanghaiJiaoTongUniversityShanghai,P.R.ChinaDecember,2010上海交通大学硕士学位论文摘要GPU上并行数据操作技术优化摘要近年来,随着多核技术与GPU(GraphicsProcessingUnits)技术的发展和成熟,GPU以其强大的并行计算能力越来越成为研究领域中的热点。人们已经开始研究使用GPU

3、对多种数据操作进行加速。其中在数据库操作中最常用最耗时的连接操作成为人们研究的重点。本文研究了三个经典的连接算法(嵌套连接算法,排序-归并算法和哈希算法)的串行实现和并行实现,在GPU平台上实现了它们的并行化算法,并根据它们各自的特点做了一些优化。同时,鉴于GPU平台和多核处理器系统的相似性,本文把应用在计算机集群上的CMD(CoordinateModuleDistribution)数据划分算法移至到了GPU平台上,并比较了两个并行连接算法(排序-归并算法和哈希算法)和CMD连接算法的性能。另外,本文也比较了以上算法在处理数据偏斜时的性能。为了和CPU多核进行

4、比较,本文还使用了OpenMP实现了排序-归并和哈希连接算法,并把它们同GPU上的版本进行了比较。本文的贡献在于,在GPU平台上实现了排序-归并和哈希连接算法,并根据各个算法的特点进行了优化,同时把CMD算法移植到了GPU平台。本文比较了这些算法在处理数据偏斜时的性能,实验表第I页上海交通大学硕士学位论文摘要明,哈希算法具有很好的表现,CMD连接算法次之,排序-归并算法最差。但是在处理均匀分布的数据表时,CMD连接算法要明显逊色于其它两个算法。而在同OpenMP的版本比较中发现,两个版本的性能不相上下。关键字:GPU,并行关系连接算法,CMD算法,数据偏斜第I

5、I页上海交通大学硕士学位论文ABSTRACTOptimizationforparalleldataoperationonGPUABSTRACTInrecentyears,withthedevelopmentandmaturityofmulticoretechnology,GPU(GraphicsProcessingUnits)hasincreasinglybecometheresearchhotspotbyitspowerfulparallelcomputingcapacity.ResearchershavebeenusingGPUtoaccelerateva

6、riouskindsofdataoperations,amongwhichrelationaljoinisthemostcommonlyusedandmosttime-consumingoperation.Thispaperhasstudiedthethreeclassicrelationaljoinalgorithms(nested-loopjoin,sort-mergejoinandhashjoin),bothserialandparallelversion.TheirparallelversionshavebeenimplementedonGPUando

7、ptimizedaccordingtotheircharacteristics.Atthemeantime,duetothesimilaritybetweenclustersandmulticoresystem,thispaperhasmigratedCMD(CoordinateModuleDistribution)algorithm,originallydesignedforclusters,ontoGPUandcompareditsperformancewiththosetwoclassicalgorithmsonGPU.Wealsocomparedthe

8、irperformanceswhenp

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。