PBPP:列存储系统中基于传递块缓冲区的流水线并行处理-论文.pdf

PBPP:列存储系统中基于传递块缓冲区的流水线并行处理-论文.pdf

ID:54925328

大小:484.51 KB

页数:6页

时间:2020-05-04

PBPP:列存储系统中基于传递块缓冲区的流水线并行处理-论文.pdf_第1页
PBPP:列存储系统中基于传递块缓冲区的流水线并行处理-论文.pdf_第2页
PBPP:列存储系统中基于传递块缓冲区的流水线并行处理-论文.pdf_第3页
PBPP:列存储系统中基于传递块缓冲区的流水线并行处理-论文.pdf_第4页
PBPP:列存储系统中基于传递块缓冲区的流水线并行处理-论文.pdf_第5页
资源描述:

《PBPP:列存储系统中基于传递块缓冲区的流水线并行处理-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第41卷第6期计算机科学Vo1.41No.62014年6月ComputerScienceJune2014PBPP:列存储系统中基于传递块缓冲区的流水线并行处理丁祥武张光辉(东华大学计算机与科学技术学院上海201620)摘要片上多核处理器(CMP)凭借其低功耗和低成本等优势迅速成为处理器市场的主角,它为多线程的实现提供了硬件支持。列存储技术在分析型应用中具有显著的优势。在列存储系统中,查询优化依然是最重要的问题之一。在列存储系统中,利用多核资源提高查询处理性能具有较大潜力。文中通过对查询执行器生成的物理查询树进行流水多线程设计,结合列存储的特点,建立传递块缓

2、冲区,使主线程和辅助线程分别对传递块缓冲区读写,以提高查询性能。同时还提出使用操作系统中经典的“生产者和消费者”模式来解决线程之间的同步问题。提出的这些方法应用在实验室研发的列存储系统DWMS中,使用数据仓库基准测试集SSB验证了这些方法的有效性。实验结果表明,传递块缓冲区的设计使SQL的查询效率有了近5O%的提升。关键词多线程,多核,列存储,传递块缓冲区,并行处理中图法分类号TP311文献标识码APBPP:PipelinedParallelProcessingBasedOilPassingBufferinColumn-storeSystemDINGXia

3、ng-wuZHANGGuang-hui(SchoolofComputerScienceandTechnology,DonghuaUniversity,Shanghai201620,China)AbstractChipmultiprocessor(CMP)withlow-powerdissipation,lowcostadvantagesbecomesrapidlytheleadingroleofthemarket,anditprovideshardwaresupportformultithread.Column-storehassignificantadv

4、antagesinanalyticalapplications.Queryoptimizationisoneofthekeyissuesincolurnmstore.Incolumn-store,multi-coreresourcescanim—proveperformanceofqueryprocessing.Inordertoimprovequeryperformanceofcolumn-stores,thispaperestablishedpassingblockbuffertomakemainthreadandworkerthreadtoreada

5、ndwriterespectivelydifferentpassingblocks,SOparentnodeandchildnodeofphysicalexecutiontreeexecuteparalle1.Weusedclassicproducer-consumerpatterntosolvetheproblemofsynchronizationbetweenthethreads.Incolumn-storesDWMSdevelopedbyourlaboratory,experi—mentalresultsOnbenchmarkdatasetSSBsh

6、owtheeffectivenessofthisdesign,anditcanimprove50%0executionper-fofinanceforsometypicalcomplexqueries.KeywordsMultithread,Multicore,Column-store,Passingblockbuffer,Parallelprocessing本文提出了一个基于传递块缓冲区的流水并行化设计,1引言通过改变执行树中上下级操作节点传递数据的方式,提高列数据分析型应用日渐普遍和重要。大量的研究表明[。:存储的查询效率。这种设计将上下级操作节点之间

7、直接通过列存储在分析型应用中具有显著的优势。列存储系统中的查传递块传递数据的方式改变为通过传递块缓冲区传递数据,询处理速度一直是用户关注的重点,是列存储研究的热点问对传递块缓冲区的读写分别采用不同的线程进行,这样可以题。充分利用多核CPU多线程的优势,提高查询效率。另外对传由于功耗和设计的限制,单纯地提高处理器主频已经非递块大小、缓冲区大小及其缓冲区的数量进行优化设置,进一常有限。现在处理器的发展趋势已经从单核高频处理器转向步提高查询优化的性能。了片上多核处理器(CMP),由指令级并行向多线程并行发本文第2节主要介绍了多线程查询优化方面的相关工展_5]。设

8、计高效的多线程,充分发挥多核处理器的优势,能显作;第3节主要介绍了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。