分片式处理器上谓词执行技术的实现与优化

分片式处理器上谓词执行技术的实现与优化

ID:39121968

大小:3.07 MB

页数:79页

时间:2019-06-25

分片式处理器上谓词执行技术的实现与优化_第1页
分片式处理器上谓词执行技术的实现与优化_第2页
分片式处理器上谓词执行技术的实现与优化_第3页
分片式处理器上谓词执行技术的实现与优化_第4页
分片式处理器上谓词执行技术的实现与优化_第5页
资源描述:

《分片式处理器上谓词执行技术的实现与优化》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作者签名:碰签字日期:和If:《:』竺中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查1)l署n借阅,可以将学位论文编入有关数据库进行检索,可以

2、采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。乜叁开口保密(——年)作者躲墨£盔竺导师躲签字日期:及∥J/.6.歹签字日期:摘要随着计算机体系结构和工艺的发展,计算机性能提升的方式由提高主频变为增加处理器核数。处理器资源匮乏的问题得以缓解,随之而来的问题是如何在功耗允许的情况下合理使用这些资源来获得最大性能。分片式处理器体系结构将计算资源和存储资源均匀分布在整个芯片上,解决了现代处理器设计中面临的存储墙、资源利用率、线延迟和可扩展性等问题,成为微处理器体系结

3、构发展的一种趋势。本文为分片式处理器TPA.PI实现了编译器后端的谓词执行技术,并对其执行过程进行优化。主要研究工作和成果包括:(1)研究了基于LLVM编译框架的后端实现技术,实现了适合TPA.PI处理器的谓词执行技术。该技术对程序的控制流图进行遍历,寻找谓词执行的候选块,再根据图中节点的依赖关系对候选块进行谓词化操作。(2)研究了超块构造中基本块选择的过程,分析了选择过程中程序各因素对其的影响,利用剖析信息对基本块的选取过程进行动态决策。(3)研究了影响超块分裂的各种因素,为超块分裂技术提供了启发式选择策略。通过衡量超块分裂的执行开销和分裂后

4、的超块质量,为超块分裂节点的选取提供评判标准,以改进超块的执行效率,提高处理器的整体执行性能。初步实验表明,本文设计的谓词执行技术能够有效地消除分支指令,合并程序中的指令块。而对谓词执行技术进行的改进使测试程序的分支命中率提高了O.68%~3%,程序的整体性能提高了1.67%'--.'8.39%。本文的研究工作为分片式处理器TPA.PI实现了谓词执行技术,为编译器后端的整体设计打下了基础。同时本文提出的优化技术也为在编译系统中提高处理器的指令级并行性提供了参考。关键词:分片式处理器,类数据流执行模型,超块,谓词执行。摘要AbstractABST

5、RACTWiththeevolvementofcomputerarchitectureandsemiconductortechnology,theperformanceofcomputersystemlSbeingimprovedviaplacingmorecoresinonesingleprocessor,insteadofemployinghigherfrequency.nleproblemoflackingprocessorresourceiSconsequentlyalleviated.However.comesalonganother

6、problemtllathowtomaximizeperformancebyfullyutilizingtheseresourceswithoutexceedingtheenergybudget.Titledprocessorarchitecture,whichdistributesthecomputingandstorageresourcesevenlyacrossthechip,resolvestheissuesofmemorywall,resourceutilization,wiredelayandsealabilitY,andthere

7、forebecomesthetrendofmicroprocessordevelopment.Theworkinthethesisimplementsthepredicatedexecutiontechniqueintheback-endofcompilerfortitledprocessorTPA-PI,andoptimizestheexecution.ThemainWOrkandcontributionsareasfollows.First。weinvestigatetheback-endimplementationofLLVMcompil

8、ingframework,andimplementthepredicatedexecutiontechniqueforTPA-PI.Suchtechn

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。