?@A(’=#?A$DE&C*基于FGH的FIJKLM编译器设计与实现陈"> ?@A(’=#?A$DE&C*基于FGH的FIJKLM编译器设计与实现陈" />
基于orc的openmp编译器设计与实现

基于orc的openmp编译器设计与实现

ID:4143511

大小:188.61 KB

页数:5页

时间:2017-11-29

基于orc的openmp编译器设计与实现_第1页
基于orc的openmp编译器设计与实现_第2页
基于orc的openmp编译器设计与实现_第3页
基于orc的openmp编译器设计与实现_第4页
基于orc的openmp编译器设计与实现_第5页
资源描述:

《基于orc的openmp编译器设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、!""#$%%%&%%’(清华大学学报-自然科学版.*%%’年第(’卷第$期$B,+C)#$$&***+,#/012345678329-":2;0<:5.=*%%’=>?@A(’=#?A$DE&C*基于FGH的FIJKLM编译器设计与实现陈永健=李建江=王生原=郑纬民-清华大学计算机科学与技术系=北京$%%%B(.摘要N该文提出了一种!"#$%&翻译技术’旨在提高用来联系传统的并行编译系统与传统的后端优化编!"#$%&编译系统的性能’并在这种技术基础上构造了一个译器系统O事实上=在设计和实现一个这样的完整

2、的基于!()的!"#$%&编译系统*系统采用了下面的2/<33W编译系统之前=有+个开放源代码-或者开主要技术来提高性能+,-系统集成在后端的优化编译器中’放部分源代码.的系统可供挑选N2Q322/<33W编具有更多的优化机会’并可以采用更为精细的开销模型.译器<$==W)23W-/?0V75@<:?Q/2@<011?0?/<33W./-提出了一种基于指导语句全局嵌套类型的!"#$%&翻译系统<*=和2T233W,))/转换系统<+=O出于可移植性技术’可以有效地减少翻译代码的长度’并减少运行时开销*的考

3、虑=这+个系统都是源代码到源代码的这个!"#$%&系统从设计开始’就是为了提供一个合适的编译技术研究平台’具有更好的可控制性0可调试性和丰富2/<33W翻译系统=采用不同的底层线程库=可能的工具支持*对转换后的代码进行特定的优化O但当考虑选择一关键词N编译.并行计算.!"#$%&翻译.运行时系统个平台来进行线程级并行性的研究时=这+个系统并不适合O首先=这些源到源的转换器缺乏足够的分中图分类号N0W+$(文献标识码NX文章编号N$%%%&%%’(-*%%’.%$&%%DE&%(析和优化模块=程序的优化主要

4、依赖于后端编译器的支持O这种不可控制的优化缺乏足够的灵活性来YJZ[K]K^[_I‘J_JKa]a[bKbc]KFIJKLM进行必要的研究O其次=由于后端编译器作为一个黑db_I[‘Jef]ZJ^bKFGH盒系统存在=使得很难从目标程序的运行行为来发现性能瓶颈及其原因=从而发现可能的优化机会O再ghijklmnopqm=rstpqmopqmn=uvjwxyzmn{

5、qm=}hijwuzp~pm次=源到源的翻译很难精确控制并行性的粒度=也很-YJI]ea_JKabcdb_I!aJe"d[JKdJ]K^#J

6、d$Kb‘b%=#Z[K$!]&K[’JeZ[a%=(J[)[K*+++,-=H$[K].难进行精确的开销分析=这限制了它在面向多线程处理器<(=的编译中的应用O.fZae]daN0?4

7、0<1<70:5一些基本要求O平台中的各个模块应该工作在一个:?Q/2@<0.A05

8、?Q/2@<0A05

9、优化模块=应该能够非常方便的互相通信O这是因9J%:be^ZN:?Q/2@<0;/707@@<@:?Q/6V234;2/<33WV0731@7V2?3;为不同的优化模块可能会开发不同粒度的并行性=063V2Q<181V优化模块和辅助工具支持=以序进行优化的过程中=对2/

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。