全局循环合并的实现

全局循环合并的实现

ID:33193146

大小:1.09 MB

页数:43页

时间:2019-02-21

全局循环合并的实现_第1页
全局循环合并的实现_第2页
全局循环合并的实现_第3页
全局循环合并的实现_第4页
全局循环合并的实现_第5页
资源描述:

《全局循环合并的实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学院计算技术研究所硕士学位论文全局循环合并的实现姓名:谷晓铭申请学位级别:硕士专业:计算机系统结构指导教师:吴承勇20060601摘要当前处理器的发展速度要远远高于存储器,这就导致了两者之间出现不匹配的性能鸿沟,使得多级Cache在存储系统中出现。为了更有效地利用宝贵的Cache空间,突破MemoryWall这一系统瓶颈,编译器的局部性优化研究一直都是学术界研究的热点。而全局循环合并作为一种新型的数据局部性优化,对于一些典型的科学计算应用非常有效,急需实现。本文在龙芯2编译器中实现了全局循环合并,重点阐述和分析该局部性优化的重要性和有效性。1.全局循环合并作为一种高级循环合并

2、优化,避免了普通循环合并中所必需的条件一待合并的循环体必须相邻,从而进一步挖掘出可利用的循环合并机会。SPECfp2000测试集中的171.swim和172.mgid可以应用该优化。2.复用距离是一种局部性的定量描述。通过在171.swim和172.mgrid上对全局循环合并前后进行复用距离分析,本文得到直观的局部性优化效果。3.本文对末来的工作诸如数组压缩、数据重组等进行了展望,并在171.swim上使用复用距离分析来考察这两种局部性优化。关键词:编译器;MemoryWalh数掘局部性;全局循环合并;复用距离分析。V●;口{tl●;}●AbstractiOnnegapbetwee

3、nCPUandmemoryisbecominggreaterandgreaterduetOtheirunmatcheddevelopingspee&Somulti—levelCacheshaveeme瞎edinMemorySystem.HowtooptimallyUSethepreciousbu岱:r?HowtosmashtheMemoryWall?Ithasbeenaresearchhotspotfordecades.GlobalLoopFusion,asanewdatalocalityoptimization,isveryeffectivetoimprovethedataloc

4、alityofSOmetypicalscientificcomputationapplicationsandneedtobeimplementedurgently.ThedissertationimplementstheGlobalLoopFusionphaseinGodson-2Compilerandanalyzesthesignificanceandeffectivityofthedatalocalityoptimization.1.GlobalLoopFusion,asanadvancedloopoptimization,avoidsthenecessaryoptimizin

5、gconditionofcommonloopfusion—thetwofusioncandidatesmustbeaajacent,anddigsupmoreopportunitiesforloopfusion.171.swimand172.m鲥dinSPECfp2000afetwobenchmarksappliedbythenewoptimization.2.ReuseDistanceisaquantitativedeseriptionforlocality.ThedissertationgivesobviousimpressionsoftheimprovementbyGloba

6、lLoopFusionon171.swimand172.m鲥dwithReuseDistanceAnalysis.3.ThefutureworksuchasArrayContractionandDataRegroupingisproposed.AndthetwodatalocalityoptimizationsareexaminedbyReuseDistanceAnalysison171.swim.Keywords:Compiler;MemoryWall;DataLocality;GlobalLoopFusion;ReuseDistanceAnalysis.图目录图1.现代编译器的

7、结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1图2.ORC总体结构和关键特征.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯3图3.ORC中j’日J表示的下降示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4图4.LNO模块的总体简要框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯5图5.传统过程问分析和优化的框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.5图6.拥有两级cache的存储系统结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..7图7.一个复用距离分析的例子⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯12图8.原始程序⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯15图9.Inlining后的程序

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。