欢迎来到天天文库
浏览记录
ID:33193146
大小:1.09 MB
页数:43页
时间:2019-02-21
《全局循环合并的实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中国科学院计算技术研究所硕士学位论文全局循环合并的实现姓名:谷晓铭申请学位级别:硕士专业:计算机系统结构指导教师:吴承勇20060601摘要当前处理器的发展速度要远远高于存储器,这就导致了两者之间出现不匹配的性能鸿沟,使得多级Cache在存储系统中出现。为了更有效地利用宝贵的Cache空间,突破MemoryWall这一系统瓶颈,编译器的局部性优化研究一直都是学术界研究的热点。而全局循环合并作为一种新型的数据局部性优化,对于一些典型的科学计算应用非常有效,急需实现。本文在龙芯2编译器中实现了全局循环合并,重点阐述和分析该局部性优化的重要性和有效性。1.全局循环合并作为一种高级循环合并
2、优化,避免了普通循环合并中所必需的条件一待合并的循环体必须相邻,从而进一步挖掘出可利用的循环合并机会。SPECfp2000测试集中的171.swim和172.mgid可以应用该优化。2.复用距离是一种局部性的定量描述。通过在171.swim和172.mgrid上对全局循环合并前后进行复用距离分析,本文得到直观的局部性优化效果。3.本文对末来的工作诸如数组压缩、数据重组等进行了展望,并在171.swim上使用复用距离分析来考察这两种局部性优化。关键词:编译器;MemoryWalh数掘局部性;全局循环合并;复用距离分析。V●;口{tl●;}●AbstractiOnnegapbetwee
3、nCPUandmemoryisbecominggreaterandgreaterduetOtheirunmatcheddevelopingspee&Somulti—levelCacheshaveeme瞎edinMemorySystem.HowtooptimallyUSethepreciousbu岱:r?HowtosmashtheMemoryWall?Ithasbeenaresearchhotspotfordecades.GlobalLoopFusion,asanewdatalocalityoptimization,isveryeffectivetoimprovethedataloc
4、alityofSOmetypicalscientificcomputationapplicationsandneedtobeimplementedurgently.ThedissertationimplementstheGlobalLoopFusionphaseinGodson-2Compilerandanalyzesthesignificanceandeffectivityofthedatalocalityoptimization.1.GlobalLoopFusion,asanadvancedloopoptimization,avoidsthenecessaryoptimizin
5、gconditionofcommonloopfusion—thetwofusioncandidatesmustbeaajacent,anddigsupmoreopportunitiesforloopfusion.171.swimand172.m鲥dinSPECfp2000afetwobenchmarksappliedbythenewoptimization.2.ReuseDistanceisaquantitativedeseriptionforlocality.ThedissertationgivesobviousimpressionsoftheimprovementbyGloba
6、lLoopFusionon171.swimand172.m鲥dwithReuseDistanceAnalysis.3.ThefutureworksuchasArrayContractionandDataRegroupingisproposed.AndthetwodatalocalityoptimizationsareexaminedbyReuseDistanceAnalysison171.swim.Keywords:Compiler;MemoryWall;DataLocality;GlobalLoopFusion;ReuseDistanceAnalysis.图目录图1.现代编译器的
7、结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1图2.ORC总体结构和关键特征.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯3图3.ORC中j’日J表示的下降示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4图4.LNO模块的总体简要框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯5图5.传统过程问分析和优化的框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.5图6.拥有两级cache的存储系统结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..7图7.一个复用距离分析的例子⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯12图8.原始程序⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯15图9.Inlining后的程序
此文档下载收益归作者所有