第十章依赖于机器的优化

第十章依赖于机器的优化

ID:74290049

大小:610.00 KB

页数:77页

时间:2021-12-28

第十章依赖于机器的优化_第1页
第十章依赖于机器的优化_第2页
第十章依赖于机器的优化_第3页
第十章依赖于机器的优化_第4页
第十章依赖于机器的优化_第5页
第十章依赖于机器的优化_第6页
第十章依赖于机器的优化_第7页
第十章依赖于机器的优化_第8页
第十章依赖于机器的优化_第9页
第十章依赖于机器的优化_第10页
资源描述:

《第十章依赖于机器的优化》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第十章依赖于机器的优化在指令级并行的机器上,程序的运行速度依赖于下面几个因素程序中潜在的并行处理器上可用的并行从串行程序提取并行的能力在给定的调度约束下发现最佳并行调度的能力并行的提取和并行执行的调度都可以静态地在软件中或动态地在硬件中完成第十章依赖于机器的优化本章内容使用指令级并行的基础问题提取并行的数据相关性分析代码调度的基本概念基本块调度的技术、发现通用程序中的高度数据相关控制流的方法、调度数值程序的软件流水线技术在多处理器系统上,使用数组的计算密集型程序的并行化和数据局部性优化的概念和方法10.1处理器体系结构在考虑指令级并行时,通常想象成一个处理器在

2、单个时钟周期内发射几个操作事实上,在每周期内发射一个操作是可能的,而指令级并行的获得是通过使用流水线技术本节先解释流水线,然后讨论多指令发射10.1处理器体系结构10.1.1指令流水线和分支延迟ii+1i+2i+3i+41.IF2.IDIF3.EXIDIF4.MEMEXIDIF5.WBMEMEXIDIF6.WBMEMEXID7.WBMEMEX8.WBMEM9.WB取指令IF,译码ID,执行操作EX,访问内存MEM,回写结果WB5级指令流水线中的5条连续指令10.1处理器体系结构10.1.1指令流水线和分支延迟分支延迟发现应该执行一个分支而不是直接后继转向一个分

3、支时会引起取分支目的地址指令的延迟并引起指令流水线“打嗝”可以通过使用硬件,根据分支的执行历史来预测分支结果并从预测的目的地址预取指令分支延迟不可避免,因为分支预测会发生偏差10.1处理器体系结构10.1.2流水化的执行如果不依赖一条指令结果的随后指令在该结果产生前就被允许执行有些指令的执行需要几个周期,几个操作同时出现在它们的执行级上可能的如果最长的执行流水线是n级,n个操作同时进行的可能性是存在的并非所有的指令都能被完全流水化,例如浮点除通用处理器大都动态察觉相继指令之间的依赖性嵌入式系统把数据相关性的检查交给软件10.1处理器体系结构10.1.3多指令发

4、射每周期发射几个操作,让更多操作同时进行超长指令字机器将若干个操作编码在单周期中发射编译器需要确定哪些操作可以并行发射超标量机器超标量机器有按普通顺序执行语义的正规指令集硬件自动察觉指令之间的相关性,并且在它们的操作数可用时就发射它们更复杂的调度器能够“乱序”执行指令10.2代码调度的约束代码调度用在代码生成器产生的机器代码上的优化技术本节讨论代码调度的约束控制相关约束在原程序中执行的所有操作都必须在优化代码中执行数据相关约束优化程序中的操作产生的结果必须同原程序对应操作的结

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。