从体系结构的演变看高性能微处理器的发展趋势

ID：22316977

大小：54.00 KB

页数：7页

时间：2018-10-28

资源描述：

《从体系结构的演变看高性能微处理器的发展趋势》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、从体系结构的演变看高性能微处理器的发展趋势

2、第1微处理器体系结构随着高性能计算的需求，计算机体系结构发生了很大变化。作为计算机核心部件的微处理器，其性能和复杂性（晶体管数、时钟频率和峰值）也按照摩尔定律增长。微处理器性能的改善在很大程度上归功于体系结构的发展和VLSI工艺的改进。体系结构的发展主要体现在三个方面，即超流水、多指令发射和多指令操作。超流水技术主要开发时间并行性。流水线技术是RISC处理器区别于CISC处理器的重要特征。采用超流水技术，尽管可以减少关键路径中每级流水的时间，但同时也引入了更多的寄存器，进而增加了面积开销以及时钟歪斜问题。另一方面，深度流水在指令相关和指令跳转时

3、会大大降低流水线的性能。多指令发射和多指令操作均是开发空间并行性。多指令发射面临的首要问题是如何保持应用程序语义的正确性，MIMD、超标量和数据流技术是多指令发射的典型结构。MIMD是并行计算的重要研究领域。超标量采用时序指令流发射技术，兼容性好，硬件开销大，功耗开销大，是目前多数商用高端处理器采用的主流技术。数据流采用token环技术，理论上可以开发出高度指令并行性。然而，其商用开发不成功，原因是运行时间开销大，尤其是token环匹配需要很高的时间代价。多指令操作是当前体系结构的重要研究方向。多指令操作包括数据并行性开发和操作并行性开发。尽管在CISC处理器中均采用过这两种技术，但CI

4、SC给体系结构开发带来三个负面影响：一是CISC指令不适合流水处理，二是指令差异很大造成译码困难，三是编译器很难开发出有效的指令操作。与CISC处理器相反，多指令操作非常适合RISC处理器，其中SIMD和VLID处理器都是利用多个操作数来实现数据并行性。但二者有很大不同。向量处理器对线性向量元素顺序操作，SIMD则对向量元素进行并发操作。对前者，每条指令只能作用于一个功能部件，执行时间较长；而后者在执行指令时可以作用于多个功能部件。向量处理器采用交*存储器实现向量的访存操作，同时可对短向量进行有效操作，即对稀疏向量进行压缩以获得高性能。SIMD适合多媒体中的分组数据流，通过特定算法将长的

5、数据流截成定长短向量序列，从而可以和向量处理器那样实现对定长短向量序列的高效处理。VLID结构都能接受单一指令流，每条指令可以包含多个操作。但前者允许每条指令包含多个不同类型的操作，同时可以开发细粒度并行性。VLID具有很强的数据压缩能力。事实上，VLID技术相结合可以获得更高的性能加速比，且非常适合多媒体数据处理。从微处理器体系结构和编译器界面划分的角度上讲，指令级体系结构可以分为顺序结构、相关结构和独立结构三类。在顺序结构中，程序不包含任何指令并行信息，完全通过硬件进行调度，即硬件负责操作间的相关分析、独立操作分析和操作调度，编译器只负责程序代码的重组，程序中不附加任何信息。超标量是

6、该类结构的典型代表。在相关结构中，程序显式指定操作的相关信息，即编译器负责操作间的相关分析，而硬件负责独立操作分析和调度，如数据流处理器。独立结构完全由程序提供各个独立操作间的信息，即编译器负责操作间相关性分析、独立操作间分析和指令调度，VLI360/91采用的Tomasulo和CDC6600采用的Scoreboard动态调度技术，MIPSR10000和DEC21264微处理器均基于该体系结构。典型超标量处理器通常采用如下逻辑结构实现动态调度：寄存器重命名逻辑、窗口唤醒逻辑、窗口选择逻辑和数据旁路逻辑。Intel的Pentium处理器、Motorola的Poouseg(this)">图1

7、ZSP400内核超标量体系结构框图众所周知，超标量处理器是通用微处理器的主流体系结构，几乎所有商用通用微处理器都采用超标量体系结构。而在DSP方面，LSI逻辑公司的ZSP200、ZSP400、ZSP500和ZSP600均采用超标量体系结构。ZSP200采用并行MAC和ALU运算部件，2发射超标量结构；ZSP400采用双MAC单元、4发射超标量处理器体系结构；ZSP500为4发射体系结构、采用增强型双MAC和双ALU运算单元；ZSP600采用4MAC和双ALU运算部件，每个时钟周期发射6条指令。图1为ZSP400结构框图。ADI公司的TigerSHARC系列采用静态超标量体系结构。该系列采

8、用了许多传统超标量处理器的特征，如load/store结构、分之预测和互锁寄存器堆等技术。每个时钟周期发射4条指令。而静态超标量的含义是指指令级并行性识别是在运行之前，即编写程序时确定的（事实上以VLID技术，用户可以对数据进行广播和合并。所有寄存器均是互锁的，支持简单的编程模型，该模型不依赖于不同型号间的时延变化。分支目标缓冲器BTB为128位，可以有效减小循环操作和其它非顺序代码的执行时间。图2为TigerSHARC系列中的AD

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 7



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

从体系结构的演变看高性能微处理器的发展趋势

从体系结构的演变看高性能微处理器的发展趋势

相关文章

相关标签