intel sandy bridge内核架构全面解析

ID：12863509

大小：2.95 MB

页数：18页

时间：2018-07-19

资源描述：

《intel sandy bridge内核架构全面解析》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、IntelSandyBridge内核架构全面解析昨天，IDF2010上Intel对下代处理器架构SandyBridge(官方简称SNB)的一些技术特点做了深入阐述，并展示了美丽的晶圆和芯片照片。今天，我们就深入新架构内部，看看它有何神奇之处。　　SNB是Intel2011年的一次重大架构更新，官方称为“2011年第二代IntelCore处理器家族”，主要针对性能级和主流市场，而高端领域暂时继续交给GulftownCorei7-900系列六核心，入门级领域则要到明年底甚至2012年才会升级。　　SNB首批产品将于2011年初发布并上市，同时涵盖桌面和

2、笔记本，架构方面也基本相同，具体型号和规格如下：　　除了处理器，配套的芯片组、主板、散热器等也会一并更新，其中芯片组是6系列，桌面上主要有P67、H67、H61等型号，原生支持最多两个SATA6Gbps接口，但没有原生USB3.0，仍需要依赖第三方控制器，另外还有PCI-E2.05GT/s高速总线。　　6系列主板的插座将改为LGA1155，不兼容当前的LGA1156。　　原装散热器也随着处理器功耗的降低而瘦身，特别是45W低功耗版本会搭配半高式矮版散热器。　前端从高级层面角度看，SNB架构只是一次进化，但是如果看看Nehalem/Westmere以

3、来晶体管变化的规模，绝对是一次革命。　　Core2引入了一种叫作循环流检测器(LSD)的逻辑块，检测到CPU执行软件循环的时候就会关闭分枝预测器、预取/解码引擎，然后通过自身缓存的微指令(micro-ops)供给执行单元。这种做法通过在循环执行的时候关闭前端节省了功耗，并改进了性能。　　SNB里又增加了一个微指令缓存，用于在指令解码时临时存放。这里没有什么严格的算法，指令只要在解码就会放入缓存。预取硬件获得一个新指令的时候，会首先检查它是否存在于微指令缓存中，如是则由缓存为其余的管线服务，前端随之关闭。解码硬件是x86管线里非常复杂的部分，关闭它能

4、够节约大量的功耗。如果这种技术也能引入到Atom处理器架构中，无疑也能使之受益匪浅。　　这个缓存是直接映射的，能存储大约1.5K微指令，相当于6KB指令缓存。它位于一级指令缓存内，大多数程序的命中率都能达到80％左右，而且带宽也相比一级指令缓存更高、更稳定。真正的一级指令和数据缓存并没有变，仍然都是32KB，合计64KB。　　这看起来有点儿像Pentium4的追踪缓存，但最大的不同是它并不缓存追踪，而更像是一个指令缓存，存储的是微指令，而非x86指令(macro-ops)。　　与此同时，Intel还完全重新了一个分支预测单元(BPU)，精确度更高，

5、并在三个方面进行了创新。　　第一，标准的BPU都是2-bit预测器，每个分支都使用相关可信度(强/弱)进行标记。Intel发现，这种双模预测器所预测的分支几乎都是强可信度的，因此SNB里多个分支都使用一个可信度位，而不是每个分支对应一个可信度位，结果就是在分支历史表中同样的位可以对应更多分支，进而提高预测精确度。　　第二，分支目标同样做了翻新。之前的架构中分支目标的大小都是固定的，但是大多数目标都是相对近似的。SNB现在支持多个不同的分支目标大小，而不是一味扩大寻址能力、保存所有分支目标，因而浪费的空间更少，CPU能够跟踪更多目标、加快预测速度。　

6、　第三，提高分枝预测器精度的传统方法是使用更多的历史位，但这只对要求长指令的特定类型分支有效，SNB于是将分支按照长短不同历史进行划分，从而提高预测精度。物理寄存器文件(PRF)和执行改进　　类似于AMD的推土机、山猫，IntelSNB也使用了物理寄存器文件。Core2、Nehalem架构中，每个微指令需要的每个操作数都有一份拷贝，这就意味着乱序执行硬件(调度器/重排序缓存/关联队列)必须要非常大，以便容纳微指令和相关数据。CoreDuo时代是80-bit，加入SSE指令集后增至128-bit，现在又有了AVX指令集，按照趋势会翻番至256-bit

7、。　　RPF在寄存器文件中存储微指令操作数，而微指令在乱序执行引擎中只会携带指向操作数的指针，而非数据本身。这就大大降低了乱序执行硬件的功耗(转移大量数据很费电的)，同时也减小了流水线的核心面积，数据流窗口也增大了三分之一。　　核心面积的精简正是AVX指令(SNB最主要革新之一)集得以实现并保证良好性能的关键所在。以最小的核心面积代价，Intel将所有SIMD单元都转向了256-bit。　　AVX支持256-bit操作数，相当消耗晶体管与核心面积，而RPF的使用加大了乱序执行缓冲，能够很好地满足更高吞吐量的浮点引擎。　　Nehalem架构中有三个执

8、行端口和三个执行单元堆栈：　　SNB允许256-bitAVX指令借用128-bit的整数SIMD数据路径，这就使用最小的核

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 18



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

intel sandy bridge内核架构全面解析

intel sandy bridge内核架构全面解析

相关文章

相关标签