cache coherence文献综述

cache coherence文献综述

ID:13243282

大小:592.50 KB

页数:12页

时间:2018-07-21

cache coherence文献综述_第1页
cache coherence文献综述_第2页
cache coherence文献综述_第3页
cache coherence文献综述_第4页
cache coherence文献综述_第5页
资源描述:

《cache coherence文献综述》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、CacheCoherence文献综述文献阅读背景如何选择高速缓存一致性的解决方案一直以来都是设计共享存储器体系结构的关键问题。相对于维护高速缓存一致性而言,数据的传输也显得简单了。高速缓存一致性协议致力于保证每个处理器的数据一致性。一致性通常是在高速缓存总线或者网线上得到保证。高速缓存的缺失可以从内存中得到数据,除非有些系统(处理器或者输入输出控制器)设备修改了高速缓存总线。为了进行写操作,该处理器必须进行状态的转换,通常是转换为独占的状态,而总线上其他的系统设备都必须将他们的数据无效化,目前该数据块的拥有者就成为了数据来源。因此,当其他设备提出需要此数据块时,该数据块的拥有者,而不

2、是内存,就必须提供数据。只有当该数据块的拥有者必须腾出空间用以存放其他的数据时,才将最新的数据重新写回内存中。当然,在这方面,各种协议也有区别,上文所诉只是最基本的一些解决方案AlanCharlesworth,SunMicrosystems,Inc.TheSunFireplaneSystemInterconnect.[C]//ACM.SC2001November2001,Denver(c)2001:1~2.。并且,协议也包括基于硬件的以及基于软件的协议两个种类。也有写无效和写更新的区别。下面概述性地介绍下体系结构中所采用的两种主要的一致性方案:监听式(也称广播式)协议:所有的地址都送

3、往所有的系统设备中。每个设备在本地缓存中检查(监听)高速缓存总线的状态,系统在几个时钟周期后决定了全局的监听结果。广播式协议提供了最低的可能延迟,尤其当缓存之间的传输是基本的传输方式。监听式协议传输数据的带宽也是有一定限制的,通常被限制在:带宽=缓存总线带宽×总线时钟周期/每次监听的时钟周期数。这将在下文中详细提到。目录式(也称点对点式)协议:每个地址都被送往系统设备中对缓存数据感兴趣的那些设备。物理存储器的共享状态放在一个地点,称之为目录。目录式一致性的开销更大,尤其在延时等方面,因为协议本身的复杂性。但是整体的带宽可以比监听式协议高很多,往往应用于比较大型的系统,最主要的应用是分

4、布式系统。这将在下文详细提到。缓存一致性涉及的体系结构主要有如下几种:第一种类型是集中式存储体系结构,也称作为对称(共享存储器)多处理器系统(SMPs),这种体系结构也称为均匀存储器访问(UMA),这是因为所有的处理器访问存储器都有相同的时延。第二种类型的多处理器的存储器在物理上是分布的。为了支持更多的处理器,存储器不能按照集中共享方式组织,而必须分布于各个处理器,否则,存储器在为多个处理器提供所需的带宽时将无法避免较长的时延。随着处理器性能的迅速提高及处理器对存储器带宽需求的增加,使用分布式存储器系统结构的多处理器的处理器数目正在减少JohnL.Hennessy,DavidA.Pa

5、tterson.ComputerArchitecture:AQuantitativeApproach[M].FourthEdition.[S.l.],2007.8。第12页共12页在一个共享内存的多处理器系统中,所有的处理器都共享一个全球的内存地址空间。除了刚才所提及的UMA(Uniform-Memory-Access)以及NUMA(Nniform-Memory-Access)模型之外,还有COMA(Cache-OnlyMemoryArchitecture)。当处理器和私有高速缓存联系在一起的时候,UMA和NUMA也被称作CC-UMA和CC-NUMA。注意到,UMA和NUMA之间的主

6、要区别就是访问时间的区别。一款商业的COMA,KSR-1,也被称为ALLCACHE,就是为了强调所有的内存都用作高速缓存的作用FongPong,MichelDubois.VerificationTechniquesforCacheCoherenceProtocols.[C]//ACMComputingSurveys,Vol.29,No.1,March1997:85~86.。多核技术取得迅猛进展,多核处理器上的高速缓存一致性问题也成为了众多研究者关注的热点。首先回顾一下多核技术的发展历史和现状。IBM是最先推出多核微处理器的厂商,在高度自动化的MPU开发工艺上采用0.13微米工艺实现的

7、Power4+已成为多核微处理器的代表性产品。IBM在蓝色基因巨型机中使用自己的双核芯片,奠定了其在多核微处理器研制方面的领先地位。SUN和IBM一直在高端服务器市场竞争激烈。AMD和Intel一直是全球处理器市场上的两大宿敌。面对处理器高功耗的制约,Intel和AMD不约而同地将目光转向了多核处理器。AMD发展64位多核CPU的步伐走在了Intel前面,2004年8月演示了双核Opteron,其产品供货于2005年中期开始。双核Opteron片内集成2个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。