重归正途迎未来 AMD全新GPU构架深度解析.doc

重归正途迎未来 AMD全新GPU构架深度解析.doc

ID:59295918

大小:3.78 MB

页数:28页

时间:2020-09-06

重归正途迎未来 AMD全新GPU构架深度解析.doc_第1页
重归正途迎未来 AMD全新GPU构架深度解析.doc_第2页
重归正途迎未来 AMD全新GPU构架深度解析.doc_第3页
重归正途迎未来 AMD全新GPU构架深度解析.doc_第4页
重归正途迎未来 AMD全新GPU构架深度解析.doc_第5页
资源描述:

《重归正途迎未来 AMD全新GPU构架深度解析.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、重归正途迎未来AMD全新GPU构架深度解析CBSi中国·ZOL作者:中关村在线顾杰责任编辑:林光楠【原创】2011年06月23日05:00震惊世界的GraphicsCoreNext●震惊世界的GraphicsCoreNext    2011年6月15日,AMD在AMDFusion开发者峰会上向与会的700多名开发者和PC业界高管们透露了其全新GPU架构的诸多细节,由于缺乏代号,因此该构架暂时被称作GraphicsCoreNext。  AMD下一步的目标是发展“针对图形、计算双重优化的统一可扩展GPU”,“一套面向

2、吞吐量的大规模多线程计算单元架构”,包括多任务多引擎架构、计算单元架构、多级读写缓存架构。AMDGraphicsCoreNext  尽管新构架的路线图、发布规划、规格参数、功能特性等一概欠奉,但GraphicsCoreNext的出现依旧瞬间吸引了全世界所有的目光,因为——你还记得AMD上一次推出具有颠覆性的全新构架,是什么时候的事情吗?R600的前世今生  ●R600的前世今生    如果我没记错的话,上一次AMD发布与前代产品完全不同的新构架,已经是近5年前的事了。  2007年5月,AMD收购ATI之后推出的

3、第一款DirectX10GPU—R600正式发布了。R600由一套几何处理单元,独立的线程仲裁器UTDP,与仲裁机构相连的SPU和TMU单元,以及完整的后端所组成。整个构架以ringbus换装总线进行连接。与竞争对手G80相比,R600的结构可以说是完全不同的两种设计思路。他的运算部分采用4个非全功能1DALU和1个全功能4DALU以VLIW的形式打包组成一个VLIWcore。5个ALU共享2套发射端口资源,全部64个VLIWcore共享8K的GDS,也就是NVIDIA方面的sharedmemory。R600构架

4、  R600构架的目的或者说初衷之一,就是通过ATI长久以来对图形编程业界的影响力,将自己认为更加合适的追求吞吐和ILP性能的保守的编程模式推广下去。压迫程序员并迫使其遵从由ATI制定的被认为是适宜的编程方法以及API转换路线。当时的实践证明,这一尝试是失败的。RV770构架  在经历了R600系列的失败之后,AMD通过RV670的tick过程修正为R600构架去除了大量的低效率的晶体管,如过于臃肿的MC部分以及缓慢的ringbus总线。这些举措都为RV770节约了大量的晶体管资源。利用这些晶体管资源,RV770

5、成功的将运算资源提升至R600的250%,但其构架本身并没有明显的变化。RV870构架  而接下来的RV870中,AMD仅为其配备了合乎DirectX11要求的寄存器资源,改进了UTDP对多线程的支持,在前端的几何单元中插入了一组TS单元,同时将运算单元中的GDS提升到了64K。除此之外,我们仅能见到进一步放大的VLIWcore规模和其他配套的纹理资源及后端资源。各资源的整体比例较之RV770并未发生本质性的改变,VLIWcore的操作管理方式及周边资源密度也未见任何实质性的变化。Cayman构架  到Cayma

6、n构架为止,R600这个构架已经被AMD反复修改了不知道多少遍,虽然Cayman构架对R600进行了历史上最大的一次改动,4DVLIW以及双几何引擎的加入让Cayman构架获得了R600系列优于RV870的DX11性能,但其最核心的通过VLIW提升吞吐能力并由简单暴力的单元扩张换取性能的做法,并未发生本质变化,这种做法在漫长的历史时期里都发挥着重要的作用。  现在看来,GraphicsCoreNext的出现,标志着R600这个颇为长寿的构架体系,终于到了垂垂暮年,行将替换了。产品:RadeonHD6970AMD显

7、示芯片全新构架新在哪里  ●全新构架新在哪里  AMD本次发布的全新构架究竟新在哪里呢?下面不妨让我们丢开那些构架图,直接归纳总结一下此次新构架的特点。GraphicsCoreNext添加的Scalar单元简介  1、取消VLIW吞吐,代之以常规SIMD方式。  2、添加完整的多级UnifieldCache体系,cache体系面向全部指令和数据开放,同时取消独立的TexCache。  3、强化原子操作。  4、构架基于并行ComputeUnit结构,强化CU间以及基于线程块级的乱序执行能力。  5、改进ALU团簇

8、结构,新构架将采用4组16widevectorALU捆绑的形式。  6、ALU团簇外添加全新的ScalarUnit。  7、加入统一定址  8、添加对ECC内存的支持。  ……GraphicsCoreNext向量单元简介  本次AMD未来构架的改进可谓天翻地覆,与最近的Cayman构架相比,新构架不仅抛弃了R600以来一直维持的VLIW体系,更在core以及uncore两

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。