欢迎来到天天文库
浏览记录
ID:10888707
大小:937.00 KB
页数:14页
时间:2018-07-08
《能否推倒i7?amd推土机cpu架构全解析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、能否推倒i7?AMD推土机CPU架构全解析APU性能喜忧参半推土机能否推倒i7 泡泡网CPU频道7月21日 AMD终于发布了让人期待已久的Llano高性能APU(加速处理器),APU的真正实力毫无保留的展现在了世人面前,详细的评测参见《AMD桌面级APU发布!LlanoA8深度评测》一文。 简单来说,APU的表现可谓是喜忧参半,喜的是GPU部分确实强大,绝对可以秒杀主流级独立显卡,性能是Intel SandyBridge集显HD3000的2-3倍甚至更多;忧的是CPU部分原地踏步,与Intel CPU的差距越来越大。 APU的CPU部分,使用
2、的还是PhenomII架构,而且还是没有三级缓存的精简版。PhenomII的架构相比PhenomI改进不大,还停留在IntelCore2Quad的级别。而Intel此后已经推出了两代Corei7产品,性能节节攀升,AMD想要与SandyBridge架构的第二代Corei7抗衡,使用老架构简单扩充核心是毫无胜算的。 AMD下一代CPU架构——Bulldozer(推土机)就肩负起了对抗SandyBridgeCorei7的重任。现在距离推土机发布已经不远了,相信更多的DIY玩家都在期待AMD全新CPU架构的表现,那么首先我们就来详细了解一下推土机架构到底有什
3、么值得期待之处吧。Intel的杀手锏——HT同步多线程技术 我们知道,在Core2时代,AMD和Intel的CPU性能差距还不算太大。但Corei7问世之后,性能有了质的提升,其中贡献最大的非HT(Hyper-Threading,超线程)技术莫属。HT技术可以轻易地把4核虚拟成8线程,在任务管理器中看到的“8个核心”不仅仅是看着爽而已,它确实带来了不小的性能增益,进一步与AMDCPU拉开了差距。● SMT同步多线程技术的工作原理 SMT(SimultaneousMulti-threading,同步多线程)的设计初衷非常简单,就是为了充分利用CPU物
4、理核心的资源,防止运算能力被浪费。左:没有超线程时的CPU处理过程 右:超线程模式CPU处理过程 一般情况下,CPU的物理核心只有一个执行线程,很多时候CPU核心会处在等待内存中关键代码或数据的状态,此时线程为暂停状态,核心运算能力被闲置。而SMT技术可以允许一颗核心运行两个或多个线程,当第一个线程暂停时,将第二个资源准备充分的线程安排给核心处理,这样动态切换的结果就是,CPU的运算能力得到了最大的利用。 简言之,SMT的设计理念就是用多个线程“喂饱”CPU物理核心,尽可能不让CPU运算单元闲置。 SMT是一种非常廉价的技术,因为CPU的物理
5、内核并没有增加,只需要为CPU赋予两套架构寄存器和重命名寄存器即可,而这些寄存器并不会消耗太多的晶体管。最终在操作系统中的呈现方式,和物理核心没有区别,操作系统会把4核8线程的CPU当作8核CPU来使用,并安排运算任务。四核八线程CPU在系统中就是“八核”的 SMT技术对那些CPU负载不是很高且支持多路并发处理的线程比较有意义,典型的比如文件压缩解压缩、视频编码解码等。如果两个线程都需要花费较长的时间等待内存和缓存准备数据的话,那么一个双线程SMT核心几乎就可以等同于一个双核处理器。 但SMT的效率根据应用的不同会有很大差异,如果内存和缓存的压力
6、不大,CPU核心一直都在忙于处理线程的话,另一个线程迟迟排不上队,此时SMT核心的效率可能还不如单颗物理核心。这就是此前测试时关闭HT技术反而在部分项目中性能更好的根本原因, 根据Intel公布的数据来看,在真实的应用环境下,超线程技术能够给CPU带来20-30%额外的性能提升,也就是说一颗双线程SMT核心相当于1.2个常规核心的效能。AMD又一次创新——反其道而行之 通过前面的介绍我们可以知道,Intel的同步多线程技术实际上并不能提升CPU的理论运算性能,只是消除了CPU等待指令时的瓶颈,在部分应用中提升了效能。这样HT技术就存在很大的局限性,
7、如果主内存不再是瓶颈,SMT的执行单元就过剩了,而一个SMT核心也就不再比一个单纯的核心更高效,毕竟SMT核心需要增加一些电路设计,比一个单纯的核心成本要高一些。 所以AMD并没有照搬Intel的做法走SMT路线,也不是继续暴力增加CPU的物理核心数目,CPU的未来并不是只有这两条路可走,于是AMD有了一个新的想法:Intel是把一颗物理核心虚拟成两颗来用,而AMD是把两颗物理核心组合成一颗大核心来用——这颗大核心的官方名称叫做“推土机模块”。 为什么要把两颗核心合成一颗来用呢?有两个好处,一是可以共享运算单元和缓存,提升效能;二是共享之后会节约晶
8、体管(重复单元合二为一),而不是像SMT那样增加晶体管(两份寄存器
此文档下载收益归作者所有