服务器cpu设计趋势:回归简约与tlp(一)

服务器cpu设计趋势:回归简约与tlp(一)

ID:22323436

大小:49.50 KB

页数:5页

时间:2018-10-28

服务器cpu设计趋势:回归简约与tlp(一)_第1页
服务器cpu设计趋势:回归简约与tlp(一)_第2页
服务器cpu设计趋势:回归简约与tlp(一)_第3页
服务器cpu设计趋势:回归简约与tlp(一)_第4页
服务器cpu设计趋势:回归简约与tlp(一)_第5页
资源描述:

《服务器cpu设计趋势:回归简约与tlp(一)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、服务器CPU设计趋势:回归简约与TLP(一)

2、第1向许多其它工业一样,计算机工业也有很多概念在流行与过时之间反复循环--强大还是简单,巨型机还是集群,肥客户端还是瘦客户端,特写用途还是通用目的,革命还是演化……,对处理器设计而言,80年代以来的一个主要发展趋势就是RISC风格的设计,这种设计风格让人们使用更简单的指令集从而简化核心设计进而带来更高的执行效率。这是KISS(KeepItSimpleStupid)原则的一个典型实例,虽然实际上并非所有有的RISC处理器都那么简单。到了90年代,处理器设计的焦点开始移向了指令并行处理(ILP/InstructionLevelParallelism)与

3、时钟频率上,处理器变得复杂多了。这篇文章主要介绍关于处理器未来发展趋势的一些基本概念,这个趋势看起来正变得越来越明显,这个趋势就是线程级并行处理(TLP/ThreadLevelParallelism)技术来使多线程应用更高效。使用多线程来提高性能目前,多处理器的工作站与服务器已经很普遍了,很年这些机型的销售都达到数百万台,随英特尔推出的超线程技术,多处理器技术也开始普及在桌面上,一些追求运算速度的应用对单一的处理器而言常常不容易达到要求,通过把处理扩展到多颗处理器上,可以提高处理效率。编写采用多处理技术的程序会有一些额外的复杂性,但这不是个大问题,除非使用多处理器技术带来的性能优势不足以抵偿这

4、个开销。事实上,很少有关键性应用不支持多线程处理的,如果它不支持多线程,有可能是因为过于高昂的开发代价或者是市场上没有支持的硬件。例如,桌面2D或3D图形处理硬件大多数是单线程的或对于主要的处理使用单线程。而高端SGI图形处理系统则使用上百颗处理器,3D处理软件常常是高可并行性的并且也可以用于桌面图形系统上,不过目前大多数桌面系统都仅有一颗处理器。不过索尼的PlayStation3游戏控制台将使用多处理器,那意味着这个游戏平台的游戏软件可以获益于多线程处理以取得更好的性能。多处理器系统已经存在了很长时间,然而通过多个处理器核心来实现多线程的技术则刚出现不久,这种称为芯片多处理(CMP/ Chi

5、pMulti-Processing)的技术将多个CPU核心放在一个处理器内,已经在一些关键任务的嵌入式应用中变得很普遍。全有的主要CPU公司都在计划推出CMP产品,通常做法是在现有设计上加入另一个同样的核心,这些产品目前主要针对服务器市场。这些可能听起来枯燥而简单,不过它涉及到一些深层次的问题,那就是在对处理器核心进行CMP优化时的取舍问题。这也是这篇文章的主要内容。这些优化的最终结果还是KISS--让CPU核心设计再次变得更加简单和有效率。不过和80年代的RISC设计风潮不同,这次不需要处理器指令集的任何改变。这次的改变涉及到操作系统核心的设计实现,也会影响到编译器的设计和一些涉及到线程的软

6、件,使用CMP技术并且每个核心也支持多线程的处理器会使只有一个处理器的系统支持大量的线程,这些线程被规划得越合理,它们被阻塞的可能性就越小,系统执行效率也将越高。另外还有一些优化工作如对代码片断和特定驱动器的更有效的锁定以使应用对于多线程处理器更加友好。对操作系统而言,现在对于多线程模型的不充分支持是个大问题,而在消费者市场上,多线程技术的硬件实现也需要时间。减肥与增效在一些设计CPU发展方向的讨论里,传统的CPU设计常常被相对于采用TLP优化的多个瘦核心被称为“FAT(肥)”,目前仅一个核心的的设计主要面向的单线和性能的优化,而对于提高多线程程序执行效率的考虑则相对次要。面向TLP优化的处理

7、器则正好相反,单线程性能向多线程性能让步,设计的目的是当有多个活跃线程时,最优化线程组的执行效率而不是单一线程的性能。为了达到这个目标有两个方面值得考虑,一是使用更小的CPU核心,这通常用带来更高的执行效率,二是针对多线程应用对核心内部实行优化,相当也会涉及到缓存和内存系统的优化。因为面向TLP优化的处理器在一定程序上已经是面向特定用途了,他们也许会针对特殊的应用例如高性能计算HPC(比如IBM和SUN的HPC实现)或者网络性能敏感的应用(比如一些嵌入式设计或SUN的Niagara处理器)进行特别的优化,当然通常用途服务器(比如IBM和SUN的主流PO的PO技术,最大能量消耗为130/ILP)

8、要小,运行最新处理器使用最新服务器测试程序得到的结果是很少有IPC大于1.0的情况,如果使用Xeon处理器,这个值很少大于0.5,这比可能达到的理论值小多了,如果使用的软硬件未经过优化,这种情况还会更糟。使用一个3GHz6路核心,肥处理器可以达到峰值18BIPS的处理能力,然而对于单线程的程序而言,然难达到高于1.5IPC的执行速度,那么它的处理能力仅为4.5BIPS,对于可以利用多线程的服务器程

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。