欢迎来到天天文库
浏览记录
ID:15366746
大小:370.37 KB
页数:4页
时间:2018-08-02
《1多核处理器的结构设计研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据第33卷V01.33第16期No.16计算机工程ComputerEngineering2007年8月August2007·工程应用技术与实现·文章编号t1000_3428(2007)l岳卅208—03文献标识码:A中圈分类号。TN47多核处理器的结构设计研究何军,王飙(国家高性能集成电路上海设计中心,上海201204)摘要:围绕如何进行多核处理器的结构设计,提高处理器性能这一问题,结合传统多处理机设计原理对多核处理器结构设计进行了研究,并对当前主要商业多核处理器进行了研究,揭示了其发展趋势,探索了未来多核处理器设计的发
2、展方向。关健词:多核处理器;ILP;TLP;处理器结构ResearchonArchitectureDesignofMulti-coreProcessorHEJun.WANGBiao(NationalHighPerformanceICShanghaiDesignCenter,Shanghai201204)[Abstract]OntheissuehowtOdesignthearchitectureofmulti—coreprocessorastoimproveitsperformance,thispaperresearcheson
3、themulti—coreprocessorarchitecturedesignreferringtOthetheoryoftraditionalmultiprocessor,disclosesthedevelopmenttrendsofcommercialmulti—coreprocessorsbymakingastudyofcurrentcommercialmulti—coreprocessors,andreflectsonthefutureofmulti—coreprocessordesign.[Keywords]mul
4、ti-coreprocessor;ILP;TLP;processorarchitecture在过去的几十年中,一般通过增加发射宽度和提高时钟频率来提高处理器性能,利用超标量发射、乱序发射执行、超级流水、动态转移预测、大容量片内Cache等技术来开发程序的指令级并行性(ILP)。但是,增加发射宽度使设计的复杂性急剧增加,这一方面不利于时钟频率的提高,另一方面也难以适应深亚微米工艺下日益显现的线延大于门延的负面影响,也使处理器设计验证成本难以承受。更重要的是,指令之间的数据和控制相关,可以开发的ILP也有限,当发射宽度大于4时,大
5、多数应用可以获得的性能提升十分有限。提高时钟频率,使流水线级数增加,转移预测失败和Cache失效的代价也随之增加,这样提高时钟频率获得的性能十分有限,另外频率提升使功耗也随之增加,使芯片封装和冷却代价也水涨船高。这些都使经典的超标量结构处理器难以进一步提高处理器性能。从应用的角度看,如在线事务处理(OLTP)、决策支持系统(DSS)和Web服务等这类应用的特点是具有丰富的线程级并行性(TLP)而缺少ILP,传统处理器结构难以开发,一般是采用多处理机系统开发。随着集成电路工艺的发展,利用先进工艺将多个处理器核集成到单个芯片上以开
6、发TLP成为可能。因此,在1996年斯坦福大学的研究人员提出了单片多处理器(CMP)结构,并进行了研究¨1。CMP结构的主要思想是通过简化超标量结构设计,将多个相对简单的超标量处理器核集成到一个芯片上,从而避免线延的影响,并充分开发TLP,提高吞吐量。通过简化单核设计,不仅有利于避免线延的影响,而且有利于时钟频率的提升,还有利于减少处理器研制的时间周期。另外,CMP结构能够适应工艺尺寸比例缩放,具有较好的可扩展性。因此,CMP结构成为当前和未来处理器发展的主要方向。但是,如何进行多核处理器结构设计,以充分提高处理器性能是一个值
7、得仔细研究和探索的问题。一208—1多核处理器设计从某种意义上讲,多核处理器就是一个芯片级的多处理机系统,是板级多处理机系统的“微缩版”,成熟的多处理机系统设计原理对多核处理器结构设计具有重要的参考价值。从硬件角度看,多核处理器结构设计主要包括两个方面:单核结构设计与多核组织结构设计。1.1单核结构设计虽然多核处理器结构最初的动机是利用简化的超标量处理器核组成多核处理器,但是广义地来看,单核结构并不局限于超标量结构,完全可以利用现有的各种处理器结构来实现。纵观处理器结构的发展历程,可以采用经典的超标量结构,也可以采用超长指令字
8、(VLIW)结构和多线程结构(技术)。其中多线程结构主要有3种:细粒度多线程,粗粒度多线程和同时多线程(SMT)
9、2J。在此,先对各种处理器结构进行简单回顾。超标量结构主要目标是利用硬件动态地从指令窗1:1中寻找出多条不相关的指令,由多个独立功能部件并行执行,以充分开发ILP
此文档下载收益归作者所有