欢迎来到天天文库
浏览记录
ID:33649365
大小:410.27 KB
页数:3页
时间:2019-02-28
《有关多核处理器的结构设计研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第33卷第16期计算机工程2007年8月VoL33No.16ComputerEngineeringAugust2007。工程应用技术与实现·文.摘号:1000-3428(2007)16-0208-03文做标识码:A中圈分类号:TN47多核处理器的结构设计研究何军,王抓(国家高性能集成电路上海设计中心,上海201204)摘要:围绕如何进行多核处理器的结构设计,提高处理器性能这一问题,结合传统多处理机设计原理对多核处理器结构设计进行了研究,并对当前主要商业多核处理器进行了研究,揭示了其发展趋势,探索了未来多核处理器设计的发展方向。
2、关性词:多核处理器;ILP;TLP;处理器结构ResearchonArchitectureDesignofMulti-coreProcessorHEJun,WANGBiao(NationalHighPerformanceICShanghaiDesignCenter,Shanghai201204)[Abstract]Ontheissuehowtodesignthearchitectureofmulti-coreprocessorastoimproveitsperformance,thispaperresearchesonthem
3、ulti-coreprocessorarchitecturedesignreferringtothetheoryoftraditionalmultiprocessor,disclosesthedevelopmenttrendsofcommercialmulti-coreprocessorsbymakingastudyofcurrentcommercialmulti-coreprocessors,andreflectsonthefutureofmulti-coreprocessordesign.[Keywords]multi-c
4、oreprocessor;ILP;TLP;processorarchitecture在过去的几十年中,一般通过增加发射宽度和提高时钟1多核处理器设计频率来提高处理器性能,利用超标量发射、乱序发射执行、从某种意义上讲,多核处理器就是一个芯片级的多处理超级流水、动态转移预测、大容量片内Cache等技术来开发机系统,是板级多处理机系统的“微缩版”,成熟的多处理机程序的指令级并行性((ILP)。但是,增加发射宽度使设计的复系统设计原理对多核处理器结构设计具有重要的参考价值。杂性急剧增加,这一方面不利于时钟频率的提高,另一方面从硬件角度
5、看,多核处理器结构设计主要包括两个方面:单也难以适应深亚微米工艺下日益显现的线延大于门延的负面核结构设计与多核组织结构设计。影响,也使处理器设计验证成本难以承受。更重要的是,指1.1单核结构设计令之间的数据和控制相关,可以开发的ILP也有限,当发射虽然多核处理器结构最初的动机是利用简化的超标量处宽度大于4时,大多数应用可以获得的性能提升十分有限。理器核组成多核处理器,但是广义地来看,单核结构并不局提高时钟频率,使流水线级数增加,转移预测失败和Cache限于超标量结构,完全可以利用现有的各种处理器结构来实失效的代价也随之增加,这
6、样提高时钟频率获得的性能十分现。纵观处理器结构的发展历程,可以采用经典的超标量结有限,另外频率提升使功耗也随之增加,使芯片封装和冷却构,也可以采用超长指令字(VLIW)结构和多线程结构(技术)。代价也水涨船高。这些都使经典的超标量结构处理器难以进其中多线程结构主要有3种:细粒度多线程,粗粒度多线程一步提高处理器性能。和同时多线程((SMT)"'。在此,先对各种处理器结构进行简单从应用的角度看,如在线事务处理(OLTP)、决策支持系回顾。统(DSS)和Web服务等这类应用的特点是具有丰富的线程级超标量结构主要目标是利用硬件动态地
7、从指令窗口中寻并行性((TLP)而缺少ILP,传统处理器结构难以开发,一般是找出多条不相关的指令,由多个独立功能部件并行执行,以采用多处理机系统开发。随着集成电路工艺的发展,利用先充分开发ILP。但正如前文所述,随着工艺的进步,复杂的进工艺将多个处理器核集成到单个芯片上以开发TLP成为可超标量结构难以进一步提高处理器性能。VLIW结构企图通能。因此,在1996年斯坦福大学的研究人员提出了单片多处过编译器静态调度避免复杂的硬件动态调度,从而简化硬件理器((CMP)结构,并进行了研究of设计,进一步开发ILP。但随着发射宽度的增加
8、,VLIW结构CMP结构的主要思想是通过简化超标量结构设计,将多需要的集中的寄存器文件的大小以及旁路逻辑等设计复杂性个相对简单的超标量处理器核集成到一个芯片上,从而避免也急剧增加,此外,VLIW结构性能对编译器的过分依赖,线延的影响,并充分开发TLP,提高吞吐量。通过简化单核
此文档下载收益归作者所有