欢迎来到天天文库
浏览记录
ID:55748983
大小:400.65 KB
页数:5页
时间:2020-06-06
《面向低功耗共享Cache路适应划分算法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第41卷第7期计算机科学Vo1.41No.72014年7月ComputerScienceJuly2014面向低功耗共享Cache路适应划分算法研究方娟王帅于璐(北京工业大学计算机学院北京1OO124)摘要如何提高多核处理器的性能和降低多核处理器中Cache的功耗已经成为下一代多核处理器的研究热点。为了降低片上多核处理器的功耗,基于路适应算法可以采用一种新的动态划分机制,该机制主要由路分配模块和动态功耗控制模块组成。路分配模块在程序运行过程中根据处理器核所运行线程的工作集的大小调整处理器核所分配的
2、Cache路。动态功耗控制模块利用程序运行的局部性原理,将处理器核所运行线程的工作空间控制在少数Cache路中。关闭剩余的Cache路,从而达到降低Cache功耗的目的。该机制使用Simics全系统模拟平台模拟多核处理器,并用SpecOMP测试集测试了系统的性能和功耗。与传统的Cache(ConventionalL2Cache,C-L2)相比,其IPC提高了9.27,功耗降低了1O.95。关键词路自适应,低功耗,动态划分中图法分类号TP391文献标识码ADOI10.11896/j.issru10
3、02—137X2014.07.006ResearchofLowerPowerOrientedWay-adaptivePartitionAlgorithminSharedCacheofCMPFANGJuanWANGShuaiYULu(CollegeofComputerScience,BeijingUniversityofTechnology,Beijing100124,China)AbstractImprovingprocessorperformanceandreducingenergyconsu
4、mptionoftheCachehavebecomeresearchtopicofthenext—generationprocessor.ToreduceenergyconsumptioninCMP,anewmechanismbasedondynamicalway-a—daptableCachecanbeadopted.Themechanismmainlyconsistsofwayreallocatemoduleanddynamicpowercontrolmodule.Wayreallocate
5、modulereassignswaysbetweencoresbasedonthread’Sworkingsetontheexecutionoftheprogram.Ourmechanismimplementslowpowerconsumptionbydynamicpowercontrolmodule.Theproposedschemebasedondynamicalway-adaptableCacheisimplementedandsimulatedbySimics.Weappliedseve
6、ralprogramsselectedfromSpecOMPasbenchmarks.Comparedwithtraditiona1cache(Conventiona1L2Cache,C—L2),itsIPCincreasesby9.27,andpowerconsumptionreducesby10.95.KeywordsWay-adaptable,Lowpowerconsumption,Dynamicalreallocate了提高空间利用率,CMP的L2Cache或更高层次的Cache1引言一
7、般会全部或部分地共享,因此不同处理器核的线程可能会近年来多核处理器体系结构,特别是片上多核(Chip竞争地使用Cache资源。当该情况发生时,会造成各个处理Muti—Processors,CMP)E体系结构已经被学术界广泛看好和器核上所运行线程的性能出现抖动,造成总体性能的下降。接受。该体系结构已经被学术界认为是处理器体系结构的发解决该问题的一种方法为增大Cache的容量,然而该方法将展趋势。CMP通过在一块芯片上集成更多的核数来达到线导致功耗的剧增并且将导致Cache的利用率降低。程级的并行,
8、从而真正实现了程序的并发执行。由于共享Cache功耗问题限制了CMP的性能的进一步提高CMP的性能,片上共享缓存机制发挥着非常重要提升,如何降低共享Cache的功耗成为了当前学者的研究热的作用_2]。为了充分利用片上共享缓存Cache,CMP的点[,例如路预测Cache技术_1、基于IPC的Cache划分技Cache系统必须为各个并行执行在不同处理器核上的线程提术l1、基于公平性的Cache划分技术l_1。根据各个处理器核供快速的数据访问。目前,片上集成的Cache容量在不断增运行的线程具有空间
此文档下载收益归作者所有