欢迎来到天天文库
浏览记录
ID:27915745
大小:66.00 KB
页数:11页
时间:2018-12-07
《可重构体系结构的异构加速器的发展和应用.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、可重构体系结构的异构加速器的发展和应用可重构体系结构的异构加速器的发展和应用可重构体系结构的异构加速器的发展和应用 为了更好的回顾近年来的可重构计算加速器相关工作,报告将以最近的可重构计算加速器体系结构以及算法应用等高水平科研成果为基础,对国内外的相关研究热点和关注领域进行客观对比,对可重构计算加速器的优缺点和挑战进行了详细的分析和说明。由于计算机体系结构是国内外计算机领域发展差距较大的方向之一,报告将以可重构计算加速器为切入点,着重分析FPGA和可重构计算加速器等技术给国内体系结构研究人员带来的新机
2、遇和挑战,展望加速器体系结构未来的发展趋势。报告中的相关内容希望能为我国计算机体系结构领域的研究提供参考。国内外研究进展比较 作者对可重构计算加速器在国内外的研究进展进行客观对比。首先,统计了在可重构计算加速器领域国内外的研究工作(主要涉及在高水平会议和期刊上发表的相关工作)。其次,将围绕体系结构和算法应用两个层次的代表性工作进行重点分析。第三,围绕加速器的成熟度和解决方案等方面,对国际和国内的进展进行比较。通过上述分析,作者给出国内加速器研究存在的主要问题,旨在找到与国际顶尖水平的差距。 我们对计
3、算机体系结构顶级会议收录论文情况进行了统计,这其中包括MICRO2016,DAC2016,ICCAD2016,ISCA2017,HPCA2017,ASPLOS2017,DATE2017,FPGA2017等有代表性的国际会议。具体情况如下所示: 图1国内外相关工作在体系结构顶会中的录用情况 从图中我们可以看出,国内相关研究工作出现在体系结构顶级会议上的频率较之从前已经在逐步提升,并且在工作质量方面也取得了长足进步。其中,中科院计算所陈云霁研究院团队提出的神经网络指令集Cambricon还获得了IS
4、CA2016的最高评分。但是与此同时,目前国内在体系结构领域的研究点较为集中,国外在这一领域的研究面更为广泛,在系统功耗、并行性、可靠性、安全性等基础研究,以及新型存储系统、云计算、大型数据中心和加速器等方面均有丰富的研究成果。国内目前的研究主要集中在大数据应用以及专用加速器设计方面,缺乏在体系结构层面上的基础性的研究。因此,我们需要认清体系结构基础学科研究对于上层科研的重要性,加大在基础领域的研究投入和人才培养力度。 从体系结构整体角度来看,在加速器设计方面,国外主要侧重于加速器架构、新型材料、编程
5、框架以及特定应用等方面研究,涌现出了一批优秀的研究成果,并且形成了一整套完备的开发体系,比如基于新型材料的PipeLayer加速器、基于ASIC的CNN加速器—Eyeriss和基于FPGA的框架¬—DNNWeaver等。在国内加速器的通用性和灵活性上面关注的不多,而经常集中在研究单一特定的算法上的加速效果上。中科院和寒武纪公司在此方面的工作较为优秀,提出了基于ASIC的神经网络加速器—DianNao系列以及稀疏网络的深度学习加速器—Cambricon-X等。我们需要意识到国内外在此领域的差距,可重构计算
6、加速器是软件和硬件相互配合的产物,单一的研究软件或者硬件并不能达到很好的效果,国内主要是侧重于单一应用的加速效果的研究,没有形成完备的研究体系。 对于计算机体系结构而言,它是软硬件系统的总称,涉及面广、结构复杂。目前,众多计算密集型和数据密集型的任务对计算机体系结构提出了更高的要求,为了提升性能并降低功耗满足日益增长的需求,使得其结构进一步复杂,给科研人员带来了更大的挑战,同时也带来了更多的机遇。 发展趋势与展望 自从计算机诞生的时候开始,国内外研究者们即注意到计算机体系结构对计算机系统的性能的影
7、响。事实上,从来不存在某种特定的计算机体系结构对所有的应用、任务来说都能得到最优的性能,例如,深度学习等领域的应用并行度较高,最适合处理该类任务的架构是多核并行架构;另一方面,有一些科学计算相关的任务,其本身无法并行,因此最适合的架构是单核架构,并且需要极大的提升单核的性能。正是由于不同的计算任务有着适合自身的计算机架构,因此上世纪60年代GeraldEstrin提出了可重构计算(ReconfigurableCompuTIng)的概念。可重构计算包括作为中央控制单元的CPU,众多可重构的计算单元(Rec
8、onfigurableProcessingUnit),这些可重构计算单元由中央处理器CPU控制,在执行相应的任务(如科学计算、图像识别、模式识别等)的时候,可重构计算单元配置成最优的架构(也即硬件编程)。ReinerHartenstein等在文献[202]中指出,可重构计算使得计算单元的时钟频率远低于CPU,但是综合计算能力却高于CPU数倍,而且功耗也低于CPU。可重构计算加速器有着种种优点,但是也存在这自身的一些缺点,如重构开销大,编程复
此文档下载收益归作者所有