欢迎来到天天文库
浏览记录
ID:10729704
大小:53.50 KB
页数:4页
时间:2018-07-07
《采用可配置处理器实现多处理器soc设计》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、采用可配置处理器实现多处理器SoC设计
2、第1内容显示中可配置处理器标志着第四代微处理器设计的开始,这种技术更加适合SoC的设计。本文介绍基于Tensilica公司XPRES编译器实现处理器配置性能优化的方法,采用可配置处理器设计技术的多处理器系统级芯片(MPSoC)设计实现。在二十世纪九十年代,ASIC和SoC制造技术的发展为微处理器设计进入第四代(即后RISC,可配置处理器)打下了坚实的基础。可配置处理器标志着第四代微处理器设计的开始,这种技术更加适合SoC的设计。500)this.style.ouseg(this)">
3、图1:一个处理器通过总线访问第二个处理器的局部数据存储器。当今的系统开发工具已经非常先进,完全可以允许设计工程师根据具体的应用目标任务来定制微处理器核。处理器定制可以在非常短的时间内,甚至几分钟就可以根据具体应用完成片上系统处理器核的设计。由于根据具体任务来定制处理器的速度非常快,因此可配置处理器可以具有非常优异的高性能来构建片上系统的设计,并且经常用于快速建立一些功能模块,而这些功能模块如果采用人工RTL方式设计的话,则可能需要几个月的时间。正是由于可配置处理器技术的高性能和快速开发能力,使得许多最终产品在多个可配置处理
4、器核的基础上实现了SoC。这些最终产品包括最大和最小的网络路由器以及诸如便携式摄像机、打印机和低成本视频游戏机等消费类电子产品。两种最新的开发技术已经嵌入到可配置处理器甚至SoC设计中,即全自动化、专用指令集定制技术和对处理器内部执行部件的多口访问技术。前者允许片上系统设计工程师更加专注系统体系结构方面的问题,而通过依赖自动化设计工具来完成某些单一功能模块以达到性能目标;后者则克服了存在已久的总线瓶颈问题,而这种问题从1971年第一个微处理器出现以来就一直阻碍着微处理器性能的提高。处理器定制十多年来,硬件设计工程师一直在用
5、C或者C++对系统进行描述,进而转换成有效的硬件。最初的系统描述通常是用C或者C++写成的,因为采用这些高级语言描述的系统可以在廉价的PC上执行和评价。然而,廉价的PC并不适合许多嵌入式系统的设计,尤其是在消费电子领域,因为其功耗太大。因此,设计工程师开始希望找到一种工具来将用C或者C++写成的系统描述转换成硬件。500)this.style.ouseg(this)">图2:两个处理器共享局部数据存储器。许多像“行为综合”、“C语言硬件综合”和“ESL”设计方法都有一些不足,因为它们都试图解决在本质上很复杂的问题:用时序可
6、执行语言写成的系统描述转换成并行互操作和非可编程的硬件模块。Tensilica公司的XPRES编译器采用一种更加简单、更加直接的方法来解决这一设计问题。XPRES编译器不是试图从头开始进行与应用相关的硬件设计,而是从一个完整的功能处理器核开始设计,然后以添加硬件执行部件和相应的机器指令的方式来增加硬件,以加速处理器上目标应用程序的执行速度。因此,XPRES编译器从一个正在工作的硬件(Xtensa微处理器核)开始设计,同时使得目标程序代码运行得更快。这种搜索的结果是完成一个微处理器的配置,此配置有一个性能/硬件开销的特性曲线
7、。性能优化的三种技术途径XPRES编译器采用三种技术来建立优化的Xtensa处理器配置:操作数融合、单指令流多数据流(SIMD)和FLIX(可变长度指令扩展)。操作数融合技术记录程序循环语句中简单操作出现的频度。XPRES编译器将这些指令序列合并成一条增强型指令,这种增强型指令通过减少循环内部的指令条数来加速程序代码的执行。应用程序中的许多循环语句对一个数据阵列执行相同的操作,XPRES编译器可以将这些循环语句进行向量化,建立一条由多个相同执行部件并行执行多个数据项的指令。对Xtensa处理器增加SIMD指令与Tensil
8、ica的XCCC/C++编译器是一致的,该编译器能够将应用程序代码中的内循环展开并且进行向量化。通过向量化可以加速循环语句的执行,这通常和增强型指令内部SIMD运算部件的序号有关。XPRES编译器采用的第三种加速程序代码执行的技术是Tensilica的FLIX技术。FLIX指令是一种类似于融合和SIMD指令的多操作指令。然而,FLIX指令由多个独立的操作组成,而融合(fused)和SIMD指令则均为相关多操作。FLIX指令中的每一个操作都是和其它操作互相独立的,XCCC/C++编译器将彼此独立的操作压缩成一条FLIX格式的
9、指令,而这种压缩后的指令能够显著加速程序代码的执行速度。采用可配置处理器设计MPSoC在当今的应用中,很少只用一个处理器就能满足系统的性能指标,即使采用面向目标应用的可配置处理器也很难做到。然而,多处理器MP指令集、高带宽接口和小面积使得在一个SoC设计中可以集成多个可配置处理器。SoC中处理器模块之间
此文档下载收益归作者所有