基于tms320c6000系列dsp的c代码优化方法研究

基于tms320c6000系列dsp的c代码优化方法研究

ID:30373871

大小:231.20 KB

页数:4页

时间:2018-12-29

基于tms320c6000系列dsp的c代码优化方法研究_第1页
基于tms320c6000系列dsp的c代码优化方法研究_第2页
基于tms320c6000系列dsp的c代码优化方法研究_第3页
基于tms320c6000系列dsp的c代码优化方法研究_第4页
资源描述:

《基于tms320c6000系列dsp的c代码优化方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第2期微 处 理 机No.22004年4月MICROPROCESSORSApr.,2004基于TMS320C6000系列DSP的C代码优化方法研究阳明晔,张志勇(国防科技大学电子科学与工程学院ATR国家重点实验室,长沙410073)  摘 要:随着DSP任务系统的复杂度增大,如何使DSP任务系统充分利用资源成为了软件开发的关键环节之一,而程序优化是解决这一问题的有效途径。优化的过程大致分为三个阶段。首先,利用C编译器对程序整体优化;其次,对重要循环体进行结构调整;最后,我们再针对一些特殊问题,采用线性汇编直接改写。本文基于TMS320C6000系

2、列DSP,着重于具体应用,对这三个阶段进行详细论述。关键词:DSP;C编译器;优化;汇编优化器中图分类号:TP332  文献标识码:B  文章编号:1002-2279(2004)02-0059-03TheOptimizationofCProgramsBasedontheTMS3206000PlatformofDSPYANGMing-ye,ZHANGZhi-yong(ATRNationalKeyLaboratory,InstituteofElectronicScienceandEngineering,NationalUniversityofDefe

3、nseTechnology,ChangSha410073,China)Abstract:WiththeincreasingcomplexityofDSPtasksystem,itbecomesakeyphasethathowtousetheresourcesufficientlybyaDSPtasksystem.AndoptimizationofDSPprogramsisanefficientlywaytosolvetheproblem.Thecourseofoptimizationcommonlyincludesthreestages:firs

4、tly,optimizingthewholeprogramwiththeCCompiler;secondly,adjustingtheimpor2tantloopstructure;finally,rewritingthecodewithLinerAssemblydirectly.Thepaperwilldis2cussthethreestagesforspecificapplicationindetail.Keywords:DSP;CCompiler;Optimize;AssemblyOptimizer1 引 言的另一主要手段。由于TMS320

5、C6000的特殊结构,功能单元同时执行的各种操作可由VLIW长指令TMS320C6000是TMS320系列产品中的新一分配模块来同步执行,使8条并行指令同时通过流代高性能DSP芯片,共分为两大系列。其中定点系水线的每个节拍,极大地提高了机器的吞吐量。列为TMS320C62xx和TMS320C64xx;浮点系列为TMS320C6000丰富的内部资源和良好的运算TMS320C67xx。由于TMS320C6000的开发主要面性能使程序的高效成为可能,但并不是每个程序都向数据密集型算法,有着丰富的内部资源和强大的能达到这一点。随着任务系统的扩大,任务复杂

6、程度运算能力,所以被广泛地应用于数字通信和图像处提高,如何提高程序效率成为程序开发过程中的重理。要环节。对DSP内部资源的最大利用是程序达到高C6000系列CPU中的8个功能单元可以并行效的关键所在。因此,要提高C代码的效率,不但要操作,并且其中两个功能单元为硬件乘法运算单元,在编程中充分考虑DSP的结构特点,更要在软件编大大地提高了乘法速度。DSP采用了具有独立程序程结束之后,对源代码进行优化。程序优化是指在软总线和数据总线的哈佛总线结构,仅片内程序总线件编程结束后利用软件开发工具对程序进行优化,宽度就可达到256位,即每周期可并行执行8条32

7、让程序充分利用资源,提高运行速度和精简指令长位指令;片内两套数据总线的宽度分别为32位;此度,达到高效的过程。优化后,在实现程序结构合理外,DSP还有一套32位DMA专用总线用于传输。的同时,充分利用C6000的并行机制,提高程序运灵活的总线结构使得数据瓶颈对系统性能的限制大行速度。大缓解。C6000的通用寄存器组能支持32位和40位定点数据操作,另外C67xx和C64xx还分别支持2 编写C代码64位双精度数据和64位双字定点数据操作。除了DSP有其结构特点,内部数据总线和寄存器宽多功能单元外,流水技术是提高DSP程序执行效率度是32位的。因而

8、在编写代码时要仔细考虑代码的阳明晔,29岁,女,硕士研究生,研究方向:DSP开发,嵌入式实时系统。收稿日期:2003-07-17·60·

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。