一种高性能向量处理器的实现

一种高性能向量处理器的实现

ID:35035919

大小:3.69 MB

页数:65页

时间:2019-03-16

一种高性能向量处理器的实现_第1页
一种高性能向量处理器的实现_第2页
一种高性能向量处理器的实现_第3页
一种高性能向量处理器的实现_第4页
一种高性能向量处理器的实现_第5页
资源描述:

《一种高性能向量处理器的实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、一种高性能向量处理器的实现TheImplementationofaHighPerformanceVectorProcessor学科专业:集成电路工程研究生:王捷指导教师:郭炜教授企业导师:王粟工程师天津大学电子信息工程学院二零一五年十一月中文摘要为了满足处理多媒体应用的需求,主流处理器厂商都在他们的通用处理器上增加了相应的扩展体系结构,用于提高多媒体性能。并提供了具有单指令多数据特点的指令集,简称为SIMD指令集。Altivec技术便是在PowerPC体系结构的通用处理器上通过扩展PowerPC指令集实现对多媒体处理技术的支持的浮点和定点SIMD技术。本文提出一个通过协处理器接口与主处理器紧耦

2、合相连的向量协处理器,研究了Altivec的顶层控制通路以及向量协处理器四个功能单元之一简单定点功能单元的设计与实现方法,并提出了一套完善的协处理器验证方案,包括基于SystemVerilog验证平台的软硬件功能单元验证、基于软硬件自动比对的顶层指令集验证和从高级语言角度入手的顶层函数库验证。整个验证方案具有较高的完备性、可重用性、可信度、效率和速度。在面积方面,采用硬件复用的方法以减少简单定点功能单元的面积。综合结果显示,采用硬件复用的方法设计的简单定点功能单元较不采用硬件复用设计相比,面积减少了53%。在速度方面,采用随机仿存指令队列及分布式保留站逻辑的动态调度方法处理真相关,基于指令之间

3、的数据相关性将操作数已准备好的指令发射到保留站,缓解因指令间数据相关对处理器性能的影响以及由于保留站资源不足对整个流水线的阻塞。实验结果表明,采用动态调度之后译码较直接译码相比,针对浮点类指令验证用例执行时间可以减少20.47%-25.93%,定点类指令验证用例执行时间可以减少5.65%-13.42%。关键词:单指令多数据;向量定点功能单元;硬件复用;乱序执行;验证方法;ABSTRACTInordertomeettheneedsofprocessingofmultimediaapplications,themainstreamprocessormanufacturershaveincrease

4、dtheircorrespondingextendedarchitecture,forimprovingtheperformanceofthemedia.Andprovidestheinstructionsetwithsingleinstructionmultipledatacharacteristics,referredtoasSIMDinstructionset.AltivectechnologyisageneralpurposeprocessorinthePowerPCarchitecture,whichisbasedontheextendedPowerPCinstructionset,

5、whichissupportedbythemultimediaprocessingtechnology.Inthispaper,avectorco-processor,whichiscloselycoupledtothemainprocessor,isproposed.ThedesignandimplementationoftheAltivectoplevelcontrolpathandthedesignandimplementationofasimplefixed-pointfunctionalunit,whichisoneofthefourfunctionalunitsofvectorco

6、-processorarestudied.ThehardwareandsoftwareverificationschemebasedonSystemVerilogverificationplatformispresented.Thewholeverificationschemehastheadvantagesofhighcompleteness,reusability,reliability,efficiencyandspeed.Inthearea,themethodofhardwarereuseisadoptedtoreducetheareaofthesimplefixedpointfunc

7、tionunit.Theresultsshowthatthehardwareareaofsimplefixedpointfunctionalunitdesignedbythemethodofhardwarereuseisreducedby53%comparedwiththedesignwithouthardwarereuse.Inspeed,thedynamicschedulingmethodba

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。