深度学习卷积神经网络vliw加速器设计与实现

深度学习卷积神经网络vliw加速器设计与实现

ID:35182107

大小:4.53 MB

页数:60页

时间:2019-03-21

深度学习卷积神经网络vliw加速器设计与实现_第1页
深度学习卷积神经网络vliw加速器设计与实现_第2页
深度学习卷积神经网络vliw加速器设计与实现_第3页
深度学习卷积神经网络vliw加速器设计与实现_第4页
深度学习卷积神经网络vliw加速器设计与实现_第5页
资源描述:

《深度学习卷积神经网络vliw加速器设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、深度学习卷积神经网络VLIW加速器设计与实现中文摘要深度学习卷积神经网络VLIW加速器设计与实现中文摘要近年来,卷积神经网络(CNN)算法及其在视觉感知领域的应用很大程度上改变了传统的机器视觉框架。但因为CNN算法大量的计算工作负载使其很难在高实时性,嵌入式场合得以广泛应用。最近,有一些国际著名的学术、商业机构推出了其专用的解决方案,用来降低功耗并提高性能,但大量的数据传输与访问仍然是一个棘手的挑战。本文的主要的工作如下:1.整合并优化了CNN卷积层,进行了细粒度的算法并行性分析,提出了IntraOutputFeatureMap的并行思路;

2、对片上片外存储模型进行分析并为CNN设置了较通用的存储解决方案;2.提出了一种全新的CNN硬件加速器结构,设定了指令集与工作模式,用户可以使用简单的VLIW指令实现多种参数的CNN网络层;3.构建了基于ZYNQ的SOC芯片设计验证平台框架,并对CNN加速器进行验证;4.使用28nm低功耗工艺库实现了CNN加速器ASIC,与其它先进的CNN加速器相比,在实现相近或更好的吞吐量情况下,本文的加速器降低了50%的外部存储访问量,能够在0.303mm2的芯片面积上达到102GOp/s@800MHz的吞吐量,最大功耗仅为68mW.关键词:卷积神经网络

3、并行计算硬件加速芯片低功耗深度学习作者:石润彬指导老师:吴迪IAbstractDesignandImplementationofVLIWAcceleratorforDeepLearningConvolutionalNeuralNetworksDesignandImplementationofVLIWAcceleratorforDeepLearningConvolutionalNeuralNetworksAbstractTheadvantagesofConvolutionalNeuralNetworks(CNNs)withrespecttot

4、raditionalmethodsforvisualpatternrecognitionhavechangedthefieldofmachinevision.ThemainissuethathindersbroadadoptionofthistechniqueisthemassivecomputingworkloadinCNNthatpreventsreal-timeimplementationonlow-powerembeddedplatforms.Recently,severaldedicatedsolutionshavebeenpro

5、posedtoimprovetheenergyefficiencyandthroughputbysometopacademicorcommercialorganizations.However,thehugeamountofdatatransferandaccessinvolvedintheprocessingisstillachallengingissue.Thefollowingworkwouldbedescribedinthisthesis,Firstofall,theCNNbenchmarklayershavebeencollect

6、edandoptimized.ThenthisthesiswillgiveaFine-Grainedanalysisoftheparallelismpossibilitiesfortheconvolutionallayers.TheconceptofIntraOutputFeatureMapparallelismisproposedinthisthesis.AnovelgeneralsolutionforCNNdatastorageisproposedaswell.Secondly,anovelCNNhardwareacceleratori

7、spresented.TheVLIWInstruction-Sethasbeendefined.UserscanimplementCNNlayerswithdifferentparametersviasimpleVLIWprogramming.Thirdly,aDigitalICverificationplatformhasbeensetbasedontheZYNQSoC.Theproposedacceleratorarchitecturealsohasbeenimplementedonthisplatform.IIDesignandImp

8、lementationofVLIWAcceleratorforDeepLearningConvolutionalNeuralNetworksAbstractLastly,thea

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。