欢迎来到天天文库
浏览记录
ID:35182107
大小:4.53 MB
页数:60页
时间:2019-03-21
《深度学习卷积神经网络vliw加速器设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、深度学习卷积神经网络VLIW加速器设计与实现中文摘要深度学习卷积神经网络VLIW加速器设计与实现中文摘要近年来,卷积神经网络(CNN)算法及其在视觉感知领域的应用很大程度上改变了传统的机器视觉框架。但因为CNN算法大量的计算工作负载使其很难在高实时性,嵌入式场合得以广泛应用。最近,有一些国际著名的学术、商业机构推出了其专用的解决方案,用来降低功耗并提高性能,但大量的数据传输与访问仍然是一个棘手的挑战。本文的主要的工作如下:1.整合并优化了CNN卷积层,进行了细粒度的算法并行性分析,提出了IntraOutputFeatureMap的并行思路;
2、对片上片外存储模型进行分析并为CNN设置了较通用的存储解决方案;2.提出了一种全新的CNN硬件加速器结构,设定了指令集与工作模式,用户可以使用简单的VLIW指令实现多种参数的CNN网络层;3.构建了基于ZYNQ的SOC芯片设计验证平台框架,并对CNN加速器进行验证;4.使用28nm低功耗工艺库实现了CNN加速器ASIC,与其它先进的CNN加速器相比,在实现相近或更好的吞吐量情况下,本文的加速器降低了50%的外部存储访问量,能够在0.303mm2的芯片面积上达到102GOp/s@800MHz的吞吐量,最大功耗仅为68mW.关键词:卷积神经网络
3、并行计算硬件加速芯片低功耗深度学习作者:石润彬指导老师:吴迪IAbstractDesignandImplementationofVLIWAcceleratorforDeepLearningConvolutionalNeuralNetworksDesignandImplementationofVLIWAcceleratorforDeepLearningConvolutionalNeuralNetworksAbstractTheadvantagesofConvolutionalNeuralNetworks(CNNs)withrespecttot
4、raditionalmethodsforvisualpatternrecognitionhavechangedthefieldofmachinevision.ThemainissuethathindersbroadadoptionofthistechniqueisthemassivecomputingworkloadinCNNthatpreventsreal-timeimplementationonlow-powerembeddedplatforms.Recently,severaldedicatedsolutionshavebeenpro
5、posedtoimprovetheenergyefficiencyandthroughputbysometopacademicorcommercialorganizations.However,thehugeamountofdatatransferandaccessinvolvedintheprocessingisstillachallengingissue.Thefollowingworkwouldbedescribedinthisthesis,Firstofall,theCNNbenchmarklayershavebeencollect
6、edandoptimized.ThenthisthesiswillgiveaFine-Grainedanalysisoftheparallelismpossibilitiesfortheconvolutionallayers.TheconceptofIntraOutputFeatureMapparallelismisproposedinthisthesis.AnovelgeneralsolutionforCNNdatastorageisproposedaswell.Secondly,anovelCNNhardwareacceleratori
7、spresented.TheVLIWInstruction-Sethasbeendefined.UserscanimplementCNNlayerswithdifferentparametersviasimpleVLIWprogramming.Thirdly,aDigitalICverificationplatformhasbeensetbasedontheZYNQSoC.Theproposedacceleratorarchitecturealsohasbeenimplementedonthisplatform.IIDesignandImp
8、lementationofVLIWAcceleratorforDeepLearningConvolutionalNeuralNetworksAbstractLastly,thea
此文档下载收益归作者所有