欢迎来到天天文库
浏览记录
ID:27870406
大小:80.50 KB
页数:3页
时间:2018-12-06
《基于FPGA加速机器学习算法.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于FPGA加速机器学习算法AI因为其CNN(卷积神经网络)算法出色的表现在图像识别领域占有举足轻重的地位。基本的CNN算法需要大量的计算和数据重用,非常适合使用FPGA来实现。上个月,RalphWitTIg(XilinxCTOOffice的卓越工程师)在2016年OpenPower峰会上发表了约20分钟时长的演讲并讨论了包括清华大学在内的中国各大学研究CNN的一些成果。在这项研究中出现了一些和CNN算法实现能耗相关的几个有趣的结论:①限定使用片上Memory;②使用更小的乘法器;③进行定点匹配:相对于32位定点或浮点计算,将定点计算结果精度降为16位。如果使用动态量化,8位计算同
2、样能够产生很好的结果。在演讲中WitTIg还提到了CNN相关的两款产品:CAPI-compaTIbleAlphaDataADM-PCIE-8K5PCIe加速卡和AuvizSystems提供的AuvizDNN(深度神经网络)开发库。ADM-PCIE-8K5PCIe加速卡AlphaDataADM-PCIE-8K5PCIe加速卡用于X86和IBMPower8/9数据中心和云服务,加速卡基于XilinxKintexUltraScaleKU115FPGA,支持XilinxSDAcess基于OpenCL、C/C++的开发和基于VivadoHLx的HDL、HLS设计流程。图1AlphaDataA
3、DM-PCIE-8K5PCIe加速卡AlphaDataADM-PCIE-8K5PCIe加速卡片上带32GBDDR4-2400内存(其中16GB含ECC),双通道SFP+支持双通道10G以太网接入。提供包括高性能PCIe/DMA在内的板级支持包(BSP)、OpenPOWER架构的CAPI、FPGA参考设计、即插即用的O/S驱动和成熟的API等设计资源。AuvizDNN开发库深度学习技术使用大量的已知数据来找出一组权重和偏置值来匹配预期结果。处理被称之为训练,训练的结果是大量的模型,这一事实促使工程师们寻求使用GPU之类的专用硬件来进行训练和分类计算。随着未来数据量的巨幅增长,机器学习
4、将会搬到云端完成。这样就急需一种既可以加速算法,又不会大规模增加功耗的处理平台,在这种情况下,FPGA开始登场。随着一些列的先进开发环境投入使用,软件开发工程师将他们的设计在XilinxFPGA上实现变得更加容易。AuvizSystems开发的AuvizDNN库为用户提供优化的函数接口,用户可以针对不同的应用创建自定义的CNN。这些函数可以方便的通过XilinxSDAcess这样的集成开发环境调用。在创建对象和数据池后,就会调用函数创建每一个卷积层、然后是致密层,最后是softmax层,如下图2所示。图2实现CNN的函数调用顺序
此文档下载收益归作者所有