基于OpenCL的目标检测算法加速

基于OpenCL的目标检测算法加速

ID:37033006

大小:6.03 MB

页数:76页

时间:2019-05-15

基于OpenCL的目标检测算法加速_第1页
基于OpenCL的目标检测算法加速_第2页
基于OpenCL的目标检测算法加速_第3页
基于OpenCL的目标检测算法加速_第4页
基于OpenCL的目标检测算法加速_第5页
资源描述:

《基于OpenCL的目标检测算法加速》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文圖肇1I基于OpenCL的目标检测算法加速名张晰:学校导师姓名、职称田小林副教授企业导师姓名、职称岳博副研究员申请学位类别工程硕士圔学校代码10701学号1502121370分类号TP751密级公开西安电子科技大学硕士学位论文基于OpenCL的目标检测算法加速作者姓名:张晰领域:电子与通信工程学位类别:工程硕士学校导师姓名、职称:田小林副教授企业导师姓名、职称:岳博副研究员学院:人工智能学院提交日期:2018年6月ObjectDetectionAlgorithmAccelerationBasedonOpenCLAthesiss

2、ubmittedtoXIDIANUNIVERSITYinpartialfulfillmentoftherequirementsforthedegreeofMasterinElectronicsandCommunicationsEngineeringByZhangXiSupervisor:TianXiaolinTitle:AssociateProfessorSupervisor:YueBoTitle:AssociateResearchFellowJune2018摘要摘要目标检测在日常生活中有着广泛的应用,是计算机视觉的一个重要的方向。它以判断图像或视频中是否存在感兴趣的单个或

3、多个目标,并确定目标的类别和位置为目的。传统目标检测算法由于提取特征的局限性、定位的误差限制了检测的精度,基于深度学习框架的目标检测算法将特征提取与目标识别、定位一体化,使得基于深度学习框架的目标检测算法逐渐占据主导地位。本文对基于深度学习框架的目标检测算法YOLO(YouOnlyLookOnce)使用开放运算语言(OpenComputingLanguage,OpenCL)对其并行加速,使其在检测精度不变的情况下训练、测试过程速度显著提高。本文的主要工作如下:(1)针对该卷积神经网络中的卷积层,最大池化层,平均池化层,批量归一化层,Softmax层,损失函数等层使用Open

4、CL语言对其并行加速,在使用NVIDIA的图形显示卡GTX1080条件下,使得YOLO的训练过程相比IntelCPU训练过程获得了大约141倍加速比,测试过程相比于IntelCPU获得了大约114倍加速比。(2)针对YOLO算法最耗时的卷积层部分,本文提出一种基于GPU的高速矩阵乘法对卷积层进行加速。该方法使用矩阵分块,合并访存,每个线程计算多个输出元素等优化方法。在使用NVIDIA的图形卡GTX1080条件下矩阵乘法相比于YOLO原始的矩阵乘法获得了大约4倍的加速比。(3)根据OpenCL语言易于在不同类型设备移植的特点,本文分别在众核处理器(ManyIntegrated

5、Core,MIC),现场可编程门阵列(Field-ProgrammableGateArray,FPGA)上对算法进行修改测试,并针对FPGA的架构特点及其资源利用情况,对卷积层中的矩阵乘法进行修改,使其在最高的资源利用率的情况下发挥出最高性能,在使用IntelFPGADE5-Net的条件下,单张图像的测试过程耗时约为1.9s。本论文工作得到了国家自然科学基金(No.61571342)的资助。关键词:卷积神经网络,目标检测,OpenCL,YOLO,FPGAIABSTRACTABSTRACTObjectdetectionhasawiderangeofapplicationsin

6、variousfieldsoflifeandisanimportantdirectionofcomputervision.Itaimstodeterminewhethertherearesingleormultipleobjectsofinterestinanimageorvideo,andtodeterminethecategoryandlocationoftheobject.Theaccuracyofthedetectionofthetraditionalobjectdetectionalgorithmislimitedbythefeatureextractionand

7、thepositioningerror.Theobjectdetectionalgorithmbasedonthedeeplearningframeworkintegratesthefeatureextractionwiththeobjectrecognitionandlocalization.Sotheobjectdetectionalgorithmbasedondeeplearningframeworkgraduallyoccupiesthemarket.WeuseOpenCLlanguagetospeedup

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。