基于异构计算的矩阵广义逆算法研究及实现.pdf

基于异构计算的矩阵广义逆算法研究及实现.pdf

ID:13511976

大小:2.98 MB

页数:112页

时间:2018-07-23

基于异构计算的矩阵广义逆算法研究及实现.pdf_第1页
基于异构计算的矩阵广义逆算法研究及实现.pdf_第2页
基于异构计算的矩阵广义逆算法研究及实现.pdf_第3页
基于异构计算的矩阵广义逆算法研究及实现.pdf_第4页
基于异构计算的矩阵广义逆算法研究及实现.pdf_第5页
资源描述:

《基于异构计算的矩阵广义逆算法研究及实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、电子科技大学UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA硕士学位论文MASTERTHESIS(电子科技大学图标)论文题目基于异构计算的矩阵广义逆算法研究及实现学科专业通信与信息系统201121010401范兴山学号作者姓名指导教师李广军教授 分类号密级UDC注1学位论文基于异构计算的矩阵广义逆算法研究及实现(题名和副题名)范兴山(作者姓名)指导教师李广军教授电子科技大学(姓名、职称、单位名称)申请学位级别硕士学科专业通信与信息系统提交论文日期2014.4.15论文答辩日期2014.5.

2、21学位授予单位和日期电子科技大学2014年6月29日答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。 RESEARCHANDIMPLEMENTATIONOFGENERALIZEDINVERSEALGORITHMWITHHETEROGENEOUSCOMPUTINGAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:Author:CommunicationandInformationSystemFanXingshanAdv

3、isor:Prof.GuangjunLiSchool:CommunicationandInformationEngineering 独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。作者签名:日期:年月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文

4、的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:导师签名:日期:年月日 摘要摘要广义逆矩阵理论不仅是许多数学分支的基本工具,更是在经济学、信息处理、自动控制、通信学、密码学和统计学等应用学科中都有着广泛的应用。因此,提升广义逆矩阵的计算性能有着非常大的实用价值,然而传统的CPU串行计算对此却无能为力。近年来,以OpenCL计算架构

5、为代表的异构计算发展迅速,已广泛应用于多个领域,在图像视频处理、密码学等领域常用来进行运算加速,广义逆矩阵也可以通过OpenCL这种异构计算方式提升其计算性能。本文以异构计算为背景,以OpenCL为编程架构,实现广义逆矩阵的运算加速。本文首先对OpenCL规范作了简短介绍;基于GPU和FPGA的硬件架构,分别分析它们的OpenCL实现机制;由于GPU和FPGA在硬件架构与实现机制上是完全不一样的,它们的性能优化技术也迥然不同,因而分别对它们的优化技术进行分析。本文以运算所需的加法和乘法次数为指标,对三种常用的广义逆矩阵算法的计算复杂度进行分

6、析,解方程法的计算量要略高于其他两种算法。然而通过基于异构计算的实现复杂度分析,在最小任务数、控制流、运算资源等关键指标上,解方程法要明显好于另外两种算法。综合计算复杂度和实现复杂度的分析结果,解方程法能获得更好的异构计算性能。因此本文以解方程法为基础设计一套基于异构计算的实现方案,在最优的并行度基础上,对方案中的多个模块进行并行化处理,并设计相应的同步点以保证数据的一致性。依据OpenCL的运行机制,分别对存储访问部分和数据处理部分进行深入优化,以提高算法的运算性能,并用MATLAB对该方案进行验证。本文分别在GPU和FPGA上实现该方案

7、,并针对它们各自的架构特点,制定不同的优化策略和测试方案。测试结果表明:在计算误差方面,GPU由于其内部的浮点运算单位精度较高,其最大误差低至10-7级;而FPGA由于其内部的乘法级。与MATLAB标准函数器位宽仅为18位,其误差相对较大,最大误差在10-3运行时间相比,GPU平台凭借其成熟的开发理论和巨量的计算资源,加速比达到了1909;FPGA平台由于其开发理论不成熟,只获得34的加速比,但还有着巨大的提升空间。关键词:矩阵广义逆,异构计算,OpenCL,GPU,FPGAI ABSTRACTABSTRACTItisthegeneral

8、picturethatthegeneralizedinverseisafundamentaltoolinthefieldsofmathematics.Alsoitcanbewid

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。