GPU加速技术在图论算法中的应用探讨.doc

GPU加速技术在图论算法中的应用探讨.doc

ID:59442973

大小:52.00 KB

页数:5页

时间:2020-05-24

GPU加速技术在图论算法中的应用探讨.doc_第1页
GPU加速技术在图论算法中的应用探讨.doc_第2页
GPU加速技术在图论算法中的应用探讨.doc_第3页
GPU加速技术在图论算法中的应用探讨.doc_第4页
GPU加速技术在图论算法中的应用探讨.doc_第5页
资源描述:

《GPU加速技术在图论算法中的应用探讨.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、GPU加速技术在图论算法中的应用探讨【摘要】对于图数据来说,其是当前很多学科的基础理论,特别是对于数学和计算机学科,如何实现图算法的计算效率是最主要的研究内容之一,伴随着算法的成熟,传统的图算法己经无法满足发展需要,为此,人们逐渐开始进行并行图算法的研究。但由于传统的CPU对数据处理受到限制,研究人员逐渐引进了新型的GPU运算处理器,其具有运算核心数量多和能力强等优点,随着对GPU研究的增多,GPU领域的图算法发展也得到了有效的提高。本文对当前的GPU加速技术在图论算法中的应用进行了简单的介绍。【关键词】CUDA强连通分量最小生成树最短路径随着信息时

2、代的发展,数据总量也在逐渐增加,这使得人们对高性能的计算能力迫切需要,像基因序列的分析以及天气预报等,但传统的CPU单核计算己经无法满足人们工作的需要,为此,开发多核计算工具和并行算法是当前信息技术发展的重要需求。这种情况下,图算法作为图论的核心内容,逐渐被人们关注,其能够通过海量的图结构数据进行有效的分析,但由于其算法的不规则访存特性使其设计难度不断增加。为此,本文对如何实现图算法的加速进行了简单的介绍,通过GPU加速技术的应用能够使图算法的应用成为现实。一、GPU同传统并行计算架构的区别1.1同多核CPU的区别研究对于CPU,其应用目的对其体系是

3、一种严重的限制,在CPU芯片上,大部分的电路都是用作逻辑控制或者缓存,这导致计算单元的晶体管数量非常少。通过大量的研究可以发现,对于GPU来说,其在应用的过程中,并行指令的数量非常少,但CPU却大部分采用的是长指令字等指令级的并行技术,这种技术使其架构和GPU之间存在着本质上的区别。此外,设计目的也存在着较大的差别,对于CPU,其主要是实现ALU指令的获取和执行,因此,逻辑控制电路等数量较大,但对于GPU来说,其主要是为了提高自身的计算能力,其更加注重的是对数据的吞吐效率,因此,对于逻辑控制设计相对较为简单。1.2同分布式集群的区别对于GPU和集群之

4、间的区别,其主要分为两个方面:首先是在计算方式上,对于集群,其采用的是主从模式,这种计算方式采用的是分割计算,通过Slave的计算和Master的集合和处理功能对数据进行计算。对于GPU来说,其通用计算和集群的模式相似,但GPU是Slave。然后是通信方式之间的区别,对于集群,其通信主要是通过局域网或者互联网等,这种算法在计算时需要对传输的细节进行重点的考虑,防止设计方面出现传输限制。而对于GPU芯片而言,其采用的是PCI-E接口进行数据等的传输,因此,其仅仅需要考虑的是如何对计算内容进行分配以及哪一部分的CPU具有什么样的特性等。二、GPU加速计算

5、有向图的强连通分量对于有向图的强连通分量计算,其是图论中一个非常基本性的问题,像对复杂产品设计中的耦合任务集进行识别等。若将设计过程中所涉及到的各个人物看做是图的顶点,然后通过不同任务之间的关系能够建立一个有向图,而其中的耦合任务集的识别就变为了对途中的强连通分量进行寻找。在GPU加技术应用之后,设计了一个FB算法,其能够对非平凡图的强连通分量进行计算。2.1FB算法对于FB算法,其在计算过程中不是依靠DFS为子的一种算法,而是通过分配模式将不同的子问题分配到各个单元中对其进行处理,而对于每个子问题,其都是通过顶点的可达性来进行分析,因此,FB算法具

6、有较强的并行化能力。对于FB算法,其需要对下面两个引理进行重点的观察:给定有向图G=(V,E),v?V,那么对于任何不包含v的强连通分量,其一定是FWD(G,V)BWD(G,v)和Rem(G,v)三个和集中的一个。通过这两个理论可以得知,对于FB算法,其具体的计算过程是:首先选择一个顶点,然后对其前闭包和后闭包进行计算,两个集合之间的交集就是强连通分量值。然后通过剩余的顶点对原图进行3个子集的划分,并通过迭代计算对三个子图进行重复性的上述计算过程,这样就能够实现子图的并行处理计算。2.2基于CUDA的FB算法首先是GPU中的图存储,对于当前的图算法,

7、其采用的都是邻接表或者邻接矩阵,对于G=(V,E),其采用邻接表来对其进行表示,定义数组Adj代表

8、V

9、,其包含了满足(v,u)EE的全部顶点,然后通过

10、V

11、X

12、V

13、来对矩阵进行表示,通过邻接表对无向图进行表示时,其大小为2

14、E

15、,而有向图的表达则是

16、E

17、。而采用邻接矩阵进行表示时,其空间需求都是0(V2)o而在通过GPU技术进行图数据的存储时,需要对下面几点内容进行考虑:首先,同现代的传统CPU主机系统相比,GPU的系统内存相对较小,然后是CUDA的模型,其采用的是一种CPU-GPU的异构模型,这种模型在进行数据的传输时同传统的计算机不同,最后则是

18、对于CUDA的存储系统,其内存和主存两者之间选择不同的地址空间,因此,在进行指针数据的操作时较为困难,且设备

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。