行划分的矩阵相乘并行改进及其dsp实现

行划分的矩阵相乘并行改进及其dsp实现

ID:34494822

大小:393.35 KB

页数:5页

时间:2019-03-06

行划分的矩阵相乘并行改进及其dsp实现_第1页
行划分的矩阵相乘并行改进及其dsp实现_第2页
行划分的矩阵相乘并行改进及其dsp实现_第3页
行划分的矩阵相乘并行改进及其dsp实现_第4页
行划分的矩阵相乘并行改进及其dsp实现_第5页
资源描述:

《行划分的矩阵相乘并行改进及其dsp实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、DSP开发与应用中文核心期刊‘微计算机信患>(嵌入式与SOC)2008年第24卷第7-2期曼!苎!l==II鼍!曼!曼曼曼曼量鼍鼍文章编号:1008-0570(2008)07-2-0216-03行划分的矩阵相乘并行改进及其DSP实现TheimprovememntrealizationofmatrixmultiplicationthatbasedonrowspartitionandinDSP准林工学院)张新菊刘羽韩枭ZHANGXin-juLIUYuHANXiao摘要:在阵列信号处理中需要大量的矩阵运算,而其中最基本的就是矩阵相乘运算。本文就矩阵相乘的行划分并行实

2、现进行了改进,将A矩阵的一行和整个B矩阵传输到每个工作进程,其中第一个工作进程指定在某台机器,其余工作进程由PVM选择在合适的机器土产生。该并行实现基于PVM环境,采用主从编程模式。然后给出了改进的行划分矩阵相乘在DSP上实现的方案。关键词:3-作站机群;PVM;并行算法;DSF中图分类号:TP393.09文献标识码.AAbstract:Owingtoneedingagreatdealofmatrixoperationinthearraysis,血processing,butamongthemthemostessentialisthematrixmuhipli

3、cation.Thistextstudiestheimprovementthatbasedonlinepartitionofmatrixmultiplication,deliversonelineofmatrixAandthewholematrixBtoeachprogress,andthefirstworkprogzessisappointedinthecertainmachine,theotherworkpro-gressesareproducedintheappropriatedmachinebyPVM.ThisschemeisbasedonthePVM

4、enviromnentandMaster/Slavemode,thenachievesthematrixmultiplicationofimprovedlinepartitionintheDSP.KeyWords:COW;PVM;PareHelComputing;DSP。1引言并行算法可以根据算法的特点进行算法分解,首先需要分析数据的依存关系和依赖关系,寻找任务的并行性,将多个操作合并成一个任务,然后将整个程序分解为单个任务,同时还可以分析目标的结构通信连接和时序关系,进行并行处理。而工作站机群能充分利用现有的—『=作站资源和局域网,在工作站机群上,对传统的并

5、行数值计算算法进行优化和改进,可以大幅度提高计算的效率,缩短计算的时间。数字信号处理对信号在时域及变换域的特性进行分析、处理,能使我们对信号的特性和本质有更清楚的认识和理解,在阵列信号处理中需要大量的矩阵运算,而其中最基本的就是矩阵乘法运算。本文就矩阵相乘在PVM环境下进行了并行化改进实现,并在数字信号处理器中得以实现。2问题的提出在文献和中介绍了一种矩阵相乘的算法。为了提高矩阵相乘的效率戒何将其进行并行化改进萁中矩阵A采用按行划分,矩阵B整个的传给每个工作进程。而PVM程序采用MastedSlave编程模式。首危主进程产生n个工作进程萁中第—个工作进程指定在

6、某台机器,其余工作进程由PVM选择合适的机器产生。每个王作进程完成矩阵乘积后蒲计算结果返回Master进程。假设矩阵A、B、C均是n阶方阵,其中A被划分为n个n阶的子矩阵,A、B是将进行乘法运算的初始矩阵,C存放运算结果,C在运算前为零矩阵。现在假设有n个处理机P.。(1

7、乘的结果矩阵c。而在矩阵相乘的直接实现中,将A矩阵的一行和B矩阵的一列传送到一台处理机,这样就需要nz台处理机,实现框图和过程如下所示:矩阵的串行实现代码如下:for(i~ntondo州j‘1)tond0t·一0for(k--1)tojdot—t+ai.k地.JrepeatCiJ‘一t在单个DSP中实现需要三个循环强嘱填微杂度为N(o,。cD加】矩阵相乘的直接实现图3矩阵相乘任务分配及并行PVM程序3.I子任务分配策略现在考虑矩阵的分配月题。假设有n个处理机,且在工作站机群上,采用PVM并行编程环境实现矩阵相乘的并行算法,必须将n个处理机对应于n个并行子任务,

8、每个子任务可以独立地进行局部矩阵运算并

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。