计算机系统结构 第7章 并行处理技术与SIMD阵列机

计算机系统结构 第7章 并行处理技术与SIMD阵列机

ID:40343796

大小:6.94 MB

页数:88页

时间:2019-07-31

计算机系统结构 第7章 并行处理技术与SIMD阵列机_第1页
计算机系统结构 第7章 并行处理技术与SIMD阵列机_第2页
计算机系统结构 第7章 并行处理技术与SIMD阵列机_第3页
计算机系统结构 第7章 并行处理技术与SIMD阵列机_第4页
计算机系统结构 第7章 并行处理技术与SIMD阵列机_第5页
资源描述:

《计算机系统结构 第7章 并行处理技术与SIMD阵列机》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第7章并行处理技术与 阵列机原理内容提要:本章首先介绍并行处理技术的基本概念、性能及并行性开发策略,然后讲述SIMD阵列机的基本组成原理、类型、特点、常用算法和几种常见SIMD阵列机的结构。重点是SIMD阵列机的基本组成原理、常用算法和结构;难点是阵列机的基本组成原理、常用算法和脉动阵列机的工作原理。7.1并行处理技术7.2SIMD阵列机7.3脉动阵列机第7章并行处理技术与 阵列机原理7.1并行处理技术7.1.1并行处理的基本概念7.1.2并行性的开发途径7.1.1并行处理的基本概念1.并行性的基本概念并行性(Parallelism)也称为同时性或并发性,是指在数值计算、数据处理、信息处理或

2、人工智能求解的过程中存在许多可以同时处理的部分,提交给计算机,同时进行处理。例如存储器猝发存取方式,就是对多个字节(或者字)同时写入或者读出;又如超标量流水线就是让多条指令同时执行。广义地讲,并行性还可以理解为多个程序同时执行。例如,操作系统中的多道程序处理,用户屏幕操作时的后台处理等。这些都可以认为是多个程序在并行执行。2.并行性的表示方法并行处理着重开发计算过程中存在的并发事件,使之并行处理。处理时,一次处理事件的大小或者规模不尽相同,常用粒度(Granularity)来表示。所谓粒度,是衡量软件进程中所含计算量的大小,常用程序段中指令数来表示。但在实际应用中,而是假设一个并行处理系统中

3、有P个处理器,同时执行某一任务,用Tw表示所有处理器进行计算时所用时间的总和,Tc表示所有处理器通信时间的总和,若用G表示并行处理中的粒度,则:G=TwTc(7.1)Tw=∑twiPi=1Tc=∑tciPi=1式中:式中显示Tc增大时,G减小。相反,当粒度较粗时,各处理器之间的通信量减小。3.并行性的等级并行处理中的粒度可分为五个等级,即作业级、任务级、例行程序或子程序级、循环和迭代级及语句和指令级,如图7.1所示。通常,并行处理就是在这些层次的任何一级或多级上开发并行性。层次越高,并行处理的粒度也就越大;相反,层次越低,并行处理的粒度也就越小。一般而言,粗粒度的并行开发主要采用MIMD方式

4、;细粒度的并行性开发主要采用SIMD方式。并行处理技术是从单处理机的并行处理逐步发展而来,包括采用多功能部件、使CPU与I/O重叠操作、流水线方式、多道程序技术以及分时等。7.1.2并行性的开发途径在一个计算机系统中,开发并行性的途径有多种,大体上可归纳为以下三种。1.时间重叠时间重叠(Timeinterleaving)是在并行性概念中引入时间因素,使多个处理过程在时间上相互错开,轮流重叠使用同一套硬件设备的各个部分,以加快程序的执行过程。细粒度流水线就是这种并行性的典型代表。2.资源重复资源重复(Resourcereplication)是在并行性概念中引入空间因素,即重复设置硬件设备来提供

5、并行操作的途径和系统可靠性。例如后面所要介绍的使用n个完全相同的处理器构成的SIMD阵列机就是具体的例子。另外,人们常说的热备份和多机容错技术也是重复使用某些资源,组成冗余部件,以提高系统的可靠性。3.资源共享资源共享(Resourcesharing)是用软件的办法让多个任务按一定的时间顺序轮流使用同一套资源,以提高利用率。例如操作系统中的多道程序和分时系统就是利用软件的方法使多个用户或程序共享CPU、主存储器和外部设备等硬件资源。并行性的开发可分为粗粒度和细粒度两种。粗粒度并行性开发主要采用的是软件方法。比如在作业(或程序)级,通过对并行算法的分析来确定可以并行操作的作业(或程序);在任务

6、级,是通过软件对任务进行分解,将其中的子任务,乃至子任务中的例行程序、子程序及可以并行操作的循环找出来,分配给不同的处理器并行处理。开发细粒度的并行性主要涉及到指令级及指令的内部操作,因而与处理器的外特性和内特性紧密相关,因此主要采用硬件的方法来实现。随着RISC技术的发展,超级标量机、超长指令字、超级流水线等技术成为这一方向的发展趋势。7.2SIMD阵列机7.2.1SIMD阵列机的基本结构7.2.2阵列机并行算法7.2.3SIMD阵列机的特点7.2.4并行存储器无冲突访问7.2.5典型SIMD阵列机举例7.2.1SIMD阵列机的基本结构SIMD阵列机通常是由一个主机(也称为控制器CU)、n

7、个处理单元PE、m个存储器模块和一个互连网络IN组成。系统工作时,由主机CU将指令广播到各个处理单元PE,其中活跃的处理单元将以同步方式执行这一指令。从形式上看,是一种单指令流的方式。各处理单元从各自的存储器模块中读取所需要的数据,即多数据流的方式。互连网络IN用来将各个处理单元PE及与存储器模块连接起来。IN有时也称为对准(Alignment)或排列(Permutation)网络。在SIMD阵列机中,根据存

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。