计算机组成与结构第9章_并行组织与结构ppt课件.ppt

计算机组成与结构第9章_并行组织与结构ppt课件.ppt

ID:59006355

大小:2.48 MB

页数:33页

时间:2020-09-27

计算机组成与结构第9章_并行组织与结构ppt课件.ppt_第1页
计算机组成与结构第9章_并行组织与结构ppt课件.ppt_第2页
计算机组成与结构第9章_并行组织与结构ppt课件.ppt_第3页
计算机组成与结构第9章_并行组织与结构ppt课件.ppt_第4页
计算机组成与结构第9章_并行组织与结构ppt课件.ppt_第5页
资源描述:

《计算机组成与结构第9章_并行组织与结构ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第9章并行组织与结构目录9.1体系结构中的并行性——掌握9.2多线程与超线程处理机——了解9.3多处理机——了解9.4多核处理机——了解9.5多核处理机实例——了解04十月202129.1体系结构中的并行性9.1.1——9.1.4参见第5.6.1节并行处理技术9.1.5并行处理机的体系结构类型指令流和数据流的不同组织方式:单指令流单数据流(SISD)代表机型是单处理机。单指令流多数据流(SIMD)代表机型是向量处理机。多指令流单数据流(MISD)这种结构从未实现过。多指令流多数据流(MIMD)代表机型是多处

2、理机和机群系统。前者为紧耦合系统,后者为松耦合系统。9.1体系结构中的并行性9.1体系结构中的并行性多处理并行机结构9.1体系结构中的并行性9.1.6并行处理机的组织和结构计算机系统可以在不同的层次引入并行机制。超标量处理机和超长指令字处理机:多发射、超标量、超长指令字多处理机和多计算机:多处理机、多计算机、机群多线程处理机多核处理机(片上多处理机)9.2多线程与超线程处理机2002年秋,英特尔公司推出一款采用超线程(HyperThreading,HT)技术的Pentium4处理机,原有的单个物理内核经过简

3、单扩展后被模拟成两个逻辑内核。9.2.1指令级并行与线程级并行超标量处理机的水平浪费与垂直浪费垂直浪费   如:资源冲突会导致不能继续执行新指令水平浪费   如:指令相关导致多条流水线中部分流水线被闲置9.2多线程与超线程处理机硬件线程的概念并行的概念就从指令级并行扩展至线程级并行多线程处理机的具体的实现方法又可分为:细粒度多线程(交错多线程)处理机粗粒度多线程(阻塞多线程)处理机9.2.2同时多线程结构同时多线程(SimultaneousMultithreading,SMT)  结合了超标量技术和细粒度多

4、线程技术的优点,允许在一个时钟周期内,处理机可以执行来自不同线程的多条指令,因而可以同时减少水平浪费和垂直浪费。9.2多线程与超线程处理机9.2.3超线程处理机结构超线程技术是同时多线程技术在其Intel系列处理机产品中的具体实现。  为了支持两个硬件线程同时运行,让每级流水线中的资源通过三种方式之一复用于两个线程:  复制、分区或共享。9.3多处理机多处理机系统由多个独立的处理机组成,每个处理机能够独立执行自己的程序。并行向量处理机(PVP)对称多处理机(SMP)大规模并行处理机(MPP)分布共享存储器多

5、处理机(DSM)9.3多处理机PVPSMPDSMMPP9.3多处理机机群式超级计算机结构9.4多核处理机9.4.1多核处理机的优势——三高三低:高并行性:可同时执行的线程数或任务数是单处理机的数倍。高通信效率:各个处理机核只需要在核内部的相对较小的区域内交换数据。高资源利用率:多核结构可有效支持片内资源共享。低功耗:不再依靠提高主频改善性能。低设计复杂度:每个核的结构相对简单。较低的成本:各个核共享器件芯片封装和芯片I/O资源。9.4多核处理机9.4.2多核处理机的组织结构  同构多核处理机与异构多核处理机

6、:同构多核(homogenousmulti-core)处理机  所有计算内核结构相同,地位对等。异构多核(heterogeneousmulti-core)处理机  各个计算内核结构不同,地位不对等。一般多采用“主处理核+协处理核”的主从架构。9.4多核处理机9.4.2多核处理机的组织结构  多核处理机的对称性:对称(SymmetricMultiProcessing,SMP)多核 处理机片内包含相同结构的核,多个核紧密耦合,并运行一个统一的操作系统。非对称(AsymmetricMulitiProcessing

7、,AMP)多核若是同构多核,但每个核运行一个独立的操作系统或同一操作系统独立实例,就变成非对称多核。AMP多核系统也可采用异构多核和共享存储器构成。9.4多核处理机9.4多核处理机9.4.3多核处理机的关键技术  多核处理机架构:每个核自身的结构 每个核是否应该采用超标量技术或超线程技术多核之间的对等性,核的数目 同构多核,阿姆达尔定律(Amdahl‘slaw) 异构多核,集成图形处理机(GraphicProcessingUnit,GPU)。9.4多核处理机9.4.3多核处理机的关键技术  多核系统存储结构

8、设计:  处理机内核心数目增多,各核心采用共享存储器结构进行信息交互,对主存的访问需求进一步增加。  目前仍然采用存储器分级的方式解决存储速度问题:采用二级甚至三级cache提高等效访问速度片内cache容量尽可能增大共享cache和私有cache9.4多核处理机9.4.3多核处理机的关键技术  多核处理机的cache一致性:  多核cache内容不一致的原因:可写数据的共享I/O活动核间线程迁移cache一致性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。