2019年-CELL的体系结构 PowerPoint Presentationppt课件.ppt

2019年-CELL的体系结构 PowerPoint Presentationppt课件.ppt

ID:59452723

大小:240.00 KB

页数:35页

时间:2020-09-17

2019年-CELL的体系结构  PowerPoint Presentationppt课件.ppt_第1页
2019年-CELL的体系结构  PowerPoint Presentationppt课件.ppt_第2页
2019年-CELL的体系结构  PowerPoint Presentationppt课件.ppt_第3页
2019年-CELL的体系结构  PowerPoint Presentationppt课件.ppt_第4页
2019年-CELL的体系结构  PowerPoint Presentationppt课件.ppt_第5页
资源描述:

《2019年-CELL的体系结构 PowerPoint Presentationppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、CELL体系结构033289孙若曦033293刘侃引言Sony,Toshiba和IBM(简称为STI联盟)为PlayStation3设计的"Cell处理器"承诺未来的计算能力将迅速达到极低的价格。后文中包含了Cell体系结构,及其深远的影响,这些影响并不仅仅局限于游戏市场,它将遍布整个计算机工业界。CELL组成CELL内部那么究竟Cell体系结构是怎样的呢?Cell是一个高性能分布式计算体系结构。它由硬件和软件Cell构成,软件Cell包括数据和程序(称为apulets),它们被送往硬件Cell进行计算并返回结果。硬件CELL一个Cell

2、处理器包含三个主要组成部分。以一个Power处理器单元作为主控处理器(PPE),另外两部分分别是八个单指令多数据流处理器(SPE)与一个可编程DMA控制器(DMAC)。处理器单元(PPE)PPE是一个64位的“Power体系结构”处理器。Power体系结构是IBM一段时间内同时用于描述PowerPC和Power处理器的名词。如果PPE基于Power设计,那么不能期望很高的主频,Power核心功耗巨大,因此需要降低主频以降低功耗。PPE实际上不过是控制器,真正的运算在SPE上。附属处理单元(SPE)每一个Cell芯片包含8个SPE。SPE都

3、有各自独立的向量处理单元。包含128个128位寄存器,达到32GFlops的流水浮点单元。SPE同时包含一个256KB的本地存储器而不是Cache结构。附属处理单元(SPE)SPE并不是协处理器,他们完全是独立的处理器。PPE使用软件Cell建立SPE环境,并驱使他们开始运算。SPE执行软件Cell中的apulet直到完成或者被通知停止。PPE通过远程过程调用RPC唤醒SPE,RPC并非直接送到SPE,而是通过执行所有存储器读写的DMAC来完成的。附属处理单元(SPE)SPE是向量(Vector或者SIMD)处理器,可以在一条指令中同时完

4、成多个操作。每个SPE每周期可以完成4个32位操作(如果算上乘加操作则是8个)。运行的程序必须被向量化,在很多诸如视频,音频,3D图形和科学计算这样的应用领域这是可行的。附属处理单元(SPE)非直接的Cache和虚存使得SPE的工作方式与传统处理器不同。这很可能让SPE上的编程变得很困难,但这样的设计是为了降低复杂度并提高性能。SPE本地存储为了解决Cache设计带来的复杂性并提高性能,Cell设计师选择了一条独一无二的激进道路。他们在Cell中使用了一系列的本地存储器,每个SPE一份,总共有8个本地存储器。SPE通过寄存器操作来读写本地

5、存储器。本地存储器以1024b的块来访问主存,但是SPE并不能直接访问主存。不使用Cache工作模式,设计师可以剔除很多复杂设计。本地存储器只能由单一的SPE访问,并没有任何与SPE或者本地存储器直接相连的一致性访问机制。一致性Coherency虽然在SPE之间不存在一致性机制,但是有一种给RAM中某些额外数据在本地存储中加入额外"busy"的机制,以避免两个SPE同时访问相同存储器时产生问题。由于仅仅标记数据是否可读取以及哪一个SPE试图获取数据,这个系统是比保持Cache与最新内容一致简单得多的实现。直接存取控制器DMACDMAC是C

6、ell中非常重要的部分,它充当着通讯集线器hub的功能。PPE并没有直接将指令发往SPE但是会将他们发往DMAC并由后者选择合适的动作,这在载入和保存数据时显得特别重要,同时取消了PPE和SPE直接相连的必要性。显然DMAC是Cell设计中最重要的部分之一,虽然其本身并不做任何处理,但是必须满足任意两点之间数十GB/s访存数据流。如果预测正确的话,PS3将具有100GB/s的存储接口,如果均分倒4个Cell上,每个DMAC将需要每秒处理至少25GB。它同时要实现存储保护,能够保证PPE和SPE之间访存和通讯的顺序,除了高速而外它还是高度复

7、杂的工程部件。直接存取控制器DMACCell处理器内部硬实时处理某些流处理需要严格的时间并且"硬"实时数据处理器的设计也已经在考虑中。一个"绝对时钟"被用于保证一个处理操作在说明的时间限制内完成。这个实用的功能同时保证与下一代Cell兼容,因为定时器本身是和处理部分独立的。存储器与其他处理器一样Cell体系结构中的存储系统也是针对rawspeed设计的,它将同时具有低延时和高带宽。前面提到过访存以1024位的块为单位。存储保护在DMAC中有存储系统的保护措施。Memory被分成沙盒"sandboxes",用一个掩码来判定那一个或者一组SP

8、E可以对其进行访问。这个检查过程是访问执行之前在DMAC中进行的。如果用一个SPE试图读写错误沙盒,存储访问将会被禁止。Cells和常用处理器的一大区别就是在Cell中SPE链接起来以流处理器

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。