ARM Cortex-A 移动处理器发展概览.doc

ARM Cortex-A 移动处理器发展概览.doc

ID:27462542

大小:579.00 KB

页数:7页

时间:2018-12-04

ARM Cortex-A 移动处理器发展概览.doc_第1页
ARM Cortex-A 移动处理器发展概览.doc_第2页
ARM Cortex-A 移动处理器发展概览.doc_第3页
ARM Cortex-A 移动处理器发展概览.doc_第4页
ARM Cortex-A 移动处理器发展概览.doc_第5页
资源描述:

《ARM Cortex-A 移动处理器发展概览.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、ARMCortex-A移动处理器发展概览    简介  ARMCortex-A移动应用处理器产品线横跨了几代产品和三个主要产品类别。有些开发人员和SoC设计人员经历了一款或多款新型ARM处理器的推出过程,他们知道该产品线如何从单个高性能通用CPU设计演进成为三个不同产品线,分别面向高端、中端、入门级的移动设备SoC市场,这让他们受益匪浅。    Cortex-A8  ARM在2005年向市场推出Cortex-A8处理器,是第一款支持armv7-a架构的处理器。ARMv7包括3个关键要素:NEON单指令多数据(

2、SIMD)单元、ARMtrustZone安全扩展、以及thumb2指令集,通过16位和32位混合长度指令以减小代码长度。Cortex-A8是ARM实现的第一个基于新ISA的超标量处理器:它实现了完全双发射流水线,这意味着cortex-a8能够同时发出在指令流中先后出现的任何两个没有数据依赖的指令。但是,它不能乱序来发射或撤销指令–该功能在之后的设计中才被实现。    当我们推出Cortex-A8时,很多合作伙伴认为这款处理器放在移动电话上是大材小用,他们很自然地质疑道,“客户会在手机上浏览互联网?不太可能吧。

3、”但是,我们和业界一些主要思想领袖合作,向客户将会需要的产品迈进,尤其是因为当Cortex-A8在2008年投入批量生产时,高带宽无线连接(3G)已经问世,大屏幕也用于移动设备。创新的移动行业充分利用了该产品:Cortex-A8芯片的推出正好赶上了智能手机出货量猛增的大好时机。    Cortex-A9  推出Cortex-A8之后不久,ARM又推出了首款多核ARMv7CPU:cortex-a9。Cortex-A9利用硬件模块来管理CPU集群中一至四个核心之间的高速缓存一致性,加入了一个外部二级高速缓存。理论

4、上,客户可以设计不包括二级缓存的小型版本Cortex-A9,这种设计允许剔除管理高速缓存一致性的逻辑模块,以实现尺寸更小的单核设计。但实际上,大多数设计都采用双核个或更多核心并附带二级高速缓存。此外,在2011年底和2012年初,当移动SoC设计人员可以采用多个核心之后,提高性能的突破点从提高单核性能转移到提高核的数量。旗舰级高端移动CPU迅速从最初的双核拓扑结构移至四核Cortex-A9。    除了开启了多核性能大门之外,与Cortex-A8相比,每个Cortex-A9处理器的单时钟周期指令吞吐量提高了大

5、约25%。这个性能的提升是在保持相似功耗和芯片面积的前提下,通过缩短流水线并乱序执行以及在流水线早期阶段集成neonSIMD和浮点功能而实现的。    Cortex-A15  随着智能手机市场开始加速发展,ARM再次预见到了不断发展的移动系统对芯片性能提出的更高要求。为此ARM开发了一款性能上大幅提升的处理器,用以专门针对新的高端移动市场。在已经非常强大的Cortex-A9的基础上,ARM凭借cortex-a15又将性能提高了50%以上。此外,Cortex-A15引入了一系列架构扩展,从而实现了更大物理地址空

6、间、硬件虚拟化支持和扩展一致性。在32位系统中内存被划分为2GB设备内存和2GB普通内存,当设备的RAM超出2GB的时候,拥有更大的物理地址空间就变得异常重要。ARM和其他合作伙伴也一直在探索虚拟化技术在商务移动系统和自带设备中的用户操作系统以及类似应用情景进行探索。。扩展一致性在big.LITTLE处理器技术中被应用的淋漓尽致,它提供了一种降低平均功耗并在功耗受限的条件下优化达到最大性能的方法。    Cortex-A15集群集成了监听控制单元(SCU)以实现硬件一致性,每个集群包含一至四个CPU核心,并集

7、成二级高速缓存控制器–Cortex-A15之后的所有ARMCortex-A系列CPU都沿用了这种拓扑结构。    在移动设备中不断突破性能极限    比较Cortex-A系列高端处理器的性能,可以看到自从Cortex-A81GH处理器在2008年上市以来,性能有了大幅提升。  一致性扩展机制,实现为AMBAACE,使下图所示的big.littleSoC成为可能。在big.LITTLE系统中,通常实现一个“大”CPU集群,并对其进行调节以满足高性能的要求,同时对“小”的CPU集群进行调节,满足对高能效。在典型工

8、作负载中,LITTLE处理器可以处理绝大部分工作,而“big”CPU集群的激活时间不足10%,在很多情况下还达不到总CPU运行时间的1%。通过CoreLinkCCI-400高速缓存一致性互连组件,CPU集群能够监听其他集群的高速缓存,从而实现软件线程从一个集群到另一集群的快速转移。    Cortex-A12  随着智能手机市场的爆炸式增长,SoC供应商和OEM将该市场划分为旗舰高端级别、中端级别、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。