轻松读懂“应用处理器”微架构 2013 版01-09

轻松读懂“应用处理器”微架构 2013 版01-09

ID:10900271

大小:328.00 KB

页数:21页

时间:2018-07-08

轻松读懂“应用处理器”微架构 2013 版01-09_第1页
轻松读懂“应用处理器”微架构 2013 版01-09_第2页
轻松读懂“应用处理器”微架构 2013 版01-09_第3页
轻松读懂“应用处理器”微架构 2013 版01-09_第4页
轻松读懂“应用处理器”微架构 2013 版01-09_第5页
资源描述:

《轻松读懂“应用处理器”微架构 2013 版01-09》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、轻松读懂“应用处理器”微架构2013版第1页:什么是应用处理器?对不起,你被标题欺骗了,实际上对许多读者来说要读懂本文并不是那么轻松:p随着半导体工艺的日趋先进,智能手机(Smartphone或者Superphone)、平板电脑(Tablet或者Pad)已经成为许多网友最常使用、最多关注、更新最快的电子消费产品,高度便携性是这类产品的最关键成功原因。所谓便携性自然是指产品必须足够轻便而且需要有足够的续航能力,因此这就要求产品的原件必须足够省电,只有这样才能减少散热和电池体积这两个最占体积和重量的问题

2、。要达到这个目标,肯定要做功能和性能上的妥协,至少相对个头更大的笔记本电脑、台式机而言,像降低吞吐率或者增加时延,从实测性能而言,目前智能手机或者平板电脑的CPU、图形处理器性能基本上相当于6到10年前台式电脑的水准。举个简单的例子,在俄罗斯网站ixbt的讨论区上,有这样的一条帖子,一位名为ssvb的网友采用origenboard.org的一片SamsungExynos4210开发板(配有Exynos4210处理器具备两个ARMCortex-A9处理器内核)跑出来的HighPerformanceLi

3、npack(HPL)性能是1.307GFLOPS,同贴中还有IntelAtomN450(Pineview架构,45nm,单核)1.66GHz的测试结果——0.944GFLOPS以及Cortex-A151.7GHz双核HPL为4.3GFLOPS。NVIDIA官网上的一份SC011文件也表明Tegra2(ARMCortex-A9双核1GHz,理论双精度浮点性能2GFLOPS)的HPL性能为1.15GFLOPS(57%效率,200MFLOPS/瓦)。这都是一个什么概念?我曾经在06年的时候用Pentium

4、D8202.8GHz跑出来的HPL性能为10.12GFLOPS,Athlon64X22.6GHz为9.158GFLOPS。那么现在台式机的HPL性能状况如何?在去年我用Corei72600K3.4GHz配合未支持AVX指令的GotoBLAS(数学库)上得到的HPL性能为51.18GFLOPS左右,后来又用支持AVX的OpenBLAS(原GotoBLAS开发者停止更新后的其中一个后续开源社区版)得出的HPL性能为99.38GFLOPS,到2013年支持AVX2指令集的Haswell架构出来后,这个测试

5、结果应该还能接近再翻番,达到200GFLOPS级别。也许你会说手机、平板要双精度干啥呢?请不要忘记在30年前的x86处理器根本没有集成任何硬件浮点单元,现在的情况又如何?曾经做出号称最强x87协处理器的Cyrix后来一头扎进整数为王的产品策略后现在影都没了。“干啥”这个问题往往是硬件具备并达到一定性能条件后就会有答案的,台式机上的性能测试软件和方案会随着手机、平板性能日益强大而变得在这类设备上运行也理所应当,除了上面说的HPL外,各类PC上流行的测试工具例如SPECCPU20xx、3DMark等也会

6、是如此。传统的CPU性能测试的确不能完全适用于手机、平板的SoC芯片(人们把可以在移动操作系统上跑应用软件的SOC称作应用处理器,简称AP),但是请注意我说这句话是因为SoC并不仅仅有CPU,还有GPU、音视频编解码器、存储控制器、非易失性存储单元、数模/模数转换器以及各种输入输出周边等,这使得我们要单纯评价一款SoC是否最佳的时候可能会感到颇为伤神。话虽如此,不过总的来说,SoC中和性能最密切相关的依然是CPU、GPU,因为智能设备里几乎所有程序的运行都必须依仗两者来执行,与用户的使用感受有直接关

7、系(请注意,我们这里说的只是指SoC芯片中,而非手机或者平板电脑整体)。因此,纵然手机、平板处理器型号各异并且内中千头万绪,我们还是应该从大家最关心的CPU、GPU着手来了解。现在情况简单多了,按照ISA(指令集架构)划分,因为目前的手机、平板CPU无非是ARM、Intel/AMD两大阵营,潜在的还有MIPS,不过目前MIPS似乎在这个领域还成不了气候,更像是一个备胎。 如果你对计算机科学还不是很了解的话,对ISA这个词可能也不会很了解,虽然它经常出现在一些时髦的技术文章中。电脑显然并不能直接明白C

8、、Java、Basic这样的高级语言(虽然有人尝试过开发高级语言处理器,但是无不失败告终),搭建在高级语言和CPU本机代码之间的就是ISA。ISA的全称是instructionsetarchitecture,中文就是指令集架构,有时候直接称呼为架构(architecture),是指程序员实际“可见”的指令集,包含了程序员编写一个能正确运行的二进制机器语言程序的所有信息,涉及到指令、I/O设备等。例如Intel的IA-32、Intel64(曾经名为IA32e、EM64T

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。