一乐电子

一乐电子百科

 找回密码
 请使用微信账号登录和注册会员

QQ登录

只需一步,快速开始

快捷登录

手机号码,快捷登录

搜索
查看: 3235|回复: 3
收起左侧

ARM Cortex-A72处理器详情

[复制链接]
发表于 2017-4-15 14:51 | 显示全部楼层 |阅读模式
ARM虽然是家小公司,但他们是整个ARM处理器阵营的核心,除了苹果、高通等极少数可以自己开发ARM兼容架构的公司之外,联发科、海思等大多数公司都会直接使用ARM的公版Cortex-A架构授权。64位时代以来,ARM已经发布了Cortex-A57/A53一大一小两种架构,但只有A53遍地开花,高性能的A57核心在手机市场只有三星、高通在用,面临着难产的尴尬。为此,ARM公司今年2月份推出了A57的继任者——Cortex-A72架构,号称性能是A15的3.5倍,功耗则降低了75%。
A72_Car_678x452.png
当时我们对ARM的Cortex-A72核心了解并不多,只知道A72核心会使用新一代的FinFET工艺生产,包括三星/Globalfoundries的14nm及TSMC的16nm,得益于先进的工艺,A72核心频率更高,可以达到2.5GHz,更高的频率有助于A72增强服务器市场的存在感,这也是它的目标市场之一。
ARM日前公布了Coretx-A72核心的详细架构,Anandtech网站也做了一番解析,我们来看下A72架构到底有哪些改进,毕竟A72核心很可能成为明年的旗舰手机/平板的标配。
值得一提的是,原先首先解释了A72核心的命名由来,为什么不选择Cortex-A59这样的命名呢?ARM解释说这纯粹是方便市场宣传而已,如果跟A57的命名很相近,那么大家就不容易看出这两种核心之间的区别(大家都只会看数字辩好坏吗?)。
2b_575px.png   I0 d$ X$ I) z& X6 A  v
A72核心的性能达到了A15的3.5倍
3b_575px.png
7 `. l' K6 d2 d- J功耗降低了75%
ARM之前宣传A72核心性能是前代的3.5倍,功耗降低了75%,但大家也得清楚这只是宣传而已,ARM并没有直接对比A57与A72的差别,如果只看这两者,A72核心在同样的14/16nm工艺下只比A57提升了34%(2.6x到3.5x,还得考虑到频率上的差异),而在同样的28nm工艺下,其功耗也不过减少了20%左右。
还要注意到,A72核心可以运行在更高的频率下,这不是简单地最高频率,此前A57由于太强,因此它只能在最高频率下维持很短时间就要降频,而ARM提供的数据表明,A72核心在16nm FinFET工艺下,2.5GHz频率运行时功耗只有750mW。
13b_575px.png
除了功耗之外,ARM还在A72架构上做了很多优化,如上图所示,整数、浮点、内存等性能皆有不同程度的提升,虽然还缺少一些细节,不过IPC性能上提升16-30%还是有的。
由A57升级而来的A72架构
ARM似乎在性能、功耗及核心面积这三个方面都做了全面的改善,这也是半导体设计的三个重要指标。这个成绩是ARM重新优化了几乎所有A57逻辑区块之后才得来的,其中CPU架构做了相当大的改进,包括新的分支预测单元,改善了解码器管线设计等。
6b_575px.png
在指令预取这一块,我们可以看到ARM重新设计了分支预测单元,它可以支持更复杂的算法,提高了性能、降低了功耗以、误预测率及投机(speculation),具体来说就是相比A57降低了50%的误预测,25%的投机率。多余的分支预测单元则被禁止了。——实际工作中,如果分支预测单元不能有效工作,那就会被绕过去。
此外,通过更好地耦合不同的IP模块,ARM还优化了RAM组织。
7b_575px.png
8b_575px.png
再来看A72的管线设计,解码/重命名性能也提升了。解码器自身是3指令发射的解码器,但ARM在提升性能。降低功耗方面花了很大精力。为了提高要性能,提升了有效的解码带宽,而解码器也获得了一些AArch64指令融合增强。此外,功耗也通过多种方法降低了,包括直接的解码等。
看起来指令分派/收回(Dispatch/retire)单元是提升性能而做的改进中变化最大的。解码器可以融合指令,ARM的指令分派单元可以将ops操作打乱成更小的微操作(micro-ops)输送给执行单元,这样可以在指令派发单元将3发射变成等效5发射。这将提高解码器的吞吐量,同时也提高了每个周期内指令派发单元创建的微操作数。
A72架构,ARM表示平均每个指令有1.08个微操作,这将缓解57架构中实际受限的指令派发单元的性能。
9b_575px.png
spec.png
另一方面执行单元也有新的设计,包括新一代的FP浮点/高级SIMD单元,由于FP浮点管线从9降低到了6,因此延迟更低。FMUL(浮点乘法)的延迟也从5周期降低了3周期,FADD(浮点加法)从4降到3,FMAC(浮点累积乘)从9降低到6,CVT单元从4降到2。FP浮点单元的渲染管线长度从19降低到了16。
整数单元也做了改进,Radix-16除法器的带宽加倍,CRC单元延迟降低到了1周期,相比A57架构其带宽达到了3倍。
10b_575px.png
另一个重大的性能改进是L/S(Load/Store)单元,ARM表示L/S单元的带宽提升了30%,这是因为引入了新的预取器。
A72架构纸面上的改进让人印象深刻,它是A57架构的革新升级,不论是性能还是功耗,或者核心面积,A72都有改进。A57架构是去年Q3季度进入市场的,但现在才有三星、高通的A57架构处理器量产上市,所以A72核心真正进入市场还需要至少1年时间。
5b_575px.png

0 x+ k" V8 g3 k! `
 楼主| 发表于 2017-4-15 15:02 | 显示全部楼层
ARM Cortex-A72要给英特尔放血 真的崛起还是PPT强国?
4 _5 v) Y/ W7 s3 p: q

不用我们介绍,你用脚趾头都想得到,这几年半导体领域发展得最快的就是手机里头的处理器。作为移动SoC领域的寡头,ARM拼了老命提升移动处理器性能,最终目的只有一个——跟以英特尔为代表的x86桌面处理器阵营决一死战。

98ffab9c804e102d_thumb.jpg

ARM今天公布了旗下最新、最强的Cortex-A72移动处理器路线图,新架构预计在2016年发布,它也是ARM酝酿已久的第二代ARMv8 64位架构,据说其性能、功耗相比现有Cortex-A57都有极大改善。ARM在路线图中甚至指出,用上最新16nm半导体工艺这颗春药后,频率提升的Cortex-A72性能上足以媲美英特尔低频的Core M移动处理器。ARM这次是真的崛起了,还是玩PPT强国?来看干货:

dde7095dbac0453c_thumb.png

首先是基础架构,Cortex-A72强调的不再是堆执行单元数量,而是全面增强。从指令拾取开始,到仲裁机构、分支预测,乃至缓存和Load/Store单元,Cortex-A72的各个部件都被大大增强,提升最多的是内存子系统,幅度达50%。ARM表示,在同频率下,Cortex-A72单个周期指令吞吐能力比Cortex-A52提升20%-60%;而如果是相同性能,则电力消费可以减少40%-60%。另外,Cortex-A72同样可以和Cortex-A53搭配,组成big.little大小核结构。

617f107f9be065d8_thumb.png

然后是功耗对比,同样适用28nm工艺制造,Cortex-A72的功耗比Cortex-A15降低50%,如果使用16nm工艺制造,功耗降低75%。

fdbce386ebcb9d45_thumb.png

16514fe450c5c6c4_thumb.png

接下来是性能预测,相比28nm工艺制造、运行在1.6GHz的Cortex-A15架构,采用14/16nm工艺打造,运行在2.5GHz的Cortex-A72处理器能提供3.5倍的性能。

9648e69d73e67e95_thumb.png

重头戏来了,ARM搬出了英特尔14纳米的Core M 5Y10C处理器,结果除了单线程性能小输,多线程下Cortex-A72完胜!领先幅度可达1.6倍。而Cortex-A72的内存性能也快过Core M。ARM还强调,这种情况下Cortex-A72处理器的功耗只有1W,而Core M功耗高达4W,AMR再次完胜。

be3da797bd353a51_thumb.png

最后,ARM还黑了一把英特尔的Xeon服务器处理器,据说2.7GHz、20核心20线程的Cortex-A72,在典型的Spec2K6 Rate服务器负载测试中,性能超越了10核20线程的英特尔Xeon-E5 2650 V3,接近更高级的Xeon-E5 2660 V3。而且英特尔两款处理器功耗都有105W,而ARM处理器功耗要低上30W,依然完胜。

5b0eca69374fdef1_thumb.jpg

帮ARM做下总结:Cortex-A72就是好,就是好,就是好(很重要的事情说三遍)。但是——什么事情都怕但是,不要忘记两点:

首先,上面这些测试项目大部分都是与填充率相关的理论性能测试,AMR在上一代Cortex-A57问世时就叫嚣杀英特尔全家,还邀请戴尔、惠普一起发布了好几款采用ARM架构的服务器,结果呢?还不是给英特尔吊起来打。

其次,Cortex-A72如此优良的性能、如此低的功耗,前提是台积电的16nm FF+半导体工艺进度一切正常,这是兑现一切承诺的前提。但台积电给的时间表有多靠谱?我们还是讨论下世界和平吧......


/ c" J7 f$ w4 |) r5 N
: A1 {: R/ ^( L: Z' N" V% J4 M
发表于 2017-4-18 22:20 | 显示全部楼层
秒杀intel全家?好像目前arm最强的U,综合性能也就是人家PIII的水平吧。

本版积分规则

QQ|一淘宝店|手机版|商店|电子DIY套件|一乐电子 ( 粤ICP备09076165号 ) 公安备案粤公网安备 44522102000183号

GMT+8, 2024-4-24 08:06 , Processed in 0.053700 second(s), 28 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表