ARM Cortex-A55: 从端到云实现高效能-1
- UID
- 1066743
|
ARM Cortex-A55: 从端到云实现高效能-1
你是否已经听说了最近市场上发布了几款新的 CPU?它们的性能非常强大!当然,我说的就是 ARM Cortex-A75 和 ,即首批基于新近发布的 的 系列处理器。本文我们讨论的就是 Cortex-A55:一款对为未来数字世界举足轻重的处理器,原因如下。
系出名门,久经考验
ARM Cortex-A75 和 Cortex-A55 是首批问世的 DynamIQ 处理器。
想要理解 Cortex-A55 的真正潜力,我们来简要回顾一下其上一代产品:。采用这款 CPU 的设备已超过 15亿台,该 CPU 依然是当今业界出货量最高的 64 位 Cortex-A 系列 CPU。Cortex-A53 于 2012 年发布,其独一无二的设计,集性能、低功耗以及尺寸扩展性于一身,具备一系列多用途特性,因而可应用于诸多市场,其中包括高端智能手机、网络基础设施、汽车信息娱乐、高级驾驶员辅助系统 (ADAS)、数字电视、入门级移动设备和消费级设备乃至。
然而自 2012 年以来,我们周围的世界发生了许多变化。我们现在看到的新兴趋势表明,保持互联、万物智能的数字世界具有非常大的发展潜力。从完全自主的自动驾驶汽车到各类设备上的智能应用程序,人工智能 (AI) 和机器学习 (ML) 将真正融入到我们的日常生活中,这一点已成定局。物联网 (IoT) 应用的盛行意味着“物”的爆炸性增长,越来越多的“物”在持续生成数据、消费数据以及与数据进行交互。增强现实、虚拟现实以及混合现实 (AR、VR 以及 MR) 注定会彻底改变我们人类之间以及人机之间的互动方式,将现实世界与数字世界融于一体。
在过去两年里,ARM 的工程师致力于研究 Cortex-A53 的后继产品,以满足这类新兴技术的需求,我们的目标是打造出一款性能、效能以及扩展性均大幅提升的 CPU,而且这款 CPU 还需要具备诸多先进的特性,从而满足从端到云的各种未来应用需求,幸运的是我们做到了。
性能全面提升
Cortex-A55 实现了全面的性能提升
Cortex-A55 采用最新的 ARMv8.2 架构,并在其前代产品的基础上打造而成。它在性能方面突破了极限,同时依旧保持了与 Cortex-A53 相同的功耗水平。我们尽全力改进 Cortex-A53,并赋予其以下特性:
- 在相同的频率与工艺条件下,内存性能最高可达 Cortex-A53 的两倍
- 在相同的频率与工艺条件下,效能比 Cortex-A53 高 15%
- 扩展性比 Cortex-A53 高十倍以上
这些归功于我们专注于 Cortex-A53 现有的设计理念并挑战这些理念。
- 我们对分支预测程序(branch predictor)进行了全面修改,在其算法中融入了神经网络元素来改进预测。此外还新增了零周期分支预测程序(Zero-cycle branch predictor)以便进一步减少流水线中的泡沫。这样可以使指令之间的空闲时间越来越短。
- 我们的设计是,使二级高速缓存对每一颗 CPU 而言都是专用缓存,这样一来与 Cortex-A53 相比,二级高速缓存的存取时间缩短了 50% 以上。我们还将二级高速缓存的工作频率设计成与 CPU 相同的频率。通过降低延迟大幅提升 CPU 在各类基准测试工具中的性能。
- 我们推出了三级高速缓存,可供集群内的所有 Cortex-A55 CPU 共享。这让 DynamIQ 集群能够得益于 CPU 附近增多的内存容量,从而提升性能、降低系统功率。三级高速缓存是 DynamIQ 共享单元 (DSU) 的一部分,DSU 是 中的一个新的功能单元。
- 8 位整数矩阵乘法对神经网络性能的影响超过85%。Cortex-A55 流水线中增添了新的架构指令,使其能够在每个周期执行 16 次 8 位整数运算。这些新的指令还使该 CPU 能够在每个周期执行 8 次 16 位浮点运算、对两条 MAC 指令进行舍入操作,有利于色彩空间转换。
相较,实现效能的大幅提升
在功率和热效率方面继续保持领先
对分支预测程序、NEON 和 FP 单元的上述改进以及内存延迟的缩短仅仅是 Cortex-A55 取得大幅性能提升的部分原因。Cortex-A55 不但实现了大幅性能提升,而且保持了与 Cortex-A53 相类似的功耗。总而言之,Cortex-A55 在节能性方面实现了 15% 的提升。相对于性能而言,功率在产品设计中更加重要。在提供同等性能的情况下,Cortex-A55 消耗的功率比 Cortex-A53 低 30% 之多!
提供持续性能的时间远比当今的 Cortex-A53 解决方案更长。这一点对于 AR、VR 以及 MR 等领域的用户体验而言至关重要,这些领域预计将会在未来移动市场上占据主导地位。这些使用场合已经高度线程化,对延迟有严格的要求。后者指的是移动时间延迟,根据行业研究,这种延迟需要保持在 20 毫秒或以下,这样才不会导致恶心和头晕。虽然当今的 CPU 已经实现了达到 20 毫秒延迟所需的性能水平,但是发热限制意味着这些 CPU 无法长时间维持这样的性能水平。有了 Cortex-A55,我们就能给出未来 VR 设备中延长持续性能时间的解决方案。
高级特性和更高的性能可满足基础设施市场的需求
行业领先的效率让 Cortex-A55 在基础设施市场卓尔不群。以太网供电 (PoE) 无线接入点以及安装在后视镜上的发热受限的汽车解决方案等应用均可利用热效率极高的 Cortex-A55 在特定的发热范围内提供最高性能。在 5G 远程无线电头端 (RRH),Cortex-A55 CPU 还能够在特定功率范围内最大限度增加网络吞吐量。 |
|
|
|
|
|