ARM64移动处理器解惑

论坛元老

Rank: 8 Rank: 8

UID: 1029342
性别: 男

1^#

打印

字体大小: tT

yuyang911220发表于 2015-5-30 21:35 | 只看该作者

ARM64移动处理器解惑

处理器, 寄存器, 大众, 先来

“64位”
我们先来谈谈“64位”这个术语及其含义。大家对于这个术语一直比较困惑，很大一部分原因在于，它没有统一的、约定俗成的定义。然而，在大体上却达成了一些共识，尽管这些共识并未为大众所知。
“××位”CPU通常是指两个部分的宽度：整数寄存器的宽度和指针的宽度。值得庆幸的是，在大多数现代CPU中，它们是一致的。“64位”通常是指CPU有64位整数寄存器和64位指针。除了搞清楚“64位”所指的对象外，明白非“64位”所指的对象也十分重要，这些对象通常包括以下几种。

内存（RAM）地址大小。这一数值（关系到硬件可支持的最大内存）与CPU的位数无关。ARM架构的内存地址通常从26位到40位不等。
数据总线大小。CPU从内存或缓存中获取的数据量也与CPU的位数无关，某些CPU指令可能需要特定大小的数据，但在实际应用中，既可一次获取多条指令，也可多次获取一条指令。上一代iPhone就已经以64位块为单位从内存获取数据了。在PC中，块大小最高可达192位。
与浮点运算相关的参数。FPU寄存器的大小和内部设计是独立的，ARM架构采用64位FPU已颇有段时间了。

“64位”的优点与缺点
尽管64位与硬件可支持的最大内存无关，但便于单一程序使用更大内存。在32位CPU中，单一程序仅有4GB地址空间，减去被操作系统和标准库所占用的部分，只剩1～3GB可用。如果一个32位系统的RAM超过4GB，单一程序很难充分利用全部空间，除非开发者耍些小聪明，例如直接命令操作系统按需求分配内存，或将程序拆分成多个进程。但在实际应用中，很少有程序这么做，因为编程更麻烦，还会有损性能。系统拥有更多内存的好处是，能同时运行多个应用并减少硬盘缓存。这样固然不错，但难免有个别程序需要使用更多内存的情况。
即使对于物理内存较小的系统，更大的地址空间也有帮助。内存映射文件是种有用的结构，在32位系统中，程序不能映射大文件（通常是指超过几百MB的文件），而64位系统的可用地址空间更大，不必有这方面的担心。
不过，增加指针宽度有个严重的缺点：在所有其他条件都相同的情况下，单一程序在64位CPU系统中更占内存。因为指针本身也需要存储于内存中，在64位系统上，这个空间增加了一倍。而大多数程序运用指针很频繁，所以额外占用的空间往往不少。这给缓存带来了压力，从而导致性能降低。
简而言之，“64位”可以提升某些应用的性能，并使内存映射文件这种编程技术更易用。不过，它也会因占用更多内存而降低性能。
ARM64
iPhone 5S的64位CPU是配有更宽寄存器的ARM处理器，与32位ARM架构相比，64位ARM架构包括以下重大变动：首先是名称的变化——它的官方名称为“AArch64”，但这个名字读起来很绕口，敲起来也别扭。苹果称它为ARM64，我也更倾向于用这个名字。
较32位ARM架构而言，ARM64的整数寄存器数量增加了一倍，32位ARM架构有16个整数寄存器，其中1个是专用的程序计数器，还有2个用于堆栈指针和链接，其他13个则作一般用途。而ARM64位架构有32个整数寄存器，包括1个专用的零寄存器，1个链接寄存器和1个帧指针寄存器，还有1个寄存器预留给平台，另外28个则为通用整数寄存器。ARM64上可用浮点寄存器的数量有所增加。32位ARM处理器有32个32位浮点寄存器，还有16个额外的64位寄存器。这些寄存器的结构有些特殊，可被视为等价于16个重叠的128位寄存器。ARM64则将其简化为32个128位寄存器，且没有重叠。
寄存器的数量会对性能会产生巨大影响。与CPU相比，内存要慢得多。与CPU处理一条指令的时间相比，读取和写入内存都需要更长时间。CPU试图通过引入缓存来缓解这一差距。但与CPU内部的寄存器相比，即使速度最快的缓存也慢得多。更多的寄存器意味着更多数据能存储在CPU内部，这降低了内存访问频率，同时提高了性能。
除了增加寄存器数量，ARM64也为指令集带来了重大变化。大多数32位ARM处理器可基于运行时条件寄存器的状态执行条件指令，这使得在编译if等语句时无需分支。不过这种方式引入的麻烦多于便利，因此ARM64取消了条件执行。ARM64的NEON SIMD单元完全符合IEEE754双精度标准，而32位版本的NEON SIMD单元只支持单精度。ARM64还增加了专门的AES、SHA-1、SHA-256加密指令。这些指令也许对普通应用帮助不大，但对特定领域的应用来说价值无穷。

收藏分享评分

继承事业，薪火相传

回复引用

订阅 TOP

返回列表