首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

ARM64移动处理器解惑(2)

ARM64移动处理器解惑(2)

Objective-C Runtime变化
在Mac OS X 10.7操作系统中,苹果引入了标签指针,这种指针允许某些类和其少量实例数据完全存储在指针中。这样在使用某些类时(如NSNumber)就无需分配内存,并提升性能。标签指针仅支持64位架构,一部分原因是受二进制兼容制约,另一部分原因是32位指针预留的数据空间不足。之前的iOS系统都不支持标签指针,而在ARM64位架构中,Objective-C Runtime已包含了标签指针,因此也可以享受Mac系统所具备的便利了。
尽管指针为64位,但在实际使用中,这些位数并不是都用上了。例如X86-64的Mac OS X系统仅使用了其中的47位。而ARM64上占用得更少,目前只有33位。只要未被系统全部占用,这些指针就能用于存储数据。这是Objective-C Runtime演进史上最重要的变化之一。
另作他用的ISA指针
Objective-C对象是连续的内存块,这个内存块中第一个指针大小的部分称为ISA。一般来说,ISA是一个指向该对象所属类的指针。
不过这么大的空间仅作为指针有点儿浪费,尤其是在64位CPU上。运行iOS的ARM64目前仅使用了一个指针的33位,而其余31位则另作他用。另外,类指针还需要对齐,这就释放了另外3位,于是ISA指针中共有34位可另作他用。苹果的ARM64 Runtime正是利用了这一点使性能有了大幅提升。
不过,最重要的性能提升也许得益于内联引用计数。几乎所有的Objective-C对象都采用引用计数(NSString文字等常量对象是例外),这使得修改引用计数的操作极为频繁。尤其对于采用自动引用计数的系统来说,资源消耗非常高。因此,提高引用计数的性能变得至关重要。
以往,引用计数并不存储在对象中,因为ISA空间不足。当然,我们可以为每个对象专门分配一块空间用于保存引用计数,但这会占用更多的内存空间。对今天的系统来说,额外的空间也许不算什么,但对早期的Objective-C系统影响严重。由于这样的原因,引用计数被系统存储在了一个单独的表中。
于是,当为对象增加新引用时,Runtime会执行以下操作:
  • 获取全局计数哈希表;
  • 锁定表以确保线程操作的安全;
  • 查询表中对象的计数;
  • 增加计数,并将新值重新存储到表中;
  • 解除锁定。
这些操作非常缓慢!即使用最快的哈希表,也没有直接从内存访问来得快。
对于ARM64,ISA字段中的19位用于内联存储引用计数。这意味着,增加对象引用的步骤可以简化为:在ISA字段正确部分执行原子操作加一。
仅此而已!速度将会快得多!当然,还有一些极端情况需要处理,真正的操作会略微复杂一些。
以往在回收Objective-C对象时,需要执行大量清除工作,跳过其中不必要的步骤,就可以提高性能。利用剩余的可用位,还有其他一些方法可使回收对象的速度更快。
将上面提到的所有优化集合在一起,ARM64的性能优势就变得非常明显了。根据我自己不太严格的性能测试显示,在iPhone 5S 32位模式下,基本对象的创建和销毁大约需要380ns,而在64位模式,仅需200ns。如果某类实例曾有过弱引用并与对象集合关联,32位模式下的耗时上升至约480ns,而64位模式下保持不变,仍为200ns。
结束语
“64位”A7处理器既不是一种营销手段,也不是一个能催生创新应用的巨大突破。真实的情况是,它介于两者之间,就像我们经常见到的技术演进一样。
ARM64让某些应用的计算速度快了一些,大多数应用占用的内存变得更多,也让一些编程技巧更容易使用。不过从总体上看,还不算重大变化。
在向64位过渡的过程中,ARM架构增加了寄存器的数量,并对其使用做了修改。改进了指令集,令其性能优于过去的32位处理器。
苹果也从这种过渡中改变自己。最大的变化是内联引用计数,这一改变使得在通常情况下,无需进行代价昂贵的哈希表查找,让对象的创建和销毁代价都减少了近一半。标签指针也有利于性能提升并减少了内存占用。
ARM64使苹果的硬件如虎添翼,尽管我们都知道这一天迟早会到来,但没想到这么快,真是很棒!
继承事业,薪火相传
返回列表