- UID
- 1029342
- 性别
- 男
|
特定应用的计算引擎加速
处理器不但拥有优化的标准架构特色,而且还可增加以下任一设计功能:
先进二级缓存控制器:ARM二级缓存控制器(PrimeCell PL310)与Cortex-A9系列处理器同步设计,旨在提供一种能匹配Cortex-A9处理器性能和吞吐能力的优化二级缓存控制器。
| 最新开发的ARM Cortex-A9处理器采用了广受支持的ARM v7架构,处理器性能、功效和功能均达到了前所未有的水平,完全能够满足消费、网络、企业和移动应用等领域尖端产品的要求。。 | PL310最多可为每个接口提供8项AXI事务支持,支持按Master接口进行锁定;这样一来,即通过将PL310用作加速器与处理器之间的缓冲器,充分利用一致性加速口,实现多个CPU或组件之间的可控共享,既提升了系统性能,也降低了相关功耗水平。
另外,PL310不但具有Cortex-A9先进总线接口单元的各项功能,支持同步1/2时钟比,有助于减少高速处理器设计中的延时现象,而且能够对第二MasterAXI 接口设置地址过滤,分割地址和频率域、以及集成片上内存的快速存取提供了支持。
PL310最高可支持2 M B的四至十六路组相联二级缓存,可与奇偶校验及支持E C C的R A M集成,而且运行速率能够与处理器保持一致。而先进的锁定技术也提供了必要的机制,从而将缓存用作相关性加速器和处理器之间的传输RAM。
Cortex-A9 程序跟踪宏单元(PTM):Cortex-A9 PTM为两款Cortex-A9处理器提供了兼容ARM CoreSight技术的程序流跟踪功能,能够对处理器中的实际指令流实现完全可视化的管理。Cortex-A9 PTM通过周期计数实施性能分析,可对所有代码分支和程序流变动进行跟踪管理。
另外提供Cortex-A9 CoreSight设计套件,可使来自多个处理器的跟踪流具备相关性,而且包括跟踪和调试Cortex-A9 MPCore多处理器设计所需要的全部CoreSight组件。
综合灵活性和参考方法
Cortex- A9处理器充分发挥了综合性设计流程的灵活性,其相关产品能够应用于任何代工厂和工艺节点。通过与各大EDA公司开展持续合作,ARM制定了专门的“实现 参考方法”(iRM),使Cortex-A9处理器的授权客户能够根据所选工艺技术对处理器进行定制、实现、验证和差异化处理。这些参考方法结合了逻辑和 物理综合技术,提供了一条可预测的硅技术之路,构成了定制方法开发的基础。此外,iRM还可整合ARM Artisan前端库文件以及经过预编译的RAM,增强了iR M实现处理器实施工艺的能力,在完整性上远远超过了已有参考解决方案。
开发工具与生态系统
所有ARM处理器都拥有ARM RealView开发工具套装、多种第三方工具、操作系统和EDA厂商的支持。
ARM RealView工具拥有独特的功能,其所提供的解决方案涵盖从概念化到最终产品的整个开发过程。RealView套装中的每种工具都与ARM硬件和软件 IP协同开发,为IP发挥最佳性能提供了保障。没有其他供应商能够为ARM IP提供这种涵盖系统、处理器设计和软件开发全部过程的独特端对端工具链支持。
通过ARM RealView套装提供的多种既相互独立又相互联系的工具,构架设计师和开发人员完全可以满怀信心地、以前所未有的速度将优质产品投放市场。
第三方支持
ARM 合作伙伴联盟是业界规模最大的合作伙伴网络,由领先的硅、系统、设计支持、软件和培训服务供应商组成。通过这个网络,系统设计师可以获得大量ARM 技术和优化IP,并为基于A R M架构的产品提供了一个涵盖设计、制造和最终应用等过程的完整解决方案。有关详情,可访问http://www.arm.com/community。
物理IP
ARM 的Artisan物理IP产品的设计目的是在性能、密度、功耗和特定制造工艺的产量之间达最佳平衡。产品涵盖各种45-250纳米工艺,同时提供多种格式 和模型,并为业界主要的EDA工具提供了支持。ARM Artisan IP平台及产品组合提供了多种选择,完全能够满足系统集成(SoC)设计师的需求。
AMBA
AMBA互联总线协议构成了集成互联规范(起到集成设计框架的作用)实际行业标准的基础, 有效提供了将各个IP组件粘接起来的‘数字胶水’。同时也是ARM 设计可复用战略的主干。
通 过更广范围的系统集成商的支持,ARM将竭力提供业界技术最先进、支持最完善且免费的互联规范。目前,外设 IP的PrimeCell组合支持AMBA协议的第2和第3版发表的协议,该协议定义了AMBA AXITM、AHBTM、AHB-Lite、APB和ATB规范。
完整的系统解决方案
两款ARM Cortex-A9处理器都包含ARM特定应用架构扩展集,包括DSP和SIMD扩展集和Jazelle® 技术、TrustZone和智能功耗管理(IEM™)技术。此外,ARM已开发一整套支持新处理器的技术,以缩短设计时间并加快产品上市时间。这一完整的系统解决方案包括:
• 浮点单元(FPU):Cortex-A9 FPU提供高性能的单精度和双精度浮点指令。
• 媒体处理:Cortex-A9 NEON媒体处理引擎(MPE)提供了Cortex-A9 FPU所具有的性能和功能,以及在Cortex-A8处理器中首次推出的用于加速媒体和信号处理功能的ARM NEON 先进 SIMD指令集。
• 物理IP:提供在Cortex-A9处理器上实现低功耗、高性能应用所需的众多标准单元库和存储器。标准单元包括功耗管理工具包,可实现动态和漏泄功耗节省技术,例如时钟门控、多电压岛和功率门控。还提供具有先进的功耗节省功能的存储编译器。
• Fabric IP:Cortex-A9处理器得到广泛的 PrimeCell® fabric IP元件的支持。这些元件包括:一个动态存储控制器、一个静态存储控制器、一个AMBA® 3 AXI可配置的内部互连及一个优化的L2 Cache 控制器,用于匹配Cortex-A9处理器在高频设计中的性能和吞吐能力。
• 图形加速: ARM Mali™ 图形处理单元及Cortex-A9处理器的组合,将使得SoC合作活动能够创造高度整合的系统级解决方案,带来最佳的尺寸、性能和系统带宽优势。
• 系统设计:ARM RealView® SoC Designer工具提供快速的架构优化和性能分析,并允许在硬件完成以前很长时间即可进行软件驱动程序和对时间要求很严格的代码的早期开发。 RealView系统发生器(RealView System Generator)工具为基于Cortex-A9处理器的虚拟平台的采用提供超快建模能力。Realview工具中关于Cortex-A9处理器的基于周期的(cycle based)及程序员视角的模型将于2008年第二季度上市。
• 调试: ARM CoreSight™片上技术加速了复杂调试的时间,缩短了上市时间。程序追踪宏单元技术(Program Trace Macrocell technology)具有程序流追踪能力,能够将处理器的指令流完全可视化,同时配置与ARMv7架构兼容的调试接口,实现工具标准化和更高的调试性能。用于Cortex-A9处理器的CoreSight设计工具包扩展了其调试和追踪能力,以涵盖整个片上系统,包括多个ARM处理器、DSP以及智能外设。
• 软件开发:ARM RealView开发套件(ARM RealView Development Suite)包括先进的代码生成工具,为Cortex-A9处理器提供卓越的性能和无以比拟的代码密度。这套工具还支持矢量编译,用于NEON媒体和信号处理扩展集,使得开发者无需使用独立的DSP,从而降低产品和项目成本。包括先进的交叉触发在内的Cortex-A9 MPCore多核处理器调试得到RealView ICE和Trace产品的支持,同时也得到一系列硬件开发板的支持,用于FPGA系统原型设计和软件开发。
40nm版(台积电)
ARM Cortex-A9 ,基于台积电的40nm-G制造工艺,已经开发出两款Cortex-A9微架构双核处理器设计方案,分别对应高性能和低能耗。其高性能版本将把ARM处理器的频率上限提高到2GHz以上。
ARM的Cortex系列处理器设计近来在移动市场大行其道,包括iPhone 3GS、Palm Pre以及频率高达1GHz的东芝TG-01等最新顶级智能手机实际上都是基于Coretex-A8核心,而近来发展方兴未艾的Smartbook智能本基本上也都是这一架构处理器的应用产品。
Cortex-A9将继续这一路线,由于从Cortex-A8普遍使用的65nm工艺升级到40nm,Cortex-A9高性能版本将在使用双核心的同时,把频率拉高到2GHz以上,同时依然保持超低功耗,预计高性能Smartbook将是它的主要战场。
低功耗版本方面,主要面向机顶盒、数字电视、打印机及其他应用,运算能力可达4000DMIPS,同时功耗不足0.25W。
和Cortex-A8一样,ARM将把该核心设计授权给多家厂商进行再开发和制造,包括德州仪器、Broadcom、高通、三星等ARM授权厂商预计从今年第四季度开始就将推出该架构的处理器产品。
28nm版(GlobalFoundries)
GlobalFoundries成功流片了基于ARM Cortex-A9双核心处理器的技术质量检验装置(TQV),而且第一家使用了28nm HP高性能工艺、HKMG(高K金属栅极)技术。
28nm与40nm的比较
GF透露,这次TQV是今年八月份在位于德国德累斯顿的Fab 1晶圆厂内完成的,使用了一整套优化的ARM Cortex-A9物理IP,能从每一个方面模拟真正的SoC产品,从而实现最大程度的频率分析、缩短产品设计周期的时间,还有完整的可测性设计 (DFT)。据透露,新处理器的工作频率在2.0-2.5GHz之间,比上代40nm工艺版本快了500MHz左右,性能也有明显提升。
GF、ARM估计,相比于40nm工艺,新的28nm工艺制造平台能带来40%的计算性能提升、30%的功耗下降、100%的待机电池续航能力提升。
这也是GF、ARM去年十月宣布的战略合作的一部分。GF预计今年年底拿出新处理器的实际样品。
顺便说一句,ARM处理器可能会让很多人感到陌生而遥远,但实际上我们身边到处都是它的影子,目前全球使用量估计高达200亿颗,占全部嵌入式32位RISC处理器的90%之多。 |
|