从Cortex - M3过度到Cortex - M4(4)----Cortex-M3、4比较

论坛元老

Rank: 8 Rank: 8

UID: 1029342
性别: 男

1^#

打印

字体大小: tT

yuyang911220发表于 2014-7-26 08:32 | 只看该作者

从Cortex - M3过度到Cortex - M4(4)----Cortex-M3、4比较

优先级, 特权, 模型, 处理器, 存储器

1.内存保护单元MPU
与Cortex - M3的相同，MPU是一个Cortex - M4中用于内存保护的可选组件。处理器支持标准ARMv7内存保护系统结构模型。您可以使用在MPU执行特权/访问规则，或者独立的进程。这个MPU提供全面支持：
·保护区
·重叠保护区域，提升区域优先级（7 =最高优先级，0 =最低优先级）
·访问权限
·将存储器属性输出至系统
2 .DSP能力
图表展示了处理器运行在相同的速度下Cortex - M3和Cortex - M4在数字信号处理能力方面的相对性能比较。
在下面的数字，Y轴代表执行给出的计算用的相对的周期数。
因此，循环数越小，性能越好。以Cortex - M3作为参考，Cortex - M4的性能计算，性能比大概为其周期计数的倒数。举例说明，PID功能，Cortex - M4的周期数是与Cortex - M3的约0.7倍，因此相对性能是1/0.7，即1.4倍。
Cortex - M系列16位循环计数功能

Cortex - M系列32位循环计数功能

这很清楚的表明，Cortex - M4在数字信号处理方面对比Cortex - M3的16位或32位操作有着很大的优势。
Cortex-M4执行的所有的DSP指令集都可以在一个周期完成，Cortex - M3需要多个指令和多个周期才能完成的等效功能。即使是PID算法——通用DSP运算中最耗费资源的工作，Cortex - M4也能提供了一个1.4倍的性能得改善。另一个例子，MP3解码在Cortex-M3需要20-25Mhz，而在Cortex-M4只需要10-12MHz。
1. 32位乘法累加（MAC）

32位乘法累加（MAC）包括新的指令集和针对Cortex - M4硬件执行单元的优化它是能够在单周期内完成一个 32 × 32 + 64 - > 64 的操作或两个16 × 16 的操作。如下表列出了这个单元的计算能力。

2. SIMD
Cortex - M4支持SIMD指令集，这在上一代的Cortex - M系列是不可用的。上述表中的指令，有的属于SIMD指令。与硬件乘法器一起工作（MAC），使所有这些指令都能在单个周期内执行。受益于SIMD指令的支持，Cortex - M4处理器是能在单周期完成高达32 × 32 + 64 - >64的运算，为其他任务释放处理器的带宽，而不是被乘法和加法消耗运算资源。考虑以下复杂的算术运算，其中两个16 × 16乘法加上一个32位加法，被编译成由一个单一指令执行：SUM = SUM +（A* C）+（B *D）

收藏分享评分

继承事业，薪火相传

回复引用

订阅 TOP

返回列表