- UID
- 79854
- 性别
- 男
|
Blackfin™ DSP是16位产品的一个大系列,适用于电信和各种互联网设备,例如可视电话、 游戏设备、网络终端、网络电视和智能手持设备。 基于ADI公司与Intel公司联合开发的微信号结构(MSA),这些代码可兼容的系列产品都具有这一内核的高性能、低功耗、动态电源管理以及微控制器指令集易用的特点。
一、DSP结构纵览
主要优势
Blackfin DSP 将一个双MAC(乘法累加) 16位 DSP 引擎的处理能力与一个巧妙、正交的RISC微处理器精简指令集的优势结合在一起,为开发人员提供一个单指令集和编程环境,同时消除了在双处理器系统中与多器件相关的附加复杂性 。因而Blackfin DSP 在编程易用性、性能和功耗方面都有重大改进,并经过优化设计用于在有功率限制的应用中处理调制解调器、音频、视频、图像和语音信号。
使用便捷
Blackfin DSP 结构是带有高级语言编译器的交互式设计,因此能提供密集应用和快速 DSP 代码。 编译器允许程序开发人员用C或C++语言编写信号处理和控制代码,它是商业和科究领域中最常用的编程语言。VisualDSP++™ 调试器内的仿形工具能自动鉴别需要编程人员作进一步优化的强信号处理"热点"。一般有80%以上的C/C++代码仍保留在最终代码中,保留了编程人员长期开发过程中的成果,并且缩短了产品上市的总体时间。
由此产生的密集代码减少了存储和执行程序所需要的内存数量,能将系统成本降至最低,而且大多数情况下允许用户将片内内存用完。
高性能
最先推出的 Blackfin DSP 在300MHz,600 MMAC条件下工作。 未来的Blackfin DSP 产品将在超过1GHz,2,000 MMAC的条件下工作,而工作电压为1V左右。通过利用完全互锁的流水线,所有体系结构实现都具有源代码和二进制目标代码的兼容性。
Blackfin DSP 指令集已经增加了专门指令以支持多媒体音频和视频功能。这些专门指令能加速视频操作,支持MPEG2、MPEG4和JPEG等压缩算法以及颜色抖动(混色)和内插处理等功能。
动态电源管理
DSP包含动态电源管理功能,它允许不断调节处理器的工作电压和频率以便降低实时应用的功耗和提高处理器性能。
代码兼容性
Blackfin DSP采用了微信号结构(MSA)。这种体系结构是由ADI公司和Intel公司联合开发的。这两家公司都使用"MSA"这个名字来描述处理器内核的基础技术。Intel公司和ADI公司所有指明采用了MSA技术的产品,都具有软件源代码和目标代码兼容性。
二、DSP结构背景
将高性能16位数字信号处理器(DSP)的特点与微控制器编程简单的特点合并到具有统一编程模式的单一平台。由于其软件编程简便和低功耗高性能,因此能实现一系列新的应用。.
本文阐述了Blackfin DSP体系结构的主要优点,它是一种尖端的信号处理技术,能完成视频、图象、音频、语音和数据通信的数字信号处理,同时还提供综合的控制能力。Blackfin DSP 体系结构是在ADI 公司和 Intel公司联合开发名为“微信号结构(MSA)”的基础上实现的这项技术。Blackfin DSP 体系结构由于采用了一个综合的信号处理和控制指令集而定义了一类新的DSP。这种统一的编程模式消除了传统的多个不同处理器之间相联系的复杂性, 因为传统的多处理器系统的信号处理和控制系统都在分立的处理器结构上工作。Blackfin DSP 体系结构经优化设计,可以处理大量的图像、声音、文本和数据流,同时这种DSP还能有效运行用户接口和控制代码,而传统方法需要一个分立器件。
动态电源管理
动态电源管理允许对功耗的设备场景敏感控制。景敏感控制。系统设计工程师可以动态地改变DSP内核的频率和电压。由于每mW功耗都能提供最大的计算处理能力,这就大大降低了下一代便携设备的功耗并延长电池寿命。例如,在1/3峰值频率处,在满足速度要求的条件下,当内核所需要的电压降至最低时,可以将电池寿命延长10倍。
高度并行的计算单元
该体系结构内的计算单元用于使在相同周期内能执行的算术运算的次数最大化。Blackfin DSP体系结构的核心是数据算术单元(DAU),它包括两个16位乘法累加器(MAC),两个40位算术逻辑单元(ALU),四个8位视频ALU和一个40位单桶形移位器。在每一个周期内,每个MAC能在4个独立的数据操作数上执行16位乘16位的乘法运算。该40位 ALU能累加两个40位的数字或四个16位的数字。 为获得最大效率,可利用这种体系结构,在本机处理8位、16位和32位的数据字运算。
高性能DSP
两个数据地址产生器(DAG)是用于产生支持高级DSP 滤波运算的地址的复合装入或存储单元。对于DSP 寻址,它支持位倒序寻址和循环缓冲。对于RISC MCU 载入和存储,支持自动增量、自动减量和基地址+立即偏移量寻址方式。6个32位地址指针寄存器(P0~P5)读取操作数。还有其它4组32位寄存器: 变址寄存器(I0~I3),修正寄存器(M0-M3),基址寄存器(B0~B3)和长度寄存器 (L0~L3)。该DAG还包括两个用于嵌套零开销循环的循环计数器以及支持传输过程中饱和和限幅的硬件。
极佳的代码密度
RISC MCU 编码一般都用时较长,因为它是线性写入的。DSP 编码一般用时较短,并且包含较多的循环周期。 Blackfin DSP 体系结构支持多种长度指令。该内核能将16位控制指令与32位DSP 指令一起混合并链接进64位组,使内存分组最大。当缓冲和读取内存时,内核自动完全填充总线长度分组,因为它没有排列限制。这两个特点使得内核处理器具有优秀的代码密度处理能力。该内核体系结构很容易为获得最佳软件代码密度提供多指令长度、指令混合及内存排列。基于代码中使用的指令,还能自动混合16,32和64位指令,而无须任何限制、方式切换或代码隔离。
视频指令
除了自然支持8位数据—RGB像素处理算法公用的字长之外,该体系结构还包括视频指令 。例如,用一条IEEE 1180 舍入运算支持离散余弦变换(DCT)。"SUM ABSOLUTE DIFFERENCES" 指令支持视频压缩中使用的运动估计算法。
对于霍夫曼(Huffman)编码,该指令集包括一个 "FIELD DEPOSIT/EXTRACT" 命令。用软件实现视频算法能使原始设备制造商(OEM)适应不断升级的标准和新的功能要求,而无须改动硬件。该内核体系结构支持一些算法,例如,MPEG2, MPEG4 和JPEG压缩。这种综合的视频指令还消除了主处理器和一个独立的视频编码解码器之间的复杂和易混的通信问题。这些特点有助于为终端应用缩短产品上市时间,同时更降低了系统总体成本。
分层结构的内存
分层结构的内存缩短了内核对内存的访问时间,以获得最大的数据吞吐量,较少的延迟和缩短的处理空载时间。L1内存直接连接到内核并且以全系统时钟速度工作。该体系结构支持大L1内存空间,但对于更大的程序和数据空间,可以使用L2内存。访问L2内存虽然需要一定的执行时间,但是一旦访问通过,它就象一个突发存储内存。对于大程序和数据空间,外部存储器能直接载入L2内存。
L1内存结构能提供数字信号处理所需要的性能以及方便微控制器的编程。这是通过将L1 内存配置成SRAM,或指令或数据高速缓存器,或二者的结合来完成的。由于同时支持SRAM和高速缓存器,系统设计师能够为操作系统(OS) 和微控制器代码保持简单的数据缓存编程模式,同时还能将要求宽带宽和短执行时间的关键DSP 数据集映射到SRAM中。
内存管理单元(MMU)能提供内存保护,当内核工作在用户方式和监控方式时,内存保护支持全部OS核心。OS核心在监控方式运行,并且为了实际应用软件在用户方式下运行,将内存单元和其它系统资源分开。而传统DSP则不具有这种独特而强大的功能。
性能发展进程
目前这一代Blackfin DSP 体系结构的特点是具有一个双MAC 300MHz ( 每秒600MHz MAC) 内核,在1.5V工作电压下能提供高性能处理。这种DSP不但具有高性能而且还具有低功耗,这两个特点适合各种各样的信号处理应用,包括高级语音调制解调器、音频和视频互联网设备以及移动通信设备。 未来的Blackfin DSP体系结构将提供频率超过1GHz (每秒20亿MAC),在低至0.7V工作电压下也能提供高性能处理, 同时仍保持代码兼容性,以保护昂贵的软件投资。
结论
ADI公司的Blackfin DSP体系结构适用于要求非常高的信号处理性能和低功耗的应用场合。这种编程模式集成了DSP 和控制指令 ,以简化带有人性化接口(例如,视频和音频)和富有特色的通信平台的开发。
注:Blackfin DSP 是ADI公司的商标 |
|