Blackfin DSP是16位产品的一个大系列,适用于电信和各种互联网设备,例如可视电话、 游戏设备、网络终端、网络电视和智能手持设备。 基于ADI公司与Intel公司联合开发的微信号结构(MSA),这些代码可兼容的系列产品都具有这一内核的高性能、低功耗、动态电源管理以及微控制器指令集易用的特点。 一、DSP结构纵览 主要优势 Blackfin DSP 将一个双MAC(乘法累加) 16位 DSP 引擎的处理能力与一个巧妙、正交的RISC微处理器精简指令集的优势结合在一起,为开发人员提供一个单指令集和编程环境,同时消除了在双处理器系统中与多器件相关的附加复杂性 。因而Blackfin DSP 在编程易用性、性能和功耗方面都有重大改进,并经过优化设计用于在有功率限制的应用中处理调制解调器、音频、视频、图像和语音信号。 使用便捷 Blackfin DSP 结构是带有高级语言编译器的交互式设计,因此能提供密集应用和快速 DSP 代码。 编译器允许程序开发人员用C或C++语言编写信号处理和控制代码,它是商业和科究领域中最常用的编程语言。VisualDSP++? 调试器内的仿形工具能自动鉴别需要编程人员作进一步优化的强信号处理"热点"。一般有80%以上的C/C++代码仍保留在最终代码中,保留了编程人员长期开发过程中的成果,并且缩短了产品上市的总体时间。 由此产生的密集代码减少了存储和执行程序所需要的内存数量,能将系统成本降至最低,而且大多数情况下允许用户将片内内存用完。 高性能 最先推出的 Blackfin DSP 在300MHz,600 MMAC条件下工作。 未来的Blackfin DSP 产品将在超过1GHz,2,000 MMAC的条件下工作,而工作电压为1V左右。通过利用完全互锁的流水线,所有体系结构实现都具有源代码和二进制目标代码的兼容性。 Blackfin DSP 指令集已经增加了专门指令以支持多媒体音频和视频功能。这些专门指令能加速视频操作,支持MPEG2、MPEG4和JPEG等压缩算法以及颜色抖动(混色)和内插处理等功能。 动态电源管理 DSP包含动态电源管理功能,它允许不断调节处理器的工作电压和频率以便降低实时应用的功耗和提高处理器性能。 代码兼容性 Blackfin DSP采用了微信号结构(MSA)。这种体系结构是由ADI公司和Intel公司联合开发的。这两家公司都使用"MSA"这个名字来描述处理器内核的基础技术。Intel公司和ADI公司所有指明采用了MSA技术的产品,都具有软件源代码和目标代码兼容性。 二、DSP结构背景 将高性能16位数字信号处理器(DSP)的特点与微控制器编程简单的特点合并到具有统一编程模式的单一平台。由于其软件编程简便和低功耗高性能,因此能实现一系列新的应用。. 本文阐述了Blackfin DSP体系结构的主要优点,它是一种尖端的信号处理技术,能完成视频、图象、音频、语音和数据通信的数字信号处理,同时还提供综合的控制能力。Blackfin DSP 体系结构是在ADI 公司和 Intel公司联合开发名为“微信号结构(MSA)”的基础上实现的这项技术。Blackfin DSP 体系结构由于采用了一个综合的信号处理和控制指令集而定义了一类新的DSP。这种统一的编程模式消除了传统的多个不同处理器之间相联系的复杂性, 因为传统的多处理器系统的信号处理和控制系统都在分立的处理器结构上工作。Blackfin DSP 体系结构经优化设计,可以处理大量的图像、声音、文本和数据流,同时这种DSP还能有效运行用户接口和控制代码,而传统方法需要一个分立器件。 动态电源管理 动态电源管理允许对功耗的设备场景敏感控制。景敏感控制。系统设计工程师可以动态地改变DSP内核的频率和电压。由于每mW功耗都能提供最大的计算处理能力,这就大大降低了下一代便携设备的功耗并延长电池寿命。例如,在1/3峰值频率处,在满足速度要求的条件下,当内核所需要的电压降至最低时,可以将电池寿命延长10倍。 高度并行的计算单元 该体系结构内的计算单元用于使在相同周期内能执行的算术运算的次数最大化。Blackfin DSP体系结构的核心是数据算术单元(DAU),它包括两个16位乘法累加器(MAC),两个40位算术逻辑单元(ALU),四个8位视频ALU和一个40位单桶形移位器。在每一个周期内,每个MAC能在4个独立的数据操作数上执行16位乘16位的乘法运算。该40位 ALU能累加两个40位的数字或四个16位的数字。 为获得最大效率,可利用这种体系结构,在本机处理8位、16位和32位的数据字运算。 高性能DSP 两个数据地址产生器(DAG)是用于产生支持高级DSP 滤波运算的地址的复合装入或存储单元。对于DSP 寻址,它支持位倒序寻址和循环缓冲。对于RISC MCU 载入和存储,支持自动增量、自动减量和基地址+立即偏移量寻址方式。6个32位地址指针寄存器(P0~P5)读取操作数。还有其它4组32位寄存器: 变址寄存器(I0~I3),修正寄存器(M0-M3),基址寄存器(B0~B3)和长度寄存器 (L0~L3)。该DAG还包括两个用于嵌套零开销循环的循环计数器以及支持传输过程中饱和和限幅的硬件。 极佳的代码密度 RISC MCU 编码一般都用时较长,因为它是线性写入的。DSP 编码一般用时较短,并且包含较多的循环周期。 Blackfin DSP 体系结构支持多种长度指令。该内核能将16位控制指令与32位DSP 指令一起混合并链接进64位组,使内存分组最大。当缓冲和读取内存时,内核自动完全填充总线长度分组,因为它没有排列限制。这两个特点使得内核处理器具有优秀的代码密度处理能力。该内核体系结构很容易为获得最佳软件代码密度提供多指令长度、指令混合及内存排列。基于代码中使用的指令,还能自动混合16,32和64位指令,而无须任何限制、方式切换或代码隔离。 视频指令 除了自然支持8位数据—RGB像素处理算法公用的字长之外,该体系结构还包括视频指令 。例如,用一条IEEE 1180 舍入运算支持离散余弦变换(DCT)。"SUM ABSOLUTE DIFFERENCES" 指令支持视频压缩中使用的运动估计算法。 对于霍夫曼(Huffman)编码,该指令集包括一个 "FIELD DEPOSIT/EXTRACT" 命令。用软件实现视频算法能使原始设备制造商(OEM)适应不断升级的标准和新的功能要求,而无须改动硬件。该内核体系结构支持一些算法,例如,MPEG2, MPEG4 和JPEG压缩。这种综合的视频指令还消除了主处理器和一个独立的视频编码解码器之间的复杂和易混的通信问题。这些特点有助于为终端应用缩短产品上市时间,同时更降低了系统总体成本。 分层结构的内存 分层结构的内存缩短了内核对内存的访问时间,以获得最大的数据吞吐量,较少的延迟和缩短的处理空载时间。L1内存直接连接到内核并且以全系统时钟速度工作。该体系结构支持大L1内存空间,但对于更大的程序和数据空间,可以使用L2内存。访问L2内存虽然需要一定的执行时间,但是一旦访问通过,它就象一个突发存储内存。对于大程序和数据空间,外部存储器能直接载入L2内存。 L1内存结构能提供数字信号处理所需要的性能以及方便微控制器的编程。这是通过将L1 内存配置成SRAM,或指令或数据高速缓存器,或二者的结合来完成的。由于同时支持SRAM和高速缓存器,系统设计师能够为操作系统(OS) 和微控制器代码保持简单的数据缓存编程模式,同时还能将要求宽带宽和短执行时间的关键DSP 数据集映射到SRAM中。 内存管理单元(MMU)能提供内存保护,当内核工作在用户方式和监控方式时,内存保护支持全部OS核心。OS核心在监控方式运行,并且为了实际应用软件在用户方式下运行,将内存单元和其它系统资源分开。而传统DSP则不具有这种独特而强大的功能。 性能发展进程 目前这一代Blackfin DSP 体系结构的特点是具有一个双MAC 300MHz ( 每秒600MHz MAC) 内核,在1.5V工作电压下能提供高性能处理。这种DSP不但具有高性能而且还具有低功耗,这两个特点适合各种各样的信号处理应用,包括高级语音调制解调器、音频和视频互联网设备以及移动通信设备。 未来的Blackfin DSP体系结构将提供频率超过1GHz (每秒20亿MAC),在低至0.7V工作电压下也能提供高性能处理, 同时仍保持代码兼容性,以保护昂贵的软件投资。 结论 ADI公司的Blackfin DSP体系结构适用于要求非常高的信号处理性能和低功耗的应用场合。这种编程模式集成了DSP 和控制指令 ,以简化带有人性化接口(例如,视频和音频)和富有特色的通信平台的开发。 注:Blackfin DSP 是ADI公司的商标 三、体系结构基础 Blackfin DSP包括一个高性能双MAC DSP体系结构,结合RISC MCU的编程方便的特点,从而形成了一个单指令集体系。下图示出Blackfin DSP 内核的框图。
两个16位MAC、两个40位ALU和四个8位视频ALU 支持8位、16位、32位整数和16和32位小数数据类型 同时读取一条指令和两个单独的数据单元 循环计数器,允许嵌套零开销循环 任意的位和位域操作、插入和抽取 两个DAG 单元,具有循环和位倒序寻址方式 统一的4GB内存空间 混合的 16位和32位指令编码,具有最佳的代码密度 支持OS操作的内存保护 因此,Blackfin DSP 体系结构在单周期内支持如下操作: 在两个MAC或两个ALU上执行一条单指令运算和 执行2 x 32位数据传送(2 读取或1读1写) 和 执行两指针更新和 执行硬件循环刷新 Blackfin DSP具有用户方式和监控方式,并能在这两种方式之间来回动态切换。用户方式限制对系统资源的访问。监控方式支持中断与异常请求、复位或非屏蔽中断(NMI)的处理。 事件控制器 事件控制器管理中断与异常请求。它支持5种基本类型的事件:仿真、复位、NMI、异常请求和中断。事件管理通过为这些基本事件指定优先权来进行组织。 内存管理单元(MMU) MMU对单独的任务提供内存保护,并且防止对系统内存映射寄存器进行非法访问。它还管理指令集和高速数据缓存器的操作。 内存分层结构 Blackfin DSP支持分层的内存结构,通过拥有独立的指令和数据内存L1以获得DSP 的最佳性能。 Memory Architecture L1指令和数据内存块可以配置为SRAM或缓存。当配置成缓存时,能实现真正的具有任意方式锁定的LRU (最近最少使用) 算法 。L1 内存访问速度最快,每个处理器周期能完成一次访问。L2 内存远离内核处理器,用于存储更大量的程序代码和数据。 调试和JTAG 接口 调试接口是 一个 IEEE 1149.1 JTAG 访问端口。Blackfin DSP体系结构还包含特殊功能,支持: 软件异常事件——调试断点,直接操作系统(OS)访问,运行时间异常 硬件断点——6个比较器和寄存器单元,3个断点频率计数器 性能计数器——3个计数器对周期和出现频率进行记数 执行跟踪——存储最后16个非增量PC数值 四、目标市场和应用 高性能DSP是实现有线和无线接入互联网、蜂窝电话和音频与视频及数据信息综合多媒体处理的关键技术。据Forward Concepts公司预测,2005年DSP的市场需求为200亿美元。为满足这种需求,DSP 技术供应商必须提供极高性能、低功耗的产品和缩短产品上市的时间。Blackfin DSP 产品系列将ADI公司和Intel公司联合开发的微信号体系结构(MSA)与其它外围器件和专门应用技术集成在一起,极大地满足了这些需求以及其它一些市场需求。 所有Blackfin DSP 系列成员都具有该体系结构的特色,例如: 一个高性能 (预计达到1GHz) 、带双乘法累加器 (MAC)的定点DSP,包含高效的RISC 微控制器(MCU)的系统控制功能,带有一个优化单指令集体系结构。 动态电源管理( 内核电压预计为0.9V) 能力允许在灵活的软件控制下动态地切换工作频率和工作电压。 软件编程优化,包括支持高级语言(像C和C++),加快编程和调试速度,以及真正支持无线通信和视频应用。 对于特殊设计考虑,个别DSP的 部分市场可能会对这些优势有不同的看法。但上述各种特性对所有DSP的目标市场需求都是有用的。另外,Blackfin DSP 系列产品会集成一些对各种市场和客户都非常有用的DSP 外围单元电路。在某些情况下,Blackfin DSP 产品还可能包含有加速度传感器或其它硬件单元电路,以满足高速增长的部分市场的特殊需求。 蜂窝终端 对下一代蜂窝终端的全球性需求将不断增加。用户对更多特色功能的要求,包括综合的语音、视频和数据服务,将不断对终端的关键性可编程硅器件——DSP以及一个通用微控制器,提出提高性能、增加灵活性和降低功耗的要求。目前的蜂窝终端通常都使用一个DSP来完成语音处理和计算任务,同时使用一个通用微控制器执行功耗管理、用户接口和协议堆栈操作。 Blackfin DSP 系列器件改变了用于下一代蜂窝终端的设计方法。它除了具有双MAC DSP 体系结构的处理能力之外,还提供流水线结构并且简化RISC 的复杂结构,从而能实现更好的频率定标和更低的成本。Blackfin DSP 系列器件还使用了经过优化选择的指令长度的指令集,能为通用控制代码提供一流的代码密度。结合Blackfin DSP 内核体系结构中的动态功耗管理,这些优点使得Blackfin DSP 系列器件能够成为下一代蜂窝终端的单处理器解决方案。 互联网设备和用户设备 人们预期,互联网会继续成为一种将语音、数据和视频信息进行组合分配的重要媒体,它利用各种产品连接到互联网,传送与处理数据并且将信息传送给终端用户。这些产品包括互联网智能手持设备(例如,PDA)、可视电话、互联网游戏设备、Web网络电话与终端、网络电视、电子邮件终端以及互联网音频播放器。每一代产品都要求DSP有更高的性能来实现高级算法,以便较容易地实现语音识别、字体识别、流式视频和音频压缩。 很多互联网设备都是高度依赖于电池供电的手持设备。DSP功耗直接影响电池的寿命,因此,对于方便而持续的操作,将DSP功耗降至最低是一个重要的设计考虑。所有Blackfin DSP器件都采用动态功耗管理方案,在实时性要求不是很高的场合,内核电压和工作频率可以下降,以便降低功耗。另外,它还支持多种待机(节电)方式 ,对于不重要的硅器件能有选择地关断电源 。Blackfin DSP的这些特点再结合未来能达到低至0.7V的内核工作电压,使其能用于要求最严格的手持和便携式设备。 Blackfin DSP 还将硬件和软件结合起来,可以有效地实现下一代互联网设备所需要的视频算法。双算术单元包括4个辅助8位视频ALU,而其指令集体系结构(ISA)提供了与视频相关的专门指令。 互联网与电信基础设施 今天,大部分的经济建立在互联网和电信基础设施不断建设的基础之上。高性能和低功耗DSP技术是在互联网上成功地综合语音、传真、数据和视频通信业务的关键,并且广泛应用于 语音IP(VoIP) 网关和远程接入服务器--这是这条流水线上的关键性器件 。 VoIP网关一般在分组数据网络上实现语音数据传输, 而远程接入服务器通常在电路交换网络上实现数据或视频传输。尽管基于网际协议的语音传输(VoIP)网关的基本功能不同于远程接入服务器,但其总体目标是在给定带宽范围内使支持的语音、数据或视频通道数最多。尽管最初是在300MHz (600MMAC)频率上, 但由于首款Blackfin DSP 产品具有极高的内核性能,可使其通道密度是原来的10倍。 另外,内核具有RISC MCU的功能,所以不再需要一个通用微控制器来进行错误检测、错误纠正和控制。 消费类和PC相关市场 ADSP-21535 Blackfin DSP 包括外围功能单元电路,所以适合比以上提到的市场和应用范围更广泛的各种应用。尤其是这种DSP包括一个SDRAM控制器,一个USB设备和PCI接口。这种SDRAM控制器能直接连接到大型外部DRAM存储体,例如PC133 SDRAM,很多消费产品比如数码相机、摄录机和打印机通常都需要这种DRAM存储体。这种无缝接口简化了与大型低成本存储器阵列的连接。USB设备和PCI接口能有效地用于PC和PC外设,例如客户端调制解调器、无线LAN、声卡和家庭网关。 Blackfin DSP的其它的市场和应用包括:汽车、基站、宽带家庭网关、中心局和网络开关、数字图象处理、数字印刷、全球定位系统、高性能数字音频、工业信号处理、手机、电信、视频会议和xDSL调制解调器。 总结 Blackfin DSP 系列的推出突破了传统的DSP和微控制器设计规则。Blackfin DSP 系列将通用微控制器熟悉的编程环境与高性能DSP的特点和功能结合在一起。系统设计工程师不再需要在DSP与 微控制器的对照中进行选择,也不再需要考虑设计双处理器系统时的附加复杂性。 Blackfin DSP 系列在一个单正交指令集体系结构中为系统设计工程师提供了性能、功耗管理和使用方便等方面的优势。
|