首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

哈工大DSP精品讲义!!!(连载)

存储器的安排

关注:多次访问存储器(DARAM),哈佛结构,高速缓存,存储空间的大小。

开发的难易程度

为减少产品成本,可使用比较便宜的开发工具。

使用何种语言编程。选择C语言、汇编语言等。用C编写用的较多。对实时性要求高的程序,仍用汇编语 言编写。也有混合编写的。消费类产品,由于成本限制,不可能使用高性能的 DSP。

支持多处理器

雷达:高数据率和大运算量的应用系统,往往需要多个DSP,在这种情况下,DSP的连接是否容易、连接 的性能,都成为重要的因素。近年推出的DSP大都非常注意增加专门的接口或DMA通道,来支持多DSP的运行。

功耗和电源管理

越来越多的DSP用于电池供电的便携式应用(如手机 便携式播放器),许多DSP厂商都降低了DSP的供电电压,加强了电源管理功能。

成本

决定DSP的价格的主要因素之一是器件封装的价格。并不存在最好的DSP。正确的DSP选择取决于具体的应用场合对于一种应用来说是好的选择,对另外的应用则可能是很差的。

TI公司的主流产品

三大家族:2000系列、5000系列、6000系列。

0.5 .1 TMSC2000家族

TMSC2000家族,将闪存、10位A/D、CAN(控制器局域网)等各种片内外设集成在一起,主要包括 TMSC240X及TMSC28X两类产品。

主要产品为两个系列:C20X、 C240X

C20X:系列用于电话、数字相机、嵌入式家电设备等。

C240X:主要用于数字电机控制、电机控制、工业自动化电力转换系统等

0.5.1 .1 TMSC240X系列

该系列为16位定点DSP,速度: LF240X为30 MIPS, LF240XA为40 MIPS。

专为数字电机控制和其它控制系统而设计的。是当前 集成度最高、性能最强的运动控制芯片。 不但有高性能的C2XX CPU内核,配置有高速数字信号 处理的结构,且有单片电机控制的外设。 将数字信号处理的高速运算功能,与面向电机的强大控制功能结合在一起,成为传统的多微处理器单元和多片系统的理想替代品。

可用于控制功率开关转换器,可提供多电机的控制等。

C240X采用诸如自适应控制、卡尔曼滤波和控制等先进的控制算法,支持多项式的高速实时算法,因而可减少力矩纹波、降低攻耗、减少振动,从而延长被控设备的寿命,为各种电机提供了高速、高效和全变速的先进控制技术。4级流水线结构,采用改进的哈佛结构。

片内外设及存储器:

(1)双10位(双8路或单16路)A/D转换器,转换时间500nS。

(2)41个可独立编程的多路复用I/O引脚;

(3)带锁相环PLL的时钟模块;

(4)看门狗定时器模块;

(5)串行通信接口SCI与串行外设接口SPI;

(6)两个事件管理器EVA、EVB,可为所有电机类型提供控制技术,在工业自动化方面的应用奠定了基础。

* 3个具有死区功能的全比较单元;2个单比较单元;

* 防止击穿故障的可编程PWM死区控制;

* 2个16位通用定时器;

* 3个事件捕捉单元,其中2个具有直接连接光电编码器脉冲的能力;

(7)8个16位PWM通道--三相反相器控制;

(8)5个外部中断(两个驱动保护、复位、两个可屏蔽中断);

(8)CAN 2.0B模块

(9)指令集:包括信号处理指令和通用控制指令,利 用的它的为反转变址寻址能力可进行基2的FFT运算。

10)用于仿真的JTEG接口。

(11)片内存储器:32K字闪存、2.5K字RAM

0.5.1 .1 TMSC28X系列

为32位定点,速度为可达400 MIPS片内:闪存、12位A/D、CAN(控制器局域网)总线模块、SPI、 SCI等片内外设。

0.5.2 TMSC5000家族

该系列高性能、多种片内外设选择、小封装、省电。

适用:无线电通信、因特网。电源可降至0.9V 及.速 度可达600. 非常适用于:数字音乐唱机、3G电话、数字相机。

0.5.2 .1 TMSC54X系列

16位定点,功耗0.32 mw/MIPS, 32-532MIPS.

0.5.2 .2 TMSC55X系列

8-48位浮点,功耗0.05 mw/MIPS, 288-600MIPS.程序字宽度为32位.

0.5.3 TMSC6000家族

TMSC6000家族为高性能DSP.

包括: TMSC62X定点DSP系列、TMSC64X定点DSP系列、TMSC67X浮点DSP系列。

0.5.3 .1 TMSC62X系列

工作频率:150-300MHz,

运行速度:1200-2400MIPS 内部2个乘法器,6个算术逻辑单元,超长指令字 VLIW)结构,大容量的片内存储器和大范围的寻址能力,4个DMA接口,2个多通道缓存串口,2个32位片内外设。

0.5.3 .2 TMSC64X系列

工作频率:400-600MHz,

运行速度:3200-4800MIPS

具有特殊功能的指令集。

0.5.3 .3 TMSC67X系列

为高性能浮点DSP工作频率:100-225MHz运行速度:600-1350MFLOPS 具有4个浮点/定点算术逻辑单元,2个定点算术逻辑单元,2个浮点/定点乘法器。

0.6 系统的芯片集成——SOC

SOC (System on Chip) 系统集成到芯片上。是下一 代基于DSP产品的主要发展方向之一。如,具有电视质量的无线电会议、家庭娱乐设施、电子游戏等。最近,可将8个DSP核, 每个具有1亿个晶体管,集成到拇指大的一块芯片上。

2010年,可将12个DSP核, 每个具有5亿个晶体管,集成到一块芯片上。相当于将今天的笔记本集成到手表大的体积内。以移动电话为例,逐步完成了从模拟到数字式的过度,即从第一代(1G)到第二代(2G)的过渡,在很短的时间内,从2G向2.5G和3G发展。

0.6.1 2G手机简介

GSM,几乎所有的2G手机采用的基带体系结构,都是以两个可编程处理器(一个DSP和一个MCU)为基础的。目前,已逐渐将这两个处理器集成在一个芯片中。

在时分多址(TDMA)模式手机:DSP负责数据流的调制解调,利用编解码实现传输误码纠正,维持数据链路的稳定,对数据进行加密、解密、保证通信的安全性,对语音数据进行压缩和解压缩。在码分多址(CDMA)模式手机:采用扩频技术,手机功能划分的方案也就发生了相应的变化,DSP仍是手机的关键部件,负责前向纠错加密、语音压缩和解压缩,还负责控制ASIC硬件。

ASIC硬件:负责对扩频信号调制或解调及后处理。在2G手机中,上述功能由DSP硬件来实现,时钟为40MHz, 在2.5G手机,语音编码芯片较以前更为复杂,数据速率率更高,时钟已高于100MHz。在2G手机中。MCU负责支持手机的用户界面。例如,大多数采用32位的RISC内核——ARM7就是典型的代表。时钟不超过10MHz。在2.5G手机,时钟也不超过40MHz。

随着科技发展,手机的功能及实现方案也在发生变化。 目前,手机还是一个封闭的、静态的、嵌入式系统的典型,主要还是为用户建立一个语音信道,这是一个固定的、实时的、集中的DSP任务。未来的移动电话市场可能会发生分化:

传统的以语音业务为主的,会继续占有一定的市场份额。 随着互联网的发展,例如下载一个MP3应用程序,希望手机支持一个电视会议,或变为GPS辅助导航仪, 将具有类似于个人计算机的特性,变为一个应用平台。因此,手机的体系结构也将发生重大的变化。

0.6.2 3G手机简介

与2G手机相比,3G手机的体系结构将发生重大变化,多媒体数据应用日益显得重要。为将实时通信功能和用户交互式分开,TI开发了的双处理器开放式多 媒体应用平台。

50-100MIPS提高到500MIPS以上。未来的手机可能会采用多个DSP芯片,一个用来实现固定功能,嵌入式解调器,另外一个更加灵活的DSP芯片用来实现各种应用。在未来的手机中,为支持各种可下载的应用, 3G中使用的DSP体系结构和软件基础结构必须不断变化,

此时,DSP将不再是具有固定功能的嵌入式处理器而开始呈现出许多类似于通用处理器的特征,如超高速指令缓冲器和内存管理单元等功能。为实现动态任务管理,需要实时操作系统 (RTOS)。

第1章 TMS320LF240X系列DSP概述

该系列包括: 闪存:TMS320LF2402、TMS320LF2406、TMS320LF2407

ROM: TMS320LC2402、TMS320LC2404、TMS320LC2406

最具革命性产品:LF2407/ LF2407A,是当今世界上集成度最高、性能最强的运动控制DSP芯片。

1.1 DSP芯片的基本结构

1.什么是DSP芯片

DSP是一种特殊结构的微处理器, 快速实现各种数字信号处理算法。

2. DSP芯片的基本结构

(1) 哈佛结构-程序和数据分开的结构

程序和数据存储在两个不同的空间。

通用微处理器,存储器结构为冯.诺依曼结构。

程序存储器和数据存储器共用一个公共的存储空间和单一的地址和数据总线。

CPU 程序/数据存储器

哈佛结构: DSP的程序存储器空间和数据存储器空间分开,即每个存储器空间独立编址,独立访问,并具有独立的程序总线和数据总线,取指和执行能完全重叠进行。

允许数据存放在程序存储器中,并被算术指令运算指 令直接使用。 指令存储在高速缓冲器(Cache)中,当执行本指令时,不需再从存储器中读取指令,节省一个机器周期的时间。

(2)流水线操作功能

DSP芯片采用多组总线结构,允许CPU同时进行指令和数

据的访问。因而,可在内部实行流水线操作。

执行一条指令,总要经过取指、译码、取数、执行运算,需要若干个指令周期才能完成。流水线技术是 将各个步骤重叠起来进行。既第一条指令取指、译 码时,第二条指令取指;第一条指令取数时,第二 条指令译码,第三条指令取指,依次类推。
取指 译码 取数 执行

(3)专门的硬件乘法器和乘加指令MAC

在数字信号处理的算法中,乘法和累加是基本的大量运算,占用绝大部分的处理时间。例如,数字滤波,卷积,相关,向量和矩阵运算中,有大量的乘和累加运算。。PC机计算乘法需多个周期用软件实现,而DSP设置了硬件乘法器以及乘加指令MAC,在单周期内取两个操作数一次完成。

(4)特殊的处理器指令

采用特殊的指令。

例如MOV指令,把指令的数据复制到该地址加1的地址中,原单元的内容不变----数据移位,相当于延迟。另一特殊指令LTD,在一个指令周期完成LT、DMOV和APAC三条指令的内容。

(5) 高速的指令运行周期

DSP指令周期可为几ns,LF2407A为40ns 。

(6) 丰富的片内存储器件和灵活的寻址方式

片内集成FLASH和双口RAM,通过片内总线访问这些存储空间,因此不存在总线竞争和速度匹配问题,大大提高数据的读/写速度。

(7) 独立的直接存储器访问(DMA)总线及其控制器

DSP为DMA单独设置了完全独立的总线和控制器。

1.2 TMS320系列DSP概述

该系列包括:定点、浮点、多处理器DSP和定点DSP。体系结构专为实时数字信号处理而设计。

TI公司从1982年推出:

第一代 TMS32010、TMS32011等。

第二代 TMS32020、TMS320C025(改进型TMS320C2xx)

第三代 TMS32030、TMS320C32等。

第四代 TMS32040/TMS320C44等。

第五代 TMS3205x/TMS320C54x等。

第六代 TMS32062x/TMS320C67x等(速度最快)。

TMS320C8X:内有多个DSP

三大系列:2000、5000、6000。

同一代的器件有相同的CPU结构,但片内存储器和外设配置不同。

1.3 TMS320LF240x系列 DSP控制器

专为数字电机控制和其它控制系统而设计的。是当前集成度最高、性能最强的运动控制芯片。

不但有高性能的C2XX CPU内核,配置有高速数字信号

处理的结构,且有控制电机的外设。

它将数字信号处理的高速运算功能,与面向电机的强大控制功能结合在一起,成为传统的多微处理器单元和多片系统的理想替代品。

主要用途:

(1)电机(交流伺服、直流永磁、开关磁阻)的鲁棒 控制器。

(2)无刷电机的全变速控制。

(3)使用先进的算法可降低传感器的数量。

(4)汽车电子制动系统。

5)多电机系统的单处理器控制。

(6)与控制算法处理一起完成电源开关转换的控制。

处理速度: LF240x为30MIPS,LF240xA为40MIPS。

240X采用诸如自适应控制、卡尔曼滤波和控制等先进

的控制算法,支持多项式的高速实时算法,因而可

减少力矩纹波、降低攻耗、减少振动,从而延长被

控设备的寿命,为各种电机提供了高速、高效和全

变速的先进控制技术。

4级流水线结构,采用改进的哈佛结构。

指令系统: 信号处理指令、通用控制指令。

源代码和目标代码与24x同代产品兼容,源代码与C2x

兼容,且与C5x向上兼容。利用它的为反转变址寻

址能力可进行基2的FFT运算。

片内外设及存储器等资源:

PLLF

PLLVCCA

DARAM(B0) PLLF2

256字 PLL时钟 XTAL1/CLKIN

XTAL2

XINT1/IOPA2

RS C2xx

CLKOUT/IOPE0 DSP

TMS2 DARAM(B1) ADCIN00-ADCIN07

内核 ADCIN08-ADCIN15

BIO/IOPC1 256字 VCCA

MP/MC

10-bit ADC VSSA

BOOT EN/XF

具有双排序器 VREFHI

VREFHO

XINT2/ADCSOC/IOP

DARAM(B2) D0

32字

SCITXD/IOPA0

SCI SCIRXD/IOPA1

VDD(3.3V)

VSS SARAM 2K字 SPISIMO/IOPC2

SPISIMI/IOPC3

SPI SPICLK/IOPC4

SPISTE/IOPC5

TP1 Flash/ROM CANTX/IOPC6

TP2 32K字 CAN CANRX/IOPC7

VCCP(5V)

4K/12K/12K/4K

WD

Port A(0-7) IOPA[0:7]

Port B(0-7) IOPB[0:7]

A0-A15 数字I/O Port C(0-7) IOPC[0:7]

D0-D15 Port D(0) IOPD[0]

PS,DS,IS 与其它引脚共享 PortE(0-7) IOPE[0:7]

R/W PortF(0-7) IOPF[0:6]

RD

READY 外部存储器接口 TRST

STRB

TDO

WE

TDI

ENA 144

JTAG端口 TMS

TCK

VIS OE

EMU0

W/R/IOPC0

EMU1

PDPINTA PDPINTB

CAP1/QEP1/IOPA3 CAP4/QEP3/IOPF7

CAP2/QEP2/IOPA4 CAP5/QEP4/IOPF0

CAP3/IOPA5 CAP6/IOPF1

PWM1/IOPA6 事件管理器A 事件管理器B PWM7/IOPE1

PWM2/IOPA7 PWM8/IOPE2

PWM3/IOPB0 * 3个捕获输入 * 3个捕获输入 PWM9/IOPE3

PWM4/IOPB1 PWM10/IOPE4

PWM5/IOPB2 * 6个比较/PWM输出 * 6个比较/PWM输出 PWM11/IOPE5

PWM6/IOPB3 * 2个定时器/PWM * 2个定时器/PWM PWM12/IOPE6

T1PWM/T1CMP/IOP T3PWM/T4CMP/IOP

T4PWM/T4CMP/IO

B4 F2 B5 F3

TDIRA/IOPB6 TDIRB/IOPF4 TCLKINA/IOPB7 TCLKINB/IOPF5


(1)双10位(双8路或单16路)A/D转换器,转换时间500nS。

(2)41个可独立编程的多路复用I/O引脚;

(3)带锁相环PLL的时钟模块;

(4)看门狗定时器模块;

(5)串行通信接口SCI与串行外设接口SPI;

(6)两个事件管理器EVA、EVB,可为所有类型电机提供控制技术,在工业自动化方面的应用奠定了基础。

* 3个具有死区功能的全比较单元;2个单比较单元;

* 防止击穿故障的可编程PWM死区控制;

* 2个16位通用定时器;

* 3个事件捕捉单元,其中2个具有直接连接光电编码器脉冲的能力;

(7)8个16位PWM通道--三相反相器控制;

(8)5个外部中断(两个驱动保护、复位、两个可屏蔽中断);

(9)CAN 2.0B 模块

(10)用于仿真的JTEG接口。

(11)片内存储器:32K字闪存、2.5K字RAM

返回列表