标题:
语音识别电路设计图集锦 —电路图天天读(1)
[打印本页]
作者:
我是MT
时间:
2015-7-17 13:00
标题:
语音识别电路设计图集锦 —电路图天天读(1)
TOP1
语音识别控制家用电器系统电路
语音识别技术是近年来十分活跃的研究领域。语音识别系统的实用化研究是语音识别研究的一个主要方向。以玩具市场为例,具有高科技含量的电子玩具、智能玩具发展迅猛,电子互动式、智能化玩具已经成为玩具行业发展的主流。我国是玩具生产和出口大国,但在高科技玩具的发展方面和国外的差距很大,因此,及时投入精力广泛开展这方面的研究,无论对技术创新应用,还是社会经济发展,都有巨大的现实意义。与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。语音识别功能大大增加了玩具使用的乐趣,并使玩具体现出一定的智能性,因此成为大部分电子玩具、智能玩具设计中使用的关键技术。
语音模块
语音输出电路如图所示,其中VDDH为参考电压,
VSS
是系统的模拟地。音频信号由SPCE061A 的DAC引脚输出送到电路的J4端,通过音量电位器R9的调节端送到集成音频功率放大器SPY0030,经音频放大后,音频信号从SPY0030输出经 J2 端口外接扬声器播放声音。 SPCE061A内置2路10位精度的DAC,只需要外接功放电路即可完成语音的播放。图中的SPY0030是凌阳的一款音频放大芯片,可以工作在 2.4~6V范围内,最大输出功率可达700mW。 J5 都是语音输出接口,;是两针的插针外接喇叭,由
DAC
输出引脚经语音集成。
放大器SPY0030 放大,然后输出。SPY0030 是音频功率放大器。因为声音是不同振幅和不同频率的波,即交流信号电流,三极管的集电极电流永远是基极电流的β倍,β是三极管的交流放大倍数,应用这一点,若将小信号注入基极,则集电极流过的电流会等于基极电流的β倍,然后将这个信号用隔直电容隔离出来,就得到了电流(或电压)是原先的β倍的大信号,这现象称为三极管的放大作用。经过电流与电压的共同放大,就完成了功率放大。
R14
为可调电阻,当调节阻值大小事,即调节了基极的输入信号,最终影响的就是输出信号即语音输出音量的大小。SPY0030的放大倍数固定为20倍。
语音输入电路如图所示,其中VMC提供传声器的电源,A
VSS
1是系统的模拟地,
VCM
为参考电压,1脚和2脚分别是传声器X1的正极、负极的输入引脚,连接SPCE061A的MICP、NICN管脚上。当对着传声器讲话时,1脚和2脚将随着传声器输入的声音产生变化的波形,并在SPCE061A的两个端口处形成两路反相的波形,送到SPCE061A 控制器内部的运算放大器进行音频放大,经过放大的音频信号,通过ADC转化器转化为数字量,保存到相应的寄存器中。 SPCE061A的A/D转换器有8个通道,其中有1个通道是MIC-NI输入,它专门用于对语音信号进行采样。语音信号经过MCI转换成电信号,然后输入至SPCE061A内部前置放大器。由于人们说话时,麦克风距离嘴边的距离不同,语音信号的能量将会有很大的差异,此时,如果芯片的的输入信号太大或是太小都将影响识别的精度。而SPCE06lA内部就带有自动增益控制电路AGC能随时跟踪、监视前置放大器输出的音频信号电平,当输入信号增大时AGC电路自动减小放大器的增益;当输入信号减小时,AGC电路自动增大放大器的增益,从而以补偿太小或是太大的信号,以便使进入户A/D的信号保持在最佳电平,又可使削波减至最小。 SPCE061A芯片中已经集成了音频输入专用
ADC
以及
AGC
放大电路,因为此芯片外部的电路比较简单。
MICP和MICN将随着MIC产生的波形变化,并在两个端口处形成两路反相波形,在经过两级运放放大,把放大的语音信号交给
ADC
转换为数字量,这时就可以通过单片机编程对这些数据进行处理,进行语音处理识别等功能。 正如我们在前面介绍的61 板具有强大的语音处理功能,如图3-8所示,X1 是语音的MIC 输入端,带自动增益(
AGC
)控制。
SPR4096外扩Flash模块
在本系统中,当我们对系统进行训练、识别、操作时,有一些语音提示,由于SPCE061A内部只有32k字的flash空间,除了一部分空间作为程序的存储之后,剩下的用来存储语音数据时远远不够的,于是系统外扩了flash。SPR4096与SPCE061A的连接方式为:
SCK
与SPCE061A的 IOB0接,
SDA
与SPCE061A的IOB1口接。SPR4096按串行接口模式工作,要把
CF2
~
CF0
均接高电平。
CF7
为低电平时选中 FLASH,高电平时选中SRAM。 SPR4096是一个高性能的4M-bit(512×8-bit)FLASH,分为256个扇区。每个扇区2Kbyte。SPR4096还内置了以个 4K×8bit的SRAM。在进行FLASH的编程/擦除时,可以并发执行SRAM的读/写。SPR4096内置了一个总线存储器接口和一个串行接口,它允许单片机通过8-bit并行模式或者1-bit的串行模式访问FLASH/SRAM存储区。 SPR4096串行接口的工作频率可达到5MHz。SPR4096有两个电源输入端VDDI和VDDQ。VDDI是给内部
FLASH
和控制逻辑供电的;
VDD
Q是专门为I/O供电的。
供电电压VDDQ:2.25V~3.6V。SPR4096最大读电流为2mA,最大编程/擦除电流为6 mA 。SPR4096模块包括总线存储接口,串行接口,SRAM,编程与擦除控制器和一个4M的FLASH。选择串行接口时,SCLK作为时钟信号线,
SDA
作为1-bit的数据线。如果接收到FLASH的读指令或者SRAM的读/写指令,串口会把这些指令传给编程和擦除控制器,让编程和擦除控制器去完成相应操作。 串行接口模式的选中是通过CF2~CF0来实现的。当
CF2
~
CF0
均接高电平时,选中的就是串行接口模式,在串行接口模式下,
CF7
为低电平时选中
FLASH
,高电平时选中SRAM。该芯片有SIF(Serial Interface)和BMI(Busmenory Interface)两种工作方式,但DIP24只支持
SIF
方式。
欢迎光临 电子技术论坛_中国专业的电子工程师学习交流社区-中电网技术论坛 (http://bbs.eccn.com/)
Powered by Discuz! 7.0.0