非特定人车载音响语音控制系统

金牌会员

Rank: 6 Rank: 6

UID: 864567

1^#

打印

字体大小: tT

rise_ming发表于 2014-3-29 16:55 | 只看该作者

非特定人车载音响语音控制系统

控制系统, 语音识别, 模型库, 语音库, 软件

关键字：车载音响语音控制
系统软件设计系统的软件包括：非特定人语音识别模块和逻辑控制模块。非特定人语音识别模块基于HMM模型算法。该算法通过对大量语音数据进行数据统计，建立识别词条的统计模型语音库，然后从待识别语音中提取特征，与模型库进行匹配，由比较匹配分数得到识别结果，并通过SDA80D51的GPIO口输出识别结果对应的词条编码信号。语音识别模块主要由信号预处理、特征参数提取、模型匹配和Viterbi算法部分组成。信号预处理部分主要完成输入语音信号的采样、模/数转换功能。A/D变换由SDA80D51内嵌12位A/D变换器实现，采样频率固定为8 kHz.特征参数提取基于语音帧，采用分帧提取特片。先对语音信号进行重叠分帧，前一帧和后一帧重叠一半（帧信号重叠是体现相邻两帧数据之间的相关性），帧长为25ms，对每帧提取一次语音特片。MFCC参数属于感知频域倒谱参数，反映了语音信号短时幅度谱的特征。p维MFCC参数的提取过程如图1所示。其中：m是帧号，N是单位帧内的采样点数。HMM是描述语音信号的一种概率统计模型，使用MarKov链来模拟语音信号统计特性的变化，HMM模型是在Markov链的基础上发展起来的。Viterbi算法是一种帧同步动态规整算法，在给定观察值序列和模型时，Viterbi算法给出了一个概率密度P（Q，O |λ）最大的状态序列。控制模块的主要功能是：在单片机查询到语音模块输出的语音词条信号后，查表获得词条编码，根据编码判断对应按键是长按或短按，分别进入相应的子程序处理，长按子程序延时1s，短按子程序延时0.2s.在子程序中，输出语音命令所对应的I/O控制信号驱动继电器吸合模拟按键或编码开关动作，并及时复位I/O口。为了避免语音控制和手动控制之间冲突，语音控制模块可以完全兼容于手动控制，在语音控制操作时，同时可以进行手动控制。

收藏分享评分

回复引用

订阅 TOP

返回列表