首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

非特定人车载音响语音控制系统

非特定人车载音响语音控制系统

关键字:车载音响   语音控制   
系统软件设计系统的软件包括:非特定人语音识别模块和逻辑控制模块。非特定人语音识别模块基于HMM模型算法。该算法通过对大量语音数据进行数据统计,建立识别词条的统计模型语音库,然后从待识别语音中提取特征,与模型库进行匹配,由比较匹配分数得到识别结果,并通过SDA80D51的GPIO口输出识别结果对应的词条编码信号。语音识别模块主要由信号预处理、特征参数提取、模型匹配和Viterbi算法部分组成。信号预处理部分主要完成输入语音信号的采样、模/数转换功能。A/D变换由SDA80D51内嵌12位A/D变换器实现,采样频率固定为8 kHz.特征参数提取基于语音帧,采用分帧提取特片。先对语音信号进行重叠分帧,前一帧和后一帧重叠一半(帧信号重叠是体现相邻两帧数据之间的相关性),帧长为25ms,对每帧提取一次语音特片。MFCC参数属于感知频域倒谱参数,反映了语音信号短时幅度谱的特征。p维MFCC参数的提取过程如图1所示。其中:m是帧号,N是单位帧内的采样点数。HMM是描述语音信号的一种概率统计模型,使用MarKov链来模拟语音信号统计特性的变化,HMM模型是在Markov链的基础上发展起来的。Viterbi算法是一种帧同步动态规整算法,在给定观察值序列和模型时,Viterbi算法给出了一个概率密度P(Q,O |λ)最大的状态序列。控制模块的主要功能是:在单片机查询到语音模块输出的语音词条信号后,查表获得词条编码,根据编码判断对应按键是长按或短按,分别进入相应的子程序处理,长按子程序延时1s,短按子程序延时0.2s.在子程序中,输出语音命令所对应的I/O控制信号驱动继电器吸合模拟按键或编码开关动作,并及时复位I/O口。为了避免语音控制和手动控制之间冲突,语音控制模块可以完全兼容于手动控制,在语音控制操作时,同时可以进行手动控制。
返回列表