首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

语音信号的时域分析

语音信号的时域分析

对语音信号分析的最自然最直接的方法是以时间为自变量进行分析。
语音信号典型的时域特征包括短时能量,短时平均过零率,短时自相关系数,短时平均幅度差。
浊音和清音之间激励的变化,会使信号峰值幅度有很大的变化,在浊音范围内基频有相当大的变化。

短时能量分析:
语音信号的能量随着时间变化比较明显,一般轻音部分的能量比浊音部分的能量小得多,窗函数的选择对短时能量表示方法的特点起决定作用。
短时能量主要有以下几个方面的应用:首先利用短时能量可以区分清音和浊音,因为浊音的能量要比清音的能量大得多;其次可以用短时能量对有声段和无声段进行判定,对声母和韵母分解,以及对连字分界。在语音识别系统中,短时能量一般也作为特征中的一维参数来表示语音信号能量的大小和超音段信息。


短时平均过零率
语音信号时域分析中最简单的一种特征,他是指没阵内信号通过零值的次数,连续语音信号,可以考察期时域波形通过时间轴的情况。离散信号,短时平均过零率实质上就是信号采样点符号变化的次数。短时平均过零率可以用于语音信号的分析。浊音时的能量集中在低频段,清音时的能量集中在高频段,可以一定程度上反应频率的高低,在浊音段有较低的过零率,在清音段有较高的过零率。

可以讲短时平均过零率和短时能量结合判断语音起止点的位置,即进行端点检测。背景噪音小,短时能量比较准确,大时,短时平均过零率可以获得较好的检测效果。一般的识别系统,其前端的端点检测过程都是将这两个参数结合用于检测语音是否真的开始。另一个用途是作为语音频域分析的一个中间步骤,不同窗口型的低通滤波器来处理过零,而改用多通道的带通滤波器,这使得输出就是频域的短时平均过零率,如果再加上用带通滤波器的短时能量的输出,就可以得到语音信号的频域分析结果。
容易受到低频的干扰,将过零率的含义修改为跨过正负门限的次数。

自相关函数
相关函数用于测定两个信号在市域内的相似程度,可以分为互相关函数自相关函数。互相关函数研究两个信号之间的相关性。自相关函数研究信号本身的同步性、周期性。自相关函数提供了一种获取周期性信号周期的方法。
短时自相关函数:短时自相关函数是在信号的第n个样本点附近用短时窗截取一段信号,做自相关计算所得的结果。如果为浊音型的周期信号,从自相关函数的性质可知,其短时自相关函数也呈现明显的周期性,和原本信号的周期性相同。清音属于随机噪声,短时自相关函数不具有周期性,随着k增大而逐渐减小。还可以用修正的短时自相关函数(严格说是互相关函数)。

短时平均幅度差函数,可用于基音周期的检测。


在语音识别中,正确的判断输入语音的起点,重点对于提高识别率往往是非常重要的,在一些语音识别或低速语音编解码器应用中,对于已经判别为语音段的部分,还需要进一步判断清音和浊音。
能够实现这些判决的集聚在于,不同性质语音的各种短时参数具有不同的概率密度函数,以及相邻的若干帧语音应具有一直的语音特性。
在孤立词语音识别系统中,需要正确判断每个输入语音的起点和终点,利用短时平均幅度参数M和短时平均过零率Z可以做到。采用短时平均过零率原因在于,以前可能是一段清辅音,能量相当弱,依靠能量不可能将他们与无声段分开。对于清辅音,他们的过零率明显高于无声段,因而能用这个参数区分。

在没有背景噪声的情况下,无声段将不会穿越这一提高的电平,因而可以正确区分清音和无声段。还可以基音周期是否存在判断浊音和清音。
继承事业,薪火相传
很好的分析贴,感谢楼主的分享
返回列表