语音接口技术浅析

金牌会员

Rank: 6 Rank: 6

UID: 1062083
性别: 男

1^#

打印

字体大小: tT

yuchengze发表于 2017-10-19 14:12 | 只看该作者

语音接口技术浅析

语音接口已经成为一个改变人机交互方式的全新切入点。这些系统如何工作?打造这样一款设备在硬件方面有什么要求?随着语音控制接口变得越来越普及，德州仪器(TI)的一位工程师对此技术进行了深入的了解，并分享了其对这项技术的认识和看法。
语音接口是什么?
语音识别技术自20世纪50年代起开始出现在我们身边。那时贝尔实验室的工程师创建了一款可以识别单个数字的系统。然而，语音识别只是完整语音接口技术的一部分。语音接口包含传统用户接口的所有方面：它能呈现信息并为用户提供一种操控方式。在语音接口中，操控、甚至一些信息的呈现都将通过语音实现。在一些如按钮或显示屏等传统的用户接口上，也可能配置语音接口这一选项。

大部分人遇到的第一款语音接口设备很有可能是移动电话，或者是个人电脑上非常基础的将语言转换成文字的程序。然而，这些设备的运行都非常缓慢、识别不精确且可识别的词汇有限。
那是什么将语音识别从一种附属性功能变成了计算机世界炙手可热的技术呢?首先，如今的计算能力和算法性能都有显著的提高(如果你对隐马尔科夫模型有所了解，对此你会有更直观的认识)。其次，云技术和大数据分析的应用也改进了语音识别效果，并且提高了识别的速度和准确性。
为你的设备添加语音识别功能
一些人常常会对如何为项目添加某种语音接口存在疑问。实际上，TI供应几种不同的语音接口产品，包括ARM?处理器的Sitara?系列产品和C5000? DSP系列产品，这些产品都具备语音处理的能力。两种系列的产品各有千秋，分别适用于不同的应用。
在选择DSP和ARM这两种解决方案时，考虑的关键因素在于这款设备能否或将如何利用云语音平台。当中有三种应用场景：第一种是离线，所有的处理过程都在本地设备上发生。第二种是在线，通过基于云端的语音处理设备，如亚马逊的Alexa，谷歌助手或IBM Watson;第三种是两者混合。
离线：车载语音控制
从目前的发展趋势来看，人们似乎希望所有事物都能够连接至互联网。然而，无论是出于成本考虑或是缺乏可靠的网络连接，在某些应用中，连接网络的意义其实不大。在现代的汽车应用中，许多娱乐信息系统就采用了离线语音接口系统。这些语音接口系统通常只能使用有限的命令集，如“拨打电话”、“播放音乐”和“提高或降低音量”。虽然传统处理器的语音识别算法取得了重大进展，但仍有不尽如人意之处。遇到这样的情况，例如C55xx等DSP可能够为系统提供最佳的性能。
在线：智能家庭中枢
关于语音接口的很多热议主要围绕于例如Google Home和亚马逊 Alexa等互联设备。由于亚马逊允许第三方进入其已配备Alex语音服务的语音处理生态系统，他们在这方面的发展备受瞩目。另外，如Microsoft Azur等其它的云服务也可以提供语音识别服务和类似功能。值得注意的是，这些设备的声音处理过程全部发生在云端。
是否值得为了这种便捷的集成而向语音服务供应商提供上行数据完全取决于用户。但是，云服务供应商承担了主要的工作，设备商需要做的很简单，实际上，由于接口的语音合成部分也发生在云端，Alexa只要完成最简单的功能，即播放并记录录音文件。既然不需要特别的信号处理功能，ARM处理器足以处理接口工作。这意味着，如果你的设备已配备ARM处理器，你就可能集成云计算语音接口。

收藏分享评分

回复引用

订阅 TOP

返回列表