首页
|
新闻
|
新品
|
文库
|
方案
|
视频
|
下载
|
商城
|
开发板
|
数据中心
|
座谈新版
|
培训
|
工具
|
博客
|
论坛
|
百科
|
GEC
|
活动
|
主题月
|
电子展
注册
登录
论坛
博客
搜索
帮助
导航
默认风格
uchome
discuz6
GreenM
»
消费电子
» 电视机智能声控选台系统设计与实现
返回列表
回复
发帖
发新话题
发布投票
发布悬赏
发布辩论
发布活动
发布视频
发布商品
电视机智能声控选台系统设计与实现
发短消息
加为好友
rise_ming
当前离线
UID
864567
帖子
4448
精华
0
积分
2224
阅读权限
70
在线时间
123 小时
注册时间
2011-12-12
最后登录
2014-8-25
金牌会员
UID
864567
1
#
打印
字体大小:
t
T
rise_ming
发表于 2013-4-30 22:59
|
只看该作者
电视机智能声控选台系统设计与实现
电视台
,
频道
,
语音
标签:
遥控发射 MIC
随着电视频道数目的日益增多,传统的电视遥控方法弊端越来越明显。它需要观念记忆大量电视台对音识别芯片TSG410设计了一个彩电智能声控选台系统,可以较好地解决记忆频道这个难题。尤其对列疾朋友来讲,更具有特殊的意义。
该系统不对彩电做任何改动。在保留原有遥控功能的基础上,实现语音控制选台,主要功能有:
开关电视:电视接通电源处于待命状态,操作者发出“开机”命令,则打开电视机;操作者发出“关机”命令,则关掉电视机;
;选台功能:操作者想看XX电视台的节目,只要发出“XX台”的命令,电视机自动跳转到该台。
识别主人功能:日防止识操作,该系统只能事先录入命令样本的操作者语音敏感,其他人发出的命令包括电视伴音均无效。
其它功能:具有电视音量、画面亮度调节等适合语音控制的功能。
1 系统设计方案
我们最初考虑了两种设计方案(见图1和图2),它们各有优缺点。第一种电路不足之处是:电路稍复杂一点,而且要对电视机的选台控制电路做必要的改动(当然这对电视机生产厂家是不成问题的);其优点是:只需一个无线话筒便可声控选台,且不必对准电视机,甚至在另一个房间也可实现遥控。第二种电路的优点是:不必对电视机的选台控制电路做任何的改动;缺点是:所有电路只能靠电池供电,芯片选择要考虑耗电和工作电压问题。由于采用红外遥控发射来控制电视,该系统须对准电视机才能正常工作。综合考虑各方面因素,我们认日第二种设计方案切实可行。
2 各个功能模块简介
2.1 语音命令提取单元
语音命令提供该单元(如图2)在电视话音和其它噪音背景下,完成提取出操作者语音命令功能,其示意图如图3所示。
MIC选用驻极体送话器,它具有结构简单、重量轻、体积小、频率响应宽、保真度好等优点,但灵敏度较低,必须再加放大器才行。由于输出阻抗可高达10 8Ω数量级,所在必须进行阻抗变换后才能与放大器配合使用。放大器采用差分放大电路,一个驻极体送话器面对送话者,其输出接送放大器正向输入端;另一个驻极体送话器背对送话者,其输出接放大器负向输入端。由于两个送话器相对于电视机和其它噪声源的位置基本一样远,可以近似认日通过二者输入的干扰是一样的。但考虑到送话器具有方向性,前者送入的操作者语音命令远远大于后者,适当选择各电阻值可以抵消掉各种干扰。放大器采用运放(OPAmps)MAX495(单电源供电+2.7~+6V)。
2.2 语音识别单元
语音识别单元主要由TSG410和非易失性SRAM组成,大体构成如下图4所示。
语音识别功能由专用语音芯片TSG410完成,TSG410是一种新颖功能齐全的语音识别集成电路。它采用CMOS大规模集成电路制作工艺制造,内含除SRAM以外语音识别所需的全部电路,如CPU、A/D转换器、ROM、语音放大器、压缩器、滤波器、振荡器及接口电路等。TSG410具有双列直插和贴片两种封装方式,可工作在CPU控制和人工控制两种模式下。语音识别的响应时间典型值日300ms,最长不超过600ms。
识别容量大,最多可识别40个字段,且分段方式灵活。为了CPU管理方便,将40个字段分成四组,编号为1~4,每组10个段。这样,第一个字段编号为10,第二个为11,第三个为12…依次类推,第40个字段编号为49。在操作显示时,十位数显示组号,个位数显示序号。因此,建立语音样本时,应注意显示数字和电视机选择频率之间的换算关系,以免语音命令和控制结果对应不起来。各段功能分配如表1所示。
TSG410的每个字段时间长度可以在0.9s和1.92s之间选择。按正常人的讲话速度,每秒吐字2~4个,如选择0.9s,则每个命令字段以1~3个字为宜,选择1.92s则最大容量为8个汉字,但可识别的字段数减少为20个。我们选择胶一种分段方式,语音命令以3个字以下为宜。因此,电视选台命令采用“地方”命名原则,如:山东、上海等,中央台可直接叫“一台”、“二台”,依次类推。语音命令差别越大越不容易出现错误识别。系统要正常工作,必须首先建立语音样本,为防止语音样本因为掉电丢失,SRAM选用内带掉电保护电池的非易失性SRAM,即NVSRAM(non-volatile SRAM),如HK1125,掉电后其数据可保存10年以上,用法同普通RAM。
一般情况下,留有30个预选频道是足够用的。实际上,既可以采用多片TSG410进行频道数和允许操作者人数扩展方式满足各种需要,也可以采用让TSG410工作在CPU控制方式的办法。此时识别容量不受40字段限制,但需增加单片机(如8031)作控制用。
2.3 控制面板
为了能输入字段号,以便建立语音样本,RSG410配置了外接键盘扫描电路。行、列信号的输入、输出口由芯片的S1~S3、K1~K3担当。这样一个三列、四行的键盘共有12个按键,其中十个定义为:0~9数字键,一个定义为:语音样本建立键(TRN),一个定义为:语音样本清除键(CLR)。由于控制面板只在建立语音样本时使用,为防止误操作,应将12个按键用塑料外亮封起来。
2.4 操作指示电路
采用两片数码管和译码驱动电路CC4558组成操作指示电路。在本系统中,操作指示电路作用是:建立语音命令样本时,用于显示存入的字段号;语音命令识别时用于显示识别结果及芯片识别结果的处理报告。
收藏
分享
评分
回复
引用
订阅
TOP
返回列表
电商论坛
Pine A64
资料下载
方案分享
FAQ
行业应用
消费电子
便携式设备
医疗电子
汽车电子
工业控制
热门技术
智能可穿戴
3D打印
智能家居
综合设计
示波器技术
存储器
电子制造
计算机和外设
软件开发
分立器件
传感器技术
无源元件
资料共享
PCB综合技术
综合技术交流
EDA
MCU 单片机技术
ST MCU
Freescale MCU
NXP MCU
新唐 MCU
MIPS
X86
ARM
PowerPC
DSP技术
嵌入式技术
FPGA/CPLD可编程逻辑
模拟电路
数字电路
富士通半导体FRAM 铁电存储器“免费样片”使用心得
电源与功率管理
LED技术
测试测量
通信技术
3G
无线技术
微波在线
综合交流区
职场驿站
活动专区
在线座谈交流区
紧缺人才培训课程交流区
意见和建议