首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

使用 PHP 代理向音频系统提供信息 -1

使用 PHP 代理向音频系统提供信息 -1

团队主管要求您准备一份与收购 XYZ 有限公司有关的意见书。这份意见书将用在当地时间下午 4:00 整开始的会议中,这次会议要做出是否收购的决定。下午 3:50,您正在办公桌前静静地将完成的材料放到意见书中,这是计算机突然发出了声音(通过您的耳机传来):“等等,还有一条来自 BCD feed 的消息与 XYZ 有限公司有关。” 您访问 feed 阅读器,查看该信息,调整了意见书,最新的信息让与会者的印象深刻。在这种情况下,您的视力障碍根本没有任何影响。
常用术语
  • FIFO: 先入先出
  • HTML: 超文本标记语言
  • RDBMS: 关系数据库管理系统
  • RSS: 真正简单聚合
  • SQL: 结构化查询语言
  • TTS: 文本到语音转换
  • XML: 可扩展标记语言

您的优势在于有多个代理为您工作,收集和组织信息。其他人都碰巧没有读到该 feed,因为新闻几分钟就不再是新闻了。该系统没有在窗口增加一个弹出窗口,而是通过声音抓住了您的注意,这是合理的,因为屏幕对您的用处不大。         
计算机音频输出是一个有用的备用和可访问呈现机制,对于有视力障碍的人尤其如此。计算机语音的概念并不新鲜 —— 电影爱好者应该很熟悉上面引用的 “等一等” 这段语音,它来自电影 2001—太空漫游(1968),计算机用语音宣布了一项通讯阵列组件错误。但是,如今大部分计算机的输出仍然使用屏幕。
为什么 Arthur C. Clarke 和 Stanley Kubrick 选择语音交互而不是屏幕或打印展示?并不是因为有视觉障碍才更需要通过听觉而不是视觉来获取信息。           
不要打印,说出来HAL 的语音温柔而友好,快节奏的世界正需要这样的变化。语音能做很多屏幕做不到的事情,听觉也比视觉更加可靠。走路的时候您的思维也可能更加敏锐。在某种情况下,对于那些没有视力障碍的人也有优势。假设您正在监控电源供应的线路电压。屏幕上不断刷新线路情况可能无法注意到它的变化。在这种情况下,代理可以在电压正常时发出低沉的声音,而在出现问题是发出高亢的声音。蜜蜂就是这样做的:干扰它们的时候,声音就会变。只要不关闭耳机或扬声器,您就可以通过听觉获取消息。
Festival TTS 引擎Festival 是一个文本到语音转换 (TTS) 引擎。给定文本字符串,引擎将通过计算机音频系统进行朗读。(参见  了解详情)。要快速验证 Festival 安装是否运行正确,请运行 $ festival,然后运行 festival> (SayText                  "Hello world")。

但是,语音也存在一些问题。有些消息中包含字符串 "PM late",这表示下午晚些时候还是说 Prime            Minister 来晚了?人可以通过语境和思考来确定含义,但是 PHP 代理怎么做到这一点?这种情况非常复杂,但是您可以在出现问题时进行处理,就像蜜蜂,可以从各种花蜜中生产蜂蜜。
电影中的计算机 HAL 并不符合实际情况,实际上还有很多细节需要研究和准备。不管怎样,就让我们假设在某些情况下音频比文字要好,首先来了解该系统的工作方式。
mashup 概述假设云中 RDBMS 数据库包含消息。这些消息可以是文本消息,也可以是确定一段声音文件的文件名,扫描这些消息的 PHP 脚本可以智能选择 TTS 引擎(如 Festival)或音频播放器(如 MPlayer)呈现内容。新消息通过 PHP 中的脚本提交到数据库,该脚本查看各种信息源,比如 新闻 feed (XML)、网页 (HTML)、bash 脚本的输出等等,还包括一项特定的作业:在队列中构建有意义的消息。图 1 提供了这种系统的图示。
图 1. 音频系统图 1 展示了一种可能的组合。左边是输入;右边是输出。中间是云,表示系统的任何部分在物理上都可以与其余部分隔离,只需要逻辑连接。云的上下都是特殊的服务(比如数据库存储器和 HTTP 服务器),前后一致地交付消息需要这些服务。图中显示可能有多个输出 —— 例如,几个用户收到相同的消息就是这种情况。
看起来直接明了,实际上也是如此,只不过每个处理阶段还有更多的细节问题。现在让我们了解这些细节。
返回列表