Board logo

标题: 微软项目颠覆人机交互:新版Kinect可读唇语 [打印本页]

作者: Dianzizd    时间: 2012-2-8 14:49     标题: 微软项目颠覆人机交互:新版Kinect可读唇语

尽管苹果iPhone的营收已经超越整个微软,但微软并非无所事事,其实对微软来说能维持这么大一摊子几十年也已经是一件不容易的事情了,何况微软这么多年并非完全偏安一角,Xbox、WP7、Kinect都是微软研究人员的努力成果。美国科技博客网站Techcrunch日前发表文章,介绍了微软实验室正在研发的新项目,这些项目旨在彻底变革人类与电脑的互动方式,未来的设备不仅可以读懂用户的唇语,而且具备3D桌面,提供一种更加丰富的人机互动体验。
以下为Techcrunch文章:
坐落于西雅图不同地方的微软研究实验室里,微软正在为彻底重塑人类与电脑的互动方式而努力。尽管外界对此知之甚少,而且仅仅处于原型模式阶段,但毫无疑问,这项工作正在如火如荼地开展。
人类与电脑
上周有消息称,微软正在研发将Kinect植入笔记本电脑,进而植入平板电脑,最终进入手机。此举并不仅仅是建立一个《Dance Central 3》等体感游戏安装架构,还将使我们的电子产品具备下一代识别智能。iPhone引导我们进入了一个设备触感的时代,而微软的研发将使我们进入一个设备与人类互识的新时代。
作为一个自然人,你如何感知周围的世界?最主要的方式是观察和听觉,另外还会使用触觉、味觉和嗅觉。然而,我们的设备则只局限于触觉。为何设备不能与人类一样?
一个很实际的原因在于:电脑不必像人类一样,因为电脑并非人类。多年来,这成为一个真理:数十年来电脑的主要作用就是放在那里,从事人类做不到的计算。人机互动仅仅局限于输入和输出。你只需向它发出指令,然后等待结果。
但是手机、触摸屏和笔记本电脑开始改变这一理念,使电脑更加个性化,更加具有互动性,更能够双向交流。使我们的设备更像人类的技术已经存在,为何不使用呢?
自然用户交互
这就是微软的愿景。尽管微软在科技界是出了名的守旧蓝筹股,仍然依靠上世纪90年代和本世纪初的PC爆炸式发展吃老本,但是微软拥有世界级的研发部门,他们能够酝酿出创新的理念和设备。问题在于,将这些创新理念打造成符合微软生态系统的产品并不容易,即便不是难事,微软也不具备这样的才能。
但是这项“自然用户交互”(NUI)的研发工作更加具有前景。人们已经在游戏领域运用了这一理念:Wii率先推出这种产品,随后Kinect将未来生活带入人们的起居室,尽管这种未来的体感控制有点滞后,语音控制也不尽如人意。人们一如既往地对自己与内容和设备互动的新方式感到好奇,虽然多年来不同的互动方式一直通过科幻小说和电影的方式来呈现,但人们仍然乐此不疲。
可见人们需要新的互动,微软同样需要,而且微软拥有技术。微软申请Kinect知识产权的做法极其明智,甚至超出了微软自身的想象。它首先使微软在Wii所创造的体感游戏市场收益颇丰,逐渐形成了一种全新的人机互动方式,这可以使微软在接下来几年时间里独树一帜。
有报道称,新版Kinect和深度IR传感器可以阅读唇语。乍一听,这种想法非常荒诞。为何会有这种创意?或许它可以使设备隔着房间,或者在嘈杂的环境里也能更好地理解你的语言,你不必调低音乐的音量以便在电视机或平板电脑上进行搜索或导航。
显然,这只是电子设备未来具备的一系列“感觉”的其中之一。新设备将具备面部识别和语音识别功能,这样用户的密码就可以设置为:用户用自己的声音读出密码,既不能由他人读出,也不能是打印出的密码。这些设备可以从人群中,例如在一个宴会上分辨出你的声音,可以对你的指令做出答复,因为设备可以与你进行眼神交流,也可以读懂你的唇语。当然,这听起来非常荒诞,但这确实是一种非常自然的互动方式。
3D桌面体验
另外一个功能就是3D桌面,用户可以真实地抓取文件,并对其进行拖放。当然,过去也曾经有过类似的尝试,而且Windows 8看起来是一个二维系统,因此这可能只是一个研究项目。不过这非常有趣,试想一下你的那些基本手势。例如,你可以拉开抽屉,桌面就像是一个极其具有回弹力的装满文件和文件夹的抽屉。还有什么更自然的手势呢?扬起手掌即显示任务栏?逆时针划动手指即撤消、顺时针即重做?
用户体验一方面体现了用户的需求,另一方面体现了设备的功能。近几年来,我们一直满足于用手指在玻璃面板上划动,制造出一种点状或波纹状的电子符号,这主要是由于电容屏幕性能良好,价格低廉,没有人愿意在手机上插鼠标。但是我们的新手机和信息将会有很多其它的互动方式。不久之后,玻璃触摸屏看起来就会像命令行界面一样怪异。
不过,有一些想法还处于构思阶段,我们仍然在使用很多命令行界面。鼠标和键盘更适用于办公,钢笔和纸张更适用于勾勒我们的想法,耳机则更适于在公共场合听音乐。科技还有无数的应用和潜在的应用范畴,但是要知道,某种应用方法必然会给新方法让路,或者这些方法总会有一天变得不再适用。
微软正努力在这个方面进行研究,苹果很可能同样如此,尽管苹果的研究从不对外公示。不过这一次,苹果似乎丢掉了科技蛋糕上的很大一块:微软已经在NUI领域取得了领先,至少在两年前就已经购买和开发了深度个性化的传感器。苹果当然可以随时在这个问题上投入巨资,但是很显然,微软已经争取到了这个难得的领先优势,并准备随时将其投入使用。
当然,这不能据此认为Windows 8就不再需要广告宣传,但我认为,这将成为一些即将到来的变革的试验田。微软希望改变人类与电脑的互动方式,因为它认为,过去的PC互动方式是把电脑当作一个只能计算的盒子,而这种方式正在迅速被淘汰。因此,如果电脑要想继续成为现实世界的一部分,他们就需要具备生存下去的能力。眼睛、耳朵,天知道还有什么。就在咫尺之遥的未来,人类将无法离开电脑。




欢迎光临 电子技术论坛_中国专业的电子工程师学习交流社区-中电网技术论坛 (http://bbs.eccn.com/) Powered by Discuz! 7.0.0