異想天開——老妈用异想天开这个词评价过我,刚好我觉得这个词很合适自己。无论是字面意思还是更深层的含义,在当今竞争如此激烈的大环境下,不懂得异想又如何会天开呢!

2008年11月20日 星期四

让机器读懂人类语言

既然机器无法像人类那样智能,那么人类就得遵循机器的规则,受制于机器。《人本界面》一书中阐述过这一观点,我很赞同,在此同时也从不同角度去思考如何解放我们的手、如何解放我们的眼睛,从而解放了我们的身体甚至心理。这一切又在日益更新的新产品中被表现出来,多触点的显示器,和iPhone语音搜索软件就是代表,并且得到了更多的技术支持,如无线网络,和云计算。可这远远不够的,在接下来的日子,我们将见证更巨大的数据流和更丰富的数据可用元素。

什么是丰富数据的可用元素,可以想象一下,我们更希望在假日陪恋人出游的时候,漫步沙滩的同时随时获取订阅的更新(感兴趣的信息),但不是用眼睛看,而是听,因为此时此刻眼睛应该欣赏着美丽的海景;明天就要召开年度重要会议了,我可没时间敲打键盘,因为要准备的资料实在太多了,我很自信我的嘴巴的速率绝对更快更直接。从表面看这似乎是改变了输入输出的方式而已,但是背后却有大量的工作要做。需要正确的文字与语音的映射关系,前后文的关联,匹配句子都是当前在尝试的方式(Google金山词霸)。这看起来很像翻译,从另一个角度看,这不正是机器理解(翻译)人类语言么。这只是一个循环,从留声机到电视机,人类努力创造更方便地获取资讯的方式,然而巨大的数据量对我们产生了压力。对,是时候返璞归真!因为以前的机器无法识别人类语言,所以我们才要用键盘,长时间的坐在电脑旁,现在应该让机器读懂我们的语言。这不是过河拆桥而是建立更直接抵达目标的方式,云计算给我们带来的契机。

像二进制一样的另一个进制,或者只是二进制的一层外衣。无论如何,使用算法,甚至很多层算法,使语音与文字之间相互映射,然后得到的是机器与人类更进一步的沟通能力。视频与音频将自动生成“字幕”,像DVD的多声道一样,只不过存储在数据库中,然后又成为新Resource(资源),当然重复使用之。
这个庞大的循环。


好啦,除了消化和创建信息的方式改变了之外,我们还得到了什么。
  • 我不再需要学英语。各种语言互通即时翻译。(即便我心情好愿意学英语,也将由我喜欢的声音与我互动)
  • Google算什么,搜索更简单,更准确。或者应该改名叫深索,因为可以搜索到视频、音频文档的内容。
  • 真正智能化的时代,遥控将被淘汰。一句Hifi stop可以停掉大厅的HIFI播放器。当然你也可以用中文讲
  • 工作和生活方式再一次被颠覆。
  • 新的数码伴侣设备
  • ...
社会问题:
  • 翻译们全部下岗
  • 伪造声音进行诈骗
  • 大量的霍金出现(人类的惰性)
  • ...
看似一大步,其实并不真的有多大。人机之间的默契还有很大的提升空间。只不过,永远需要我们记住的是机器只是工具,只是协助人类的伙伴。或许会改变我们的习惯、会使我们依赖,但永远无法也不要代替人类,这也是我不想看到的。

短期内我将不会去实现他,但我坚信这将在不久之后被实现,因为科技的发展不是倍增,而是以n次方的倍率在发展,谁能保证明天醒来今天的某项技术已被淘汰呢。事实上我希望我能参与这一过程,只不过我即将毕业需要为生活费而奔波、我不懂英文、我编程刚刚入门、我文凭不高、我没有很多钱、我还太年轻、我没有经验。我希望我们都能看到。

0 评论:

发表评论

请选择 名称/网址 网址可不填