“文字的历史大约只有5000多年,语音的历史则至少有20万年。”李彦宏在去年百度世界大会曾强调的语音技术发展,表面上看是回归自然和原始。而从移动互联网时代的大趋势来看...
文字的历史大约只有5000多年,语音的历史则至少有20万年。 李彦宏在去年百度世界大会曾强调的语音技术发展,表面上看是回归自然和原始。而从移动互联网时代的大趋势来看,其表现为 语音和图像将逐渐取代传统的电脑键盘输入,成为消费者需求表达的主要方式。近来百度已在该领域持续发力,最近的表现是其依靠语音交互 翻译技术开发的小度机器人正矢志打破语言障碍。
贴身翻译 背后:无缝人机交互之难
《星球大战》中话痨型机器人C-3PO令人拍案叫绝的翻译能力如今真的成功被百度人工智能复制了!近日举办的第十届中国电子信息技术年会上,曾在江苏卫视《芝麻开门》勇闯全关的小度机器人,此番化身 贴身翻译 再惊艳亮相,多语种即时翻译令来宾倍感惊讶。理所当然的,小度机器人背后由百度牵头研发的机器翻译项目获得了科技进步奖一等奖。
简单地讲,机器翻译就是用软件将文本或语音翻译成其它语言。全世界共有超过 6000 种语言,各国科技巨头们不断尝试用机器翻译弥合人与人之间的沟通障碍,从而实现旅游、外贸活动、在线电商等服务的最终使命。然而往往事与愿违,实现像小度机器人这样 贴身翻译 无缝的人机交互技术背后总是艰难重重。
最常见的例子比如,我们日常经常接触到的便是在线翻译,缺陷显而易见。不顾语法和上下文语境地翻译语句让机器翻译更多地只是扮演 词典 而非 翻译 的角色。事实上,机器算法和语言文学性是一对天生不可调和的矛盾,翻译程序化是机器翻译的本质。机器本身侧重翻译效率,但是语言本身充满情感,机器无法准确翻译包括人性化语法、语义等也在情理之中。除非,依靠一个庞大的数据库,让机器不断学习从而更加理解人。
小度机器人的成功表现正是得益于此,通晓万族语言必然离不开将个体与后台海量的数据库匹配,从而得出答案。作为世界人口最多国家的第一大搜索引擎,百度在发展大数据领域具有非常好的天然优势。百度翻译API目前有近万个开发者接入,日均访问量近亿次。与此同时,作为百度大数据引擎的精华,百度大脑融合了全球领先的深度学习算法、数据建模、大规模GPU并行化平台等技术,实现了无时无刻不在学习与成长,它拥有200亿个参数,构造起世界上最大的深度神经网络。
百度智能未来:用户步步逼近 零成本
当对云端尤其是移动云端模式的深度探索和完善后,爆发潜能的百度将一步步逼近智能。尤其当百度逐一将文本、语音、语义、图像、人脸识别等技术打通结合后,百度将迎来李彦宏强调的 技术奇点 。
而进化中的百度,正不断从学习、生活的方方面面帮助用户:最初搜索让用户省却翻阅书海的漫长仅靠输入关键词便可从机器上获得答案;而后,当百度语音输入、图像识别技术成熟后,用户进一步解放了双手。
百度机器翻译技术的跃进则意味着,其将积极地清除着用户文化交流中的语言壁垒。与百度过去大多数技术不同的是,百度自诞生起的最大价值在于力图无缝对接人和信息,而机器翻译则可能要更多地服务于人与人。想象一下,除了小度机器人的智能机器人表现形态外,倘若未来可以将翻译云平台与社交、聊天平台打通的话,就可以实现来自不同国家的小伙伴们进行基于文本、语音、视频的友好沟通服务,从而终结神话传说中从巴比伦通天塔倒塌以后开始的人类语言不通的历史。
每一次科技的进阶都在不断满足人类的生物本能式需求。对于百度也是如此,每一次布局的策源地都在于用户,推动用户在人机交互成本和时间上不断接近 零努力 。再往后可以猜想下,百度人工智能还要更多地模仿人类的细微情感而非识别或模仿人类的行为或声音。在笔者看来,或许,最理想的人机交互是不是还要继续解放其它感知器官,仅通过脑电波便可以实现人机交互?
(文王小琉)
科技在线遵循行业规范,网站刊载的所有文稿、图片文件均为用户自行上传或转载,为传播更多的信息之目的。其相应的版权归原所有人所有,如以上内容涉及到您的合法权益,请用电子邮件通知我们及时处理。