机器翻译“山头林立” 还难以取代人力翻译

来源:新华网
2014-07-16 15:36:18

  【技术局限】

  随着电脑运行更快、储存设备更便宜、翻译软件更智能,机器翻译的热爱者忍不住憧憬:会不会有那么一天,人们将彻底告别学习外语的苦恼,借助机器翻译,实现跨越语言障碍的自由交流?

  对于主要居住在国内、只和本国人打交道的多数人而言,机器翻译会是一个不错的选择。随着技术完善,机器翻译将更为准确可靠,足够偶尔使用外语的人使用。

  然而,人类语言如此复杂、微妙,远非平行语料库能够囊括。“如果涉及比喻或者任何诗意的语言,就非常困难,”牛津大学学者布隆索姆说,“如果用到一个翻译系统从未见过的双关语,电脑只会字面直译。”

  如果考虑各种语言的出处和文化差异,有些字词无法翻译,即所谓的不可译性现象,则根本不能指望机器翻译取代人工翻译。

  另一方面,如果完全依赖机器翻译,会出现所谓的“谷歌漩涡”现象。谷歌翻译之所以备受推崇,因为其借助网络资源摘取了海量人工翻译资源。然而,随着机器翻译应用渐广,越来越多机器翻译的“二手”材料也混入其中。

  “我们试图鉴别一段译文是否出自自己的系统,”谷歌机器翻译负责人奥赫说,“这意味着,我们将停在过去,不停地重复错误,(系统)却不停地将其显示为正确。”谷歌因此开发了一套特定网络算法,试图分辨从网络摘取的翻译资料是否出自自己的翻译系统。

  发展机器翻译的终极目标是,人类借助机器,无视语言差别,实现书面和口头的自由交流。然而,对于大部分机器翻译系统而言,口译仍然是一片鲜有涉足的“无人区”。

  “口语与书面语不同,句子里包含了不少‘嗯’、‘呃’,”剑桥大学信息工程学者比尔·拜恩说。“口语开头可能就是错的,提及以前说过的事情,当然还有些口语根本无法书面表达。”(袁原)

  相关链接:少见的机器口译

  虽然已历经数年开发,可用的口语机器翻译系统并不多,其中一种被美国军方采用。该系统储存约2500个常用语阿拉伯语译法,供驻扎伊拉克的美国士兵与当地人交流。

  谷歌的一款手机应用是大众可用的一款口译工具。这款应用植根于谷歌的网络工具,可识别17种语言。

  开启应用程序之后,主要用户对手机讲话,其语音将被录制并传送至谷歌的语音识别服务器,接着被转化为文本文件,并利用谷歌的网络工具予以翻译。翻译后的文件将再次转化为音频,经由互联网发送至用户手机。完成整个过程只需数秒。

  谷歌的这款口译应用程序不尽如人意。背景音、口音或者含义模糊都可能导致最终结果出错。除此之外,该应用还有一个致命问题:对互联网的依赖。由于处理的数据量极大,最强大、先进的智能手机都无法单独完成整个口译过程。

  “我们开发的语言模式如此庞大,以至于必须分别储存于多个电脑终端,占据许多许多许多G的内存,”奥赫说。

上一页 1 2 下一页