谷歌翻译在进步,翻译们怎么看?

9月30日国际翻译日前夕Google发布新版神经机器翻译(GNMT)系统,并表示使用了最先进的训练技术,翻译质量会有较大提升。

这个消息出来后,当然引起相关人群的一阵骚动,甚至发出了‘是不是以后都不用学英语了’的感叹。尤其活跃的是过度解读这个新闻的媒体和段子手们。作为身处其中的翻译们,会怎么来看这个事件呢?

也许有些人会忧心忡忡,虽然站在他们的角度——‘人工翻译是永远不可取代的’仍然是自己的口号,但是却总有些淡淡的哀伤在撩拨着他们的思绪。这种莫名的哀伤是什么呢?其实就是对机器翻译到底能进步到什么程度不够了解,不好判断不知道未来的变化究竟怎样。最大的恐惧来自于无知。

关于GNMT

神经机器翻译(NMT: Neural Machine Translation)是一种用于自动翻译的端到端的学习方法,该方法有望克服传统的基于短语的翻译系统的缺点。不幸的是,众所周知 NMT 系统的训练和翻译推理的计算成本非常高。

GNMTGoogle Neural Machine Translation系统

已经经历10年成长的谷歌翻译这次发布的GNMT系统到底取得了什么进步呢?用一张图来直接说明效果:

来自对比评估的数据,其中人类评估者对给定源句子的翻译质量进行比较评分。得分范围是 0 到 6,其中 0 表示「完全没有意义的翻译」,6 表示「完美的翻译」。

在谷歌论文《Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》中提到,机器翻译在一些人工翻译绝不会出现的低级错误方面还有很长的路要走,例如漏词和错误翻译专有名词或罕见术语,以及将句子单独进行翻译而不考虑其段落或页面的上下文。

下面的可视化图展示了 GNMT 将一个汉语句子翻译成英语句子的过程。首先,该网络将该汉语句子的词编码成一个向量列表,其中每个向量都表征了到目前为止所有被读取到的词的含义(「编码器(Encoder)」)。一旦读取完整个句子,解码器就开始工作——一次生成英语句子的一个词(「解码器(Decoder)」。为了在每一步都生成翻译正确的词,解码器重点注意了与生成英语词最相关的编码的汉语向量的权重分布(「注意(Attention)」,蓝色链接的透明度表示解码器对一个被编码的词的注意程度)。

使用人类评估的并排比较作为一项标准,GNMT 系统得出的翻译相比于之前的基于短语的生产系统实现了极大的提升。在双语人类评估者的帮助下,我们在来自维基百科和新闻网站的样本句子上测定发现:GNMT 在多个主要语言对的翻译中将翻译误差降低了 55%-85% 以上。

现在,移动版和网页版的Google Translate 的汉英翻译已经在 100% 使用 GNMT 机器翻译了——每天大约 1800 万条翻译。GNMT 的生产部署是使用谷歌公开开放的机器学习工具套件TensorFlow 谷歌的张量处理单元(TPUTensor Processing Units),它们为部署这些强大的 GNMT 模型提供了足够的计算算力,同时也满足了 Google Translate 产品的严格的延迟要求。

来看看专业人士的点评吧:

Google翻译达到了人类翻译的水准吗?那要看在什么语言,什么领域,什么任务上。举个极端的例子,如果只是翻译单个单词,我们99.99%的人都比不过电子词典。如果只是翻译比较短的句子,训练语料里覆盖得全而且次数多的句子,机器翻译自然有优势。但要是一个全面的比较,机器翻译跟专业译员的距离相差还是很大的。其实所有的人工智能都是同样的,什么人脸识别超过人类,语义理解超过人类等等,下次再碰到这么说的公司或者媒体,别理他!活不好好干,就知道忽悠人。

翻译也是这样,机器翻译在可以预见的未来取代不了人工翻译。尤其是现在的人工翻译的市场跟机器翻译的市场基本上不重合,人工翻译对准的是高端市场,要求很精准的翻译需求,而机器翻译则是:

1. 要求不那么精准的翻译情景,比如旅游,比如网页浏览,比如信息监控等等。

2. 机器翻译帮助专业翻译人员提高效率。

如果中国对外交流的程度达到欧美现在的程度,那么中国的高端翻译市场将会是无比巨大的。有志于从事翻译的同学,放心大胆地进来吧。当然了,作为一个翻译,如果你到现在还装作看不见机器翻译的进步,还在完全排斥机器翻译,那么被市场淘汰就怨不得别人了。

点评人:加拿大国家研究委员会NRC多语言处理研究组陈博兴研究员。他1998年本科毕业于北京大学,2003年博士毕业于中国科学院声学研究所,主要研究兴趣是自然语言处理、机器翻译和机器学习。

前面对翻译质量的评分结果可以看到,拉丁语族语言之间的相互翻译的质量明显超过汉英之间的互译。

汉英翻译作为最‘难’的语言对中的一种,不但由语言本身的特点所决定,而且更多的是支撑两种语言背后的文化有着巨大的差异。

这种差异我们只需要通过为广大群众喜闻乐见的一个谷歌神翻译‘松下问童子’就可以感知一二。

机器翻译的进步不但不会让翻译市场萎缩,反而会让它更繁荣。因为机器翻译可以进一步消除基本的语言障碍,促进文化的交流。文化交流加强的结果就是翻译的市场增加了。

所不同的是,市场对翻译的质量有了更高的要求。

谷歌翻译的应用场景可能是这样的:

也可能是这样的:

还可能是这样的:

或者是这样的:

但是,人工翻译的以下这些领域,包括谷歌翻译在内的机器翻译还不能涉足:

在人工翻译领域,深谙文化的母语级的翻译也会随着翻译市场的繁荣而大幅增加,高端的场景翻译会大幅增加。

也就是说伴随着谷歌的进步,翻译也需要进步。

英译中的需求会更多,需要中国人来做英译中的外国人会更多。

中译英的需求会更多,需要外国人来做中译英的中国人也会更多!

其他语种也是一样的趋势。即使没有机器翻译来加速推动,文化交流发展方向也是逐渐向着发达和深入的方向进行的。

这也是IWORKU一直主张‘用本地人解决本地的问题’的主要原因!返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
推荐阅读