加入收藏 | 设为首页 | 会员中心 | 我要投稿 源码网 (https://www.900php.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 人物访谈 > 专访 > 正文

专访 Google Brain 工程师,谷歌神经网络翻译会是机器翻译的极限吗?

发布时间:2016-11-17 23:28:28 所属栏目:专访 来源:极客公园
导读:副标题#e# Google 翻译毫无疑问是目前最好的机器翻译工具没有之一,如果还有什么能够超越 Google Translation 那也一定是它自己。 当两天前 Google 推出了全新的整合神经网络的翻译工具——GNMT(Google Neural Machine Translation)谷歌神经机器翻译系统,

而其实早在三年前 Google brain 就很想做了这件事了,但当时软件和硬件都不能够很好的支持,直到后来开发出了 Tensorflow 使得训练类似的模型可以充分利用分布式计算,利用很多很多不同的硬件类型。另外,一些专门的硬件加速器也帮助在短时间内完成这个训练,所以很大一部分原因是因为过去两三年 Google 在机器学习、在人工智能方面的巨大投入,使得类似的操作才变得可行。

来自 Google Brain 的软件工程师陈智峰也表示到目前为止 Google Allo 和 Gmail Inbox 都已经开始不同程度使用 GNMT,并且 GNMT 的底层技术模型是可以运用到很多领域,很多产品都在这个基础模型上都可以做出针对性优化。

虽然已领先时代,但仍有缺陷

虽然 GNMT 已经可以算是领先于整个时代,但机器翻译的缺陷还远未得到完全解决,GNMT 仍然会做出一些人类翻译者永远不出做出的重大错误,例如漏词和错误翻译专有名词或罕见术语,这类重大错误往往是因为训练数据里的缺陷,例如「LinkedIn 领英」,如果词库里没有 catch up 上这个特有词汇,翻译时就会出错。

另外就是虽然现在 GNMT 已经可以将句子作为翻译单元,在翻译时考虑整个句子中每个字的前后关联,但 GNMT 将句子单独进行翻译时还是无法考虑到其段落或页面的上下文的关系。

机器翻译的极限在哪?

机器翻译的极限是完全代替人类吗?答案是:并不能全部取代。

要试图解决这个问题,首先横在面前的就是深度学习基础算法结构的能力限制,虽然Deeplearning 就是指层数更多,但这并不意味着更深层、更多的网络获得更好的效果。

虽然按照逻辑应该是模型随着深度的增加会更强大,但实际中随着层数的增加每次运行的计算量也会指数级增加,当超过一定的量级反而使得使用反应速度下降,所以在目前计算能力没有质的突破的情况下,现实情况下有不同的考虑,并不是越多层越多网络就能带来越强大的深度学习能力。

那这是否意味着目前 GNMT 已经到达了机器翻译的极限呢?

陈智峰的回答是:「还没有。」

好在现有的深度学习 RNN 模型还有很多可开发的空间,例如让模型变得更大或者层数增加,同时在该领域每年也都有新的模型出现,深度学习的模型也会不断迭代,所以 GNMT 目前的技术还远未到极限,更加不会是机器翻译的极限。

对于类似面对更标准化的科技、医学等等固定且有成文规则的文章机器可以更快翻译,准确率也更高,同时像是更注重信息类的新闻翻译做的比较好。

完全替换人的翻译有一定难度,且很有可能是无法实现的,因为现有的机器翻译都是针对现在已经出现过的语言现象,但面对不断出现不断发展的语言来说还是需要人来不断创造新词汇或赋予词汇新含义。

(编辑:源码网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读