来源:经济学家圈
来源
InfoQ
编者按:近日,黄国平博士论文《致谢》刷屏。文中,黄国平回顾了自己走出小山坳,与命运抗争的故事。全文波澜不惊,却能直击人心,堪称现代版《送东阳马生序》。有网友评论说,“他活成了这个世界的一束光”,是无数“寒门学子”的希望。但于黄博士而言,故事只是过往的一部分,技术成果才是评述一位专家的最好佐证。年10月,黄国平在的QCon全球软件开发大会(上海)上分享了《人机交互式机器翻译研究及应用》,从行业谈到技术,再从技术具象为应用,全程干货十足,值得收藏细读。我们特别将演讲内容整理出来,以飨读者。
以下是演讲的核心内容。
在今天的话,机器翻译已经是人工智能当中一个非常古老的方向了,但是我在前面加了“人机交互式”这5个字,或许大家会有些奇怪,为什么要加这个前缀?好,在接下来的演讲当中,我将一一揭晓。
我是黄国平,来自腾讯AILab,博士是在中国科学院自动化研究所,我的研究方向就是机器翻译,然后学位论文也是人机交互式机器翻译研究与实现,进了腾讯后的这一段时间,基本上还是延续了博士期间的一些工作。
今天我主要是在这里分享这么几个方面,首先我会先简单并且快速地过一下机器翻译现状。然后我们讨论一下人机交互式机器翻译相关的行业技术应用,以及我们在做人工智能落地方面的一些思考,因为在这个过程当中我们遇到很多问题,然后我们又想了一些办法来一一克服。
我做报告的目的,也并不一定是为了让大家听了就能够去下一套很好的机器翻译系统,而是看我们解决问题的这些思路,看是否能够为大家日常的工作当中提供一些借鉴,那样的话我就觉得很值了。
机器翻译现状简介
我相信大家在阅读文献的时候,或者去查找资料的时候,或多或少都会用到机器翻译,比如说比较出名的也是比较早的谷歌翻译,然后有百度翻译。后面也出现了很多机器翻译产品,比如搜狗,还有腾讯翻译君。我把所有这些截图再放在一起的话,大家也觉得左右两边应该是概括得比较准确的,就是说“藕花深处田田叶,叶上初生并蒂莲”。大家都像双双胞胎兄弟似的,好像也看不出来什么区别。
在这种情况下,大家好像就是说这个领域是古老的,但也是比较喧嚣的。其实除了在这些新闻PR稿中经常看到的公司之外,机器翻译研究的背后,技术的进步是有很多人在幕后做非常辛苦的工作的。
比如说在这些单位里面,中科院自动化所、中科院计算所、清华大学、东北大学、哈尔滨工业大学、南京大学等等,他们有的研究机器翻译至少都快30年了。
当然也有一些新生的,像苏州大学,然后还包括现在更多的商业公司,投入资源和人力到这个问题上来。
我们当然是比较开心了,毕竟大家都开始