微信号:infoqchina

介绍:有内容的技术社区媒体

网易有道周枫:曾梦想执笔去教书,却转岗当上CEO

2018-06-14 08:19 二叉树

记录与时代并行的技术人,暌违已久的二叉树短视频回来了!叩问过技术大牛的「初心」,描绘过技术人的「众生相」,这次我们带您去见识那些横跨「两界之间」的技术人们。这是 10 位行走在中国人工智能之路上的技术人,他们正见证着中国的人工智能技术落地。点击公众号菜单「戳」一栏“二叉树视频”或扫描文末二维码可观看往期高清视频。

他曾经的理想是在高校教书。但是在伯克利读博期间,他的论文被丁磊看上了。他曾经作为兼职学生被 Chinaren 和 Sohu 委以重任,他说那是因为在 20 年前,懂系统的人实在太少。

今天的他,尽管官方职位是一名“CEO”,但是言谈之中仍然掩盖不住浓浓的技术气息。当 InfoQ 二叉树团队前去采访他的时候,他的桌上正摆着一份由机器翻译成中文的最新的一份年度亚马逊 CEO 致股东的信——坦白说,如果是一位完全不懂英文的人去看机器翻译的这个版本也可以看懂里面的意思。

人工智能技术对翻译领域都造成了哪些影响?对教育领域又会造成哪些影响?且看今天的二叉树——


《两界之间》技术专题纪录片 | 第九集

由 InfoQ 二叉树 出品

嘉宾简介

周枫,现任网易高级副总裁,网易有道 CEO,在网易有道期间先后主导了有道词典、有道搜索、有道云笔记、有道精品课、有道翻译官的产品研发工作。

Q:首先请您介绍一下有道翻译这块的发展?


有道是国内最早做在线翻译引擎的公司,我们从 2008 年开始就有自己的自主研发的翻译引擎。2008 年一直做到现在(2018 年),基本上做了有两代的翻译引擎。整个有道词典目前累计了有 7 亿用户,每天全平台活跃用户超过 1700 万。

Q:上述整个过程中有哪些重要的变化?

2008 年我们去考虑做翻译的时候,其实考虑了很久,因为当时翻译在商业应用的领域是非常新的状态,我记得 Google 的翻译应该是大概 2006 年、2007 年商业应用的,互联网公司中间基本上是没有什么公司有翻译的技术的。所以我们因为当时是刚刚出了有道词典,用户都需要用翻译,但是其实用户也不知道可以做自动的翻译,那么我们团队觉得:要不我们试一下?


试完之后发现,的确可以把它做出来,当时用的是统计机器翻译的技术。机器翻译大概从 1940 年、1950 年左右就有人在讨论,最初的翻译技术叫规则机器翻译。统计机器翻译是更好的、第二代的技术。

我们 2008 年左右把它做出来,对我们的产品发展发挥了非常大的作用,每年它通过数据的积累,通过算法的改进,质量都有提升,但其实到 2012、2013 年之后,它的质量就达到一个瓶颈,因为总体上,统计机器翻译是有自己的局限性的。之后几年,其实翻译的产品和业务都是比较难受的,因为它质量不理想,也有很多关于翻译的笑话。

基本上是到 2015、2016 年的时候,整个学术界提出来基于深度学习的神经网络翻译的一些论文和想法。当时其实还没有公司把它产品化,我们也是认为值得去尝试,所以花了大概有两年时间把神经网络的机器翻译最终产品化。在 2017 年我们推出了神经网络的机器翻译的引擎,比之前的翻译的效果提高了非常多,而且现在总体上这个领域非常活跃,每个季度我们的翻译质量,包括一些同行的翻译质量都会有比较大的提升。


去年的一年时间,包括我们在内的翻译质量的提升,可能比过去五年加起来都要多。每个季度我们都会有新的模型上线,刚刚上个星期我们的中文和英文的翻译引擎就上线了一个全新的版本,它的整体的网络架构、整体的训练方法和之前的 2017 年我们上线这个版本是完全不一样的。

机器翻译基本上我觉得有三部分工作,第一部分工作是数据,对于翻译来说的话就是平行语料,就是一句英文一句中文或者一句日文一句中文。第二部分是模型架构,或者说网络架构,因为它是深度学习,它是个网络,有很多不同的做法,这个是大家会有差异化的地方。第三部分,实际落地的时候会有很多问题,包括大小、尺寸,包括性能,包括你是在服务器端还是在在手机端,还是说各分一半等等很多选择。

Q:像您说的落地,在有道来说就是翻译蛋。为什么会想到做这样的一个形态?

对我们来说也是个挺巧合的事情,因为我们很多用户用我们翻译里边的离线翻译的功能,用了之后都很喜欢,用户就会提更多的需求。2017 年年初我们推出了语音对话翻译的功能,功能一上线之后,用户非常喜欢,使用量比我们想象的要大很多。

我们刚好那个时候也碰上一个我们的合作方,他们愿意做硬件。他们说既然你有语音翻译的功能,我又会做硬件,我们一起合作来做一个翻译的硬件。其实我们开始的时候还是讨论挺多,觉得有很多挑战,因为单独卖用户一个硬件也挺不容易。实际做下来之后发现还是不错的,用户需求比我们想象的要大,而且产品体验总体上也还不错。

Q:您在翻译蛋的产品研发中扮演一个什么角色?

主要工作是团队做的,我还是在产品的技术和体验,很多事情上还是会跟团队一起参与和讨论。像我们希望支持更多的语言,像我们希望说二代我们一定要把离线的翻译做得更好,这方面是我比较关心的。


可能有个例子是我自己参与事情比较多的,是关于这个产品的尺寸的设计。我们是想了很久这个问题,最后我们自己的定位是说,我们认为这个产品应该要比手机小,把它做成 70 克这样的一个重量,用户觉得这个是比较符合他需要的。第一代我们是 70 克,第二代还是 70 克。

Q:翻译的研究领域,您现在关注哪些新的进展?

翻译本身在模型方面还是有挺多新的架构,包括我们自己用的比较多的,像注意力这样的机制,像 transformer 这样的机制,我们在不断的看,不断的自己也在尝试。

然后实际从工程角度上,我自己体会是说,真的要把产品做到说用户认为非常好用和指标高还是不是一回事。

Q:目前我们在教育领域都有哪些投入?

我们认为工具产品也是教育产品,当然最直接的就是我们的课程产品,它的品牌是有道精品课。主要的形式是直播的大课,就是一个老师既有可能给几百人同时上课,也有可能是同时上万人一起上课。

目前来看的话,其实直播课程是比较关键性的一步,直播课程使得在线教育开始能够得到大批量的用户的接受,也有了一个比较健康的商业模式。我觉得至少在可能从一年多前开始,到未来可能两三年或者更长,直播应该是互联网教育的一个主要的形态。我是这么看这个问题。

我觉得互联网的这样的远程的纯在线的教育方式里边,两个问题最关键:第一个是学习的效率,第二个是学习的动力。这两个问题必须都解决,才是一个比较好的产品形态。我们发现直播形态其实能够比较好的保持学生的注意力,因为它有一个大家一起学习的感觉,跟老师也有各种各样的互动。我觉得是娱乐直播产品给教育产品做了一个非常好的示范。

所以相当于我们摸索了几种形式之后,到 2016、2017 年开始做直播之后,发现用户的反馈是完全不一样,以前可能能学完课的比例是百分之十甚至更低,现在很大比例的学生都能坚持下来。

Q:录播变成直播就有这样的效果吗?

直播是其中挺关键的一步。我觉得直播只是开始,后面的话我们觉得非常重要的一环是 AI 技术的各种的应用。

在当下的话,这里边我们认为一个关键的点,就是怎么把这样的一个基于直播的教学从单向变成双向。因为如果是简单的直播的话,总体上它的方式是老师讲学生听,这是一个单向的过程,总体上你还是没有办法知道学生到底学的怎么样?他是不是有听懂?课后他有没有去跟进去学习?他的困扰有没有得到解决?我觉得这是目前阶段我们在着力解决的问题和未来的产品机会所在。

我们做了一些尝试,包括我们的有道智能答题板,包括我们做的用户习题的系统,包括我们做的一些做作业的自动批改,这些都是一定程度上把教学过程从单向变成双向。


Q:您是相当于从小学的时候就接触计算机?

对,我初中小学花了很多时间在计算机上,高考的时候我就选了清华的计算机系,基本上到清华之后也一直在跟计算机打交道。

我在清华的时候,刚好 1998、1999 年的时候,中国互联网的第一批公司大发展,所以当时我去了 Chinaren 和 Sohu 两家公司兼职。那个时候,其实兼职学生往往被公司赋予重任——因为会做系统的人很少,所以当时还是积累了一些经验。之后我去了美国伯克利读 PHD,毕业之后回到网易。

Q:当时没有想过要留在美国?

我本来是想在美国教书的,我去美国读 PHD 的时候是觉得说,其实我是个挺喜欢教书的人。现在我们做教育相当于也是教书,所以还好,绕了一大圈。

Q:其实像您一直以来做底层也做了很长时间,其实也还是很关注技术。您觉得一直推动您去做这个领域的动力在哪里?

我觉得还是兴趣。我觉得每个人做工作,其实最开心的就是能找到自己喜欢的东西,对吧?我觉得我还是比较幸运的,不管是说做互联网产品也好,还是说做教育也好,这本身都是我喜欢的。

我会觉得跟同事们一起去做团队的工作,把整个 team 能够找到一些好的工作方向,这是一件我觉得挺好的事。

另外一方面,关注一些技术的细节,去了解一些新的技术的方向,包括实际动手去参与一些,也是另外一种很开心的、能够去做的事情。

我觉得对于擅长技术、熟悉产品的、工程和设计方面的团队带头人,其实是有很多优势的,使得团队沟通中间很多事情变得更加高效和直接。就像我们很多时候讨论问题的时候,比方说有一个新的领域,可能大家如果和非技术工程背景的一些同事聊的时候,也能聊明白,但是可能要聊很久;而在网易,我们去把可能领域最初的技术的介绍,把最初的那几篇论文我们找出来,可能花个两小时读一下整个领域是怎么来的,为什么有这件事情,以及说它未来一段时间可能的技术走向,就比较清楚了。我觉得这个是一个挺好的优势。

就像我之前读 Elon Musk 的自传,我觉得还是挺有共鸣的。其他人就说他们发现说 Musk 这个人有一个习惯,就是喜欢打破砂锅问到底,会问到非常技术细节的东西。然后后来大家发现,不是说 Musk 怀疑这个人不懂,而是说这是他学习的一种方式。打破砂锅问到底,问完之后,一方面了解了团队的工作状态,另外一方面 Musk 自己学会了很多事情。我觉得在网易很多时候也是这样的文化,我们还是非常技术的一个文化。

Q:现在如果请您分享一件印象最深刻的跟团队一起的事情,您会想到什么事情?

我觉得可能是我们大家一起去构思出来当时有道词典的一个最主要的功能,叫“网络释义”。那是在一次会上我们讨论出来的,就是说白了我们把搜索的技术应用到让机器编词典这件事情上来,这个是有道辞典最主要的一个打动用户的功能。

这个事情印象很深刻,因为相当于是有道第一个做出来一个原创的产品,而且很快的时间就有了大量的用户。我觉得这次影响后来我们做很多事情,就像后来我们发现说直播这件事情对于教育非常的有用。

当你每次遇到这样的这样的 moment 的时候,你会有这样的感觉,说有可能我找到了一个很不错的东西。这样的感觉,可能三次中间只有一次是对的,但是你会发现每次碰到这样事情的时候,一些很聪明的人在一起,同时都会说是不是有点道理?可能第二天就有人去把原型已经做好了,这个感觉是非常棒。

Q:最后,您对于整个团队在未来有怎样的期许?


我们希望能够在教育这个事情上跑得更快一些,因为确实是非常好的一个机会,整个一个非常大的市场,而且能够和 AI 非常好的结合起来。所以我们希望说这边能够真的做出一些好的产品,帮助到学生们,帮助到家长们,同时也让我们自己能够为这个事情而感到骄傲。


图书上新,三天限时特惠

InfoQ 推出的极客新书《裂变:秒懂人工智能的基础课》开售!本书特点:

  • 零基础入门人工智能

  • 贯穿数学基础、机器学习、人工神经网络、深度学习、神经网络实例、深度学习之外的人工智能和应用场景。

6 月 13-6 月 15 日,奉上以下福利:

《裂变》新书,原价 59 元,首发价 49 元!

《裂变》新书 + 《人工智能基础课》专栏,原价¥127,套装价¥89!

另外,即日起,每邀请一位好友购买《人工智能基础课》专栏,你可获得 12 元,你的好友也将获得 6 元的现金奖励,多邀多得,上不封顶,随时提现!(提现流程:极客时间公众号 - 我的 - 现金奖励提现)

长按 识别下图二维码 或者戳 阅读原文,立即拥有。


 
InfoQ 更多文章 技术人应该如何投资时间? 迅雷创始人程浩:流量、资本红利已成过去式,中国互联网下一个十年属于…… GitHub被收购,Stack Overflow在裁员:后开源时代,开源的未来往哪边? 程序员练级攻略 甲骨文在开源后裁掉了JMC整个团队;中兴:将支付10亿美元罚款,更换董事会等高层;阿里云:未来三年追平亚马逊技术丨Q新闻
猜您喜欢 依赖管理工具漫谈--从Maven,Gradle到Go 致程序员的价值观 橘子娱乐陶喆:算法背景同学应该创业么? Go 性能优化技巧 6\/10 你永远无法叫醒一个装睡的人!前Nokia工程师肺腑之言..发人深省...