微信号:infoqchina

介绍:有内容的技术社区媒体

王坚博士,那个行走于现在与未来之间的大顽童 | 二叉树视频

2018-04-11 08:04 二叉树


记录与时代并行的技术人,暌违已久的二叉树短视频回来了!叩问过技术大牛的「初心」,描绘过技术人的「众生相」,这次我们带您去见识那些横跨「两界之间」的技术人们。这是 10 位行走在中国人工智能之路上的技术人,他们正见证着中国的人工智能技术落地。点击公众号菜单「戳」一栏“二叉树视频”或扫描文末二维码可观看往期高清视频。  


他的身边总有话题围绕,你难以用他的职位去定义他,难以用他说过的话去定义他,甚至难以用他做过的事去定义他。如果要给这个现象寻找一个解释的话,那大概是因为:

他似乎总是在现在与未来之间的某个夹层上漫步。而尚未发生的事情是无法被定义的。

最近的他正在 2018 与 2050 之间频繁往返。我们把他最近说的一些话、最近在做的一些事情用影像记录了下来,作为二叉树第三季的见面礼送给你:)

《两界之间》技术专题纪录片 | 第一集

InfoQ 二叉树 出品

拍摄地点:杭州·云栖·博悟馆

  嘉宾简介
王坚,nickname= 王博士 / 博士,目前官方职位 = 阿里巴巴集团技术委员会主席,关键字 = 心理学 / 微软研究院 / 阿里云 /YunOS/ 云栖小镇 / 城市大脑 / 2050 / etc.。
1今天说的人工智能跟 60 年以前不是一回事。
  首先请您回顾一下您经历过的这么多事情。有哪些您觉得是对您个人的发展有重大作用的?


其实我很难讲哪些事情对我个人发展有重大的作用,只能说是我记住了哪些事情。我想,至少发生了那么多事情,这些事情我记住了,没有忘掉。

以前我在学校,年轻的时候就评为教授,然后我突然就发现,其实周围有很多人帮助我很多——比我年纪大很多的、大 20 岁 30 岁的。那个时候有很大的感触。

后来离开学校,对我来讲也是件很大的事情。在当时只是感觉工作跟以前是不一样的,但说不上来怎么不一样。后来到 2008 年加入阿里巴巴以后,这时候突然就会发现,跟你工作的人都比你年轻 20 岁。

我觉得倒真的不是某件特别的事情让我记住,但是我从跟比我大 20 岁的人一起工作,突然变成了跟比我小 20 岁的人一起工作,这让我发现,一个事情不只是工作的问题。就是说:除了自己的工作之外,我还可以做些什么?当时别人替我做了那么多,现在的我能为他们做什么事情? 我觉得这对我有很大的影响。


  您如何评价您现在的性格?

我觉得我比较运气的地方,就是今天想做一件事情的时候,不需要有特别的边界。但我这个结论,我不知道是我的性格?还是我现在所处的环境?还是别人对我的宽容?这是很难讲清楚的。

认真想想看,在很多事情上我都是个既得利益者。因为这个时代的发展,你碰巧在这个地方,还可以想一些过去想都不敢想的事情,这其实是件很奢侈的事情。你可以想想,可能今天一家企业的科研经费,就是过去一个国家的科研经费,这样的变化在 30 年之内完成,是非常不容易的一件事情。在那么短的时间里面有这么一个跨越,经历这么一个事情,我觉得这个是每个人都值得去反思、去想一想的。

  您为什么对私有云或者是智慧城市这种名词如此反感?可以说是洁癖吗?

我倒不是洁癖,但是每个人想法不一样,可能从旁观者来讲是洁癖,但我自己觉得是一个认识的问题。其实本来叫什么名字都没有关系的,张三李四本来就是一样的,但是一旦这个被赋予了张三李四,名字就变得重要。

我觉得像智慧城市、像私有云这些东西,别人拿这个东西表达的东西,其实已经不是你想要表达的东西。这时你会有一个很强烈的感觉:这样的认识跟表达会影响你的发展。 它严格意义上不是个洁癖,我自己觉得还是用“眼睛里容不得沙子”会比较好一点。


有些技术发展是有超越性的。当它是一个真正意义上的一次很大的跨越的话,那我觉得眼睛里容不得沙子是重要的。不然的话,大家模糊过去,又回到从前了。私有云就让我觉得回到从前了,它给传统的 IT 发展找了一条苟延残喘的理由,这是我自己的理解。

  现在有一个说法是算法加数据就等于一切——包括生命本身。您对这种观点什么看法?

任何东西你只要说到什么加什么是一切的话,肯定是错的。这是肯定的。我今天还想不到一个东西可以包含一切。

这个东西在现阶段非常重要,我觉得这本身是不错的。但算法只是智能很基础的层次,算法能说清楚的东西都还是比较简单的东西。算法说不清楚的东西,语言才能说清楚,所以如果讲语言智能,要比算法智能要好一点吧?

算法加数据,在我看来,最多只能说是让传统的计算机科学又有了一次质的飞跃,为传统意义上的软件加硬件的计算机科学的提供了一次巨大的发展机会,我觉得说到这个份上也就也就差不多了。不然我们人类就没有希望了,对吧?折腾了几百年,把事情都折腾完了,下面折腾什么对不对?要给子孙后代留点东西对吧?这是我自己的感受。

我觉得作为一个学科也好,作为一个行业也好,作为一个人类也好,能碰上这么一次这么大变化的时代,已经很幸运了。我刚刚大学毕业的时候赶上了软件加硬件的时代,现在又赶上了数据加算法的时代,是很运气的。换句话说,除了这些之外,可能还有一些其他的东西是我不知道的。就像 30 年前我们知道有硬件软件,尽管那个时候有算法的说法,但是大家都不清楚这个东西会给我们带来质的飞跃。所以严格意义上讲,今天只是重新发现了算法跟数据的价值而已,并不是带来什么新的东西。

2在很多事情上我都是个既得利益者。
  说到人工智能领域,在您关注的范围内,过去一年——或者一年不够的话五年,哪些发展或者说突破是您觉得非常值得关注的?

如果是从一个做纯粹做人工智能专业的角度来看,我其实也没那么关注,只是了解一下,主要还是想了解会有什么大变化。


我自己觉得,其实人工智能在过去十年已经发生很大的变化,你如果还要发生很大的变化,实际上是很挑战的。任何人随随便便想还有一次非常大的变化,我觉得是可望不可及的,因为一个学科要有一次重大的变化,不知道要积累多少年。大家可以想想,深度学习的东西都是从我们读大学的时候开始积累起来了,对吧?

但是倒过来讲,我觉得人工智能本身的发展是可以是巨大的。很多东西其实从理论上也没有突破,但它就是有着蓬勃的发展,比如软件、互联网,这些东西都经历过没有关键突破但是蓬勃发展的时候。

所以我自己觉得比较乐观。虽然如果一定要讲到底什么蓬勃发展,我也很难一定说是哪个领域。是无人驾驶?医学图像处理?这不确定的。但有一个是肯定的:

今天为什么软件跟硬件大家不再提了?并不是它不重要,是因为它在所有的地方。所以今天为什么人工智能大家说的那么那么重要?就是因为它不在什么地方。我觉得今天的人工智能在我眼里,就好像在中国刚刚修了一条八达岭高速,大家没有感受到 99.9% 的路还没有修。

所以我觉得人工智能会蓬勃发展的一个很重要的事情,就是它会到所有的地方。可能十年以后,甚至五年时间,它就会在各个角落。

  您觉得经过 60 年的发展,人工智能现在是还在初级阶段吗,还是一个什么阶段?

我觉得这也是个矛盾的地方。从学科发展角度,它有它的延续性,“好像”是发展了 60 年。但是你认真想想,今天说的人工智能跟 60 年以前不是一回事情——我觉得差别可能远大于集成电路跟电子管的差别。

集成电路从原理到机理,其实跟电子管完全不一样,只不过它达到的功能是一样的。集成电路不知道做多少电子管做不到的事情,对吧?电子管只能做那些非常 basic 的事情。现在讲的人工智能跟 60 年的人工智能,从哪个角度讲都不是一回事。现在,它们要达到的目的可能是比较接近的;但再往下搞,就可能连目的都不接近了。

所以我觉得从这个角度讲的话,我一直觉得会有更多的新的技术出来帮助我们,但不一定是大家想象的这么延续的发展。

  您的意思是技术杂交?

物质条件不一样。它有所谓的智能性在,我觉得这可能是它们唯一共同的东西。智能的问题是个永恒的问题,我觉得智能技术是可以慢慢演化的,但是不是可以简单的叫人工智能,我觉得还是值得讨论的,因为人工智能这个事情还是带有一定的方法论跟它最基本的考虑在里面。

  您觉得脑科学的研究对人工智能这方面会有什么影响?

我觉得在很长时间应该还是平行的。我对任何现在说脑科学可以帮助人工智能的说法还是蛮谨慎的。

  我们知道今天的计算能力相比今天的数据量而言是不够的,但是我没有一个量化的概念。不知道您能否提供一些?

这句话对又不对。我觉得不对的地方是,计算永远跟不上数据的量。 原因就是,人对计算的需求本来就是贪得无厌:你只要有计算,我就会把你消耗掉,这个是我觉得了不起的地方,也是它的问题。


我们今天消耗的计算量可能是以前的几十万倍,其实很大的。想想看,今天有什么东西消耗掉的量是超过十年二十年以前几十万倍的?我想计算可能是唯一的东西。

但倒过来讲,其实今天的计算量是可以帮助我们从数据里面得到更多的东西,因为我们远远没有用好今天的计算。就像我们以前传统的农业,就这样盲目地浇田把水都浪费掉是一样的。当你有滴灌的时候,你才知道要这么精准的干这些事情。

所以我觉得两方面都要考虑。如果你不能够很精准的、很有效的使用计算,再多的计算也会被浪费掉,最后也是不够用的。

  计算的浪费是指?

机器不通电,浪费。机器通了电你不计算,也是浪费。就这样。你想,现在多少电脑不通电?多少电脑通电不在干活?其实没有人统计过这个数据,我也不知道。但你可以想象这个场景对吧?CPU 的使用率,百分之二十、百分之三十,对不对?

  那比如说现在安防摄像头,大家都想有通缉犯出现可以自动人脸识别,但其实是做不到。这不是因为计算能力不足吗?

我觉得这个不是因为计算能力不足,是因为原来他们都没有想要计算——至少我知道是这样。这个问题是一个典型的数据浪费的问题。因为现在大部分在放摄像头的时候,从来没有想过这个数据是要处理的。这就是城市大脑的事情。

只有你能算的时候,你才会真正知道计算能力是不够的,我也同意的。但是我想,第一步问题还不是计算能力不够,真实的情况是我们的数据没有被计算。我觉得还是先把这两个合在一起再说。

  那么您关注量子计算的原因又是什么?

我其实没有特别关注,只能说是我想去了解,大概知道这个行业的发展。我想如果从这个角度讲,关注量子计算一个非常重要的事情,就是 等到计算跟数据真正集合的时候,你才会发现只增加几十倍的计算量是不够的,肯定要想到的是百万倍,甚至更多的计算量的增长,我想这个时候可能量子计算是唯一能够满足你需求的。

但是我还是要讲,把这两个东西合在一起就够我们走上五年、十年了。没有那么简单的。所以我想也给量子计算创造出一个时间的缓冲出来。其实大家没有那么迫切说,今天什么事情非量子计算不行。今天你想做什么事情,还是有条件做的。

  您认为在线数据比离线数据更有价值。这对于人工智能有怎样的意义?

我觉得这是非常大的意义。严格意义上讲,不应该简单就是一个在线数据和离线数据的差别。这实际上是两个世界的差别。你认真想一下,今天是没有办法离开互联网讨论公司,对吧?大家把互联网当做是一个应用场景,其实不是的。互联网是最最基础的,它不是应用场景,而是所有的应用场景都在互联网上面。


所以从这个角度讲的话,今天的智能已经是一个在线智能。今天不可能有一个不在线的智能,就像人死去不可能有智能是一样的。在线这个东西是渗透在每一个环节,它不是说数据在线,智能可以不在线,没有这样的事情。

  您觉得在线和离线是一种有点像温度、灰度一样的东西吗?

我觉得在线离线是一个硬币的两面。你不可能去买一个东西,说把一个硬币的那边去掉,这个不可能,只是以前我们没有意识到这个问题。等到你发现那一面叫在线的时候,你再也不可能拿出一个硬币,它没有在线的一面。

  我的感觉却是,比如说在线从 0 到 100 来算,这个东西是有 90 分在线,那个东西是只有一点点在线?

我觉得不是这样一件事情。我是觉得在线离线不是一定要做两种状态之间的转换,它都有存在的价值,就像我说的一个硬币的两面,这是我想讲的第一件事情。那么第二件事情,今天应该是没有严格意义上的离线的东西了,因为那些东西如果离线,可能那东西存不存在对你都不重要了,对吧?

所以我是觉得今天实际的情况是说,以前所谓离线的东西也被在线了,因为不在线的资源是大家既不能用也看不见的资源——尽管它是存在的。你就想,今天你会不会翻箱倒柜去找你的软盘?不会的。你今天还是会去翻一些书,书是离线的,但那个东西占据非常少的内容。所以我自己觉得,实际上今天的在线就包含了我们原来离线的东西。

你一定要讲百分比的话,就是你自己作为一个个体是多大的依赖于在线的世界,多大的依赖一个离线的世界。我觉得今天没有一个人可以说他不依赖于在线世界,也没有一个人说他不依赖于离线世界。但我想中国可能是有最高的在线人口。

3搞得很烦的时候,搞个算法玩玩。
  您看一个技术,是实用的角度多吗?您的价值判断是什么?

跟心情、跟角色是有关系的。你想用一个技术,当然是要看它的实用价值。但是你觉得好玩的时候,你当然不会去看它的实用价值。所以我觉得跟心情有关系了。你为了玩去了解一个东西,跟你为了用去了解一个东西,它本来就是有这些属性。所以我觉得这个问题取决于你自己当时的出发点和心情。


我觉得每个人其实都会这样的,因为他所处的角色不一样,只是每个人在谈技术的时候,他都用了一个特定的角色去谈这个技术而已。

  你的意思是因人而异?

跟个性有关系,比如说你这个人就是喜欢玩一些算法,本身算法的魅力就是一件很好的事,跟他有没有用没有关系,对吧?我自己的话,有工作要完成的时候,好玩不好玩是第二位。可是你搞得很烦的时候,搞个算法玩玩也不是个坏事情,对吧?

  您除了计算机,除了之前学的东西和做的工作之外,还有别的兴趣吗?

对机器我都很有兴趣——计算机也只是机器的一种而已。我觉得其实世界上只有两种东西,一个是人造出来的,一个是大自然造出来的,我只是碰巧——不管是历史的原因还是什么原因——天天接触人造的东西比较多一点,自然对那个东西的兴趣就会比较多一点。

  您说是“碰巧”?

碰巧。当然有人喜欢大自然是吧?他对人造的东西都不喜欢。但他基本上也是坐人造出来的车去看大自然,对吧?我们也会拿人造的机器去拍大自然。所以其实是没有什么差别,只是你的专注点在哪里。说是碰巧,意思就是说可能自己的工作、可能过去的习惯,对这种会比较关注一点。

  如果从未来往现在看的一个角度,您希望您在现在这个时代扮演一个什么样的角色?

好像没想过这个。很难想象这个问题。我觉得没有办法从未来看现在,对吧?我是觉得,你所有想的事情都是未来的事情,是这样想才对。


前几天云栖有几个人在说他们农村保护的事情。现在很多人讲农村的时候,都不知不觉给人家一种感觉——是不是要回到过去?其实是回不去的,你知道吧?所以其实真正的问题是说,未来的乡村到底是什么样子,而不是说把乡村回到过去,那样走不通的。

我觉得更重要的是说,你想想未来会发生什么变化。那么我现在看未来,做城市大脑一个很清楚的目标,就是未来的城市只要今天城市的 1/10 的资源、1/10 的土地、1/10 的水,就可以让现在这样一个城市活下来。我觉得这是一个巨大的挑战。想象一下今天的所有的马路都只有原来的 1/10 的量,这个城市还是蛮美妙的。

  您觉得我们现在这个时代和历史上的哪个时代最像?

我不是历史学家。以我的专业,我觉得最近的、最像的一个,就是当年工业革命从英国转到美国的这段时间,跟我们今天这个时代是非常像的。

  这个观点是从国家的角度?

完全是从技术跟产业的角度。撇开国家这个事情先不说,当时所有的我们今天讲的原创技术,比如说铁路、电、汽车,其实都是在欧洲发明的,都不是在美国发明的。但真正这些事情变成一个改变全世界的事情,是在美国发生的。认真想一下这件事情,对吧?当时只有美洲大陆都通铁路的时候才产生那么大的变化,英伦三岛都通的时候没有发生大变化,因为太小。同样汽车也是:在欧洲,汽车就是汽车。可是到了美国,汽车就变成了新的生活方式。电就更不用说了。

所以我想,这是真正的变化的开始,我觉得现在就是这么一个时代。互联网最早的几个原始技术不是在中国发明的,但我想真正的产业革命是有可能在中国完成,因为我们的网络空间要比别人大得多。 这是可以想象的事情。

4因为我们大家共同热爱科技,所以我们就互相热爱了。
  下面有几个关于 2050 大会的问题。首先,如果说我们现在是处于一个重要的时代,您希望 2050 在其中发挥怎样的作用?

我自己觉得,2050 年一定不会是现在这个时候的简单的延续。这是我可以想象的,因为我自己可以看到,刚才讲谈到量子计算的问题,刚才说很像欧洲跟美国的关系,我觉得这些变化一定会在 2050 左右发生。这是我自己的直觉。


所以那个时候就会发生很大的变化,它的变化不会小于美国发现了西部——把老百姓的生活方式都变了,更不用讲会有些新的东西出来——比如那个时候因为电的出现,突然空调就出来了,对吧?所以用我以前的话讲,你不知道会在上面会产生多少东西,会改变我们现在生活的方式。

有一次我跟一个记者采访,当时我随便一句话,他就把它发扬光大了一下。就是说,以前大家可能从来没想过人类有夜生活,是因为有了电才有的。所以后来他就说:爱迪生发明了夜生活。这其实是件很大的一些事情,对不对?

我想到那个时候,我觉得我们肯定会发现一些比夜生活还要有意思的事情,这是我可以想象的。所以今天我们少睡了那么多觉,还天天搞得兴高采烈,我也搞不清楚为什么:)所以我觉得还是非常值得期待的。反正不会是人工智能出现了,把人类给害了,这是我可以保证的。

  年初的时候腾讯也办了个会,他的主题叫科技向善。您对这样一个主题有什么看法?

我觉得科技实在是可以从太多的角度去看它,这是我现在越来越理解到的东西。过去大家知道科技可以当用的东西来看,对吧?科技对这里有帮助。

其实我慢慢理解的话,如果今天要我结合 2050 来讲科技的话,那这是我自己的一个非常大的、认识上的飞跃。我突然明白,科技不只是帮助了你,也不只是你可以来用,也不只是可以把你的生活变得更好。我觉得科技一定会像体育跟音乐一样,它把人团聚在一起。人因为科技要在一起。

  算是一种艺术性的共鸣吗?

其实人生来也不知道什么东西叫音乐,什么叫体育,都是人编出来的,对吧?但是它慢慢变成好像是不同的人共同的东西。我觉得科技也可以——这东西本来也是人编出来的,对不对?但慢慢就会发现,其实科技不再是区分大家之间差异的东西,科技实际上让我们变得更加一样。因为我们大家共同热爱科技,所以我们就互相热爱了,就像大家热爱音乐,我们互相就热爱,这个道理是一样的。

  但是,科技和体育、音乐毕竟有很大的不同在于它是工具?它似乎天生是用来解决问题的。

我刚刚讲的恰恰就是要想改变你这个观念。其实今天大部分人觉得科技是个工具,但是我觉得到最后科技就会不是个工具,这是我想表达的。


体育一开始也是工具,马拉松也是为了传递一个信息,对不对?最后跑跑他跑出马拉松出来了。我觉得科技也会经历过这样一个过程,这就是 2050 大会我到最后觉得要表达的事情。科技像马拉松一样把人团聚在一起,作为一个科技工作者,我觉得是一个最了不起的事情,是吧?科技、科学,不再是科学家的事情,而是大家的事情,更是年青人的事情,对吧?我觉得这个是可能我们已经可以倡导的时候,因为科技已经在我们生活中的每一部分。

  对于现在社会上面临的一些问题,比如说塑料污染、雾霾污染、土壤污染等等。2050 大会会不会把解决这些社会问题作为主题?

我不知道,但是我相信会有的。我不是决定主题的人,我只是邀请了这些年轻人,他们会决定他们要讨论什么东西。

我觉得去火星是一个非常了不起的梦想,我觉得是应该有这样的梦想的。但你认真想一下,我们要到火星去,不能是因为地球上呆不下去了要移民过去。如果是因为地球呆不下去,移到火星上,我们还是会待不下去的,对不对?更不用讲,最后能够去火星的人都会是有钱的人,年轻人没有钱是去不了的。

所以最后世界还是会把问题留给年轻人的。地球没有问题的时候,咱们去火星是件很挑战的事情。等到地球上呆不住的时候,能呆在地球上是最挑战的事情,对吧?历史很公平的把这些问题都留给了年轻人,因为只有年轻人可以活到那个时候去解决这个问题。


所以我想他们会关心这个事情,但我也不是决定讨论这个问题的人。到底是塑料袋最重要还是别的最重要,今天的他们有他们自己的看法。

  您之前书上提到过从《自然》《科学》到 Arxiv 的转变,从大英百科全书到 Wikipedia 的转变,都是很重要的。现在还有什么类似的趋势吗?

这些东西我觉得一直在。其实在今天这个时候,大家有很多办法来表达他对世界的研究,甚至一个不专业的人都可以表达一下他对世界的看法。

我自己觉得这个变化可能比电子书替代了纸质书还要重要:它不只是把书从纸质变成了电子,而是说知识积累、来源完全不一样了。我们再也不依赖于几个人的科学知识创造。每个人都是创造者,而且每个人都有可能传播。我觉得这不是一个形式的变化。这是一个真正的财富创造的变化。这是我自己看到的变化。

文章不代表科研,背后我觉得其实意义还是蛮深远的。它不只是文章质量问题,而是说这个不能代表我们所有人类对知识的看法,这是我觉得最有意思的地方。没有“在线”这件事情,这个事情是不会发生的。

“在线”最早的原始积累是把离线的东西搬到在线,但我们已经过了原始积累的时期。它上面本身创造出来的东西,那些在过去的离线世界创造不出来的东西,是我觉得真正有意义的事情。

  最后,您还有什么别的想要分享的吗?比如说最近看的书或者是一些其他的感想?

最近没有好好看书。但是因为做 2050 大会,我突然发现:“志愿”的力量一旦释放出来,价值是巨大的。我以前没有体会到这件事情,但这个事情对我的冲击不会亚于当时我看到“在线”上积累的财富是可以超过“离线”的时候。我是这么看的。



技术领导力 300 讲年度大专栏隆重上线

原价 299/ 年,限时优惠 100 元,每邀请一位好友购买,你可获得 41 元现金返现,多邀多得,上不封顶,立即提现。

戳 阅读原文 立即生成专属海报

 
InfoQ 更多文章 如何打造一支有超强战斗力的技术团队? 不会被同龄人抛弃的程序员是什么样的? RocketMQ联合创始人:选择MQ时,要注意的有哪些? 快手CEO称将用正确价值观指导算法;工信部调查WiFi万能钥匙等蹭网类APP;V2EX站长被指非法公开用户隐私信息丨Q新闻 成为架构师的路上,看这一篇文章就足够了,因为……
猜您喜欢 【福利】临近跨年,蒜头助力编程年!!! 十条敏捷失败之路 有心形函数,就有心碎函数 【限时抢票】Cocos 2015开发者大会(春季)来啦! Android--Vsync 实例分析