微信号:robot2025

介绍:全球首家云端智能机器人公司,掌握云端智能机器人的前沿技术,在这里您可以了解机器人业界的最新动态.

王思聪怼柯洁“嚣张劲儿哪去了”,反被怼少掺合你不懂的事!

2017-05-25 17:05 机器人2025

王思聪又一次触犯众怒了。



柯洁今天对战Alphago,以1/4子负于对方,暂时0-1落后。


昨天晚上,柯洁在决战前夕发表了文章《最后的对决》,表示这将是他与人工智能的最后三盘对局,因为“AI进步之快远超我们的想象……我相信未来是属于人工智能的”;“我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!”



以下为《最后的对决》全文:


决战前夕,感慨万千...


在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:

无论输赢,这都将是我与人工智能最后的三盘对局


很多人可能会问为什么?


其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了...我相信未来是属于人工智能的。


可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言...它的热情——也只不过是运转速度过快导致CPU发热罢了。


我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这...最后一次...


拼尽全力后,无论结果...管他口中是是非非,来一首《沧海一声笑》..岂不美哉、快意?我淡然笑到...


不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。


(完)


包括傅园慧在内的网友们,评论的画风都是这样的:



到了王思聪,画风就变成了这样:



王思聪说的,是这么一件事儿:去年3月李世石与AlphaGo对战落败,彼时的柯洁还十分年少轻狂,放话说“AlphaGo赢了李世石,但它赢不了我”。



这句话让柯洁一夜之间成了网红,但随着柯洁对AlphaGo了解的深入,他的态度也渐渐发生了改变。


从去年年底到今年年初,AlphaGo的新版本Master在野狐围棋网横扫中日韩多位人类围棋高手,并取得了60胜0负1平的恐怖战绩。


研究了大半年计算机棋路的柯洁感觉世界观被颠覆: “它颠覆了我们对围棋的认知,所以说它的出现是我们的幸运。我们可以重新的认识和定义围棋。”


等到他自己和AlphaGo决战的时候,竟然已经有了一丝悲壮的意味:“我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!”


面对升级了的阿尔法狗,先输一局的柯洁甚至说“AlphaGo越来越像围棋上帝”,再也不复当年的“猖狂”。


柯洁在比赛中的标志性动作抓头发@视觉中国


于是王思聪站出来表示不屑:你当年的嚣张劲儿哪儿去了?


结果,网友们群起而攻之:“你知道AlphaGo一年进步了多少吗?”



“他嚣张是因为蝉联世界冠军,你嚣张只是因为你是王健林的儿子。”



上一次王思聪被骂得这么惨,还是奥运会的时候。


当时孙杨被霍顿挑衅侮辱,中国泳协向澳泳协抗议,要求霍顿道歉,然后,王公子就在微博上阴阳怪气地说了这么一段话:



网友:好好当网红不好吗?



以上来源:公众号再深一点


 AlphaGo 重演了一部进化史


该来的终于来了。


一年前 AlphaGo 发布,看完论文后我就在知乎上发文预测机器会完胜人类。好些行业朋友不相信,为此我收了很多“智商税”,之后微信发红包一直发到春节才发完。此外我还立了两个断言:一个是 Google 很有可能再研发出 AlphaGo 2.0,摆脱“监督学习”,不再需要人类下围棋的历史数据,而是只通过“增强学习”,两台 AlphaGo 自我对战学习如何下棋,并达到登峰造极的地步。从公开的资料判断,此言中了。这意味着什么呢,又有什么看点呢?


技术重大提升:和 1.0 原理大不同 更接近于人


AlphaGo 1.0 是巧妙地混合了三种算法:蒙特卡洛树搜索 + 监督学习 + 增强学习。其中蒙特卡洛树搜索是一种优化过的暴力计算,比 1997 年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习 3000 万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是 AlphaGo 获得突破性进展的关键算法。而增强学习作为辅助,是两台 AlphaGo 从自我对战众中学习如何下棋,据悉对棋力提升有限。


根据公开资料推测,此次 AlphaGo2.0 的技术原理与之前有着巨大不同:


1. 放弃了监督学习,没有再用人的 3000 万局棋谱进行训练。这本是 AlphaGo 最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。


2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从 AlphaGo 2.0 的“马甲”Master 的历史行为看,走棋非常迅速,约在每 10 秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。


3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。


在这样的算法下,AlphaGo 2.0 对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。我猜测如此算法下,有可能仅仅依靠一个 GPU 工作,每一步棋消耗的能源接近人的大脑。


最大看点: AlphaGo2.0 棋风完全脱离人类经验


今年年初,AlphaGo 化身 Master 连胜人类顶尖棋手 60 局。在围棋领域,机器完胜已经变成公认的定论。这导致很多人开始问:这次人机大战还有意义吗?我们的关注点不再是机器是否会赢——而是机器将用什么姿势战胜人类。


AlphaGo 学习了 3000 万步人类棋谱,走棋风格也近似于人。在比赛现场,偶有 AlphaGo 走棋和人的经验不符合,就被评为“愚蠢”,只是在中盘之后发现机器渐渐局面占优最终获胜,为了自圆其说解读为“AlphaGo 中盘逆转”,前两局莫过如此。第三局开始评论者长了教训,开始尊称 AlphaGo 为“阿老师”,有了欣赏和敬畏的心态。这带给围棋界很大的冲击,以前大家认为正确的东西,其实是不正确的。柯洁曾经评价说:“AlphaGo 出现,很多理论都被推翻,再看以前定式变得好笑,亏那么多目就不再是两分。”人类通过数千年实战,总结了围棋理论,然后计算机告诉人类:这些全都是错的。现在在很多比赛上,人类棋手已经开始向机器学习,模仿 AlphaGo 的下法,棋圣聂卫平也曾表示“理论被颠覆了”。


而 AlphaGo2.0 脱离了机器对人模仿,走棋风格也将完全脱离人的定式。在与柯洁的比赛中,会不断出现我们意想不到的走棋,而且这些走棋在教科书中会被认为是低级错误或者完全不可理喻,但凡一个正常的棋手都不会这么玩,但凡一个新手这么玩都会被点拨这样不对。而 AlphaGo2.0 会不断制造这样的局面,关键他还是对的。可想对专业棋手的心里会有多大的震撼:不仅自己这一辈子都没这么想过这么下棋,整个围棋界都没有想过。会不会怀疑自己白活了?会不会反思两千年围棋的发展为什么有这样的瓶颈?还有多少海阔天空等着我们去探索?可等不及我们去探索,计算机就给出了终局的答案,多么惆怅。


我们会津津乐道,AlphaGo 是什么棋风。但可以这样推理:但凡有流派和风格,就还有局限性。只有当所有流派合一看不出流派的时候,才到达致高境界。AlphaGo 2.0 便会是这么一台机器,没有风格,稳如磐石。


可以想见这次与柯洁的对弈,能频现“怪招”,完全颠覆人类对围棋的理解——这会是比赛最大的看点。英勇的柯洁,要解锁 108 种姿势来抵挡了。


2017 人机大战的意义:重演一部进化史 重新认识智慧的边界


2016 年在 AlphaGo 和李世乭的对战后,人工智能进入大众的视野,我们开始重新思考机器和人的关系。


围棋已经有两千多年的历史,在漫长岁月的琢磨中,围棋理论不断进化,到达了很高的水准,AlphaGo 的获胜,我们大可以解读于“青出于蓝”,毕竟是在人类围棋进化的主路径上又攀高峰。


而 AlphaGo2.0 完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。


这会给我们什么启示?如果跳出围棋的规则,类比看地球生命的进化:人类是从原始的有机物,到单细胞开始逐步变成灵长类动物,并且发展出超越其他一切生物的智慧。这条路径是唯一的么?人类的生命形态和最顶级的生命形态还有多大距离?AlphaGo 告诉我们:我们还有极大的发展空间;AlphaGo2.0 告诉我们:如果有合适的条件,完全可能有其他的生命进化路径,以及更不一样的进化结果。


让我们欢呼人的智慧造就了 AlphaGo,这也帮我们开了眼界,看到我们离最终的生命形态和智慧依然有遥远的距离。


保持敬畏,坚定前行,终得圆满。


以上摘自知乎日报:王小川


维权声明:凡是机器人2025发布的文章都会找原文作者授权并给予白名单,若没有授权到的文章,如涉及版权等问题,请及时联系运营者(微信:xiaoejiqiren)我们将第一时间处理,谢谢!


大家好,我是机器人2025一个专注于全球智能机器人产业的开放合作平台,为打造机器人产业界第一高端人脉与价值分享平台而努力。

 
机器人2025 更多文章 祁厅长胜天半子,AlphaGo就胜人四分之一子! 40行代码的人脸识别实践 非神经网络的深度模型 凯文· 凯利go说:AI小数据时代即将来临,那如何落地? 数学模型教你如何成为星际争霸高手——向机器学习
猜您喜欢 【流媒体|从入门到出家】:流媒体协议—RTMP 微信Tinker的一切都在这里,包括源码(一) 制作游戏修改器 - 植物大战僵尸阳光修改 greenplum表设计以及SQL优化 2016[设计教育再设计]系列国际会议(五)| 精心设计的教育:经历、能力和理想