微信号:bigdatalab

介绍:宽客俱乐部旗下美国大数据实验室,大数据研究应用.

李世石对AlphaGo十段,与两美女通宵准备,冀挽回人类4000年面子

2016-03-13 09:36 大数据实验室

洪敏杓帮助李世石寻找败因


第二局局后的李世石


3月10日李世石输掉“人机大战”第二局后,李世石回到酒店的彻夜研究破Alpha GO之策,和李世石关系最要好的洪旼杓九段和朴正祥九段,女棋手韩海苑三段和李多慧四段一直陪着他。等李世石们研究完,已是11日凌晨6点。


李世石通宵达旦,呵壁问天,他遇到了一生最强的“对手”。3月9日他输掉“一盘都不能输的比赛”,至此四千年围棋开启人工智能时代,接着3月10日李世石再次完败,他所代表的职业围棋界被逼入了赛点。3月初的第17届农心杯决胜局李世石尽管不敌柯洁,但是主将三连胜接连击败中国围棋名人连笑和日本围棋名人井山裕太,3月9日事实上是作为“三国围棋名人”临敌Alpha GO。李世石首败后,韩国职业棋手以“棋神”、“十段”称呼Alpha GO,如果3月12日李世石再败,Alpha GO可能永久占据人类文明的围棋“名人碁所”,自然进化的人类可能再无机会夺回。


3月12日的第三局,无论李世石本人,还是围棋界的所有人类,可能都不会惦记忽然显得很可笑的“百万美元”冠军奖金了。后三盘李世石的任务有两个,一是大逆转,为围棋界至少赢得半年时间,这事实上是“不可能的任务”;二是至少取得一胜,侦测出Alpha GO“可能”存在的短板。如果李世石0比5全败,人类围棋的“天启”就彻底降临。


3月9日李世石首局失利后,谈感想说了两个“意外”,一是Alpha GO能解题序盘阶段李世石刻意下的新手,二是难解局面下可以释放胜负手。但首局后李世石依然认为比赛刚开始,胜负50比50。3月10日的第二局不敌后,李世石承认至始自终处于落后,完败给Alpha GO,后三盘的目标已调整为但求一胜。


第二局后李世石的体会是:“如果序、中盘不取得优势,后盘再无机会。”对于Alpha GO的“棋风”拿出最独特见解的是比赛的读秒员郑由贞(音译,院生出身),如图。

郑由贞觉得,Alpha GO的棋结构上始终呈坚实的连接状,咋看是笔直的角尺。徐奉洙九段对围棋的理解是“归根结底,都要连起来”,而整体连成一片的棋,就不容易输。


尽管观战的职业棋手们第二局Alpha GO也下了几步问题手,但李世石认为Alpha GO至始至终领先。第二局李世石最后悔是左下一带的定型。

第二局李世石试图把棋局引向乱战,所以左下选择了白1、3(白48、50)冲断作战的变化。进行到黑10(黑57),似乎是白棋成功的局面,因为白棋在不确定的左下一带获得了安定。但是没走几手,才发现结论是正相反。

此后实战进程,黑1是“人类”能看懂的好手,接着右边黑3贴下,黑5再扳,让白棋棋形重复,然后黑7守关,上边一带黑棋实地华丽丽地暴涨,李世石等结论认为此时黑棋已占优势。

李世石是后悔白1应如图打吃,而不是冲断。那么进行到黑7,黑棋的棋形已经崩坍,白棋可以一举取得优势。

黑81是完全出乎人类“视界”的、第二局最闪光的一手棋。Alpha GO这一步落下,李世石的身形开始剧烈摇晃,内心受到了很大的震撼。李世石虽然一生下了无数“天外飞仙”的手段,但绝没有想到这一步还能下到这里。李世石的白80像是小“尼莫”掉进了汤锅里。

战定型,黑棋笔直地割下了上边的实地,基本确定了胜势。接着。。。

很难想象Alpha GO仅靠黑101、黑109、黑115三记胜负手(三个黑▲)就打爆了李世石上中腹一带的白棋形胜之地。


Alpha GO此三子又是笔直的角尺状,而且如此简洁。在首届美林谷杯计算机围棋大赛,林在范说他的“石子旋风”每秒钟自我对局4万局后选择胜率最高的手段,而加持了政策网、价值网两层神经网络的Alpha GO犹如四维生物般在时间线上来回穿越着选择最有效、最简洁的手段,而这三步庄严的三角又揭示了Alpha GO的棋风之美。不过接着,Alpha GO走了黑1冲、白2挡的恶手交换。因这交换黑棋自紧气,给了上中腹一带的白棋唯一一条逃生通道。继而。。。

在乌鹭网讲解的李贤旭八段百思不得一解白1(白148)接住时,黑2(黑149)为什么不这么笨曲一步?如此中腹白四子无法逃脱。但此时李贤旭已不敢乱加断语,因为Alpha GO的每步棋都在嘲弄“你们人类不懂”,此时职业棋手们已集体失语。


关于劫的争议,李世石们彻夜研究后的结论


第二局最后阶段,李世石在左上一带没有走开劫次序,以致李世石与谷歌间有“不开劫秘密协议”的质疑不断被提出来。基于蒙特卡洛算法的计算机围棋普遍有一个短板,就是不会处理复杂劫争的局面。


在去年首届美林谷杯期间,冠军程序“石子旋风”在和连笑七段的“人机大战”中因陷进两劫循环的死循环被打爆。李世石和Alpha GO的前两局都没有出现复杂劫争,固然Alpha GO规避打劫,李世石也无意拿劫争做文章。也就是前两盘李世石并没有火力侦察Alpha GO究竟有没有不会开劫的短板。


11日记者微信询问“石子旋风”的开发者林在范:“你认为Alpha GO已经解决了打劫的短板了吗?”林在范回答说:“虽然对局并没有出现劫争,但是能下出这个实力,应该得到解决了。Alpha GO打劫能力可能比职业棋手稍弱,但本身不会成为明显的短板。”


11日在韩国太极网讲解的洪性志对李世石未开两个劫感到惋惜。事实上韩国棋手们眼巴巴地等着李世石开劫,因为Alpha GO的短板可能就在打劫。

洪性志很遗憾李世石左上一带白1~5没有开劫。

最后阶段李世石在输定的情况下没有走出开劫次序是洪性志表示的第二个遗憾。他认为左下白棋有劫库,这劫可以打。


事实上,10晚至11日凌晨的彻夜研究,洪旼杓、朴正祥们给李世石提的第一个方略就是开劫争胜。因为Alpha GO前两局明显表现出规避劫争的倾向,李世石应复杂劫争为核心制定作战计划。


和人类对局李世石“劫王”,即使优势局面下也会悍然与对手开劫到底。第二局唯一遗憾是李世石未能侦测Alpha GO的打劫能力,而第三局Alpha GO未必真不善于开劫。


李世石们彻夜研究出的第二个制胜方略是“大模样作战”,前两局Alpha GO留下的印象是更倾向于侵削而不是战斗,Alpha GO尽量减少变数,安定地架构框架。所以用大模样作战增加变数,以此诱导Alpha GO的失误。


而最关键是李世石本身要减少失误。洪旼杓九段与李世石彻夜研究后,11日凌晨6点走出酒店,并接受了韩国《体育京乡》的采访。洪旼杓说:“看前两局就知道,Alpha GO序、中盘也会出现失误。但问题是李世石的失误会出现在后盘。序盘的失误可以容错,通过战斗转换等可以得到挽回,但后盘的失误是诉求无门。李世石二连败的原因就在于此。”


洪旼杓最后说:“通过这次彻夜研究李世石九段如果能3比2大逆转当然很幸福,但并不容易。只希望李世石九段好好休息一天,12日的对局可以打下反击的桥头堡。”


(来源:云计算头条





最全面超值的量化对冲课程


  • 量化与对冲概览

  • 期货量化交易

  • 量化投资在股票市场的应用

  • 量化投资理论进阶与高级实践


2016年3月25-26日广州,两天4000元。


咨询电话/微信:13061694649


 
大数据实验室 更多文章 用户画像数据建模方法 李光斗:警方是如何利用大数据抓到王全安的 降楼价,新加坡居然靠的是无人驾驶! 小数法则和经验主义 什么性格的人适合 Quant 这个职位?能否描述一下 Quant 一天的生活是怎样的?
猜您喜欢 【武汉精选招聘第七期】 Android++:为Android App开发而生的Visual Studio的原生扩展 程序员都应该了解哪些安全知识 [长文]R语言与分类算法的绩效评估 线下培训体验的机会来啦,点击阅读全文即可获得!!!