AlphaGo 对李世石“放水”?棋手说不可能!
就在舆论普遍认为李世石将会继续败北的时候,人机大战的第四场,李世石出人意料地挽回了胜局,将比分改写为“3:1”。
比赛开局阶段,李世石始终落后于 AlphaGo,一直在被吊打。然而,第78手的时候,局势峰回路转,李世石下出了关键的一步,一招极其冷门下出妙手。对于这一步棋,视频观战的职业棋手古力评价为“神之一手”。
随后,AlphaGo 一连串的差手让棋面局势利好于李世石。在第97步,AlphaGo 再次出现低级失误,所下白子被李世石果断吃掉。最终,经过长达4个多小时的鏖战之后,AlphaGo中盘认输,李世石终于在这场人机大战中赢回“尊严”之战。
对于戏剧性的比赛结果,朋友圈出现了有多种观点看法,其中最有代表性的一种说法是“AlphaGo 选择性放水“。甚至还有阴谋论表示,AlphaGo 今天失利是因为被改代码。那么,AlphaGo 放水的可能性有多大呢?
我们第一时间针对这一问题请教了围棋界、科学界的专业人士。对此说法, 他们都表示,“可能性为零”。至于李世石第78步的落子,完全可以称得上是载入史册的一次妙招!
业余围棋5段的高飞龙表示:
李世石创造了历史,第78步棋没有一定水平看都看不懂,很高的职业水准才能想得到。
棋手鲍云对于李世石第78步下法给予了很高的评价:
“配得上最高评价神之一手。
AlphaGo 程序在大优局面的情况下被李世石的妙手打懵了,导致在随后的20来步进入疯狗状态。鲍云表示:
AlphaGo 前半盘大优,不是防水的态度。至于AlphaGo 第97步的表现可以用“疯狗病发作”来形容。78-97步,机器应该有足够的(时间来)缓冲调整计算出局面走势。97确实是很“丢狗”的一步,说明算法还是有极大的问题,抗击打能力不足,崩溃的太脆了”。
那么,AlphaGo 为何会出现如此明显的异常表现?
根据Alphago原论文第一作者之一的Demis Hassabis 在赛后的总结,
“李世石下出白78后,AlphaGo自我感觉良好,在程序的“值网络”(用于评估电脑胜率)中,误以为胜率达到70%,直到第87步才反应过来。”
高飞龙猜测,很可能是蒙特卡洛算法本身的一个缺陷。“78步本身是盲点,(李世石)小概率的选点,很可能导致(AlphaGo)在正确率很高的算法上出现意外事件,导致出错。”如果这一猜测成立,人类将可能找到每盘打败阿尔法的策略。而谷歌公司,将需要很长的时间来修正这一“缺陷”问题。
出门问问NLP工程师李理也在微信群给出了自己的猜测:
(如果一定要猜测)我觉得可能是开局主要靠value network,因为搜索空间太大,有可能在某些特殊的局面下出现非常差的结果。就像之前神经网络识别图片时也出现过很诡异的错误,还有人研究怎么构造让它识别出错的例子。
同时,他也认为这一“诡异”问题将会比较难解决,
神经网络打分是固定的,搜索有一定随机性。而value network是异步的,调试也不简单,得通宵加班找bug了。
PS.最新消息补充:
在赛后的记者招待会上,李世石谈到了AlphaGo的两个弱点:一个是AlphaGo执黑棋时似乎挣扎比较多,相较执白棋时更难赢。另一个是,当它遇到出其不意的招数时,有可能会导致失误,未必是失误,就是bug。
那么问题来了,第5场比赛,各位怎么看?是李世石再下一城还是AlphaGo 4:1 荣耀收关?