围棋界只是不理解现在人工智能的计算机的,它的工作原理,打个比方,AlphaGo现在的水平相当于会九阴白骨爪的周芷若(金庸先生的《倚天屠龙记》),所以职业高段跟它下棋,一开始会非常不习惯。
所谓的蒙特卡洛算法,就是随机函数;所谓剪枝本质就是排除法;像什么左右互搏,那就是写小说了。AlphaGo的“自我提高”,也会碰到瓶颈,那是由于它跟人脑相比,其它能力缺乏导致的。
人脑是很奇怪的,比如我2岁时学字,并不是有人教我的,而是听别人念一遍,我就记住了,所以在3岁时,可能也混了几百个字。
首先说一下,计算机是如何工作的,分成四个部份:
1、CPU负责整数运算;2、GPU负责浮点运算;3、模拟人脑的工作原理;4、路径积分。
围棋界似乎不能理解2+4。其实这个谷歌的人己经介绍过了:它对业余1段,是绝不可能下出职业9段的棋;但是对于职业棋手,它现在下的一样是职业棋手的棋。最简单的说:如果这个世界上的任何一个人,能死记硬背一百万张棋谱,他也会有围棋“直觉”,哪怕他根本不懂得下围棋。
第二盘,它认为自己己经赢了:路径积分己经排除了李世石,之后的任何翻盘的概率。所以它下出李昌镐的招牌下法:稳稳的自补——宣告它己经赢了。右上白棋可以劫争,但如果盘面优势大,它可以忍让。
我上篇博文说过:它在算得尽的情况下,是不会出错的。
唯一的机会,就是下成细棋劫争。或是从一开始就肉搏战,然后到处开劫。
其实这些,对于像李世石这样的棋手而言,都是次要的。重要的是:他以为纯粹是机器打败了他,但不是的。你不给它学人类的棋,它今天仍然是业余棋手。
第二盘那黑37,是它想“模仿”,可能在以前某个类似的(等价)“画面”里,它认为比如说有些前辈曾经下出过,而它的价值评估是:这是全盘价值最大的一手棋。但从现在的复盘来看,它好像没有完全“学会”。
这个原因,也可能表明它当时处在“超极限”状态:超出它的算路了,只是凭着相同的直觉认为。这个“超极限”,并不一定是从计算机的运算峰值能看得出的。当然,前提是李世石要理解:为什么会有“5路间冲”这个思路,然后找出计算机“似是而非”的地方,予以反击。但显然,对于人类,这也是“超极限”了:因为以前的棋,有可能是长考几小时,甚至是一段时间的结果。
下的越强,就会招来越多的“前辈”和当今的高手,联手来对付你。这对李世石来说,我相信那是无比兴奋的事;要么就肉搏+劫争,因为第一盘AlphaGo24、26顶断开始肉搏战时,它下出一手缓手,我想它是有意避开任何劫争的可能?