标签:
杂谈 |
李世石对AlphaGo比赛开始后,不管懂不懂,人人都在讨论围棋和人工智能,这是种社交恐惧,唯恐失去共同话题,谁都想说几句,文章良莠不齐。现在热度过去,再讨论就容易多了。
现在人机对局已经完成了两局。对这两盘棋李世石状态的评论,原本想勉强说几句(因为我不具备谈这个的实力)。今天发现李喆六段这篇佳作:http://sports.sina.com.cn/go/2016-03-11/doc-ifxqhmve9080655.shtml ,就不用再班门弄斧了。
在AlphaGo赢李世石第二局以后,职业棋手们大部分转变了态度,开始认真对待,也总结出了一些特征,最典型的,就是他们发现电脑下的很多臭棋,并不是因为水平差,而是在已赢定的情况下争取更高概率的安全运转:
http://ww2/large/56fc0caagw1f1ts8g1sblj20c80dgmzd.jpg
这一步挡,业余初段都会知道比T4跳要损。而且,因为此棋是在一个封闭局部,所以可以通过穷举严格证明电脑没有下出最佳走法。但对于电脑来说,已经赢定的情况下,赢一目还是赢两目,没有任何区别,反正都是赢。有时为了增加赢棋概率,尽快定型降低风险,它可能主动下损棋。这应该是为了简化训练程序复杂性而设置的目标。但这个弱点难以被棋手利用,因为一旦电脑下出这种棋,那99%以上意味着你已经输了。另外,Google部分员工可以看到AlphaGo后台的胜率预判。第一局AlphaGo全程认为自己优势,而第二局AlphaGo则认为李世石前半盘下得非常出色,平分秋色。当然这并非李世石已完美,而是AlphaGo在前半盘还有缺陷。所以胜它并非完全不可能,那李世石胜一盘的可能性是多少呢?我谈一下自己的判断:
欧洲棋界以匈牙利物理学家发明的Elo(等级分)来作为棋力评判。这个评判比段位,以及中日韩的等级分制度科学得多。根据Elo还可以估算出两个棋手之间的平均胜率。目前樊麾二段的Elo是2986分,去年10月战胜他的AlphaGo老版是3168分,李世石大约是3520分。他对樊麾的平均胜率通过计算可得95%,棋份大概是授二子到让先之间。对老版AlphaGo的平均胜率89%,同样可以让先胜率过半,这也是李世石看了两人棋谱后的底气所在。
但从去年10月到2月份Google主动约战,期间三个月AlphaGo每天都自己跟自己下大约一百万盘棋,以优化估值网络。考虑到Google不可能主动凑上来丢脸,所以在2月份约战时,AlphaGo的Elo很可能已经超过了李世石,个人判断至少在3700分。Google需要留一些余量避免机器学习算法中的“过拟合”现象(指的是由于机器自己跟自己下,导致它优化的估值网络是针对自己某个特例的)。有这个把握,才可能挑战。这方面的基础判断,可以看我在赛前写的预测AlphaGo取胜的文章,怎样在对相关方面知识一无所知时预测棋赛的结果:http://weibo.com/ttarticle/p/show?id=2309403951020702063790
这是大家需要抛弃的第一个思维定式:并不因为Google工程师大部分是不懂围棋的外国人(这里要提一下,Aja是台湾业六,在大陆棋力至少也是业余强五),就不知道李世石有多强。相反,他们可以通过科学的方式准确地评估出李世石有多强,AlphaGo有多强,以及双方相遇时的平均胜率,约战之后所作的只是验证这个评判。
然而,根据我得到的内部消息,意想不到的是,AlphaGo的棋力在双方约战之后依然随着训练时间直线上升,没有遇到瓶颈。尽管我不知道它具体的Elo,但从时间上推算,目前新版AlphaGo的Elo至少达到了3800-3900,有一定几率达到了4000。如果在3900,那么李世石的胜率约为10%,大致是让先棋份,如果达到了4000,那么李世石的胜率为6%,大致在让先到授二子之间。我个人认为,从前两盘的情况看,AlphaGo的Elo很可能达到了4000。根据我的另一个内部消息,AlphaGo新版对旧版的胜率高达100%,我们假设这个值是99.5%取整所得,那么它的Elo可以反推为4085分。
此时要再想胜一盘就非常困难了,李世石在后三盘想赢一盘,概率只有不到20%。柯洁是目前世界上等级分最高者,Elo是3621,他单盘的胜率为10%,对AlphaGo五盘里面赢一盘有50%的概率。当然,这一系列推算都建立在AlphaGo等级分为4000的情况下。具体多少,我想赛后Google会披露的。
不少人很难理解对李世石“授2子”“让先”这种概念,认为说这种话“不懂围棋”、“不知道2子有多大差距”。我可以打个比方,百米短跑选手,一个跑10秒,另一个跑9.7秒。他们之间显然“相差巨大”。要是有个人100米只用了8.5秒,你肯定不信。因为9.7秒已经接近了人类极限,你想提高0.1秒都是很难的。但假如我说我开着一辆汽车完成的,你如果懂汽车,肯定信,因为汽车虽然也有极限,但不在9.7秒这里。假如你从来没见过汽车,也不知道汽车是啥,那你说什么也不会信。但这是无知。你必须拓宽自己的思路,主动地去理解、拥抱新事物,而非抱残守缺,人工智能就是这辆汽车。
值得玩味的是人们在此事件中的态度转变。从开始的不屑,到恐惧,直至无法接受。即便认为AlphaGo会赢的人,也有很多承认此事超出了他们的预想。他们的反应如同遭到了更高文明的碾压一般,在历史上重复过无数次:1.电脑根本不会走中盘,李世石把局面搅乱,展现一下杀力就行了。(我大清乃泱泱大国,英吉利小小岛国,大军碾过,立成齑粉)2.第一局李世石是因为不小心才输的,只要稳妥走棋,它那些靠纯计算拿出的厉害杀招就没用了。(我方输在贪功冒进,只要严守坚城,洋人自退。他们那套大炮妖术,用黑狗血泼之,就能破除)。3.第二局李世石为什么不打劫?电脑说不定不会打劫。是不是和Google有协议?(听说洋人膝盖不能弯,我们只要耍一套地堂刀,专斩他们的脚就行了。打不赢是因为汉奸太多)……
这些都是人类根深蒂固的弱点,因无知而自大,又因无知而恐惧。也许棋份上有差距,但并不说明AlphaGo就完美了。它很可能会有弱点。想要赢棋,永远建立在对对手的深入了解上。
附图:Facebook黑暗森林围棋程序对每一手后的胜率判断。从图中看,AlphaGo前半盘不够好,中盘优势大的话,还是有机会的。来自:http://zhuanlan.zhihu.com/yuandong/20639694