加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

谷歌开发程序AlphaGo首次战胜人类围棋高手

(2016-01-28 09:56:22)
分类: 转载精华

【注:卧槽!我以为,这辈子都看不到这一天呢,没想到人工智能发展这么快。我试过很多围棋软件,都不可能战胜业余棋手。谷歌,竟然要挑战专业顶尖高手,这个太牛逼了。这世界变化快,围棋代表了棋类游戏的最巅峰,机器永远战胜人类,这是科幻片。】


  来源:财新网

  【财新网】(实习记者 吕光一)近日,人工智能在同人类高手的的围棋对弈中取得历史性胜利。

  2016年1月28日,《自然》杂志发表论文,并以封面故事展示了由谷歌旗下人工智能公司DeepMind研发的计算机围棋程序“AlphaGo”,这项程序在一项竞赛中以5比0的成绩战胜了欧洲围棋冠军樊麾。这是有史以来第一次,计算机程序在不让子的情况下,在围棋游戏中击败人类专业高手,而这原本被认为是人工智能在10年后才能达到的成就。接下来,AlphaGo还将在2016年3月挑战世界冠军棋手李世乭

  20多年来,人工智能在大众棋类领域同人类的较量一直存在。从上世纪90年代中期战胜全世界跳棋顶尖高手的Chinook程序,到战胜国际象棋大师卡斯帕罗夫的深蓝,通过一代代的更新发展,在这类以智力博弈著称的游戏中,人工智能刷新记录,打败人类,创下纪录。

  然而,一直以来,围棋却是个例外。在这次AlphaGo取得突破性胜利之前,计算机围棋程序虽屡次向人类高手发出挑战,但其博弈水平远远低于人类。在同职业高段位顶尖棋手的较量中往往只能在“让子”的情况下才能打个平手或是略胜一筹。2013年日本电脑围棋“Crazy Stone”让四子打败了围棋九段高手石田芳夫,2015年11月份韩国专家林宰范研发的“DolBaram”程序在让四子的情况下击败了前超一流棋手赵治勋九段

  之所以出现这种情况,是因为比之于计算国际象棋,计算围棋要复杂得多。围棋最大有3^361 种局面,大致的体量是10^170。而国际象棋最大只有2^155种局面,体量大致是10^47。围棋一盘大约要下150步,每一步有250种可选的下法,那么一盘围棋需要计算250^150种情况,大致是10^360。这是一个过于庞大的数字,传统蛮力搜索在围棋这里并不可行。

  因此,AlphaGo战胜人类围棋高手尤为难得。开发者大卫·斯尔弗(David Silver), 黄世杰(Aja Huang) 和 戴密斯·哈萨比斯(Demis Hassabis)运用深层卷积神经网络来缩小传统蒙特卡洛树搜索的广度和深度,以挑选最佳招数。“Alpha Go”的核心也正是两种不同的深层神经网络:策略网络(policy network)和价值网络(value network)。利用“价值网络”去计算局面,根据局势对路线进行取舍;用“策略网络”选择下子,减少不必要的棋步,在配合中选出有希望的好棋步,抛弃明显差棋,从而将计算量控制在计算机可以完成的范围内。

  此外,开发者们还用两种方式同步训练AlphaGo,一是用许多专业棋局进行训练的监督式学习(supervised learning),然后让“Alpha Go”和自己对弈,这种方法称为强化式学习(reinforcement learning)。在这种不断的学习,反思和练习下,在同其他围棋程序进行的总计495局的较量中取得只输一局的辉煌战绩。它的对手也包括Crazy Stone、Zen和Pachi三个先进的计算机围棋程序。

  在自然发表的论文中,AlphaGo与樊麾对战五局,均取得了胜利。樊麾出生于中国,后入籍法国,曾获欧洲围棋冠军,目前是法国国家围棋队总教练。

  “我开始以为会是我赢,”樊麾接受《自然》采访时表示,在第一局落败之后,他改变策略并更积极地反击,但仍然失败。“因为我们是人类,所以我们会犯错误、会疲倦,求胜之心也会带来压力。而程序并非如此,它非常的强大稳定,像一堵墙。”樊麾表示,他觉得AlphaGo棋路略有些奇怪,但仍然像是一个强大的真人对手。

  “在观察棋局时,如果不是预先知道,我很难看出来哪一方是电脑下的,”英国围棋协会主席乔恩·戴蒙得(Jon Diamond)表示,在AlphaGo之前,最好的计算机程序也无法战胜人类的业余高手,因此他曾认为,计算机程序打败人类专业高手在5-10年之后才会发生

  韩国专业旗手Hajin Lee则表示,从棋局记录上来看,AlphaGo明显强于樊麾,但它是否能够战胜世界顶尖选手仍然存疑 ,“也许,这个程序会遇强则强”。

  围棋界纷纷表示,AlphaGo对战李世乭,将是令人期待的标志性战役。韩国九段棋手李世乭是近10年中获得世界冠军头衔最多的棋手,他的旗风属于力战型,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手。

  面对挑战,李世乭回应称,这将是有史以来第一次计算机程序在不让子的条件下挑战人类最顶尖的专业高手,他将很荣幸地应战。 “我听说DeepMind的人工智能很强,并且越来越强,但我有信心,至少这次能够赢得比赛。”。

  韩国围棋协会对这场未来的人机围棋大战表示欢迎,关于比赛结果,他们认为,“也许由于李世乭之前没有跟计算机对弈的经验,所以AlphaGo有可能赢个一两局,但是难以获得最终胜利。”

  如果对这场比赛下赌注,英国围棋协会成员、此前AlphaGo与樊麾战局的裁判托比·曼宁(Toby Manning)笑称,自己会押李世乭获胜,“但我可能不敢赌上很多钱。”

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有