未来超级计算机能穷尽围棋历史的著名棋局的所有棋局么

科学视角解读人机大战 未来3-5年能赢所有人类棋手_中国经济网――国家经济门户
经济日报微信中经网微信
精彩图片推荐神经网络可能终将在围棋上打败人类 | 科学人 | 果壳网 科技有意思
神经网络可能终将在围棋上打败人类
本文作者:麻省理工科技创业
(Alulull/编译)在几乎一切领域里,人类都面临着被计算机迎头赶超的局面。譬如,机器视觉专家最近开发出了一种新的算法,使得计算机获得了超越人类的面孔识别能力。类似算法用于物体识别上,也在逐步缩小机器与人类的差距。而人类国际象棋选手在很久以前就放弃了打败计算机的努力——计算机第一次击败顶尖人类是在1997年,而人类最后一次击败顶尖计算机是在2006年。
但是,有一个领域仍旧由人类独领风骚,那就是一项古老的中国棋类竞技——围棋。计算机始终没能掌握这门技艺,目前最好的算法只能达到一个优秀的业余棋手的水平,顶级的人类棋手能轻易地将其打败。
如今,这一局面似乎有望被打破。苏格兰爱丁堡大学的克里斯托弗o克拉克(Christopher Clark)和阿莫斯o司多奇(Amos Storkey)利用了一种机器学习技术,来计算下一步棋的走向,而正是这种技术帮助面孔识别算法实现了革新性的进步。结果表明,人类继续称霸围棋赛场的希望恐怕十分渺茫了。
围棋需要两名棋手,以及一个由19X19条网格线划分而成的棋盘。棋手轮流将黑色或白色的棋子下在交叉点上,目标是在游戏结束时比对手占据更多的领地。当己方棋子将对方棋子包围时,棋手就能将该棋子移走。
专家认为,计算机之所以在围棋上表现不佳,原因有二。首先,围棋每一步的可能下法非常之多。棋手在起手时就有19X19=361种落子选择,而在比赛的任意阶段,通常都有数以百计的可能下法。与之形成对比的是,国际象棋的可能下法通常只有50种左右。
第二个问题在于,计算机很难分辨当下棋局的优势方和弱势方。对国际象棋来说,只需要把目前棋盘上剩余棋子的价值总和算出来,就能获得关于棋手形势的可靠指标。但这种方法对围棋来是行不通的。“计算双方棋手的棋子数目很难告诉我们,现在到底谁的赢面较大。”克拉克和司多奇说。
目前顶尖的围棋算法往往用蛮力法来解决这个问题,那就是对每一步可能的下法模拟出随后的整场比赛,并用不同的下法重复多次。如果在绝大多数模拟棋局中电脑能够获胜,那么就判断这一步棋为好棋。
很显然,这项任务非常耗时,且计算量极大。即便如此,计算机还是不能打败人类围棋高手,因为人往往只需一眼就能看出当下棋局的形势。
许多专家相信,人类掌握围棋的秘诀在于模式识别——通过棋子组成的图形形状来判断优势和弱点,而不是预测几步棋后的走向。
也正是因为这个原因,模式识别算法的最新进展有可能会大大改进计算机的表现。新算法利用大型的图片数据库,训练深度卷积神经网络(deep convolutional neural networks)来识别物体和面孔,其精确性如今已能与人类媲美。因此,可以预想,同样的算法用在围棋棋局自动评估上,也能发挥巨大的作用。
克拉克和司多奇所做的工作恰恰如此。两人训练深度卷积神经网络解决的问题是:给出一张两名围棋高手对局途中的棋盘照片,有没有可能预测出下一步?
他们的解决方案就是让神经网络对一个巨大的围棋棋局数据库进行学习,从而找到下一步棋的下法。克拉克和司多奇使用了超过16万个高手棋局,生成了共计1650万个棋子位置及其下一步的数据库。他们利用大约1500万个这种位置-步法的信息对来训练一个8层卷积神经网络,令其识别高手们棋路。这一过程共耗时数天。
接着,他们用数据库中剩余的部分棋局信息对该神经网络进行了测试。换句话说,他们向神经网络输入了源自某一棋局的棋盘位置,并让它选择下一步的下法。克拉克和司多奇说,经过训练的神经网络的预测准确性达到了44%,“显著超过了目前其他的最佳算法。”
这种新算法非常有趣,尤其是因为它在进行决策时没有利用任何先前的着子信息,也没有对将来的棋子位置进行评估。
神经网络的训练结束后,克拉克和司多奇让它和两个目前最好的围棋算法进行了对弈。第一个对手叫做GNU Go,棋力相当于一名中等水平的业余棋手,等级大约为6-8级。(围棋的业余等级为逆序,初学者为30-20级,最高为1级,再往上则改用段位。)
第二个对手则是目前的顶级围棋软件之一,名叫Fuego 1.1,等级大约为5-4级。人类棋手通常需要多年时间学习才能达到这一水平。
对弈的结果对于人类棋手来说无疑是一个凶兆。面对GNU Go的200次棋局中,克拉克和司多奇的神经网络的胜率高达90%。换句话说,只需几天的学习训练,神经网络就能稳定地击败6-8级的人类棋手。
在Fuego 1.1面前,它表现欠佳,只赢了10%的棋局。尽管如此,这依然是重大进步。“面对这个对手,哪怕只能赢过几局,也说明(我们的神经网络)的能力达到了相当高的水平。”克拉克和司多奇如是说。
很明显,前景是乐观的。“尽管目前神经网络使用的是‘不往前看’的策略,计算时间也远远小于对手,但它们仍然能够超越GNU Go,而且还能从Fuego那儿拿下几局。”他们说。
进步的空间也很容易预见,比如,将这种算法与其他考虑过往步数并会向前预测的算法结合起来。克拉克和司多奇的一个提议即是,将他们的卷积神经网络与传统的算法同步运行,前者能够帮助后者减小需要探索的步数。
克拉克和司多奇并没有说他们的算法能够打败世界上最好的围棋选手。但毫无疑问的是,围棋选手也终将向计算机霸主低头,这一切只是时间的问题。(编辑:Ent)
参考文献:
arxiv.org/abs/: Teaching Deep Convolutional Neural Networks to Play Go
<, Why Neural Networks Look Set to Thrash the Best Human Go Players for the First Time
你可能感兴趣
引用 的话:足球篮球之类的机器超人类估计有难度是啊,但是以后的人机混合足球必须规定一个射球速度上限,还要有体重限制,否则来几个移动铁墩子,铲断时像坦克一样碾过,一接球就时速五百公里开大脚,足球小将那些个狗血破网情节就要变成现实了。
机器在19路的棋盘赢了人,我们还可以把棋盘改成25路29路嘛
看来以围棋作为人类对人工智能的最后防线的计划要改一改了。
显示所有评论
全部评论(202)
一眼看出形式真的是根据图形?我怎么感觉好像不是呢,倒像是类似直觉的东西……
引用 的话:一眼看出形式真的是根据图形?我怎么感觉好像不是呢,倒像是类似直觉的东西……直觉的输入是什么?是棋盘上的棋子的排布,也就是图形。
转一张图,最近四十年来国象和围棋的机器对弈能力,围棋距离Top Human还有一步之遥。当然,光战胜人类顶级棋手还不算终点,还要利用丧心病狂的计算能力,争取每盘棋都以最小优势取胜(记得以前的MOGO就有这习惯,大多数胜局只赢1/4子)。可惜奥运会没有棋类比赛。不过话说回来,奥运会里面大多竞技项目机器也足够碾压人类了,举重、射击、划船、自行车……如果未来有混合奥运会,人类顶多也就赢点技巧类的,体操跳水乒乓球羽毛球之类的比赛。
poi的既视感。。。
Deep 这几年真是略神了一点。。
引用 的话:转一张图,最近四十年来国象和围棋的机器对弈能力,围棋距离Top Human还有一步之遥。当然,光战胜人类顶级棋手还不算终点,还要利用丧心病狂的计算能力,争取每盘棋都以最小优势取胜(记得以前的MOGO就...足球篮球之类的机器超人类估计有难度
引用 的话:足球篮球之类的机器超人类估计有难度是啊,但是以后的人机混合足球必须规定一个射球速度上限,还要有体重限制,否则来几个移动铁墩子,铲断时像坦克一样碾过,一接球就时速五百公里开大脚,足球小将那些个狗血破网情节就要变成现实了。
看来以围棋作为人类对人工智能的最后防线的计划要改一改了。
引用 的话:直觉的输入是什么?是棋盘上的棋子的排布,也就是图形。也许吧…我是感觉跟主观的去“看图形”那个感觉完全不一样。反正我围棋非常臭,思维方式没啥参考价值…
需要将定式输入计算,并建立相关的快速反应逻辑,这样就可以降低运算时间。再有就是要学会数目。
又是POI即视感
开来,快要逆天了
第二个对手则是目前的顶级围棋软件之一,名叫Fuego 1.1,等级大约为5-4级。人类棋手通常需要多年时间学习才能达到这一水平。太扯了吧……4级的水平哪儿需要学习多年啊
小孩子五岁开始学围棋的话,如果六岁时没到5-4级水平,基本就不用考虑做棋手了,不管是职业还是业余的。
医学硕士生
引用 的话:转一张图,最近四十年来国象和围棋的机器对弈能力,围棋距离Top Human还有一步之遥。不至于吧,按本文的说法,目前计算机最高水平还是业余,应该离人类的master还很远。
引用 的话:需要将定式输入计算,并建立相关的快速反应逻辑,这样就可以降低运算时间。再有就是要学会数目。不会数目就像象棋不知道照将,那还下什么棋,无论是人还是机器
这种方式不就等于人类不断学习升级自己的棋艺吗?如果人类寿命和健康能像计算机那样,不会比计算机差的。
引用文章内容:第二个对手则是目前的顶级围棋软件之一,名叫Fuego 1.1,等级大约为5-4级。人类棋手通常需要多年时间学习才能达到这一水平。开玩笑吧,我学棋两年在河南打上业余四段,河南业余四段的水平在全国业余四段里是最高之一了(当然离职业段差太远)
引用 的话:这种方式不就等于人类不断学习升级自己的棋艺吗?如果人类寿命和健康能像计算机那样,不会比计算机差的。人类的计算能力有限……
电脑围棋想要获胜我觉得没有那么难。开局阶段看起来选择很多,但其实这么多年下来,怎么开局就那么几种下法,最嚣张的不过是天元开局。三三、三四、四四、中国流之类的常用开局输入电脑就能应付绝大部分开局。如果真有人故意不按常规开局,也没关系:下模仿棋度过开局阶段就可以了。边角可以可以通过大量的定式解决问题,而且可以只在局部计算,比如一个角,一般只要看做5*5就足够了,再大一些也不会超过5线了,不然实地就要吃亏。配合大量定式的局部计算应该可以有效减少计算量。到了中盘,这时候角边争夺已经差不多了,很多地方死活已经有了结果,都可以排除出计算范围,更进一步缩小了计算量。而且一些愚形也可以果断排除出计算了:效率太低。这时候棋谱就派上用场了:棋手都是打谱过来的,很多时候就是按照打谱的记忆来,这方面计算机怕谁?到了官子,应该是计算机最擅长的部分,就不多说了。这样综合下来,应该可以有效提高计算机的棋力。PS:想到一个科幻小说。文中主人公面对超级计算机的时候,执黑第一手下在天元,之后就下模仿棋,最终靠让目上的微小优势获胜。这可能是人类面对计算机的最优下法了。
我觉得这个思路的问题是每一盘棋的差异性都太大了,几乎完全一样的局面可能因为某几个棋子的位置不同而导致截然不同的走法
机器在19路的棋盘赢了人,我们还可以把棋盘改成25路29路嘛
引用 的话:人类的计算能力有限……计算机计算能力也有限,所以围棋玩儿不转,计算量太大。正如文中所说只能靠模式识别与人类抗衡,换句话说就是靠记忆图形。而人类如果能活足够久并且保持健康,大脑是可以不断开发的,其储存量把现在的计算机加一起也比不过一个完全开发的大脑。可惜人类活不久也无法保持健康,终究会被不断成长的计算机超越
引用 的话:机器在19路的棋盘赢了人,我们还可以把棋盘改成25路29路嘛下完一盘棋得一整天吧……还算快棋
引用 的话:电脑围棋想要获胜我觉得没有那么难。开局阶段看起来选择很多,但其实这么多年下来,怎么开局就那么几种下法,最嚣张的最后贴目可是黑棋吃亏啊
引用 的话:足球篮球之类的机器超人类估计有难度球场上来个坦克编队一路碾过人都没了
胜利还远吗
引用 的话:电脑围棋想要获胜我觉得没有那么难。开局阶段看起来选择很多,但...大框是这么回事,但是编程实现又是另一码事了吖……比如咱看脸识人一瞬间的事,就这个一瞬间让各路专家吭哧瘪肚多少年,细节是魔鬼啊。
引用 的话:计算机计算能力也有限,所以围棋玩儿不转,计算量太大。正如文中所说只能靠模式识别与人类抗衡,换句话说就是靠记忆图形。而人类如果能活足够久并且保持健康,大脑是可以不断开发的,其储存量把现在的计算机加一起也...模式识别没问题,但是围棋这个系统太复杂了,看起来几乎一样的棋形可能因为一两个子的位置差别,甚至很远的一个地方的不同而导致完全不同的走法,计算机可以做到识别这些吗
POI S04E11里用到概率估算模型估计就是基于决策树的神经网络,不过那集里需要计算评估的选项和围棋对弈所要计算的相比差太多。我当时就在想,如果机器宝宝足够强大的话,可能在某些细节上还可以提升POI小队的生存几率。
引用 的话:大框是这么回事,但是编程实现又是另一码事了吖……比如咱看脸识人一瞬间的事,就这个一瞬间让各路专家吭哧瘪肚多少年,细节是魔鬼啊。 不懂编程。不过我觉得这个软件工作量最大的地方在于输入棋谱
显示所有评论
(C)2017果壳网&&&&京ICP证100430号&&&&京网文[-239号&&&&新出发京零字东150005号&&&&
违法和不良信息举报邮箱:&&&&举报电话:打开手机浏览器,扫描阅读
字体大小:
第278 围棋才能证明智慧手机
  第278围棋才能证明智慧手机
  江红兴:“想要证明智慧手机是智慧手机,我们需要一个能够直观衡量智宇人工智能水平的对象。有了对比,大家才能明白为何我说Sapientia_4是智慧手机,而其它手机只是把‘智能’一词庸俗化的智能手机。”
  “谷歌安卓不能视作衡量对象,其最新版本的Android_2.0更新集成的语音控制功能,远远不如智宇科技2008年发布的Sapientia_2。说一句安卓落后智慧操作系统两年时间,都是我在抬举它。”
  “苹果iOS也不能视作衡量对象,乔布斯准备收购的Siri,同样差Sapientia_2十万八千里远。”
  “2007年,我说诺基亚塞班系统一点儿不智能,智能手机应该重新定义;2010年,我要说,谷歌安卓和苹果iOS同样一点儿都不智能,不配称作智能手机。在我眼里,这些智能手机不过是电脑的小型化、触屏化,与‘智能’毫无关系。用它们当参考标准,仿佛让人和猿猴比谁更聪明,比赢了是理所当然,并不能因之证明智慧操作系统的杰出。这样的门槛太低,不能显现智宇集团和春秋集团现在的人工智能水平。”
  “那么,我们选择的对象是谁呢?”
  和谷歌安卓、苹果iOS比,不能显现智宇的水平!
  江红兴端的口出狂言。
  回顾2009年度全球智能手机市场,智宇和智星的联合出货量力压诺基亚成为全球第一。但是苹果和谷歌也丝毫不弱,苹果排名世界第四;谷歌安卓系统凭借多家手机制造商的支持,市场份额增加速度也令人瞠目结舌。以美国市场为例,2009年第三季度,安卓的市场份额尚不足苹果iOS的四分之一;2009年第四季度,安卓的市场份额已经几乎追平苹果iOS。全球范围内统计智能手机操作系统市场,截止到2009年底,谷歌安卓也已经快速追平到苹果iOS的三分之一。
  一家是市场份额稳定增加的竞争对手,一家是令人瞩目的潜力之星,却都被江红兴鄙弃语气说配不上“智能”字眼。
  看在观众眼里,江红兴未免有些膨胀。
  智宇粉丝虽然相信Sapientia系列智慧手机天下第一,却也不敢傲慢到鄙弃其它手机不配称作智能手机。台下的观众不禁小声议论:“今儿画风不对啊。”
  的确画风不对。
  魏东生实践中深度参与盘阳市建设,并在全国范围内合纵连横构建政治同盟,但他公开活动时,惯例绝口不言政治话题。即使偶尔被记者追问热点国际纠纷,魏东生也往往持以模棱两可态度,推脱说一些没有营养的两国共赢套话、废话。今日魏东生却先后放出两条劲爆新闻,一条间接为揭秘者斯诺登佐证,另一条抨击美国向跨国集团非法索要其它国家用户的隐私数据。如此,魏东生令奥马巴政-府陷入外交被动同时,自己也成为政治舆论的风暴中心。
  江红兴先前给人的印象是实干兴邦,专注提高自家产品品质,很少在公开场合攻讦竞争对手。智宇Sapientia_3G搭载的手机游戏《水果》,用户因为手机游戏开篇连续把水果斩为两截而浮想联翩,彼时江红兴还曾专门在社交网站刻意解释一句:“此事纯属偶然。”
  岂料继魏东生畅谈国际政治敏感话题之后,江红兴今日也改变画风,揪着谷歌和苹果的短处狠踩。
  在场观众不禁又好奇又疑惑,小声议论这是不是春秋集团和智宇集团的新常态。
  约一分钟时间,发布会背景屏幕忽又闪现新的图片:IBM的商标。
  观众懵然不解。
  IBM又不生产手机,Sapientia_4发布会怎突然提起它?
  江红兴缓声为大家解惑:“魏东生先生在2003年提出了智慧宇宙和智慧星空的概念,这也是智宇集团和智星集团的来源。2008年,IBM也相继提出了智慧地球和智慧城市概念,由此人们常拿智宇和IBM比较,开玩笑说这两家公司谁能先智慧起来。”
  “论历史,智宇肯定不如IBM。智宇和智星的智慧手机业务合并起来固然是全球第一,与IBM相比却算不得什么,毕竟IBM的计算机业务曾强到它一家公司生产的计算机数量是世界其它所有计算机厂家生产的计算机数量总和的4倍。而且,IBM创建于1911年,智宇集团创建于2003年,两者足足相差94年,根本不是同一个时代的产物。”
  “要比,只能比现在。”
  “比现在,IBM就不如智宇了。智宇诞生的2003年,IBM年度营业收入891亿美元;刚刚过去的2009年,IBM年度营业收入958亿美元,增长幅度微乎其微。反观智宇,2009年年度营业收入约1080亿美元,无论营业收入还是营业利润,都超越了曾经的蓝色巨人IBM。”
  “论及技术底蕴,IBM也不足为傲。”
  “好似计算机科学技术的王冠超级计算机,IBM前几年年年喊反超,结果呢?2009年12月期次的全球超级计算机五百强排行榜,三台寒武纪2009垄断第一名、第二名、第三名;三台寒武纪2008垄断第四名、第五名、第六名;两台寒武纪2007继续垄断第七名、第八名;第九名是克雷公司(Cray_Inc)研制的美洲豹;到了第十名,才是IBM研制的走鹃。”
  “再比较具体性能参数,寒武纪2009-3的Linpack计算值约4.787亿亿次;而走鹃的Linpack计算值才堪堪1042万亿次,莫说远远不如寒武纪2009-3,甚至远远不如智宇2007年的产品寒武纪2007-1。要知道,寒武纪2007-1的Linpack计算值约6182万亿次,足足是走鹃六倍。”
  “更前面的寒武纪2004D,LInpack计算值也有844.1万亿次。”
  “走鹃只比寒武纪2004D强点儿。”
  “2009年12月,智宇又研制了寒武纪2009-4;本月,就在举办Sapientia_4发布会同时,智宇又研制成功性能更加强大的寒武纪2010-1。如果没有其它制造商突破寒武纪2007屏障,寒武纪系列超级计算机将会前所未有地垄断2010年6月期次的全球超级计算机五百强排行榜的前十名。”
  “在超级计算机领域,智宇最少领先IBM四年时间。”
  诚如江红兴所言,智宇集团已经制霸超级计算机行业。想当初,智宇集团一举成名天下知,世人震惊寒武纪2004强势之余,私下不免怀疑智宇集团有没有造假放卫星。时光荏苒到现在,世人已经习惯到麻木,智宇刷新超级计算机新纪录仿佛是理所当然的结果,“能超越寒武纪的只有寒武纪自己”也从一句戏言变成铁的事实。
  别说追赶智宇的脚步了,三年前的寒武纪2007都像一座大山。
  无敌到寂寞。
  IBM或许不爽智宇的鄙弃,却没有办法反击:智宇已经开始冲刺十亿亿次超级计算机,它还在千万亿次领域打转。
  IBM甚至连一句狠话都说不出来。
  IBM倘若敢说大话,智宇完全蔑视态度嘲讽它:“最好先制定一个能达到的小目标,譬如先研制一台亿亿次超级计算机。”
  有此底气,江红兴遂能以友商全部都是垃圾的姿态侃侃而谈:“我们不否认IBM的伟大。”
  “可是,IBM已经老去。”
  “IBM已经是耄耋老妪。”
  “和耄耋老妪比,智宇赢了也不光彩。”
  “所以,IBM也不是智宇的比较对象。”
  “我在这里提及IBM,只是追忆IBM辉煌历史中的一件产品。智宇诞生那年,有一本名曰《谁说大象不能跳舞》的管理学热书,作者郭士纳(Louis_Gerstner)在上世纪九十年代成功领导IBM转型。IBM转型期间,郭士纳为了证明蓝色巨人的底蕴,刻意立项研制一台超级计算机‘深蓝’,最终顺利击败国际象棋大师加里·卡斯帕罗夫。深蓝是计算机发展史绕不过去的里程碑,自此以后,一项又一项棋类运动败给计算机。”
  “但,棋类运动还有一座大山。”
  “那就是围棋。”
  “围棋是与国际象棋截然不同的棋类运动,简单来说,国际象棋可以穷尽所有变化,而围棋,以计算机科学技术迭代速度预测,哪怕是智宇出品的超级计算机,在未来很长一段时间内,也无法穷尽其所有变化。围棋状态空间复杂度上限是3的361次方,这数字庞大到什么程度呢?可观测宇宙中普通物质的原子总数约为10的80次方,宇宙原子总数与围棋状态空间复杂度上限相比,差距都是数量级的。”
  “围棋状态空间复杂度上限,数字太庞大了。”
  “计算机程序想击败围棋,必须拥有一定的筛选能力,必须拥有一定的价值判断能力,必须拥有一定的‘智慧’。”
  “这样的智慧,才是智宇想向世人展现的智慧。”
  “参考2010年度世界围棋棋手最新排名,春秋、智宇、智星、祝为联合邀请李世石、孔杰、崔哲瀚、古力、李昌镐等排名世界前三十名的顶级专业围棋棋手,在5月18日举办一场烂柯围棋挑战赛。”
  “类如深蓝挑战国际象棋大师加里·卡斯帕罗夫,这场烂柯围棋挑战赛也将是计算机发展史绕不过去的里程碑。”
  “所以,让围棋来鉴定智慧手机的成色吧!”
MjAxNy8wMy8wNi8jIyM1ODcx
/book//.htmlGoogle能成为下一个世界围棋冠军吗?_第一财经
Google能成为下一个世界围棋冠军吗?
一财网刘佳 任绍敏
有着2500多年历史的围棋,一直被视作计算机最难以攻克的大众棋类。但现在,这一人工智能研究的领域&拦路虎&,开始遭遇强劲挑战。
1月28日,GoogleDeepMind团队宣布,他们研发的人工智能(ArtificialIntelligence,下称&AI&)程序AlphaGo,在没有任何让子的情况下以5∶0击败了欧洲围棋冠军职业围棋二段樊麾,同时也击败了目前最好的围棋程序中99.8%的对手。
果壳网新浪微博称:&围棋,人类已经下不过谷歌的AI了!&多年以后,当人类仰视AI的智慧时,准会想起谷歌推动黑白子的无形的手。围棋九段、第二届百灵杯世界冠军柯洁转发了上述微博,并评论说:&震惊!!赞!虽说看棋谱感觉水平有限&&但可怕的是这还不是完全体,它是可以学习进化的&&&
AlphaGo的下一个挑战将是世界顶级围棋选手之一李世石,这场对战将在今年3月进行。李世石是围棋九段高手,也是近10年来获得世界第一头衔最多的棋手,Google为此提供了100万美元作为奖金。
为什么围棋难以攻克?
1997年5月,象棋冠军加里&卡斯帕罗夫被IBM&深蓝&击败。今年3月,相似的历史还会重演吗?
&对于更加智能和灵活、具备与人类类似解决问题能力算法的开发工作而言,游戏无疑是一个绝佳的试验场。&Google在官方博客中这样写道。
历史上,电脑最早掌握的第一款经典游戏是井字游戏,这是1952年一位博士在读生的研究项目;随后是1994年电脑程序Chinook成功挑战西洋跳棋游戏;3年后,IBM深蓝超级计算机在国际象棋比赛中战胜世界冠军加里&卡斯帕罗夫。
除了棋盘游戏外,IBM的Watson系统在2011年成功挑战老牌智力竞赛节目Jeopardy游戏一战成名;2014年,Google自己编写的算法,学会了仅需输入初始像素信息就能玩几十种Atari游戏。
但此前,有一项游戏仍然是人类代表着顶尖水平,那就是围棋。
围棋虽然看上去规则简单,却因为精妙而富有思想深度,几个世纪来都牢牢抓住了人们的想象力。
Google介绍说,围棋的搜索空间是漫无边际的&&比围棋棋盘要大1个古戈尔(数量级单位,10的100次方,甚至比宇宙中的原子数量还要多)。因此,传统的&强力&人工智能方法也就是&为所有可能的步数建立搜索树&,在围棋游戏中根本无法实现。
今年1月10日,卡耐基梅隆大学机器人系博士、Facebook人工智能组研究员田渊栋曾在知乎中作答称,&围棋难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆,同时状态空间大,也没有全局的结构。这两点加起来,迫使目前计算机只能用穷举法并且因此进展缓慢。&
目前,Facebook的智能围棋darkforest最新的darkfmcts3在KGS围棋服务器上达到了5d,赢了一局Zen,输了一局给DolBaram,被让四子与一位韩国的职业六段一胜一负。
&现在的深度学习能在大量对局中找到这样的一些规律,但仍然没有人脑厉害。这一方面说明我们现在算法的局限性,另一方面它还有巨大的发展空间。&他说。
人工智能击败职业顶尖棋手真的快了吗?
知名少儿对弈平台新博围棋老总陈劲松在朋友圈评论说:&三个月以后,Deeplearning也许可以打败李世石,那也只不过是围棋高手队伍里面多了一个小伙伴而已,它学会了大家所有的招数。它同时还在等待学习你们发明的新的招数。&
职业二段棋手、围棋资深教练刘轶一对《第一财经日报》称,不用担心,不会那么容易。不过他所在的朋友圈里,围棋职业棋手们众说纷纭,有些认为不可能,有些认为指日可待了,还有声音是&人类快被自己灭绝了&。
击败欧洲围棋冠军
那么,人工智能程序AlphaGo是如何击败围棋高手的?
GoogleAlphaGo的研究者DavidSilver说,AlphaGo系统的关键是,将围棋巨大无比的搜索空间压缩到可控的范围之内。
而为了达到这一目的,AlphaGo系统将最先进的蒙特卡洛树状搜索技术与两个深层神经网络相结合,每个深层神经网络均包含许多层,每层又包含数以百万计的神经元一样的连接。
在AlphaGo两种不同的神经网络中,&策略网络(policynetwork)&的作用是预测下一步,并用来将搜索范围缩小至最有可能硬起的那些步骤。另一个神经网络&价值网络(valuenetwork)&则是用来减少搜索树的深度,每走一步估算一次获胜方,而不是搜索所有结束棋局的途径。
上述方法使得AlphaGo的搜索方式相比之前的方法更人性化。例如,深蓝采用强力方法搜索的棋子位置要比AlphaGo多数千倍。而AlphaGo则相反,它通过想象下完剩余棋局来对下一步进行预判,如此多次反复。在上述模拟游戏中,策略网络提出下一步的智能建议,而价值网络则对走过的每个位置进行评估。
具体而言,Google首先采用围棋专业棋手的3000万步下法对价值网络进行训练,直到该网络对人类下法预测准确率达到57%(AlphaGo之前的纪录是44%)。
但AlphaGo的目标是击败水平最高的人类棋手,而不仅仅是模仿他们。为了做到这一点,AlphaGo学会自己发现新策略,通过自身两个神经网络之间成千上万的对弈,采用被称为强化学习的试错法逐步进行改善。这种方法提高了策略网络的效率,以至于最原始的神经网络(即其中不包含任何树状搜索)可以击败最尖端、构建有巨大无比的搜索树的围棋软件。
这些策略网络又反过来对价值网络进行训练,采用的还是从自我对弈强化学习的方法。这些价值网络可以对围棋的任何位置进行评估并预测获胜方,而人们过去曾认为这个问题太过困难,根本无法实现。
实现上述所有设想的前提是,计算机要超级强大。Google称,这一过程大量使用了Google云平台,使得人工智能和机器学习研究人员得以随时灵活地获得计算、存储和联网能力。此外,采用数据流图形(如TensorFlow)、用于数值计算的开房源库使研究人员得以对多个CPU或GPU的深度学习算法的计算需求进行高效利用。
AlphaGo到底有多强大?为了回答这个问题,Google在AlphaGo和人工智能研究领域最前沿的其他顶级围棋软件如CrazyStone、Zen和Pachi之间进行了一次比赛。AlphaGo在总计495局中只输了一局,胜率是99.8%。
AlphaGo甚至在每局开局让对方四步的情况下对阵CrazyStone,Zen和Pachi,胜率分别达到了77%,86%和99%。
如果在今年3月的对战中,AlphaGo战胜李世石,是否意味着人工智能已经超过人类?
或许还不能如此断言。但新成立的非营利性组织OpenAI的AI研究者IlyaSutskever认为,从技术的角度说,这个研究对AI具有纪念碑式的贡献。
在棋类游戏之外,这场对决也将引发更多的思考&&那些人们曾经以为人工智能不可能完成的脑力挑战,是否都将被一一打破?未来人类是否会被人工智能所取代?
编辑:胡军华

我要回帖

更多关于 围棋棋局 的文章

 

随机推荐