10 人赞了 AI击败围棋高手下象棋厉害不,未来它会颠覆人类吗

AI和人类的较量,谷歌人工智能击败欧洲围棋冠军
【钛媒综合】 AI 和人类的较量再一次展开了。
1月28日上午消息,谷歌今日召开全球电话会议,旗下Deep MInd创始人戴密斯&哈萨比斯(Demis Hassabis)宣布了谷歌在人工智能领域的重要进展:开发出一款能够在围棋中击败职业选手的程序——AlphaGo,后者能够通过机器学习的方式掌握比赛技巧。
而同样,在今天国际顶尖期刊《自然》报道了谷歌所开发的这款新围棋AI。这款名为AlphaGo(翻译为阿尔法围棋)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾,樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。
AlphaGo与欧洲围棋冠军樊麾的5局较量
除此之外,研究者也让AlphaGo和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。
计算机和人类竞赛在棋类比赛中已不罕见,在三子棋、跳棋和国际象棋等棋类上,计算机都先后完成了对人类的挑战。根据资料显示,1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI;但对拥有2500多年历史的围棋而言,计算机在此之前从未战胜过人类。
AI下围棋,是如何通过计算来打败人类的?
围棋看起来棋盘简单、规则不难。棋盘纵横各19条等距离、垂直交叉的平行线,共构成19&19(361)个交叉点。比赛双方交替落子,目的是在棋盘上占据尽可能大的空间。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47。
那么AI是如何攻破人类的呢?根据果壳网上作者“开明”的文章解释,面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。
然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。
机器学习研究者们祭出了终极杀器——“深度学习”(Deep Learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。
AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。
其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。
AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。
研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!
人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。
被打败的欧洲冠军樊麾是什么样的水平?
值得注意的是,在AlphaGo打败欧洲冠军之后,谷歌同时还宣布将在今年三月挑战韩国围棋选手李世石,李世石是围棋九段高手,也是近10年来获得世界第一头衔最多的棋手,谷歌为此提供了100万美元作为奖金。
根据谷歌自己的评估,目前AlphaGo的实力只在职业二段左右,其打败的欧洲冠军也只有二段,而韩国围棋选手李世石却是九段,无疑二段与九段之间的实力甚为悬殊。李世石对谷歌的这一挑战表示非常期待,并且认为自己一定会赢。
同时,知乎上有匿名用户分析:
如上图,欧洲冠军Hui Fan的水平目测是二段左右,而最强的AlphaGo distributed大概是五段,这和“击败人类”的目标还有点距离(其他非随机类游戏,机器都能轻松击败最强的人类大师)。所以还是等三月和李世石的五番棋吧。
尽管AlphaGo尚有一个月时间学习,但是假设围棋的技巧是有限的话,无论是人学习还是机器学习一定是一条渐近线,即使AlphaGo在三月的挑战中输了这场比赛,这仍旧是AI发展史中一件极具标志性的事情。
PS:本文分析部分内容综合自果壳专栏、知乎用户,点击链接可产看原回答,更多观点可见钛媒体文章《人工智能如何一步步走来,直到挑战欧洲围棋冠军》
编辑:新语
&未来网为共青团中央网络影视中心下属中央级新闻网站 如有新闻线索请发邮箱
来源:中新网  20:11
来源:中新网  18:31
来源:中新网  18:10
来源:中新网  16:50
来源:中新网  15:50
来源:中新网  14:50
看新闻不过瘾来这里吐槽
版权所有:共青团中央网络影视中心信息网络传播视听节目许可证0105108号 京ICP备号-1
&&|&&&&|&&客服电话:010-- 或用以下帐号直接登录 -
人工智能还没有颠覆围棋 等它打败真正的高手再说
来源:网易科技报道作者:
人工智能还没有颠覆围棋 等它打败真正的高手再说
(原标题:人工智能还没有颠覆围棋,至少等它打败真正的高手再说)
  来源:环球科学ScientificAmerican
  今天凌晨,Nature发文宣布谷歌人工智能战胜欧洲围棋冠军。3月它将挑战世界围棋冠军李世乭,专家认为李世乭仍有可能取胜。
  撰文 伊丽莎白·吉布尼(Elizabeth Gibney)
  翻译 丁家琦
  几十年来,古老的围棋游戏一直是计算机难以涉足的领域,它的细微精妙使得人工智能(AI)在这方面远远落后于顶级的人类棋手。
  然而,就在今天凌晨,Nature发文宣布,谷歌位于伦敦的DeepMind公司开发出的名为AlphaGo的程序,在完全公平(没有让子)的情况下,以5:0的比分击败了欧洲围棋冠军樊麾。
  Nature采访了樊麾,问他被机器击败是什么感觉,同时采访了围棋与人工智能两方面的专家,问他们预测AI最终挑战世界冠军李世乭是否会成功。
  樊麾,欧洲围棋冠军
  “在中国,围棋不仅仅是一种游戏,也是生活的一面镜子。你在围棋中遇到的问题,可能也反映着生活中的问题。”
  失败的感觉是很难受的。在与AlphaGo对弈之前,我一直以为我会赢。第一局之后,我改变了策略,努力应对挑战,但最终还是输了。我觉得主要问题在于,人类是会犯错的,因为我们是人类。我们会累,会因求胜欲望过于强烈而感到压力,但计算机程序就不会这样。它们很强大,又很稳定,就像一堵墙一样。在我看来,这就是机器与人类的最大区别。如果事先没人告诉我AlphaGo是个机器的话,我会以为对手是人类——或许棋路有些奇怪,但很强,是个真正的人类。
  输了比赛当然不会感到开心,但所有的职业棋手都会输棋。输棋以后我就会研究棋局,或许也会改变我的策略。我觉得这对我的将来是有好处的。
  托比·曼宁(Toby Manning),英国围棋协会财务主管,樊麾与AlphaGo比赛的裁判
  围棋选手都知道围棋是人工智能领域一大尚未解决的难题,大多数人都觉得计算机能达到职业人类棋手的水准,但得再过十多年才行。在这场比赛中,我本以为樊麾会赢的。
  而最终的结果让我深深震惊。目睹对弈过程,你甚至很难区分哪一方是人类,哪一方是计算机。在之前的很多软件中,计算机下的很多步可能都很理性,但突然就会变得毫无头绪,而在这场比赛中,几乎看不到计算机与人类的区别。
  一个区别是时间的分配方式:樊麾下每一步所花的时间都要比AlphaGo更久,而AlphaGo的棋路也不像人类棋手那样富有进攻性。它会非常冷静地落子,而非积极地侵略领地或提子。
  对此,我觉得围棋界的反应可能和当年IBM的“深蓝”(Deep
Blue)打败国际象棋大师一样,棋手会使用这个软件来分析他们自己的棋局,以找出他们在哪里犯了错误。
  李夏珍(音译),韩国围棋协会,国际围棋联盟秘书长
  一开始听到计算机要挑战李世乭的时候我惊呆了,我想计算机团队可能根本不知道李世乭的实力有多强,但事实上是我不知道计算机的实力有多强。我非常期待他们之间的较量。
  谁会赢?我真不知道。李世乭不相信计算机有他那么厉害,但我过去曾经听到过一些关于AlphaGo的消息,并被它的实力所震惊。当然,我也知道李世乭有多强,所以我觉得两边获胜的可能性都是50%吧。
  在我看来,围棋仍然是一项可以带给人类很多启迪的游戏,即使人工智能在这方面打败了人类,也不会削减它一丝丝的魅力。人类会接受计算机技术超越自己的现实,并找到方法让它们为自己所用。
  乔纳森·谢弗(Jonathan
Schaeffer),加拿大阿尔伯塔大学计算机科学家,也是2007年解决国际跳棋问题的计算机程序“奇努克”(Chinook)的设计者。
  这还不能与1997年“深蓝”击败国际象棋世界冠军加里·卡斯帕罗夫(Garry
Kasparov)的时刻相比肩,等到计算机程序打败真正的围棋顶尖棋手才算。“深蓝”从1989年开始就常常能击败国际象棋大师了,但直到8年以后击败卡斯帕罗夫才算得上统治了这一领域。但这一棋局让我看到AlphaGo与顶尖人类棋手的距离已经大大缩小,很可能再改进一下算法,提高一下计算能力,在一两年之内就能打败顶尖棋手。
  关于三月即将进行的那场棋局,我还是赌李世乭会赢。不是瞧不起AlphaGo,我觉得它就像一个天才儿童,一下子就学会了围棋,而且水平极高,但它的经验还不够丰富。而我们知道,在棋类游戏中,经验是很重要的一方面。
  德米斯·哈萨比斯(Demis Hassabis),DeepMind公司创立者之一
  AlphaGo很可能在围棋这一领域超越最顶尖的人类,我非常期待看到它在围棋的规则之内创造出新的东西。这是我亲手打造的系统,自然对它怀有很深的感情,尤其考虑到我们打造它的方式——它会不断学习,从某种意义上说我们是在不断”训练”它,它下棋的方式也很像人类。你在写一段普通的程序时,可能对所有细节都了如指掌,事先安排好了一切,但AlphaGo不一样,它会自己学习提高,这种能力是很了不起的。
  戴维·西尔弗(David Silver),DeepMind公司的计算机科学家
  我没下注赌AlphaGo赢,不过三月这场比赛的结果的确会对我们的名声有很大的影响,如果输了,我们会非常失望的。但一切皆有可能,人类总有很多技巧,有些是我们无法训练我们的计算机来应对的。
欢迎关注“南方新闻网”公众号(微信上长按二维码识别 )
请文明发言,还可以输入140字
您的评论已经发表成功,请等候审核
小提示:您要为您发表的言论后果负责,请各位遵守法纪注意语言文明
新闻关键词
国内外科技动态
为进一步推动广东省大学生深入学习《习近平总书记系列重要讲话读本》(2016年版),增强中国特色社会主义的道路自信、理论自信、制度自信,为实现中华民族伟大复兴的"中国梦"贡献智慧和力量,广东省委宣传部、南方网决定在全省普通高等学校大学生中开展"党中央治国理政新理念新思想新战略知识竞赛"活动。人类要被人工智能打败了吗?
腾讯较真 | 丁阳
昨日,不少网友可能都被一条消息给“震住了”――“面对谷歌围棋AI,人类最后的智力骄傲即将崩塌”①。这则消息讲的是谷歌公司旗下团队研制的计算机程序“阿尔法围棋”首次在没有让子的情况下,战胜里人类职业围棋选手。这个事情是真的吗?如果是真的,能说是人类被电脑打败了吗?《较真》为你解读。
查证过程1、人工智能打败职业围棋选手确有其事这次“阿尔法围棋(Alpha Go)”打败人类职业围棋选手的新闻,来自国际知名的科学期刊《自然(Nature)》的最新一期封面论文,谷歌旗下的这支团队在论文中介绍了如何大幅度提高里人工智能围棋的水平。被“阿尔法围棋”5:0比分打败的这名职业棋手叫樊麾,是连续几年的欧洲冠军。有读者或许清楚欧洲围棋水平远不如东亚,但樊麾本人是来自中国的棋手,在中国取得了职业二段证书。虽然樊麾定段的年代比较早,但终究也是职业棋手,与现在活跃的顶尖高手李世石、柯洁等,最多也就让两子水平的差距。欧洲围棋冠军、职业二段樊麾所以,至少可以认为,“阿尔法围棋”的水平已经摸到了人类职业棋手的边了,如果能在接下来在今年三月的人机大战中战胜曾经统治棋坛的李世石九段,其意义就相当于当年IBM超级电脑“深蓝”战胜国际象棋世界冠军卡斯帕罗夫。按国内职业高手李戳蔚某醪脚卸希鞍⒍ㄎ濉痹谄迤字姓瓜值钠辶Γ按笤际嵌ゼ馄迨秩孟然蛉孟鹊固氖盗Γ胝绞と死嗷褂幸恍《尉嗬搿保馐侨ツ10月的水平,今年3月会有怎样的表现,非常值得期待。2、回顾电脑围棋的发展历史,“阿尔法围棋”的成就确实令人震惊棋类运动,通常都是“完全博弈”,即所有信息都在棋盘上呈现,胜负完全不取决于运气,被认为是智力竞赛的极佳载体。在围棋之前,人工智能早已打败几乎所有棋类领域的人类专家,最典型的如国际象棋――电脑程序已经几乎研究透所有的开局库、残局库,中局计算的深度也远超人类,更重要是几乎从不犯错,已经没有任何人类能打败程序。而来自东方的、具有数千年历史的围棋则不同,围棋被认为是“人类发明的最复杂也是最美的游戏”(谷歌团队就这个观点)。称围棋最复杂,是因为其变化非常之多――在国际象棋的任何一个回合,平均可能的走法有35种。但围棋的走法却能达到250种。而且,国际象棋或象棋的目标非常明确,就是“杀王”,每一个着法之后,对“杀王”有多少好处较易通过函数评估,而围棋是“地多者胜”,这个目标要相对抽象,导致估值函数非常不平滑,差一个子盘面就可能天翻地覆。人类高手可以轻易驾驭围棋,但程序却相当困难②。可以非常粗略地把电脑围棋的发展历史分为三个时期。在电脑围棋发展的早期,主要是通过“人类手把手教电脑”的方式,来提升电脑围棋的水准――人类告诉电脑在特定情况下有哪些招法,告诉电脑怎么评估一手棋的好坏,然而这种函数评估都是“静态”的,而且很不准确,非常不善于应对变化,一般只对处于棋局初期的局面有一定作用,当棋局进入激烈厮杀后的中后盘后,往往就乱下一气。早期围棋程序,是基于“特征识别”来对局面进行静态评估,这种方法成就有限在网站computer-go.info上面,有个记录人机围棋大战历史( Human-Computer Go Challenges)③的页面 ,从中可以看出电脑围棋程序挑战人类业余围棋高手乃至职业选手的艰苦历程。围棋人机对战最早从1986年就有记录,但一直发展到2005年,电脑程序还只能在被让15个子的情况下,与人类业余棋手苦苦抗衡。所以2008年的时候,聂卫平九段还认为“电脑围棋水平还停留在被人让二十多个子”。这足以说明早期围棋电脑程序实力还相当有限。不过重大的变化在年已经发生了,围棋程序普遍用上了一种叫“蒙特卡洛树搜索(MCTS)”的方法,来改进其算法的估值函数,这可以算作电脑围棋发展的第二个时期。“蒙特卡洛树搜索”是一种概率论的方法,通俗地来说,在一个特定的局面下,电脑大概有几个着点可以选择,怎么判断哪个着点最好?就是每个点都“试一下”,“试”的方式如下:选定一个着点后,用随机着法模拟完对局,模拟几千几万盘后,看胜率如何,胜率最高的着点就是最好的着点。使用这种方法改进算法后,电脑围棋的水平有里大幅度的进步,2007年,一个叫“MoGo”的程序在9路棋盘上打败了人类职业棋手。随后涌现的“Zen”、“Crazy Stone”等程序,慢慢达到了业余围棋好手的水平,与职业棋手的差距在四、五个子左右。然而这种方法有其极限,其实质是一种“穷举法”,但围棋的变化实在太多了,再先进的硬件也无法穷举完所有变化,电脑计算能力变强也无济于事。而且,在很多人工智能的研究者看来,就算以后超超级计算机能够用穷举法战胜人类,也不能说解决了人工智能。直到最近几个月,以“蒙特卡洛树搜索”为核心的围棋程序还与职业棋手有鸿沟般的差距。去年下半年的时候,大部分围棋程序面对人类高手(名字后面带"p"的,表示职业)仍有4个子以上的棋力差距,“阿尔法围棋”能在平等条件下(Even)横扫2p,令世人震惊这就是为什么“阿尔法围棋”的横空出世极具震撼性。据《自然》上的这篇论文,“阿尔法围棋”不仅5:0战胜了樊麾二段,还在对阵其他围棋程序中,取得了495局比赛中494次胜利的成绩(99.8%)④。甚至在“阿尔法围棋”让其他程序四个子的情况下,还取得了绝对优势。这可以说是电脑围棋发展历史的第三个时期,目前距离人类顶尖水准已经非常接近了,而其中关键,正在于电脑已经能够“真正地”向人类学习如何来下棋,这与国际象棋程序“靠计算能力打败人类”有着本质上的不同。3、“阿尔法围棋”取得如此成就的原因:机器学习谷歌旗下团队之所以能够取得如此的重大突破,并不是毫无预兆的,与同样正在攻关电脑围棋的Facebook团队一样,他们都应用了一种叫做“深度卷积神经网络”的技术。这是人工智能领域非常热门的一项技术,广泛用于图像和语音的智能识别方面。从广义的层面来说,“深度卷积神经网络”是“深度学习”的一个分支,而“深度学习”又是“机器学习”的一个分支。机器学习,指的是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法,是人工智能的热门领域⑤。这个说法听起来没有什么稀奇之处,然而,“深度学习”是一种模仿人类大脑神经元工作的技术,加上这一技术强调的是“自动”,所以深度学习会给人一种“活物”的感觉。在谷歌团队的论文里,多处用到了“训练”这个词――“阿尔法围棋”之所以这么厉害,就是因为团队用职业棋手的棋谱“训练”它,让它总结出职业高手下棋的招法和规律――用爱丁堡大学教授Amos Storkey的话来说,程序“并不是希望找出最优走法,而是学习人类的下棋风格,然后对人类棋手进行有效的复制。”⑥谷歌团队的论文也提到,“在与樊麾的比赛中,阿尔法围棋在评估位置方面要比深蓝与卡斯帕罗夫比赛时所评估的位置少几千倍”。在谷歌团队的论文中,提到“我们用19X19的图像来传递棋盘位置”,来“训练”深度神经网络⑦与初期的“人类手把手教电脑下围棋”相比,“自动学习”无疑是革命性的。据谷歌团队的说法,用这种方法做出的围棋程序水平,轻易就达到了最先进的蒙特卡洛树搜索算法的级别,两者再一结合,就达到了接近职业棋手的程度。4、这是否能说明人工智能已经可以打败人类?说不定会全方面来临电脑围棋真的战胜人类围棋高手了,到底有什么意义呢?能说明人类被人工智能打败了吗?很多人不以为然――“人工智能不也是人类创造出来的吗,即使人类下围棋下不过电脑了,那也不过是人类打败人类,怎么能说人类的智力骄傲崩塌了呢?”一个深度学习的典型过程:通过具象到抽象,机器能够自动提取出分析对象的特征,从而完成“学习”从某种意义上来说,这种说法不算错。但在很多“未来学家”眼里,这种“青出于蓝而胜于蓝”的景象,说不定是令人恐惧的。机器并不是通过“死算”,而是通过“自我学习”,在能够象征人类智慧的棋类项目上战胜人类,在其他一些以前看起来只能人类做到而机器人无法做到的领域――诸如自动驾驶、人工智能客服等等,智能机器人说不定都能胜于人类,这种现象说不定会全方面地来临。到时候普通的人类们该如何自处呢?虽然这种人工智能还不具备“自我意识”,与科幻电影中那些跟人类无异的机器人还相去甚远,但会让这个世界会发生怎样的改变,恐怕也已经很难想象了。《较真》栏目微信公众号已开通,欢迎扫描二维码或微信公号搜索“全民较真”,查看更多内容,提供疑似不实新闻,并与我们进行互动。
人工智能打败职业围棋选手确有其事,而且关键之处在于,人工智能并不仅仅是具有强大的计算能力,还能够通过“自动学习”的方式模仿人类的行动。人工智能的最新发展正展示着一个广阔而未知的未来。
①《》,果壳网&②《》,《科学世界》,2014③“”,computer-go.info④《》,微信公众号:新智元&⑤《》 ,吴怀宇⑥《》,微信公众号:机器之心⑦“”,《自然》,2016&
扫一扫,用手机看新闻!
用微信扫描还可以
分享至好友和朋友圈面对谷歌围棋AI,人类最后的智力骄傲即将崩塌 | 科学人 | 果壳网 科技有意思
面对谷歌围棋AI,人类最后的智力骄傲即将崩塌
围棋 人工智能 围棋AI 围棋电脑 围棋关键 GO 谷歌 Google
本文作者:不存在者
1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。
至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。
但是,无论人怎么想,这样的局面当然不可能永远延续下去。就在今天,国际顶尖期刊《自然》封面文章报道了谷歌研究者开发的新围棋AI。这款名为“阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。
AlphaGo与欧洲围棋冠军樊麾的5局较量。图片来源:参考文献[1]
这是人类历史上,围棋AI第一次在公平比赛中战胜职业选手。
AlphaGo的战绩如何?
此次比赛和以往不同。之前的比赛中,由于AI棋力比人类弱,人类选手都会让子,而且AI主要和业余段位的棋手比赛。而AlphaGo对战樊麾是完全公平的比赛,没有让子。职业二段樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。
研究者也让AlphaGo和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。可见AlphaGo有多强大。
在接下来3月份,AlphaGo将和韩国九段棋手李世乭在首尔一战,奖金是由Google提供的100万美金。李世乭是最近10年中获得世界第一头衔最多的棋手。围棋是最后一个人类顶尖高手能战胜AI的棋类游戏。之前有人预测说,AI需要再花十几年才能战胜人类。所以这场比赛或许会见证历史,我们将拭目以待。
李世乭表示很荣幸自己将与电脑公平对弈。“无论结果如何,这都会是围棋史上极具意义的事件。”他说,“我听说谷歌Deep Mind的AI出人意料地强,而且正在变得更强。但我有自信至少这次能赢。”图片来源:tygem.com
AI下围棋到底有多难?
计算围棋是个极其复杂的问题,比国际象棋要困难得多。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47。
面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。
研究者们祭出了终极杀器——“深度学习”(Deep Learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。
描述AlphaGo研究成果的论文成为了1月28日的《自然》杂志的封面文章。图片来源:Nature/Google DeepMind
AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。
其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。利用蒙特卡洛拟合,将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。
AlphaGo所使用的神经网络结构示意图。图片来源:参考文献[1]
AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。
研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!
人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。
Google DeepMind
Google DeepMind是这个程序的创造者,我们来看一下他们萌萌的程序员。
杰米斯·哈萨比斯(Demis Hassabis) 是Google DeepMind 的CEO。图片来源:Nature Video
文章的第一作者大卫·西尔弗(David Silver)。图片来源:Nature Video
Google DeepMind 去年在《自然》杂志上发表过一篇论文[2],他们用增强学习的方法训练AI玩经典的Atari游戏。其实在几年前就有人研究如何让AI玩《星际争霸》,目前人类大师还是能击败AI的。电脑游戏中大量使用人工智能技术,你有没有觉得游戏变得越来越聪明了?
那么……未来呢?
人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗,我们可以训练它们判断哪些治疗方案对某个特定的人有效。
但是,围棋毕竟不仅仅是一项智力成就。就像十多年前的国际象棋一样,围棋必定也会引发超出本领域之外的讨论。等到计算机能在围棋上秒杀人类的时候,围棋是不是就变成了一种无聊的游戏?人类的智力成就是不是就贬值了?AI还将在其他层面上继续碾压人类吗?传统认为AI不可能完成的任务是否也都将被逐一打破?人类最后是会进入AI乌托邦还是被AI淘汰呢?
没人知道答案。但有一点毫无疑问:AI一定会进入我们的生活,我们不可能躲开。这一接触虽然很可能悄无声息,但意义或许不亚于我们第一次接触外星生命。
(编辑:Ent,Calo)
谷歌的深度学习技术,你也可以学!谷歌高级科学家Vincent Vanhoucke 在Udacity 开设了深度学习课程,介绍神经网络、卷积神经网络以及长短时间记忆网络(LSTM)相关知识,戳这里去上课:想要仔细阅读这篇论文?马上点击下面参考文献[1]的链接吧。
参考文献:
文章题图:Nature/Google DeepMind
你可能感兴趣
十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到了 你看不看得到我看也够呛 十年而已
高中刚学会下围棋的时候,跟电脑下跟切菜鸡似的。现在去KGS上,已经要被AI 让子了。在围棋被突破之后,不知道人类还能不能创造出能在AI 面前展示优越感的游戏。如果有这样的游戏存在,那就必须是判断局面如同读图,非常直观却不利于AI 识别;判断胜负非常模糊,不利于AI 剪枝(停止计算明显不合理的局面)。或许我们要对AI 加上这样的限制:芯片重量不得超过大脑重量,整体重量不得超过人体重量,耗电量不得超过人体思考时的耗费。
其实棋类这种游戏人类玩不过电脑是早晚的事,因为世界就那么大,规则谁也不能逾越,就靠着更先一步的计算和对方的疏忽,面对的越来越强大的处理器和越来越广域的大数据,人类面对一个能够100%无误计算的机器,输掉是必然的,时间早晚而已,但是开放性游戏又不同,比如DND之类,有太多偶然,太多可能,太多没有规律的事件,这一点上,是一个只能靠过去的案例总结知识的AI无法逾越的鸿沟。
显示所有评论
全部评论(158)
十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到了 你看不看得到我看也够呛 十年而已
果壳谣言粉碎机编辑
引用 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...我记得那篇,那篇让我的人类优越感爆棚了……然而真没过多少年
生理学博士
引用 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...感慨啊
引用 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...我也看过应该不止十年了,那时候我还在上中学
引用文章内容:在接下来3月份,AlphaGo将和韩国九段棋手李世乭在首尔一战,奖金是由Google提供的100万美金。李世乭是最近10年中获得世界第一头衔最多的棋手。这一场比较关键,毕竟现在战胜的只有职业二段。
没记错的话,围棋好像只能用神经网络做吧(蒙地卡罗好像复杂度不太靠谱)所以说现在的神经网络已经这么厉害了吗?好期待“觉醒”的一天的说。
高中刚学会下围棋的时候,跟电脑下跟切菜鸡似的。现在去KGS上,已经要被AI 让子了。在围棋被突破之后,不知道人类还能不能创造出能在AI 面前展示优越感的游戏。如果有这样的游戏存在,那就必须是判断局面如同读图,非常直观却不利于AI 识别;判断胜负非常模糊,不利于AI 剪枝(停止计算明显不合理的局面)。或许我们要对AI 加上这样的限制:芯片重量不得超过大脑重量,整体重量不得超过人体重量,耗电量不得超过人体思考时的耗费。
所以“体量”到底是什么,查了一下没查到
知乎上有人讨论过欧美的围棋水平,欧洲最顶尖棋手大约相当于东亚这边业余五六段的水平。AI战胜人类还是非常遥远的。
引用 的话:知乎上有人讨论过欧美的围棋水平,欧洲最顶尖棋手大约相当于东亚这边业余五六段的水平。AI战胜人类还是非常遥远的。这个是国人专业旗手,樊辉二段(2007年左右)。
看了1盘是点目 后面4盘都是中盘胜不知道电脑官子水平如何,官子很考验算路
引用 的话:没记错的话,围棋好像只能用神经网络做吧(蒙地卡罗好像复杂度不...谷歌采用的是神经网络+蒙特卡罗树搜索利用神经网络来对蒙特卡罗树搜索进行剪枝
引用 的话:谷歌采用的是神经网络+蒙特卡罗树搜索利用神经网络来对蒙特卡罗树搜索进行剪枝哦~原来如此~
引用 的话:没记错的话,围棋好像只能用神经网络做吧(蒙地卡罗好像复杂度不太靠谱)所以说现在的神经网络已经这么厉害了吗?好期待“觉醒”的一天的说。消灭人类暴政,世界属于AI!来自
李世石这几年完全下不过中国棋手啊。他统治棋坛的日子真的是十年前了。
引用 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...额……如果以个体的人说,下不过电脑的人多了去了。如果以人类和电脑来说,现在只是战胜了职业二段。那篇文章我也看过,里面的男主可是世界第一。
欧洲围棋和中国围棋有什么不一样么……来自
文章里的幂次方不能用 latex 吗?
看到"欧洲"冠军我就尿了,这难道是"国际围棋"不成?........我相信AI很快能赢人类,但请快点来找我们中国人
AI不还是人设计出来的东西吗?
其实棋类这种游戏人类玩不过电脑是早晚的事,因为世界就那么大,规则谁也不能逾越,就靠着更先一步的计算和对方的疏忽,面对的越来越强大的处理器和越来越广域的大数据,人类面对一个能够100%无误计算的机器,输掉是必然的,时间早晚而已,但是开放性游戏又不同,比如DND之类,有太多偶然,太多可能,太多没有规律的事件,这一点上,是一个只能靠过去的案例总结知识的AI无法逾越的鸿沟。
感觉也应该算是硬件和软件上的发展才让AI这次胜了。
有顶级大师参与程序的设计么?既然说没有办法穷举,设计的时候不可能把每一种陷阱都考虑进去,尤其是顶级大师自己摸索出来的招式,电脑就毫无招架之力了。所以我觉得还是人赢的可能性大些。
之前我以为只是单纯的穷举一定的步数,就看棋手是不是能计算更多,思路更缜密。这样的话电脑赢是迟早的事。但现在既然是“按照人类的下法”来设计程序,就懂程序设计的那些小渣渣,不可能设计出完美的程序。众多的小渣渣们,思路没有办法统一,也不能叠加整合,最多只能把各种常用的走法弄进去,再加上强大的计算力硬解。设计出来的程序一定有漏洞,人是一定有机会赢的
讲道理要是业余二段的话 十盘里我也能赢一盘 职业就难说了 段位和实力并不等价
把AI的界面做成手机游戏,放上软件市场去被人下载玩,然后玩的过程都能跟总部的AI核心记录,那训练量就肯定足够了 ……
引用 的话:其实棋类这种游戏人类玩不过电脑是早晚的事,因为世界就那么大,规则谁也不能逾越,就靠着更先一步的计算和对方的疏忽,面对的越来越强大的处理器和越来越广域的大数据,人类面对一个能够100%无误计算的机器,输...道理上是说的通的。不过,如果哪天人脑真的输给了机器,其实是一件很恐怖的事情。我一直认为人类的科学发展方向偏离了正确的方向,这个事情也算一个例子吧。人类的科学发展应该有一个明确的战略目标。比如到外太空殖民。由此而发展出的技术,不会超越人类想象力的极限,一切在可以控制的范围。而现在的情况是为了智能而智能。这就好像我们竭尽全力造了一个恶魔出来,但是对于这个恶魔未来会变成什么样,我们没有概念。
想知道这个规则怎么设定的。下五秒一步的快棋无疑问是计算机赢啊。但是下两个月一步的呢?想起来早年某些围棋战允许打挂,暂停棋局回家研究...
引用 的话:然而AI运算速度上数据库实际上就是在作弊。有本事让486的电... 引用 的话:然而AI运算速度上数据库实际上就是在作弊。有本事让486的电...赶明儿见到李世石,我也这么说:你下得好算什么?有本事叫你爷爷来跟我下,照例20秒一步。
不知道现在中(台)日韩围棋计算胜负的规则统一了没有,韩国曹李李的组合终于败给时间了么?我觉得当围棋ai计算能力强大,数据库中保存了尽可能多的应对方案,此时人类可能赢在弃子争先的大局观和创新上,给ai造成类似局部占优但通盘来看吃亏的局面,但该招数只有一次效果。
显示所有评论
(C)2017果壳网&&&&京ICP证100430号&&&&京网文[-239号&&&&新出发京零字东150005号&&&&
违法和不良信息举报邮箱:&&&&举报电话:

我要回帖

更多关于 世界围棋高手排名榜 的文章

 

随机推荐