人工智能击败欧洲围棋冠军,alphago围棋软件下载 究竟是怎么做到的

热门标签:
·····
谷歌人工智能连赢人类围棋冠军5局,它怎么做到的,如何评价它?
1月28日,《金融时报》援引《自然》杂志的报道,由谷歌伦敦子公司DeepMind开发的AlphaGo机器,以5:0的战绩击败了欧洲围棋三届冠军樊麾(出生于中国,现籍法国)。DeepMind是2014年被Google以4亿英镑的价格收购的人工智能团队。
在1月27日,DeepMind团队发表的《Mastering the game of Go with
deep neural networks and tree
search》作为《自然》(Nature)封面论文上线。团队创始人Demis
Hassabis表示,他们开发的围棋程序AlphaGo融合了高级树状查找和深度神经网络。
同一天,Google在官方博客中表示:“我们很骄傲地公告天下,我们的科学家已经搞定了围棋,并攻克了人工智能领域的一项重大挑战。”
今年3月,AlphaGo将在首尔与过去十年全世界最顶级的围棋选手李世石对决。
谷歌AlphaGo是怎么赢的?——双大脑工作
通过对神经网络进行的3000万步训练
(所有棋谱均来自人类专业棋手的比赛),AlphaGo预测出人类对手下一步走法的正确率已经达到了57%,之前的纪录是44%。
AlphaGo使用两个不同的神经网络“大脑”,通过两者合作得出移棋决定。
根据微信公众号《人工智能学家》对上述论文的编译得知,AlphaGo的两个大脑分工如下:
大脑1:“监督学习(SL)政策网络”。着眼于棋盘中的位置,并试图决定最佳的下一步。实际上,它用来估计每个合法下一步行动为最好的一步的可能性,其顶层猜测就是具有最高概率的那步。该团队通过几百万个优秀的人类棋手在KGS上的下棋选择,训练这个大脑,其目的仅仅是复制优秀的人类棋手的移动选择。它一点也不关心赢得比赛,只下那步顶级人类棋手会下的那步棋。
AlphaGo的下棋选择器有57%的概率可以正确匹配优秀的棋手下棋选择。
大脑2:“价值网络”。它不猜测具体的下一步怎么走,而是通过设想的棋盘分布,估计每个玩家赢得比赛的概率。它通过提供整体的位置判断来配合“监督学习(SL)政策网络”。这个判断只是近似的,但它对加快阅读速度非常有用。通过将未来可能的位置分为“好”或“坏”的分类,AlphaGo可以决定是否要沿着一个特定的变化进行更深的阅读。如果位置评估器说某个具体的变化看起来情况不妙,那么AI可以跳过阅读,不沿着那条线继续发挥。
据论文介绍,当只使用一个大脑时,AlphaGo大概和目前最好的电脑围棋AI实力相当,但结合两个大脑是,它可能达到人类职业棋手的水平。
专业围棋手是怎么看的?
年三度欧洲围棋冠军樊麾,也是本次人机大战的主角之一,他表示:
在中国,围棋不仅是一项比赛,它还是生活的一面镜子。我们说,假如你的棋下得有问题,那很可能是你心性的问题——棋如其人。
输棋确实很难过。和AlphaGo对战之前,我觉得我能赢。在第一局失利后,我改变了战术,增强了进攻,但还是输了。问题是人类有时会犯致命的错误,因为我们是人。有时我们会疲惫,有时我们求胜心切,我们总有这样那样的压力。电脑程序不会这样,它非常强,也非常稳定,简直就像一堵墙一样。对我来说这是很大的差别。我知道AlphaGo是个电脑,但如果没人告诉的话,我可能会觉得它是个有点陌生却又非常强大的对手,是个真人。
当然,输掉比赛让我不太开心,不过作为职业选手,我们输过很多比赛。所以,失败了就从中学习,也许会有所收获。总之从长远来讲这是一件好事。
随后在一个微信群里,樊麾说:“一切都是真的,因为一直在保密中,所以大家都不知道。我没有放水,不过下得确实不好。只能告诉大家,这个系统确实很强!拭目以待和李世石的棋吧!这是去年10月下的,还有些条款在保密范围之内的,我不能告诉大家,不过我觉得跟李世石的棋会很精彩!”
曹大元九段:昨晚就看到了,所以睡不着觉了,压力很大啊!
孟泰龄:我认为樊麾布局有三盘占优,另两盘劣势。我觉得电脑确实有职业水准。感觉电脑棋风稳健,酷爱实地,如果后半盘它真的可以滴水不漏的话,那距离顶尖真的只有一层窗户纸的距离了。显然电脑大局观差一些,但局部棋型的感觉及计算已经有相当水准了。
业内人士怎么看?
DeepMind创始人Demis Hassabis:
AlphaGo正在突飞猛进,甚至会超越最棒的人类选手。能够看它在围棋规则内去创造新的东西,感觉很神奇。我们对自己创造的这个系统有种很密切的感情,特别是它被创造的方式——它会学习,我们也会教它,它的风格就像人一样。和其他编出来的程序不同,你不知道它到底都会什么,因为它能够自己学习。
阿尔伯塔大学计算机科学家、Chinook设计师 Jonathan Schaeffer:
我想这还不是围棋版的深蓝时刻。真正的成就是这个程序能作为选手在顶级比赛中较量的时候。深蓝从1989年开始就常常战胜各路大师,最后登顶则是八年之后的事情。但就目前情况来看,我认为AlphaGo和顶级人类选手之间的差距被大大缩短了。可能只需要再进行一点努力和改善,再提高一点计算能力,不出一两年,它就能打败人类。
就今年3月份的比赛来说,不是打击AlphaGo团队,我还是看好人类。我们可以把AlphaGo看成是少年天才。它突然学了一手好棋,进步神速,但毕竟还是经验有限。从国际象棋和西洋跳棋来看,经验还是很重要的。
国际围棋联合会秘书长Hajin Lee:
当我知道那个电脑要挑战职业顶尖棋手李世石的时候,真的很吃惊。我当时觉得这个挑战者绝对对顶级选手有多强完全没概念。但实际上,可能我才是那个不知道这个电脑有多强的人。现在我对这个比赛非常兴奋。
谁会赢呢?我不知道。李世石自己也觉得可能那电脑跟他一样强。可能是我听到了太多AlphaGo的消息,我现在惊讶于它的强大。同时我也非常了解李世石的水平,所以我认为他们双方五五开吧。
我觉得围棋是个很有内涵的竞技,我不觉得如果电脑AI击败了人类会对围棋造成什么伤害。我想人们会接受自己被电脑技术超越这件事。
最后,让我们通过下面五张GIF图回顾一下这五局棋,樊麾是怎么输给谷歌AlphaGo机器的(来自微信公众号:棋文弈事):
贵州大数据产业政策
《贵州省大数据发展应用促进条例》发布,2016 ...
贵州大数据产业动态
大数据历史学的前身,是历史统计学,早在1922 ...
贵州大数据企业
作为国内领先的O2O跨境电商平台,海捣网已在深...
《2015中国互联网发展报告》从大数据的角度揭 ...高清大图:2015年中国大数据企业评级图,可点 ...年初,由中国CDO精英俱乐部发布的《中国大数据...人工智能战胜欧洲围棋冠军,这些AI顶级专家们怎么说--百度百家
人工智能战胜欧洲围棋冠军,这些AI顶级专家们怎么说
分享到微信朋友圈
DeepMind开发的AlphaGo击败了欧洲围棋冠军。在本文中,FLI采访了多位著名的AI研究者对谷歌围棋AI的看法,包括《人工智能:一种现代方法》的作者Stuart Russell。
前几天,谷歌旗下的DeepMind宣布,他们开发的人工智能系统AlphaGo战胜了人类欧洲围棋冠军,引起了世界轰动,因为在围棋这项任务上,计算机已经艰难跋涉了很多年。
Francesca Rossi是IBM的顶级AI科学家,他告诉FLI说:「AI研究者一直在等待计算机掌握围棋技术,但是没想到这一天来得这么快。比起象棋计算机深蓝来说,这个研究成果解决了一个长期存在的艰难问题,因为围棋中的步数实在太多了。」
Victoria Krakovna是FLI的联合创始人之一,也是一名AI研究者。她赞同道:「对计算机来说,围棋的挑战比象棋大多了,因为棋盘上的位置组合多得简直要爆炸了,许多专家都认为AI在近10年内都无法掌握围棋。」
围棋确实是一个很复杂的游戏,可能的走法是个天文数字——象棋只有35^80种可能的走法序列,而围棋则有250^150种。更直观地解释就是说,35^80已经是一个非常大的数字了,超过了可观测宇宙中的所有原子数量,标准的非图形计算器已经无法计算。所以,也难怪大多数AI研究者都预计AI系统要在围棋上超过人类顶尖棋手还需要花10年的时间。
Krakovna解释说,DeepMind的 AlphaGo解决问题的方式是用监督式学习和强化学习相结合。也就是说,人类专家帮助他们将围棋的知识构建入该系统,但接下来,这个系统用试错法和自己对弈,并从中不断学习。
加州大学伯克利分校的AI教授Stuart Russell是AI经典教材《人工智能:一种现代方法》的作者之一。他告诉FLI:「这个成果表明,深度强化学习和帮助程序决定哪些概率值得考虑的所谓『价值网络』能带来一个非常强大的围棋系统。」
然而,这究竟有多么了不起呢?根据发表在《Nature》上这个成果,AlphaGo以5:0的比分击败了欧洲围棋冠军樊麾,但还不清楚它是否能击败世界冠军。 Rossi 和 Russell对此都有自己的衡量。
Rossi说:「DeepMind的技术创新是将新的机器学习方法与搜索结合在一起,看起来十分通用,除了围棋等棋类游戏之外,应该还可以用在其他情景中。这使得这个结果更加重要,并且更有前景。」
然而,尽管这个结果让Russell十分折服,但他不清楚为什么这个程序只击败了欧洲冠军,而不是世界冠军,因为围棋一直被李世乭这样的亚洲精英选手所垄断。他解释说:「围棋被认为是很难攻破的难题,这是一个令人印象深刻的成果。很难说这个成果是否和卡斯帕罗夫之败具有同样重大的意义,因为卡斯帕罗夫是世界冠军(1997年,世界象棋冠军卡斯帕罗夫输给了IBM的深蓝计算机)。樊麾是一个很棒的棋手,但目前的世界冠军比他更强。另外,樊麾一局都没有赢,所以我没有信心预测人类优势会维持很长时间。」
实际上,AlphaGo正要在3月与世界围棋冠军李世乭对弈。这是围棋界一个值得期待的大事件!
另一位顶级AI研究专家、康奈尔大学的计算机科学教授Bart Selman也向FLI分享了他的想法。同Russell 和 Rossi一样,Selman也对计算机程序击败人类围棋选手感到震惊,因为围棋比象棋难多了。但是他补充道:「AlphaGo是一个令人兴奋的进展,因为它将深度学习(用来发现大量走法序列中的微妙模式)与最新的游戏空间探索技术相结合。所以,它展现了深度学习与算法搜索方法的第一个混血儿。这样的AI技术拥有巨大的潜力。从新的AI和机器学习方面看,这个进展比IBM的深蓝计算机还要重大。但从另一方面讲,说到绝对表现时,深蓝还是占据上风,毕竟它击败了世界上最棒的棋手。然而,有了DeepMind基于学习的新方法,看起来,超越人类的围棋程序距离我们并不遥远了。期待AlphaGo即将开始的比赛,真的很兴奋。」
机器之心,最专业的前沿科技媒体和产业服务平台,每日提供优质产业资讯与深度思考,欢迎关注微信公众号「机器之心」(almosthuman2014),或登录机器之心网站查看更多精彩内容。
分享到微信朋友圈
在手机阅读、分享本文
还可以输入250个字
推荐文章RECOMMEND
阅读:20万
阅读:17万
阅读:17万
热门文章HOT NEWS
整部影片的内核是足以触动到观众心弦的~
百度新闻客户端
百度新闻客户端
百度新闻客户端
扫描二维码下载
订阅 "百家" 频道
观看更多百家精彩新闻用微信扫描二维码分享至好友和朋友圈
Google旗下的人工智能公司DeepMind开发的Alpha Go不久之前击败了欧洲围棋冠军,《Nature》杂志将以封面论文的方式报道这一人工智能领域的里程碑,意义不亚于1997年那场深蓝击败国际象棋大师卡斯帕罗夫的世纪之战。据悉,3月AlphaGo还将向世界顶级围棋选手李世石发起挑战。正如外媒的评价,“1997年,当IBM深蓝计算机在象棋上称霸时,它使用的是手工编码的规则,在搜索时将穷尽所有可能发生的步法。Alpha Go从本质上则是随着时间而学习的,可以识别出可能具有优势的模式,然后模拟出数量有限的潜在结果。”关于“奇点临近”的杞人之言又开始抬头,不过相比这些乍然爆出的人机对垒,已经润物无声地融入我们生活的Siri、Google Now等智能助手可能更有“存在感”。它们不是要与我们一较高下誓不罢休的对手,而是随时听遣,安排我们的日程起居,供我们调戏的助手。在《与机器人共舞》作者约翰• 马尔科夫看来,前者是志在取代人类的AI(Artificial Intelligence),后者是意在辅助人类的IA(Intelligent Augmentation),即使是Google这样的公司也会在被这两条不同方向的道路所撕裂。比如, Google Now与Google Glass都是用来增强人类能力的工具,而无人驾驶汽车则是要从司机手中彻底接管驾驶权。它收购的Boston Dynamic机器人公司放弃了对人类智力的模拟,而是专注于做和人类四肢有同样灵活性、平衡性、适应性的无头Big Dog,而它的Google Brain项目则在学习像人一样识别一只猫。Body与Brain的分离及其后果在其无人驾驶汽车项目上体现的最为明显。作为第一个报道Google无人驾驶汽车项目的记者,约翰• 马尔科夫在《与机器人共舞》中详细披露了坚持走AI路线的Google无人汽车遇到的问题:完全无人驾驶的汽车将陷入一种四向停车难题(four-way stop)。在没有红绿灯的路口,司机之间需要复杂的交流,而对于相互独立、互不连通的计算机系统来说,在可预见的未来想解决此类问题则更为困难。借助于摄像头、多谱勒雷达、激光雷达等传感器,Google无人汽车能够对行驶途中的环境路况实时感知,然而车与车之间的数据共享与时时“沟通”目前看来仍然遥不可及,受限于无线通信标准、车厂合作、政府监管等原因,“车联网”在短期内仍然难以实现。更为棘手的是,司机经常会违背或忽略交通规则,而无人车与行人之间的意识“沟通”仍然是天方夜谭。相比于对于“无人”概念如此执着到底的Google,很多其他公司取径更为现实的IA路线。比如,Mobileye无人驾驶汽车能让车上的乘客敏锐地感觉到机器援助的存在,更有公司采用眼球追踪、生物识别等技术来检测司机的注意力是否在方向盘上。这对于也在跻身无人汽车大潮的Uber来说并不是个好主意,毕竟按照创始人Kalanick 的说法“Uber价格贵的原因就是司机的成本太高,如果没有司机的话Uber的的费用会大大降低。”实际上,根据《与机器人共舞》一书的梳理,AI与IA两个阵营的竞争,两种价值观之间的碰撞自1960年代就在硅谷展开了。1966年,在约翰麦卡锡带领斯坦福大学人工智能实验室启动制造模仿人类能力的人工智能项目的同时,在美国的另一边,麻省理工学院的马文明斯基与恩格尔巴特则启动了把计算机作为人类智力的延伸的智能增强项目,自此开始了半个世纪的花开两朵,各自生长。在摩尔定律的号角声中,随着运算能力的几何量级飞升,当时的人工智能阵营被一股乐观的气息所笼罩——如果你感觉自己陷入困境,那么只需要等上10年时间,你的问题就定然能通过计算性能的提升而得到解决。在他们眼中,机器的视觉、听觉、推理能力等都可以通过计算能力的提升而迎刃而解。1978年,人工智能最忠实的信徒莫拉维克甚至在杂志上撰文:“再过10年,制作可以匹敌人类智慧的设备的硬件价格应该相当于目前一台大型计算机的水平。”然而,他预想中的机器人时代并未到来,斯坦福大学虽然作出了一些基于“if then”逻辑的“推理引擎”并将各行各业的专家知识打包成包含600项思维规则的“指导手册”,然而这种需要人类去“input-out”的方式并不能让机器自己去认识世界,分析归纳,这并不是他们想要的思维机器(thinking machine)。20世纪80年代,是“头脑中的自行车”的黄金年代,却也是相关公司接连倒闭的“人工智能的冬天”。而IA阵营则成了人机交互的先驱,恩格尔巴特不只是大名鼎鼎的“鼠标之父”,更是图形化用户界面、超文本系统的先驱,从窗口、鼠标到自动助手、计算机,再到“对话式交互”,IA阵营基本上仍在恩格尔巴特最初规划的理论框架内发展。在他们的努力下,从庞然巨物到桌上电脑再到口袋玩物,从打孔纸到键盘鼠标、触摸屏再到语音助理、Magic Leap,机器成为一种愈来愈易用的人脑之延伸。1987年预言了后来的iPad、 Siri的苹果Knowledge Navigator宣传视频中就虚构了一个系着领结的虚拟助手,然而14年后的Siri则不再有个人化身。实际上,在虚拟助手设计方面,化身一直都饱受争议。IA阵营的开发者们一直对“是否应该把这一系统变成聊天机器人”举棋不定。他们认为,没有人会坐下来和一个虚拟机器人聊上一整天,他们要做的,是设计一个系统来帮助人们管理自己忙碌的日常生活。呆萌的Siri“可调戏性”很差,而Google Now虽然已经智能到可以通过你的停留时间自动判断家庭与工作地,“非人化”则避免了给人以毛骨悚然、细思极恐的感觉。同样的微软的大眼睛曲别针Office助手也因为太过“活泼”令人分神而被“下岗”。实际上,这是IA与AI之间那条无形的线在其作用。而随着全球互联网与海量大数据的出现,给了人工智能领域的另一支流——深度神经网络研究以大展拳脚的空间,机器的深度学习也成为可能,也让人工智能在两次冬天之后再次迎来爆发。《纽约时报》曾以《需要多少计算机才能正确的识别猫?16000台》为标题报道吴恩达领导的Google Brain是如何训练机器认识猫的,这需要Youtube上数以百万级的视频资料。语音识别、机器视觉、物体识别、人脸检测、翻译会话等领域的创业公司开始遍地开花。数十亿计移动传感器和计算系统——智能手机在源源不断地喂养、调教着一颗超级大脑,仿佛一张高速运转地神经网络。AlphaGo所使用的神经网络结构示意图而AlphaGo的挑战成功,是神经网络威力的最好证明,正如Google在博客中披露的:“传统的人工智能方法——构建搜索树来穷尽所有可能的位置——不可能挑战人脑。我们选择将围棋“分解”,用改进的搜索树算法结合深度神经网络开发出AlphaGo这一程序,通过将棋盘分解成包含数百万类似神经元的网络联接,划分为12个不同的网络层,其中的‘策略网络’(policy network)去选择落子,而‘价值网络’(value network)则负责预测对弈的胜者(计算局面)。我们让围棋高手训练AlphaGo程序走了3000万步,它预测对手下步棋的准确率达到了57%(之前的记录是44%)。为了击败而不只是模仿最好的棋手,AlphaGo还能够通过增强学习(reinforcement learning)在神经元之间对弈,调整网络连接,从而开发出新的策略。”在人工智能阵营中,还有一帮人坚持着自底向上的路线:要想实现模拟生物智能的目标,就应该从制作人工昆虫这种最低层次的设备起步,模拟最简单的生物系统,而不是试图匹敌人类的能力,这就是仿生机器人(动物)。Boston Dynamic等公司所开发的机器猫、狗、豹等已经实现了“头脑简单,四肢发达”。协调性、适应性不亚于甚至超过了人类。人工智能的Brain与Body都在快速成长,难怪微博中关于Boston Dynamic机器人最普遍的看法是:满脑子是以后人类被机器人毁灭的画面。与此同时,AI与IA也在互相交融。Google Brain的研究成果已经被运用到Google Now等很多产品中,更准确地洞悉用户的信息输入,更人性化的理解人类的意图。微软发布的第一款智能助理Cortana显然比Siri、Google Now更加“人格化”——名字来自于《光晕》中的角色,虽然只是个圆形图标但却拥有16种表情,可以和你进行更自如机智的对话,而且声音更富有语调和感情。很显然,微软的目的就是让人们像爱上《Her》中的萨曼莎一样爱上小娜。就像约翰• 马尔科夫在《与机器人共舞》一书的最后问到的那样:人类已经将自己相当一部分的时间交给了与其他人类通过计算机互动,或是直接与一些类人的机器互动。这些人工智能化身将会成为我们的奴隶、助手、同事,还是三者的融合?AI还是IA,这终将是摆在开发者与使用者面前不得不回答的问题。作者: 约翰• 马尔科夫(John Markoff)出版社: 浙江人民出版社译者: 郭雪出版年:
跟贴热词:
文明上网,登录发贴
网友评论仅供其表达个人看法,并不表明网易立场。
目前没有跟贴,欢迎你发表观点
正在加载..
图片,文字等缺失或错误
色情,暴力等非法内容
广告,重复文章等垃圾内容
我有话要说

我要回帖

更多关于 alphago围棋软件下载 的文章

 

随机推荐