为什么围棋初段需要多久AI需要用大量显卡

若朴 发自 凹非寺量子位 报道 | 公众号 QbitAI围棋界又出现了一个神秘的高手。名叫:舞者(P)。而且又是一个人工智能程序。之所以被外界关注到,是因为最近一段时间舞者(P)在弈城围棋的亮眼表现。无论是对战人类,还是对战其他AI。先看看看战绩。舞者(P)被称为目前弈城围棋对战平台上的“胜率之王”:129胜,34负,胜率约为78.6%。最近20战的成绩是16胜4负。月初舞者(P)还曾下出18胜2负的成绩,从而引发的外界的关注。△ 舞者(P)最近20局战绩舞者(P)在弈城围棋上的首次对弈,发生于今年4月2日,只下了70手便负于中国女棋手於之莹。整个4月,舞者(P)在弈城的战绩是27胜8负,排名223。此后,舞者(P)一直低调成长,直到7月遇见“地震狗”DEEPZEN(B)。在双方7月4日的这次交锋中,执白的舞者(P)连杀DEEPZEN(B)中腹和左下两条大龙获取胜利。此外,舞者(P)对战比利时、美国的围棋程序LEELA(B)、cnc(B),都能占据压倒性的优势。7月,舞者(P)排名92位,战绩:33胜6负。上周六(8月19日),来自台北的人工智能围棋程序CGI(B)在弈城围棋对战平台开启连胜模式——弈城围棋在报道中写道:“其中不乏“超级玛丽”、dauning(P)这样的高手,以至于观棋的棋友无罪说:‘AI太嚣张了!’”。不过首先站出来终结CGI(B)十四连胜嚣张气焰的,却是另一个AI:舞者(P)。两个人工智能的较量在周日午夜00:30开始,执黑的舞者(P)以“变形中国流”开局,很快获取大幅领先,行至第241手CGI(B)投子认负。目前8月的排行榜上,舞者(P) 战绩:40胜6负。△ 舞者(P)执黑中盘胜CGI(B)舞者(P)是谁?昨晚,答案揭晓。给出谜底的是AlphaGo团队的核心成员黄士杰(Aja Huang)博士。黄士杰博士透露的信息显示:舞者(P)的棋力和DeepZen(地震狗)、腾讯绝艺、CGI(B)等在伯仲之间,而且也借鉴了AlphaGo的技术。另外更让人吃惊的是,舞者(P)只是今日头条工程师的一个业余时间作品,并且只用了一台机器进行神经网络的训练。(UC:震惊!)△ 黄士杰博士揭露舞者(P)真身这的确是一个让人感到吃惊的成就。AlphaGo之所以强大,离不开背后团队和资源的大量投入(点击这里参考量子位此前的报道)。另外,可以用清华大学的围棋AI神算子做个对比。神算子还谈不上是高手,它的创造者由小川教授介绍说,这个AI也借鉴了AlphaGo的技术,目前最缺乏联调和磨合:“我们去年论文框架是有4个模块,模块间要共同协调配合,彼此间参数磨合也需要一定的周期”。最近围棋AI还有什么新动向其实最近围棋界的人工智能动向,不止舞者(P)一个。比方说,上周中信证券杯首届世界智能围棋公开赛落幕,来自日本的“地震狗”DeepZenGo最终击败来自台北的CGI,以三连胜的战绩夺冠。当然CGI获得了亚军,而腾讯的绝艺获得第三名。这几个围棋AI上面也提到过,只不过有些名字跟弈城围棋上的ID略有小小的区别。另外,舞者(P)不知道是不是没有报名,反正前八里没有。咱们来重点说说CGI。虽然曾经负于舞者(P),但勤奋的CGI(B)在弈城围棋上目前以55胜8负战绩排名第六。而且要知道,两个月前CGI距离最高水平的围棋AI还有大约两子的差距,现在已经“脱胎换骨”可以制霸全场了。CGI是Computer Games and Intelligence Lab(计算机游戏与智能实验室)的简写,作者是台湾交通大学资讯工程研究所吴毅成教授。2015年初CGI的版本相当于业余三段,去年初成长到业余六七段的水平。如今CGI一跃成为黑马。(包括7月登陆弈城围棋,获得不俗战绩)负于DeepZenGO获得亚军之后,吴毅成对新浪体育表示:“人类学习AI的话主要是学习布局和大局观,AI的后半盘和官子不行。AI因为胜率选择的原因思维比较跳跃,如果人类学棋的话最好还是按照人类的思维学习”。尽管获得第三,但绝艺这个成绩显然与外界的期望不匹配。也有人评价说,最近绝艺没有取得新的突破。不过在腾讯的野狐围棋平台上,绝艺并非没有作为。目前绝艺的测试版“骊龙”,在野狐围棋上已经取得了23连胜的成绩,不过自从8月11日晚间之后,骊龙迄今并没有继续在野狐上对弈。此前,绝艺曾经取得过32连胜。△ 骊龙最近在野狐围棋的战绩量子位会继续保持对围棋AI的关注。OMT除了在对战平台上大杀四方,围棋AI还被应用到教育领域。某大咖围棋道场最近就引入一套AI围棋教育系统,开班授课。人工智能系统化身辅导老师,对刚入门的小朋友进行1对1的辅导。因为没有收广告费,量子位也就不把详情放出了╮( ̄▽ ̄)╭。主要是讲最近有这么一个事儿,实际效果如何,我们真不知道~互动时间最后放个互动,围棋第一人柯洁,最近又有金句,回答了关于聪明、围棋AI、女棋迷来信等几个问题。在量子位公号(QbitAI)对话界面,回复:“柯洁又有金句”六个字,就能查看柯洁最新的抖机灵回答~— 完 —诚挚招聘量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。量子位 QbitAI?'?' ? 追踪AI技术和产品新动态
本文仅代表作者观点,不代表百度立场。本文系作者授权百度百家发表,未经许可,不得转载。
分享到微信朋友圈
打开微信,点击 “ 发现 ”
使用 “ 扫一扫 ” 即可将网页分享至朋友圈。
扫一扫在手机阅读、分享本文
百家号作者平台APP
扫码下载安卓客户端
便捷管理文章信息
随时查看文章收益AlphaGo之父:除了下围棋,AI还要塑造人类未来 - 简书
AlphaGo之父:除了下围棋,AI还要塑造人类未来
DeepMind两战两胜围棋大师李世乭,激起了人们对人工智能潜力的热烈讨论。然而DeepMind的产品远不止AlphaGo而已——连主打产品都算不上。正如公司联合创始人戴米斯·哈萨比斯在本周早先说过的,DeepMind想要“解决智能问题”。为了实现这一目标,他有很多想法。
哈萨比斯一贯不走寻常路,不过现在回顾起来却另类得不无道理。他是儿童国际象棋天才,曾5次获得脑力奥林匹克运动会全能脑力冠军,年纪轻轻就通过在游戏开发公司Bullfrog和Lionhead研发侧重于人工智能的游戏《主题公园》和《黑与白》名噪一时,后又成立了自己的工作室Elixir。2005年,哈萨比斯从游戏产业中抽身,转而读了个神经科学博士,随后在2010年成为了DeepMind的联合创始人。在AlphaGo首战告捷后的上午,哈萨比斯接受了The Verge的采访。当谷歌一位负责人告诉他一夜之间韩国媒体发表了超过3300篇关于他的文章后,他难掩惊讶。“太难以置信了,不是吗?”他说道。“看到小众的东西变得这么流行还真是有趣。”除了AlphaGo,我们的谈话还涉及了电玩、下一代智能手机助手、DeepMind在谷歌旗下扮演的角色、机器人、人工智能如何辅助科学研究等等。料很多,慢慢看。(以下内容酌情略有删减)“ 围棋一向是人工智能研究的终极目标对既不了解AI也不了解围棋的人,你要如何描述昨天发生的事所引起的文化共鸣?
我想就此说几点。围棋一直以来都是完美信息博弈的巅峰。在可能性上,它远比国际象棋复杂。因此在AI研究领域,尤其是继“深蓝”之后,围棋一直是大家的终极目标。正如你所知,尽管付出的努力不少,却收效甚微。
“蒙特卡罗树搜索”是十年前的重大创新,但我们将直觉层面引入了AlphaGo的神经网络,而顶级棋手之所以杰出正是因为他们的直觉力。连比赛现场解说员迈克尔·雷德蒙都无法算出胜负,这真令我震惊,他可是职业九段!这正显示出了围棋的估值函数写起来有多难。比赛过程中,AlphaGo有没有哪几手棋是出乎你意料的?有的。当AlphaGo向左下角李世乭的地盘猛攻时,我们相当震惊——从李世乭的表情来看,我想他也这么觉得。这是很出人意料的一招。因为进攻太猛?应该说一方面攻得太猛,一方面又太鲁莽了!并且它对李世乭将计就计。李世乭以富有创造力的进攻著称,他在比赛中也是这么做的,我们猜到他会这样。比赛开局,一切还没落定,他就全盘各处进攻。传统的围棋程序非常不善于应对这样的比赛,它们在局部计算上并不差,但需要大局观的时候就显出劣势了。“ 为什么说谷歌围棋的胜利如此重要?举办比赛的初衷之一就是为了考察AlphaGo的实力。你从昨晚的比赛看出了什么?事情比我们希望的还要好。我们之前认为比赛的胜率是50:50。我现在还是这么认为;一切皆有可能,李世乭也会以不同的战术应战。因此能一探究竟是很有趣的。继续你的第一个问题,人工智能的意义,你也听我说起了AlphaGo和“深蓝”的不同。“深蓝”是定制的程序,程序员从国际象棋大师那里将信息提炼为具体规则和启发式算法,而我们则赋予了AlphaGo学习的能力,让它自己从练习和培训中学习,这点更与人类更接近。如果AlphaGo照这样赢下去,接下来是什么?未来会有其他的人工智能比赛吗?对于完美信息博弈,围棋已经是顶点了。当然,还有其他的围棋大师可以与之对决。也还有其他的竞技项目——无限注扑克很难,多玩家的形式很有挑战性因为这是一种不完美信息博弈。当然,还有各种人类比计算机玩得好的电竞游戏,比如在韩国大受欢迎的《星际争霸》。策略游戏对非完美信息世界中的策略能力有很高的要求,是谓“部分观察”。但围棋中你可以看到整个棋盘,对计算机来说难度会小些。你对称霸《星际争霸》有兴趣吗?也许吧。我们的目标不是要横扫竞技项目。我爱游戏,也曾经编写过电脑游戏。但前提是游戏能作为测试我们编写的算法的平台,这样来测试算法效率较高而已。最终我们是想要将它应用于解决现实世界中的重大问题。能谈一下你现在从事的和之前从事的游戏业的区别吗?像DeepMind这样的东西是我一直以来的终极理想。从某种意义上说,我已经为之计划了20多年。我之前所做的都是为了从事有朝一日投身到人工智能的领域。如果你熟悉我在Bullfrog等公司所做的事情,你就会知道,我所围绕和涉及的工作重心全是AI。从16、7岁制作《主题公园》起,我就意识到了人工智能的巨大潜力。我们的游戏有数百万的销量,无数人沉浸其中,都是因为AI的功劳。在此基础上,我曾尝试在游戏制作生涯中更进一步,然后就转向了神经科学的学习,因为在2005年左右我觉得已经很难再打着制作游戏的旗号进行AI研究了。毕竟发行商想要的只是游戏,对吧?所以截止到那时,AI最大的用武之地就是游戏咯?我认为是这样的,而且当时我们做的还是前沿得不得了的AI。90年代,学术研究进度放缓,所有诸如神经网络、深度学习和强化学习这些新科技都还没得到普及。所以事实上最好的AI都是在游戏中出现的。那还不是我们今天搞的这种学习型AI,而是有限状态的机器,但是它们已经相当复杂并且可以自适应了。像《黑与白》这样的游戏就用到了强化学习——我至今仍然认为这是强化学习在游戏中最复杂的典范。但是到了04、05年,游戏产业已经发生了变化,不再像90年代那样既有趣又有创意,可以容你随意实现自己的想法了,而是充斥着与游戏画面、销售和FIFA游戏这些相关的东西,变得不再那么有趣。我在游戏领域中已经发挥到极致,是时候搜集不同的信息来准备创立DeepMind了。这就关系到了神经科学。我想从人脑解决问题的过程中得到启发,那么还有什么比读个神经科学PhD更好的方法呢?IBM已经将“沃森”应用于癌症诊断中。DeepMind又能给我们带来什么呢?现在谈这个还有点早。几周前我们宣布了和NHS的合作,而那只是为机器学习提供平台的开始。以我的理解,“沃森”跟我们所做的还是很不一样的。“沃森”更像个专家系统,是一种不同类型的AI。这类AI做的是对图像进行医学分析,纵向跟踪重要信号或随着时间自我积累,来帮助人们建立更健康的生活方式。这对强化学习来说是很适合的。谈谈智能手机助手吧。你在开赛日的讲话中用到了电影《她》中的画面。所以未来就是那样的吗?不,我的意思是《她》代表了对这类事物的主流观点。我认为人们想要的是智能、连贯且深刻理解你真正想表达的意思的智能手机助手。
现阶段这类系统还不堪一击——一旦涉及到程序没有的模板,它们就全无用处。因此关键是要让它们变得真正具有自适应力,更灵活稳健。优化这些系统需要什么样的突破?为什么不能明天就开始着手进行?能是能,我只是觉得要换个角度。这还是预编程序与学习程序的区别。目前基本所有智能手机助手都是特定预编的,这就意味着它们只能做预设好的事。然而现实世界混乱而复杂,手机用户会做出各种不可预判的行为。DeepMind的根本理念是,AI的唯一途径就是从根本上进行学习并且有通用性。AlphaGo是从学习大量棋谱起步的。然而对于智能手机来说输入数据要多样得多。
是的,学习正是通过海量的资料来完成的。事实上,我们打算在接下来的数月里尝试AlphaGo算法——我们想去掉一开始的督导学习部分,完全让他自学,彻底从零开始。这样需要花费的时间要更长,因为随机下棋需要花更多的时间来训练试错,或许得好几个月。但是我们认为让它纯自学成才是可能的。你说的可能是因为现在的算法比过去先进?不,之前的算法也可以。这样并不会让程序变强,只是让它自学,没有监督辅导的部分。我们认为这个算法不需要督导也可以。我们去年用雅达利游戏测试时就没有任何人类知识的引导,只是从在屏幕上随机行动开始的。雅达利游戏比较容易吧,因为失败更显而易见?比较容易是因为比分更有规律。在围棋中,无论结束时你是赢是输都只得1分。这就是信用赋值问题,关键之处在于围棋中你下了一百手棋,但是不确定哪几步导致了输赢,所以信号是很弱的。而在绝大部分雅达利游戏中,你做的绝大多数事都会让你得分,所以你得到的线索会更多。对于人工智能改变手机,你能不能给出个时间范围?
我想,在接下来的2-3年内你就会看到苗头了。开始可能变化不大,只是有些方面进步了。或许在4-5年后功能上会有一大步飞跃。谷歌有没有左右你们配合他们的产品方针或商业模型来行事?
没,我们可以自由掌控对研究进度的优化。我们的使命就是如此,我们就是为此才加入谷歌的,因为这样可以提升我们的研究进度。过去两年就是这么过来的。
当然,我们也在做许多谷歌内部产品,但那些还只初具雏形,不便公开。当然,智能手机助手是重中之重,桑达尔·皮查伊也多次谈到它是谷歌未来发展的核心。“ 谷歌的支持对AlphaGo来说“非常重要” 你们和谷歌大脑有互动和交叉吗?当然,我们其实非常有互补性。我们每周都要交流。谷歌大脑主要注重于深度学习,有杰夫·迪恩这样了不起的工程师,所以他们已经深入到了公司的每个角落,才有了像谷歌照片搜索这么棒的东西。他们做得出色极了。他们也位于Mountain View总部,所以离产品部更近,研究周期只有12-18个月。而我们做的是算法开发,周期要2-3年,一开始也并没有明确的产品指向。谷歌对AlphaGo的支持有多重要?没有谷歌你们能成功吗?非常重要。AlphaGo在比赛中并不需要用到很多硬件,但是训练中我们需要很多硬件支持,尝试不同版本,让它们在云端展开对战。要想高效实现这些就需要大量的硬件,如果没有这些资源我们是无法在这么短时间里完成的。我在日本工作,现在机器人在日本有两种用途。一种是发那科这样的公司的工业机器人,还有一种是软银的Pepper这样的管家式机器人等等。从某些角度说都很厉害,但使用范围有限。你怎么看?是的,正如你所说,发那科机器人的物理功能很强,但他们缺乏智力。管家机器人则有些类似智能手机助手——也是以模板响应来预编的。如果你的行为超出这个范围,他们就傻眼了。那么机器学习会如何提升机器人的能力呢?这是完全不同的另一方面了。你要从头创造学习新事物的能力,还要具备应对意外的能力。对于任何机器人和软件来说,在现实世界中与现实用户互动,这些能力都是必须的,这样才能让它们派上用场。我相信学习的道路终归是对的。眼下,学习型机器人最实际的用途是什么?说实话我们没怎么考虑过这点。显然,无人驾驶车可算是机器人,但目前为止还是狭义人工智能——尽管在计算机视觉方面用到了学习型AI。特斯拉用的是几乎现成的基于深度学习的计算机视觉技术。我确信日本在考虑研发老年护理机器人,我觉得家务机器人对社会也是极有用的,尤其是考虑到人口老龄化这个严峻问题。学习型机器人为什么会在这些领域尤为出众呢?你应该先想想“为什么我们还没有这些东西呢?”为什么没有能包揽家务的机器人?原因就在于每人的家在布局和家具等方面都完全不同。即使在室内,情况每一天也不尽相同——有时会变得凌乱,有时会变得整洁。所以你没法给机器人预编程序来打扫房间,对吧?更不用说人们在如何叠衣服上都有不同的偏好。这正是问题的复杂之处。这些对人类来说很简单,但事实上在做这些事的时候,我们是在处理异常复杂的情况。我问一句:你用扫地机器人吗?呃……我们的确有一台,但不太好用……(笑)从长远看,你对人类、机器人及人工智能在未来的互动有何期待?我个人并没太多考虑过机器人。真正令我对运用这种AI感到激动的领域是科学。我期待能由AI研究助手来完成一些枯燥的工作,挖掘有趣的文章,在数量庞大的数据中摸索出结构并呈现给人类专家和科学家,使他们能够更快地取得突破。几个月前我在CERN进行了一次演讲。显然,他们产生的数据比地球上任何其他人都多,也许在他们庞大硬盘的某处就藏着新粒子,只是因为数据太多而没人来分析发现。所以,要是有一天AI能参与发现新粒子,就太酷了。真是精彩的结语。来源:The Verge作者:Sam Byford编译:未来论坛 商白文章转载请注明出处为 “未来论坛”微信账号(ID:futureforum)未来论坛官网:www.futureforum.org.cn
未来论坛是一个承载人类科技梦想,用科技改变世界的公益平台;一个连接前沿科技,解读未来趋势的思想平台。
未来论坛由一批时下最有影响力的互联网界、投资界、科技界人士共同发起。其中有李彦宏、杨元庆、徐小平、丁健、沈南鹏、张磊等工商界翘楚,也有施一公、饶毅、张首晟等蜚声中外的顶尖科学家。
在围棋峰会开幕式致辞中,DeepMind CEO Demis 表示,樊麾已经成为 AlphaGo 开发团队中的一位重要成员。樊麾表示,自己在与 AlphaGo 对战以后,获得了很多从未有过的认知。柯洁与 AlphaGo 对战将以全新并且激动人心的方式共同探索围棋的奥秘。De...
澎湃新闻特约撰稿 刘秀云 责任编辑:洪燕华 澎湃新闻 AlphaGo(阿尔法狗)之父在英国剑桥大学演讲。 4月10日,“人机大战”的消息再次传出,关于人类和AI的对抗再次牵动世界的神经。 “我会抱必胜心态、必死信念。我一定要击败阿尔法狗!”对于5月23日至27日与围棋人工智...
作者:张熙
班级:1402019
学号: 【嵌牛导读】:柯洁对阵AlphaGo首局失利。 【嵌牛鼻子】:AlphaGo、人工智能 【嵌牛提问】:柯洁使用了怎样的策略对付AlphaGo?AlphaGo2.0较之1.0有何改进? 【嵌牛正文】: 在围棋...
本文系《文工团》约稿,禁止一切形式的未授权转载,谢谢合作。这篇是约稿的第二版,第一版可以点这里。 围棋,是一项中国先人所发明的古老对弈游戏。 相较于中国象棋或者国际象棋,围棋的最大特点在于它的每一个棋子都是相同的,没有不同的走法与规则,以及,更重要的一点,围棋中每个棋子的作...
阿尔法狗与人类顶尖棋手的人机大战注定成为人工智能(Artifical Intelligence, AI)的里程碑事件,当AI变得越来越复杂,越来越聪明,以至于在多个领域全面超越人类的时候,那时的AI会是提高人类生产力和生活质量的好助手?抑或是彻底控制奴役人类的天网?现在还难...
芝士就是力量!只要加了芝士,就连最普通的蔬菜也能变得奶香四溢,好吃的不得了~呐,今天就来给大家推荐一下芝士满满的好吃的~希望大家吃完能拍着肚子,满载而归~ (按首字母排名) 721幸福牧场 地址:复兴中路soho复兴广场B2层31和36号 日式餐厅来的,起司猪排非常棒!...
作父母的都有望子成龙的愿望,但成龙后的儿女,能给父母带来什么,还真难说。一位母亲,丈夫早亡,含辛茹苦将儿子养大,儿子很争气,考上大学留在大城市,结缘高官家庭步步高升,由于工作忙,离家多年除了给母亲打几个电话,竟然没抽出时间回家看望母亲。
幸好他还有个姐姐,为了让弟弟上学...
我不知道未来会怎样,但我决定从这一刻开始记录。有关爱情,有关友情,有关那些从未得到的渴求着的美好,有关我和你一样挣扎着的人生。
刚刚我冷落了他整整三个小时,在煎熬了那许久我才匆匆回复他。平时我也没有这个机会,就只是因为手机没电了。呵呵,手机没电了我才能暂且离开他...
和好朋友在一起,聊到这几天天气很热该喝点绿豆汤解暑。朋友问:你要绿豆吗?我回答:不要。冰糖呢?我回答:不要。白糖呢?我摇头。这时我忽然意识到:家里绿豆冰糖白糖都很少了只剩一点点该买了啊!那我怎么就脱口而出不要呢?朋友说:家里的夏季福利发了太多,根本吃不了。我奇怪自己为什么急...
(接上) 女孩怔怔的看着盘中那浑圆饱满的单面蛋,完美的圆形,蛋白上错落有致的小孔,以及那鲜嫩欲滴吹弹可破的蛋黄,在女孩的脑海中好像一个完美的乳房,她必须恨恨压抑自己,才能控制住那种恨不得咬上一口的原始冲动。 当女孩回过神来时,闻到了一股的香味,这种味道不陌生,是排骨青菜汤的...最强围棋AI主机配置 双22核CPU、四路TITAN X(为什么要显卡?_显卡吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:3,055,079贴子:
最强围棋AI主机配置 双22核CPU、四路TITAN X(为什么要显卡?收藏
居然要这么大的内存和这么好的显卡,为什么呢?据介绍,这次出战的DeepZenGo是14.0版本。主机配置为CPU:Xeon E5-2699v4 ×2(44核,2.2GHz),GPU:TITAN X(Pascal代)×4,SSD 128GB(系统盘),SSD 480GB ×2,内存128GB。
战神Z7-KP7D2 GTX1060 6G/i7-7700HQ/IPS屏/全彩背光键盘
显卡GPU辅助计算?
强迫症?内存条插槽都插满系列?
我还怀疑128g够不够呢,要是这个ai算法不行的话
最强的是阿尔法狗,用了几台服务器这个日本的deepzengo连人都打不过
深度学习训练基本都用gpu。测试的时候,也是gpu快很多
机器学习gpu效率高啊
和alpha?差远了
看成 DeepMind Go
登录百度帐号推荐应用围棋后德扑也被人工智能攻克了!下个会是麻将吗?_网易新闻
围棋后德扑也被人工智能攻克了!下个会是麻将吗?
用微信扫码二维码
分享至好友和朋友圈
(原标题:围棋之后,德州扑克也被人工智能攻克了!下一个会是麻将吗?)
你有没有想过,未来某一天,称霸各种竞技、棋牌游戏的都不再是人类,而是AI(人工智能)?据科技网站TechRepublic报道,虽说位于匹兹堡的河流赌场与“科技突破”有些不搭,但本周二(1月31日),它确实见证了卡耐基梅隆大学的AI系统Libratus将4位德州扑克顶级选手斩落马下。据凤凰科技报道,Libratus是卡耐基梅隆大学计算机科学教授尚德洪姆与博士生布朗共同打造的,在为期20天的赛程中,它们一共进行了12万手牌的比赛,最终Libratus战胜了四位人类顶尖高手。“这是AI开辟的新疆界,”尚德洪姆在赛后的新闻发布会上说道。“也是AI在游戏比赛中获得的里程碑式突破。”▲图片来源:卡耐基梅隆大学Libratus的成功主要在于不断学习,每结束一天的比赛,它都能学到人类牌手的技巧并有所提升。“每天比赛结束后,Libratus内置的原算法就会分析对手的漏洞和技巧,并将其融入到Libratus未来的牌路之中。”尚德洪姆说道。而Libratus的方式与此前人机扑克大赛的思路有所不同,此前研究人员主要寻找对手的破绽并针对相应破绽进行各个击破。Libratus则正相反,它寻找破绽的目的是要补漏,防止自己也出现同样的破绽。1月30日傍晚,完成了3万手比赛的Jimmy Chou就曾筋疲力尽地告诉媒体,“这太难了。它(Libratus)不仅不留空子给我钻,而且我真的觉得它在钻我空子”。在现实生活中或许比AlphaGo更有用Libratus的胜利是AI逐步统治棋牌类游戏的又一里程碑,1997年时IBM的深蓝电脑在国际象棋比赛中击败世界冠军卡斯帕罗夫,去年AlphaGo则成功在围棋比赛中摘冠,而此前这项运动被认为是直觉的游戏。与深蓝电脑纯靠计算能力有所不同的是,AlphaGo拥有强化学习的能力。Libratus的胜利还象征着AI的另一个巨大突破,因为德州扑克与围棋预设的挑战不同,它信息缺失的特性是此前AI从未触碰过的。▲图片来源:视觉中国杜克大学计算机教授科尼特兹也认为AI击败德州扑克顶级选手是个巨大突破。“扑克是一个有关不完美信息的游戏,它与现实世界的战略决策更加息息相关,而这种特性在商业、政治、安全甚至社交生活中都能发挥直观重要的作用。”新南威尔士大学AI教授瓦尔斯也同意这一观点。“从某些角度来看,德州扑克的难度甚至要超越国际象棋和围棋,因为它的信息缺失非常严重。你不知道对手拿了什么牌或者即将打出什么牌,这就意味着变数的增多。此外,在扑克比赛中,选手们还会动用心理战虚张声势来影响对手的判断。”值得注意的一点是,虽然Libratus用的依旧是传统的树形搜索、抽象和游戏战略分析等AI技术,但我们现在并未完全了解Libratus的工作方式。“AI的进步可不止在深度学习上。”瓦尔斯补充道。同时,瓦尔斯认为我们不能高兴的太早,因为AI并未彻底统治扑克界,眼下的比赛还是一对一,如果有更多选手加入进来,德州扑克的难度将会成倍增加。想在多人比赛中获胜,AI恐怕还得多历练几年。此外,Libratus与AlphaGo有相同的毛病,那就是它们只专精于一个领域。因此人类不必担心它们的觉醒,因为除了玩扑克和下围棋,它们什么都不会。围棋和德州扑克之后,人工智能的下一站会是哪个游戏?不少正在家里搓着麻将的中国网友认为,麻将会是AI无法攻破的堡垒,但果真如此吗?带着AI去打麻将,就能百战百胜?在许多人看来,麻将只要手气足够好,不需要技术也能赢。大部分人也常常将自己的胜利或失败,归于手气,也就是运气够不够好。但运气真的是麻将游戏中的一切吗?一局人类看起来必输的牌,让AI来接管,结果会不会有所不同?▲图片来源:视觉中国每经小编在此向大家分享一篇深入解读的文章。诚然,麻将是一种运气成分占比非常高的竞技棋牌项目,技艺再强的高手,也有输给菜鸟的可能性。但同时不可否认的是,麻将中“技艺高低”也是明显存在的。麻将技艺的高低,不仅仅存在于高手和菜鸟之间。即使是顶尖高手,日本竞技麻将的高手段位中,在经过大量场数的竞技之后,顶尖选手之间的分数差距,同样可以稳定地被拉开,竞技水平被显著地区分开来。所以在麻将领域,研究出一个具有极高竞技水准的 AI,是完全有可能的。麻将 AI 的策略是怎样的?相比于棋类这样在大多理论上可遍历(通过计算机模拟出每一种可能的情况)的“完全信息动态博弈”,棋牌类项目, 因为很多情况下,你都不能知道对方手上的手牌,也不知道接下来会摸到什么牌,所以更多的情况是属于无法遍历的“非完全信息动态博弈”。也就是说,相比于棋类
AI,力求“将对手逼入必输的岔路口”这个博弈目标不同,麻将 AI
的策略则更多地增加自己得点的期望值,尽量让自己有更大的可能性和大牌,同时尽量避免对手的大牌点炮。而麻将的打牌策略,显然是有最优解的。每圈弃牌的14个选择里,我们总可以找到我们当前认为最好的选择,而高等的选手,和高级的 AI 要做的,就是尽量能多思考几回合。当代的计算机棋手大多采用的是“蒙特卡洛树”搜索算法,策略是选择或迫使对手选择一个分支,这个分支下的所有的结局都是自己胜。AlphaGo 就是蒙特卡洛算法和深度学习的结合。让自己有更大的可能性和大牌,就需要通过手牌和弃牌池里的牌,计算自己进张(摸到有效牌)和鸣牌(吃、碰、杠),使自己手牌有进展的概率,进而计算自己和牌得分的期望值。这对于 AI 设计来说实际上是很简单的。让 AI 避免对手的大牌点炮相对更难,一方面麻将 AI 需要通过大量的牌谱数据库,来获得通过对方打出的弃牌来分析其牌型的能力。这样可以让 AI 拥有在几圈之前,就开始弃掉别家需要的关键牌的能力。百战百胜的麻将 AI 距离我们有多远?因为竞技麻将这项运动的小众性,麻将
AI 目前处于一个相当缺乏发展的阶段。目前还没有可以完全战胜所有人类的麻将 AI,但这其中主要的原因是缺乏相关的研究。大多麻将 AI
都还停留在游戏厂商的 AI 上,计算强度非常有限,无法与棋类 AI 动辄就在超级计算机上进行运行相比。但麻将运动中,可执行的打法数量,实际上是远小于围棋的。因为毕竟手上只有 14 张手牌,一共也只有 136 张的总牌数。所以实际上麻将的复杂度,AI 运行所需要的计算量,实际上也是比 AlphaGO 这样的围棋 AI 要少很多的。并且麻将有着相对明确的目标,有着相对少的和牌牌面,所以麻将 AI 实际上完全可以储存大量的牌谱,然后在运算的时候,只要寻找对自己有用的牌即可,这样可以减少很多的计算量。目前最强的麻将 AI,是东京大学开发的日麻 AI —— “爆打”。“爆打”在日本最大的线上麻将平台,天凤上进行了 1.3 万多场比赛,最高达到过七段的成绩,这意味着「爆打」比 96% 以上的麻将玩家都取得了更好的成绩。▲日麻 AI “爆打”对战两位天凤六段选手和一位八段选手,自摸。除了麻将之外的其他棋牌 AI实际上,除了麻将之外,很多中国民间喜闻乐见的棋牌项目,对于开发
AI 来寻找最优解的能力,相比棋类 AI 程序来说,都要简单得多。其面对的问题,同样是因为这些项目中都包含了运气成分,这使验证 AI
的有效性变成了一个相当难的问题。相反,麻将还是这些项目中相对规范化程度非常高的一个,至少在日本,有着非常完善的 ranking(排名)
机制与平台。而因为验证 AI 有效性很麻烦,所以也导致了这类 AI 开发的相对滞后。而这样的 AI 的作用是什么?除了他们可以用来研究算法本身之外,棋牌 AI 所伴随的棋牌类竞技规范化,也是一个很重要的事情。但同时,我们还可能会看到的是,伴随着棋牌类竞技项目的赌博,可能也会开始依赖于 AI 催生出一个全新的产业。斗地主、桥牌、德州扑克…… 在未来我们都有希望看到这些项目对应的“最强 AI”,永远能找到最优解的 AI 出现。
很多人都想不通,为什么人类要研究一个仅仅是用来下围棋的
AI,更不必说“打麻将”这件事,如今在中国完全不被当做一个“正经”竞技项目。但他们很难意识到的是,AI
实际上代表了人类对这个世界,孜孜不倦的探求,和挑战自我的精神。用来“打麻将”的
AI,我们创造它的动机,当然不是让我们可以利用其功能,在麻将场上百战百胜。而是我们通过麻将 AI
这件小事,使人类的智慧之光,得以在广袤的世界中延伸,直到洒满每一角落。这是我们要探究这个世界上一切未知事物的动力,包括却不限于,创造一个永远可以找到最优解的,麻将 AI。
本文来源:每日经济新闻
责任编辑:曾自航_NN6325
用微信扫码二维码
分享至好友和朋友圈
加载更多新闻
热门产品:   
:        
:         
热门影院:
阅读下一篇
用微信扫描二维码
分享至好友和朋友圈

我要回帖

更多关于 围棋游戏 的文章

 

随机推荐