围棋 master alpha go界新星Alphago,会是人类终结者吗

围棋界新星Alphago,会是人类终结者吗?_青瓜网
> 围棋界新星Alphago,会是人类终结者吗?
围棋界新星Alphago,会是人类终结者吗?
时间: 01:07:23
来源:山阳洞主
你真的了解AlphaGo吗?分享人工智能的伟大胜利的朋友,你们真的了解AlphaGo吗?按维基百科:AlphaGo是由Google DeepMind开发的围棋程序。2015年10月,它成为第一个不借助让子,在全尺寸19×19的棋盘上击败职业围棋棋手的电脑围棋程序。AlphaGo使用蒙特卡洛树搜索(Monte Carlo tree search),借助值网络(value network)与策略网络(policy network)这两种深度神经网络,通过值网络来评估大量选点,并通过策略网络选择落点。AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的棋局,一旦它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它。围棋无法仅通过寻找最佳步来解决;游戏一盘平均有150步,每一步平均有200种可选的下法,意味着有太多需要解决的可能性。而根据Nature在一月份的文章,他是这样描述的:AlphaGo是一套为了围棋优化的设计周密的深度学习引擎,使用了神经网路加上MCTS (Monte Carlo tree search),并且用上了巨大的谷歌云计算资源,结合CPU+GPU,加上从高手棋谱和自我学习的功能。这套系统比以前的围棋系统提高了接近1000分的Elo,从业余5段提升到可以击败职业2段的水平,超越了前人对围棋领域的预测,更达到了人工智能领域的重大里程碑。Alphago 人工智能的计算机装有 48 个 CPU 和 8 个 GPU,不过,除此之外,谷歌没有公布更多详细信息。而制造AlphaGo的则是谷歌的DeepMind团队。DeepMind并不是谷歌自己创建的,而是,其联合创始人Larry在2014年初以4亿美元收购的一家英国人工智能公司所创建的。DeepMind的创始人是Demis Hassabis,这可是一位计算机天才,但是,很少有人听说过 DeepMind和这位天才。直到现在网上疯炒的各家媒体,依然还是展望人工智能的前景,很少有报道这位天才以及这家公司,也难怪,这真是一家非常低调的公司。另外,DeepMind 的投资人之一可是大名鼎鼎的 Elon Musk,就是 Tesla 和 Space X的老板,这位牛人向 DeepMind 投资了 650 万美元。谷歌收购的过程也非常有趣,其联合创始人Larry在飞机上听说了这个公司,非常感兴趣。恰巧,Facebook的创始人Mark Zuckerberg也同时对这个小公司产生了兴趣。所以,谷歌收购的过程很漫长,不过最终还是早出手的Larry胜出,这点让Zuckerberg如今仍耿耿于怀。再来看看DeepMind 的核心技术。现在街头巷尾都在谈论的机器学习,其实这是一个非常宽泛的概念,而其中最酷的分支要算是深度学习(Deeplearning)和强化学习(Reinforcement learning)。深度学习是受人脑启发的一种结构,在实验的基础上,该结构中模拟神经元层间的联结得到加强。深度学习系统能够从大量的非结构数据中获取复杂信息(see Nature505, 146–148; 2014)。Google正在使用这种算法来自动分类图片,目的则是为了进行机器翻译。强化学习,其实就是一个连续决策的过程,其特点是不给任何数据做标注,仅仅提供一个回报函数,这个回报函数决定当前状态得到什么样的结果(比如“好”还是“坏”), 从数学本质上来看,还是一个马尔科夫决策过程。强化学习最终目的是让决策过程中整体的回报函数期望最优。谷歌的DeepMind就将深度学习和强化学习两者的精髓合二为一,提出了深度强化学习。2014年,这个团队就在《自然》杂志发表了Human-level control through deep reinforcement learning的论文,让业界对此充满了期待。李世石何许人也?根据维基百科:李世石,韩国围棋九段棋手,成长于韩国全罗南道偏僻的飞禽岛,所以又被称为“飞禽岛少年”。因中文汉字无“乭”字(韩国自创字),故中文媒体多将其简化为“石”(李世石)。早年棋风锐利,擅长大规模的攻杀,成绩卓越,近年来随着年纪渐长与技术逐渐成熟,开始转变为全能棋风,能攻能守,刚柔并济成为一代棋界巨匠。李世乭厉害之处在于他下棋的风格飘渺灵幻,时常有神来之笔,兼有强大的战力且计算极为精准。同时他也有着高水准的心理质素,世界大赛上常在落后的情况下迎头赶上逆转拿下胜局。在年期间与中国的围棋第一人古力九段有多次交锋,受到很大关注。我们来看其国际赛场上的表现为什么这次用围棋考验人工智能?社会上很多中流砥柱应该记得20多年前的IBM深蓝,在围棋大赛上打败了国际象棋冠军卡斯帕罗夫。而这次为啥选择围棋大师作为挑战者,因为围棋大更难!根据知乎用户峰哥的描述,围棋的复杂度为10^{172} 而国际象棋则只有10^{46} 。关于人工智能挑战围棋的难度描述,知乎用户Ruofan Wu是这样描述的:本人曾经参加国机器博弈相关的比赛,略了解一些。所谓计算机博弈或者机器博弈,顾名思义就是让计算机学会人类的一样思考、能够像人一样下棋。如何让计算机下棋?首先要让计算机看懂棋盘棋子,这对应的是机器博弈中的棋盘表示;然后是看懂棋局,知道输赢、知道哪儿可以落子,对应的是判断输赢与走法生成器;之后是知道落子的优劣,对应的是估值函数;最后是知道在哪儿落子,对应的是搜索引擎。棋盘表示、走法生成器、搜索引擎和估值函数,可以说所有机器博弈程序的基本组成部分。由于围棋的棋盘为19*19=361,棋盘较大,且下棋过程中会出现提子(吃子)的情况,较为复杂。客观上来说,围棋状态复杂度与博弈树复杂度都是公认的第一。(简单来说状态复杂度就是棋盘上可能出现的棋面状态的个数,博弈树就是从最初棋局根据落子的各种可能展开的树型结构最外层叶子点的个数。如果没记错的话。)机器博弈最简单的做法就是让计算机根据当前棋局去枚举下一步所有可能的走法,然后再这一步的走法中选择最好落子点,然后落子。这只是一步搜素,通常人在下棋的时候并不会只去想下一步棋,高手会思索当前步数之后五至十步,通常来说只要你对局面或者对方心理了解得当,是可以预判、预估对手下一步落子,你思索的层数越深,则你做出的选择就会越得当。而这个思索的过程牵扯到大量的棋类知识以及大量运算对人脑来说极其复杂,而对于计算机来说也是同样复杂,只不过复杂难点在于其牵扯到的大量棋类知识。所说的思索就是搜索引擎、棋类知识就是估值函数,计算机只能通过值来判断优劣,它永远不会有感性认识,如何把棋类知识抽象成估值和评分标准是非常考验棋力的。在得当的估值函数作用下,搜索引擎的作用就是较快的找出给定n步上较好的落子点。注意,是较好,因为在速度和质量之间需要有所取舍,通过舍弃、剪枝等一系列算法减少计算机在每一步的候选搜索落子点,来提高速度,从而使得可以想更深的层数去试探搜索。近些年蒙特卡洛算法在棋类中的广泛应用,以及随着计算机计算能力的提高,相信计算机的搜索能力会越来越好,较好可能会变成最好。像围棋这一类会出现吃子情况的棋类,在搜索的时候会出现搜索树(当前棋局之后可能产生的各种局面展开构成的一棵树)回溯的情况,就是当前步走完之后出现了和上一步重复的棋局(典型代表就是围棋里的“打劫”),也会给搜索的过程带来麻烦。在实现的时候需要特殊处理。棋类的开局非常重要,在处理开局的时候通常使用开局库以及机器学习的方法,开局库就是所谓的经典围棋开局,以前书店里20块一本的那种,当然还有残局库,都是好素材,录入到计算机里会大大减少开局时计算机走昏招的概率。而机器学习通常和开局库残局库结合使用,最简单的方法,通过对开局库每种开局胜负情况的统计,修改开局库每种开局的评分,让计算机去选择获胜几率较高的开局或者残局。计算机围棋想要战胜人脑,其前提是人类对围棋的逐渐研究透彻,只有人类对围棋的理解达到一定水平,才能将人类的智慧抽象成计算机可以理解的数据。本人曾做过六子棋相关的机器博弈,水平有限,做出来几MB的程序,六子棋创始人做的程序单独一个bin文件就80MB,而且反应速度极快,个人推断这个bin文件存储的就是开局库(可能还会有残局库)。的确计算机没有人类下棋的思维,但是在积累了足够多的前人的下棋经验,并将其转化成开局库或者残局库的形势,计算机可以利用自己存储与运算的优势,将无数棋谱记住,也许今天计算机使用的是开局库或者残局库,在不久的将来计算机使用的可能就是局部的残局库。你和电脑下棋的时候,这一秒他是常昊,下一秒他就变成了武宫正树。电脑的棋力和人脑一起进步的,并终究会超越人脑。这些人工智能可以应用到哪里?根据李开复的说法:AlphaGo里面的深度学习、神经网络、MCTS,和AlphaGo的扩张能力计算能力都是通用的技术。AlphaGo的成功也验证了这些技术的可扩展性。但是,AlphaGo其实做了相当多的围棋领域的优化;除了上述的系统调整整合之外,里面甚至还有人工设定和调节的一些参数。AlphaGo的团队在Nature上也说:AlphaGo不是完全自我对弈end-to-end的学习(如之前同一个团队做Atari AI,用end-to-end,没有任何人工干预学习打电动游戏)。如果AlphaGo今天要进入一个新的应用领域,用AlphaGo的底层技术和AlphaGo的团队,应该可以更快更有效地开发出解决方案。这也就是AlphaGo真正优于深蓝的地方。但是上述的开发也要相当的时间,并且要世界上非常稀缺的深度计算科学家(现在年待遇行情已达250万美金)。所以,AlphaGo还不能算是一个通用技术平台,不是一个工程师可以经过调动API可以使用的,而且还距离比较远。但根据AlphaGo背后的男人就是DeepMind公司的创始人之一德米斯·哈萨比斯(Demis Hassabis)的说法:最终,我们想要将这些技术应用到真实世界的重要问题中。因为我们用的方法是通用的,我们希望有一天,它们能延伸得更广,帮助解决最紧迫的社会问题,从医药诊断到环境模型。”哈萨比斯说。关于人工智能的未来相信大家都看过《终结者》,里面的天网有没有让你不寒而栗。然后生化危机里面那个小女孩,也让你很害怕吧。更糟糕的是《黑客帝国》中的世界。在那里,人类甚至愚昧到发现不了机器已经将自己取而代之。他们进行着日常的工作和生活,把一切看成正常的,忘记了他们实际上是生活在一个虚拟的世界之中。人类的“存在”仅仅是装在这些生活在营养舱里的人类大脑中的程序,由一个大型的计算机进行操作和管理,而机器需要这些人的唯一理由是要用他们作为生物电池。关于人工智能意识,物理学家加来道雄提出了一种判定和量化的标准。他认为,意识至少由三个基本成分组成:一是感觉和认识环境,二是拥有自我意识,三是会设定目标,计划未来,制定达成目标的策略。他以数字1到10对意识程度进行了量化。比如,锤子不能感觉环境,因此它的意识等级为0。但是一个温度调节装置可以感觉环境,并且通过改变环境温度对环境产生影响,它意识等级为1。由此他也认为,具有反馈机制的机器有初步形式的意识。在现今的研究中,模式识别是人工智能发展的主要障碍。机器人能够比人更好地感觉环境,但是它们不能理解或认识它们看到的是什么。在意识的这个尺度上,机器人的得分最低,接近于昆虫,因为它们缺乏模式识别的能力。在确定了目标后,研究人员的目标就变成了创造具有所有这三个特征的机器人。相对来说,第一项较难达到,因为机器人虽然能够感觉环境,但理解不了它的意义;自我意识比较容易取得;最后是获取常识,在此基础上才能拥有为将来制定计划的能力因此,我们看到常识是高级意识的前提。为了让机器人模拟现实和预测将来,它必须掌握有关周围世界的几百万条常识的规则。但是有了常识还不够,常识只是“游戏规则”,而不是策略和规划的规则,它更关乎机器人在现实世界中的生存。今天,对于如何向机器人灌输常识,使其产生意识的方法,研究人员所知有限。大多数人举手投降,并且表示巨大的计算机网络会有办法显示“突然出现的自然发生的现象”,就像有时本能地从混沌中产生秩序一样。当问到这些突然出现的自然发生的现象什么时候将产生意识时,大多数人只能是哑口无言。如果机器人超越人类?进化的定律只有一条,即适者生存。也许人类会成为落后的一方,最终被锁在动物园里供机器人观赏。也许这就是我们的命运:我们孕育演化出了这些超人机器人,然后退场。而它们把我们看成是在它们的演化进程中的原始祖先。在某一天,我们不再是地球上智力最高的生物,而且我们的创造物也许能够复制它们自己,并创造出比它们还聪明的机器人。然后,这个自我复制机器人的大军将创造无穷无尽的下一代机器人,每一代都比前一代聪明。理论上,机器人能够在很短的周期内创造更聪明的下一代,最终,这个过程将呈指数级膨胀,直到最后,在它们贪得无厌的变得更加聪明的要求下,吞噬了这个行星的资源。这就是“奇点”,这个词原来来自相对物理学世界,代表重力为无限大的点,任何东西都不能从这里逃逸,包括光,所以它代表了一个视野,超过这个视野,我们什么也看不见。发明家雷·库兹威尔是奇点理论忠实的代言人。他喜欢根据技术的指数增长进行预测。在1999年,他写了一本畅销书《灵魂机器的时代,当计算机超过人的智力》,预测候机器人于什么时将在智力上超过我们。在2005年,他写了《奇点临近》,并且详细阐述这些预测,称计算机超过人的智力的决定性的一天很快就会来临。他预测,到2019年,1000美元级别的个人计算机就将具有和人的大脑一样强的能力。此后不久,计算机将把我们甩在后面。到2029年,同样价格的计算机将比人的大脑强大1000倍。到2045年,这一价格的计算机将比每个人合起来的智力强10亿倍,即便是一台小型计算机也将超过整个人类的能力。在他的想象中,2045年后的计算机将变得非常先进,甚至能够复制自身、智力不断地增加,产生失控的奇点。为了满足它们永无止境的贪婪及不断增加计算能力的欲望,它们将开始吞噬地球、小行星、行星、恒星,甚至影响宇宙本身的历史。库兹威尔相信,在这样的未来中,我们要想的不是如何对抗智能机器的入侵,而是要与这个技术融合。我们要把这些智能的设备放在我们的身体和大脑里,让我们活得更长寿,更健康。没有人知道最后到底会怎样,未来是否会像《终结者》或《黑客帝国》所描述的那样,成为人类时代的黄昏绝响,但也许在我们面前还存在着另外一条光明的道路。本文部分摘自电子发烧友网!“AlphaGo”会成为人类的“终结者”么?
在网络围棋平台上完成60连胜的辉煌战绩后,神秘账号“Master”自曝真身,持续了近一周的棋坛“Master风暴”终于尘埃落定。与多数人的猜测一致,打得众多棋坛名将怀疑人生的“Master”,正是“AlphaGo”的升级版。&
与人工智能概念相近,“师出同门”的智能机器人产业,如今也迎来了新一轮的热潮。在新年伊始的CES2017上,LG、三星等电子制造厂商纷纷推出了智能机器人新产品,国内百度、ROOBO等公司也分别携带“百度小鱼”、“达萌”等自主创新机器人亮相展会。
智能机器人,这种在二十年前可能还仅仅存在于科幻小说里的角色,随着制造业和人工智能的迅猛发展,也已经悄然出现在我们身边,关于“机器人取代人类”的哲学讨论也越来越有现实意味。
关于机器人自主智能化题材的科幻电影数量繁多,比较知名的如《终结者》系列、《黑客帝国》系列、《我,机器人》等,在这些电影里,智能机器人产生了自主智慧,并支配和奴役了人类。在现实生活中,“机器人取代人类”也有成为现实的趋势,富士康公司的自动化机器人制造、一些大型酒店的机器人服务员已经取代了部分人的工作,使得我们对于机器人自主智能化的未来不由得产生担心。
实际上,机器人智能无论怎样发展,都是人类的工具和产品,从市场经济的角度进行考虑,机器人的生产进度也必然根据人类的需要来进行,因此,人类并不需要担心这个问题。就目前来说,智能机器人将人类从简单、重复性或危险性的“体力活”中解脱出来,这是一件好事情。
在谈论“AlphaGo”大战围棋名将的时候,除了感慨人工智能飞速发展外,国人心中可能更多的是一种酸酸的味道。智能机器人60年的发展史里,中国似乎一直给人一种“缺席”的感觉。
而近年来,中国在智能机器人领域的探索中也走得很快。“BAT”、联想、科大讯飞等国内互联网公司,都有自己的智能机器人研发项目。地平线、图灵OS、ROOBO等智能机器人领域创业公司也在国内资本中广受追捧,顺利的完成了各自的融资计划,并分别推出了工业机器人、商用服务机器人、宠物玩具机器人等一系列新品。
日,工信部办公厅、发改委办公厅、国家认监委办公室发布《关于促进机器人产业健康发展的通知》,帮助引导机器人产业协调健康发展。
2016年8月,IC PARK曾举办“实力芯动
智汇领航”科技创新交流会,邀请中科院自动化所研究员、智能服务机器人实验室主任李成荣及北京中科锐思科技有限公司董事长刘金亮、法国Nao机器人北京总负责人王立朝共同探讨中国智能机器人发展和国产机器人研究重点等问题。
与PC、手机等其他高科技产品一样,智能机器人的核心技术也是芯片。智能机器人是一项涉及到集成电路芯片设计、应用系统平台与网络数据共享等学科的复杂工程,其中在机器学习、计算机视觉、自然语言处理、手势控制、情感感知计算、视频内容识别等关键技术上,中国与世界先进水平还存在着现实差距。
(IC PARK 园区效果图)
发展智能机器人,首先就需要解决集成电路产业的缺“芯”状况。除了国家发布的各项支持政策及大额资金的投入外,IC
PARK等集成电路产业园区建设,也使得芯片产业自主化进程得以提速。作为北京市落实国家集成电路产业发展战略的重点项目,IC
PARK在支持国产芯片发展上也是不遗余力的。园区构建4大生态圈,9大产业服务平台,面向集成电路设计企业,提供全生命周期产业服务支持,帮助企业高速成长,激发企业科研创新能力,推动集成电路设计与物联网、软件应用、智能硬件等关联产业融合。
随着“中国芯”的核心竞争力逐渐增强,中国智能机器人的自主化程度和产品技术水平也将越来越高。人工智能技术日新月异,智能机器人产品层出不穷。在无数产业人的努力之下,相信未来中国自主研发的智能机器人一定会在国际市场中大放异彩。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。围棋界对AlphaGo心服 最后一招:结天罡北斗阵?_网易体育
围棋界对AlphaGo心服 最后一招:结天罡北斗阵?
用微信扫码二维码
分享至好友和朋友圈
(原标题:围棋界对AlphaGo心服 最后一招:结天罡北斗阵?)
昨天的比赛推翻了人们最后一个疑问——阿尔法狗是不是不会打劫?
其实纵观本次“人机大战”我们会发现,从最初的5:0碾压到现在还能不能赢一盘,阿尔法狗代表的人工智能只用了3盘棋就颠覆了以往我们对人工智能在围棋领域的印象,这场“人机大战”与其说是人工智能征服了人类最顶级的棋手,不如说是人工智能在人类世界最好的营销宣传片。
这不,从开始有点蔑视的“阿尔法狗”,到现在有点亲切的“狗哥”,就是一个很好的证明。
不打劫阴谋论破产 阿尔法刀枪不入
“人机大战”第二局结束后,双方在比赛中有意避开劫争一度引发了公众的讨论。不少职业棋手认为,在一整场棋局中,喜欢战斗而且善于战斗的李世石,居然没有制造和利用打劫的手段。特别是第二盘比赛中,阿尔法狗在本可行使黑棋权利时一直没有提劫,李世石也一再避开了打劫的变化,让很多人怀疑双方有不准打劫的协议。
阿尔法狗是不是一遇到对方提劫就懵掉了?
这个疑问在昨天比赛之前一直是大家想知道的。不过,昨天比赛最后阶段李世石侵入白下方大空抛出胜负手,双方在这里经历了一番“劫争”,但李世石没有成功逆转,在白176手后推枰认输。这个比赛过程告诉我们,所谓的“劫争协议”是个天大的误会,我们对于人工智能在围棋领域的表现似乎再也没有了借口。
曾经以为个人能横扫 现在组团心里也没谱
阿尔法狗到底有多强大?
3盘棋下完,人类世界最顶尖的棋手没有一个人敢说心里有谱。“我本应该有良好的表现,但实际不是这样。回头看,从第一局开始就很难赢,因为我错误地估计了‘阿尔法围棋’的实力。真正的胜负在第二局就确定了。在那局开始时,局势是在按我的意识进行,机会比较多,但我都没抓到。”
作为当局者,李世石的感受是最直接的,但事实上是3盘棋中,他也不清楚他到底有没有机会赢。虽然他说“它肯定有弱点,可惜我还没找到。这次比赛是我输的,不是人类输的。”但即便现在世界公认实力最强的中国天才少年柯洁,最初说“就算阿法狗战胜了李世石,但它赢不了我”,到“有六成的胜算”,再到有点自嘲自己的“5%胜算”,都只能说明一个问题——人类棋手现在根本不知道阿尔法狗真正实力极限在哪里。昨天古力甚至出招,五个超一流九段联手,也许可以与阿尔法狗决一死战,这让人想起《射雕英雄传》里,全真教对付黑风双煞的救命绝招——天罡北斗阵。
本文来源:中国新闻网
责任编辑:张增辉_NS1548
用微信扫码二维码
分享至好友和朋友圈
加载更多新闻
热门产品:   
:        
:         
热门影院:
阅读下一篇
用微信扫描二维码
分享至好友和朋友圈当前位置 & &
& 李世石输给谷歌AlphaGo:人类毕竟不是机器
李世石输给谷歌AlphaGo:人类毕竟不是机器
16:23:15&&作者:
编辑:冰冰 &&)
让小伙伴们也看看:
阅读更多:
好文共享:
文章观点支持
当前平均分:0(0 次打分)
[03-09][03-09][03-09][03-09][03-09][03-09][03-09][03-09][03-09][03-09]
登录驱动之家
没有帐号?
用合作网站帐户直接登录

我要回帖

更多关于 master 围棋 alphago 的文章

 

随机推荐