像围棋这样的尼姆游戏必胜策略有必胜的策略吗

围棋游戏(Go Free)是一款让你不再感觉到无聊的智力类手游,这款游戏可以让你随时进行,玩起来相当的不错,赶紧来下载玩玩吧!
这个围棋差不多是市场里收到最多好评的围棋游戏之一,而且比较适合新手,不过AlphaGo的话可以试试对战这个。
作为一款富于和简单规则的游戏,围棋被广泛认为是最佳的思考类游戏
围棋游戏特色
完整的9x9、13x13棋盘游戏
10个不同的难度等级
Aya Go引擎
2玩家轮流游戏模式
安卓版下载
苹果版下载
本站仅创建用户沟通交流的信息平台,所展示的游戏/软件内容来均来自于第三方用户上传分享,资源仅作为用户间分享讨论之用,除开发商授权外不以盈利为目的。如果侵犯了您的权益,请反馈,我们将第一时间处理。
1金庸群侠传X修改版v1.0角色扮演
2旋风少女v1.0.0角色扮演
3植物大战僵尸2天空之城破解版v1.6.0休闲游戏
4黑暗风暴破解版v1.0.7射击游戏
5馅饼大作战v1.3休闲游戏
6捕鱼达人3破解版v1.0休闲游戏
7亡灵杀手:夏侯惇破解版v3.0角色扮演
8球球大作战v7.1.0休闲游戏
9炫舞浪漫爱v1.11.0动作游戏
10三国群英乱舞破解版v1.1角色扮演林建超:围棋是战略游戏 决策思维智能化已成必然_棋牌_新浪竞技风暴_新浪网
林建超:围棋是战略游戏 决策思维智能化已成必然
林建超将军
  林建超将军报告的题目是“从AlphaGo围棋人机大战看决策思维智能化面临的挑战与决策”,认为本次研讨会研究AlphaGo围棋人机大战对人工智能发展的影响,是一次深度思考和对策研究的学术活动,不是一般的情况问答和满足一般好奇心的科普活动,因此具有重要意义。
  林建超将军的报告主要从决策思维,讨论了三个问题:1)对这次围棋人机大战特点性质的基本判断;2)这次人机大战对推进指挥决策智能化的启示;3)加快发展人工智能的决策和思考。
  林建超将军把这次围棋人机大战特点性质概括为四点:1)突然性,标志性,理论性,和非对称性。1)突然性。这次围棋人机大战之前,谷歌方面事先采取了严格的保密措施,比赛是在信息严重失衡的情况下发生的。2015年10月AlphaGo围棋已经战胜欧洲围棋冠军樊麾的事实直到日才得以披露。在2015年的11月北京举行的第一届世界计算机围棋大赛上谷歌没有参加,获得冠军的机器对弈中国职业七段棋手被让5子完败。这些事件造成了整个业界的误判,普遍认为还需要10—20年计算机围棋才能与职业棋手对垒。当时最乐观的估计是刘知青教授跟我说是5—10年。全世界对于谷歌的技术进步都没有思想准备。2)标志性。在计算机智力博弈发展的过程中,深蓝战胜国际象棋大使卡斯帕罗是一个标志性事件。国际象棋的变化量10的201次方,中国象棋的变化量10的200次方,围棋的变化量10的808次方,完全不在一个数量级上。所以这次AlphaGo围棋战胜李世石作为标志性的事件载入人工智能的发展史、也载入围棋发展史。3)理论性。这一次人机大战不仅是人工智能技术的展示,而且有支撑实战的理论突破。DeepMind公司开展了深入的理论研究,之前已经在《自然》杂志上发表了通用人工智能的论文,AlphaGo技术实际上是在这些理论基础上展开的,这次谷歌论文关于“深度学习神经网络树搜索”等理论是这次人机大战的核心看点。4)非对称性。这次人机大战不是严格意义内国际规则的比赛,而更是谷歌内部的测试。李世石所面对的机器本身就是分布式结构,不是单机版,它的智力支撑是巨大的。
  总体看,这次人机大战是一次宣誓性的商业运作行为,但是实现了人工智能的巨大突破,本质上是一次实验和测试性的科学实践。它的理论价值突出表现为两点:第一个,测试的人工智能基于海量数据的决策响应速度;第二个,检验了对抗条件下决策正确性的程度。它存在某些复杂特殊情况下的算法缺陷,没有具备真正意义上的思考能力,没有情感和个性,不能现场分析对手的心理状态,不具备这方面的交互认知能力等等。但是更值得关注和警觉的是,谷歌公司及AlphaGo围棋开发项目,与美国正在大力推进的从大数据到决策智能化发展的战略与背景有着密切的联系。就是我们对2014年谷歌收购DeepMind和Alpha团队本身所包含的这些意义,我们还应该从美国正在做的战略背景上去看,其中包括军事决策系统的智能化,以及如何从大数据和复杂图像中得出最佳决策等问题。2015年11月,美国国防部宣布成立了数字防御部门,设立了国防部创新顾问委员会,而该委员会的主席正是谷歌母公司阿尔法拜特的董事会主席。所以如果我们不了解这些战略背景,我们对很多问题就只能做技术解读。据此我们有理由判断,这次Alpha Go围棋亮相的人机大战,其目的并只在围棋,而是一个从大数据到决策,从人工交互中增长机器智能的可公开案例,是测试深度学习和决策响应效果的有计划、有组织的阶段性检验性测度,是一次典型的美国版的军民融合,其向通用性人工智能发展,包括运用指挥决策的可能性客观存在。所以我们看这件事情,不是只能有技术视角,更需要有战略视角。
  林建超将军认为这次人机大战对推进指挥决策智能化有重要启示。围棋是战略游戏,天然具有战略特质,围棋与军事有相同之处,也有不同之处,可以做一个比较。围棋的特点是,有限性棋盘、封闭式博弈、单一性目的、经验化定式、全透明对抗。军事的特点是开放性战场、多维化作战、非模式性行动、隐蔽性攻防、综合性或混合型目的。因此,计算机围棋的模式不能直接照搬到军事上,但是作为人工智能技术发展和实际运用的标志性事件,它的震撼辐射效应以及自身所揭示的科技原理和内涵,对我们清醒认识作为人类思维的组成部分,指挥决策思维面临的挑战和契机,应该有深刻的令人警醒的三个方面的启示:
  一,人工智能进入指挥决策领域已成必然。人机大战告诉我们,人工智能的迅速发展已经具有了这种进入的现实可能性。新一轮世界军事革命已经开始新的聚焦,由信息化、网络化革命上升为思维领域的革命这个趋势已经呈现。AlphaGo围棋的背后呈现出一个整体性的战略谋划,是美国实施“第三次抵消战略”的一个技术的结果,其本质是用中国所还没有掌握的高新技术来抵消中国的经济崛起。
  二,人工智能核心技术发展对指挥决策将带来革命性的冲击和变化。我们可以概括为五个可能会改变。1)人工智能不可能具备思维的观念可能会改变。虽然目前理论界尚未定论,但是人工智能趋向思维化已经可见端倪,从以上李徳毅院士和刘知青教授介绍的情况看,人工智能不可能具备思维这个观念,确实面临着挑战。2)人工智能只能起辅助决策的观念可能会改变。出现人工智能思维成为主角,或者机器与人并行成为主角的可能性也已经显现。3)人工智能不可能超过人类思维的观念可能会改变。人的优势固然存在,机器的优势也很明显。4)人工智能只能模仿人类,而人类不能向人工智能学习的观念可能会改变。人与机器共同学习提高成为发展趋势。5)人与智能化机器只能是主辅关系的观念可能会改变。科学界不少人预计,到2045年将是人工智能的思维能力达到或者某些方面超过人脑的一个标志性的时间点,据现在还约有20多年。可以肯定的判断,随着科技的迅猛发展,人工智能将进入战争设计、战略方针、战役方案、规划评估、作战指挥等关键领域,人机融合模式将成为未来决策指挥的基本形态。
  三,AlphaGo围棋的研制过程和方法对指挥决策领域人工智能开发具有示范性的意义。美国防部成立国防创新顾问委员会,谷歌赤巨字研发AlphaGo围棋,这都充分展示了他们对技术创新、技术引领的极端重视和敏锐,实际上也树立了一个标杆。他们重视理论创新和理论准备,有重要的启迪作用,特别是不拘一格网络人才的做法值得我们借鉴。
  林建超将军建议要加快发展人工智能的决策和思考。林建超将军把三个概念融为一体,一个是思维博弈,一个是智慧决策,一个是围棋,他们都可以用思维博弈人工智能的概念统一起来。习主席说要把科技创新摆在发展全局的核心位置,这个话说的是非常到位的。当前世界主要强国把人工智能技术作为21世纪三大尖端技术,我们可以回顾一下,进入新世纪的时候很多人做这种预言,基因工程、纳米科技、人工智能这将是21世纪的三大尖端技术,加紧在各个领域,包括指挥决策、思维博弈领域的应用研究,已经成为一个趋势。美国正在积极推行以创新技术为核心的“第三次抵消战略”,我们应该抓住这一次人工智能技术发展的契机,要主动作为超前研究、加快发展,坚决避免我与美等发达国家的装备代差、信息代差演变为思维代差的局面出现,更要坚决避免未来无人作战系统和智能战争形态高度发展的情况下,整体战争代差的出现。在人类的发展史上已经出现过三次战争代差:1)冷兵器和热兵器作战的战争代差,2)轻武器和机械化作战的战争作战,3)是机械化与信息化作战的战争代差。现在我们正面临着第四个战争代差的可能到来,那就是信息化与智能化的战争代差,这是我们要坚决避免的局面。
  因此,要将人工智能研究特别是思维博弈人工智能的研发作为我国人工智能发展的突破口,要纳入国家和国防科技发展的总体战略。当前,人工智能正处于高速发展之际,许多关键技术有待突破,我们在人工智能研究上与世界主要强国相比当然存在着比较大的差距,要赢得未来战略竞争的主动就必须立足科技自主创新这个战略基点,加强前瞻性、先导性、探索性的重大技术公馆和新概念的研究,特别是要加紧制定实施各种“人工脑”的计划。美国在2013年发布了“脑计划”,之后欧盟和日本也相继发表了类似的计划。可是目前,我国的脑科学研究仍然处在较低的水平,因此必须加快步伐迎头赶上。思维博弈智能系统,在人工智能大系统中应当居于核心和引领的地位,而人工智能围棋的发展应当走在前列,中国围棋界要与人工智能界联手打造世界一流的围棋脑,并在自主创新的基础走在学术和技术的前列。
  为此也要建立军民融合的人工智能模式,充分发挥民用人工智能的有适合成果。我国人工智能技术在民用领域的应用和发展势头很强劲,比如百度公司的百度大脑项目,腾讯公司得些稿机器人,阿里巴巴的推荐系统等等,属于这些成果,中科院软件研究所、清华大学计算机学院、北京邮电大学、北京航空航天大学以及国防科技大学等等单位,在这方面都具备了一定的技术储备,取得了很多的研究成果。我国人工智能围棋有一定的发展,特别是有一批像万同科技这样的精锐力量或者叫新锐力量在蓄势待发。因此,我们应当充分挖掘和利用人工智能民用领域的人才与技术优势,推动人工智能技术和成果向相关领域的转化,共同打造“实际需求牵引—技术研发推动—成熟技术转化—应用研发实验”的发展模式,促进人工智能在相关领域的快速发展。
  关于加快发展我国人工智能围棋的对策思考,林建超将军建议三个办法:1)要把发展人工智能围棋纳入我国人工智能发展的总体规划。中国作为围棋的起源国,在新的围棋新的竞技形态面前要有历史担当。2)人工智能围棋具有很强的示范性和关注度,应当成为我国人工智能发展的突破口和切入点。3)新一轮世界性围棋竞赛,特别是中日韩之间的人工智能围棋竞赛已经发动,中国决不能落后。现在,美国的、法国的、日本的、韩国的人工智能围棋都在开始上新的项目,有很多是在国家支持下发展,例如韩国。中国如果在这一轮的竞争中再一次落后,将会产生比较严重的社会问题,现在我们可能意识不到,由于围棋在中华民族,不光在我们中国,而且在全世界华人中以及深受中华民族影响的广大地区,围棋是一个传统的标志性的智慧成果。现在我国的科学技术发展、经济发展达到了这样一个高度,但是如果在人工智能围棋这个问题上不仅落后于美国的谷歌,又再次的落后于美国的脸书,日本、韩国和法国的研制项目将会引发严重的后果,这一点我们应当从政治的、社会的、科技的、军事的各个领域来分析。
  我们党的历代领导核心都高度的重视围棋,毛主席有两个爱好,一个是游泳,一个是下围棋,他在井冈山下围棋的棋桌,至今摆在八角楼里。他对围棋的巨大贡献,是在世界战略史和围棋史上,第一次把现实军事战略指导与围棋思维直接联系在一起,他就是在中国抗日战争战略问题中那段最著名的论述,他用敌我双方的进攻和防御行为、和围棋的吃子和做眼联合起来,并强调在做眼这个问题上显示了建立敌后抗日根据地战略作用之重大性。这段话讲的非常精辟,我们在研究围棋史上,都为毛主席这段论述感到非常吃惊,有如此深刻的见解。邓小平主席不仅关注围棋,中日围棋擂台赛期间每场比赛他都要亲自过问结果,获胜之后专门把中国棋手请到家里做客,还教他的孙子和孙女下围棋。江泽民主席倡导琴棋书画,是他组织领导中央国家机关各个有关部门制定了振兴琴棋书画的工作计划。胡锦涛主席喜欢下围棋,而且在奥巴马担任总统之后第一次到中国访问,向他赠送围棋的这件事在外交史上是写下了独特的一笔。习近平主席不仅喜欢下围棋,至今还挂着福建省围棋协会名誉主席的职务。他在宴请朴槿惠总统的时候,请我们今天的围棋世界冠军常昊出席,并且亲自把常昊介绍给朴槿惠总统。在他出访韩国的时候,又把韩国的棋手李昌镐请过来。现在我们的李克强总理喜爱、关心围棋,常昊也跟随他参加了中韩青年领袖论坛,还亲自把常昊和李昌镐叫到一起进行了友好的交谈。
  林建超将军认为,我们的领导人都这么喜爱、关心围棋,如果再发生中国的人工智能围棋不仅落后于谷歌,可能又落后于脸书,然后又落后于日本,而后又落后于韩国,一旦出现这样的局面将会出现什么后果,我认为有关部门是负不起这个责任的。所以我们说决不能落后,我用了一个的“决”字,说明没有后退的余地,没有回避的空间。在这里边关键是要改变这样几种心态,就是“别人已有,热点已过,精华已尽,市场已占”的被动心态,要以清醒的判断、深刻的思考、强烈的责任感,看待和推进人工智能围棋这项崭新的事业。
  林建超将军表示,要形成推进人工智能发展的四个层面社会合力:1)要引起决策层的关注。从局外观看转为入局担责,要看到它对于中华民族的责任,有很多东西如果一旦和中华民族优秀传统文化联系在一起,这个责任就非常重大。所以现在央视对于这个问题认识非常清楚,现在转播围棋很多。“谁是棋王民间争霸赛”,是第一次由中央电视台倡导、组织的全民性的围棋比赛。2)调整围棋界的思路,从跟风约战要转为勇对挑战。跟风约战大家是有热情,但是还要从根本态度上转变。3)点燃企业家的热情,从热心助赛转为远见助智。4)整合研发者的力量,从各自为战要转为集智攻关。本来我们的力量就不够强,再不强不行,因此也应该有我们的强势团队。
  林建超将军强调,要走出独立自主的人工智能围棋创新路线:1)要掌握先进的理论和技术,不要耻于学习,要承认落后。这一点上我们一定要有虚心学习的态度。2)要确定新的需求目标,我们的目标应当要高于谷歌。比如说刚才李德毅院士提出的,他们有围棋程序,我们可以发展围棋脑,他们有围棋脑,我们还可以综合人工智能的制度发展围棋机器人,让他们不仅有思考能力、计算能力,而且有感知,就是情感的感知能力、对手面向的观察能力,甚至还有自己伸手拿棋、放棋软硬手的能力等等,就是能够成为一个单机版的活脱脱的机器人,我们当然应当定这样的目标,我们的目标应当比谷歌远大。现在谷歌在发展围棋程序方面究竟还有多大的热情,我对此是打一个问号的,因为他们具有证明宣誓性的炒作动机,他们有他们阶段性的目标,和有整体性的部署。因此,突破围棋人工智能是他们的一个阶段性的选择,他们并不是因为热爱围棋才去做这件事,他们和我们的根本差别在于,我们是热爱围棋,热爱由中华民族发明创造的这个智慧的瑰宝,所以我们不光要热爱围棋、喜爱围棋,我们在人工智能上也要勇于挑战、勇于担当。所以我们要追求确立新的追求目标,要找到自己的创新点,我们的创新点在什么地方,最后形成有独特风格的理论和技术体系。这是一件非常困难的事情,但是我想现在应当做。
  最后,林建超将军概括了目前的工作任务:1)正确宣传。希望你们媒体积极正确地宣传,不要进行迎合低级趣味的炒作,而是把这件事正正当当、大大方方非常庄重的提出来,摆在社会和决策者的面前,要引发各方面的深刻思考,要对这件事情的推动提供正能量。2)形成方案。我们应当要拿出发展的方案,只有见解是不行的,要落实在方案规划上。3)进入决策。刚才李院士说到的决策上还有两派的争论,我认为应当让持反对意见的那些专家们要听一听这些呼声、听一听这些见解,让他们进行一些深层的思考,而不是某些主观的甚至是直观的感觉,因为他们可能多数人并不懂围棋,他们对围棋不像三千万围棋爱好者这样有深厚的感情。但是如果他们走出了正确的一步,他们将会在历史上留名,他们将会在为中华民族优秀文化的传承做出历史性的贡献,他们也会载入史册。4)实际推动。这件事情光说不行,现在韩国由朴槿惠总统出面,宣布了他们发展人工智能围棋的计划,由国家投资来进行这方面的项目的开发。日本已经发誓要打败AlphaGo,脸书也毫不谦让,他根本不服谷歌,也已经雄心勃勃的在提这个计划。现在形势逼人,我们必须做实事,要来推动这件事情的发展。
文章关键词:
收藏&&|&&&&|&&打印&&|&&关闭
您可通过新浪首页顶部 “我的收藏”, 查看所有收藏过的文章。
请用微博账号,推荐效果更好!QQ围棋对付无赖必胜法〈碧云轩—QQ游戏
QQ游戏经验心得:QQ围棋对付无赖必胜法
  从第一次进来QQ下棋到现在也有一段时日了,帐号有几个,都只有业余1段水平.无论我如何努力就是无法再越雷池一步,进入2段.心里实在难受也有些无奈!
  在这段时间了,棋艺不曾有所长进,就是遇到无赖太多,反而积累了一些对付无赖的招数,为了拯救仍在无赖的水深火热之中的QQ围棋爱好者早日脱离苦海,只好甘冒自大之嫌,在这里胡言一番,请各位棋友指正!
  首先下棋的时候,看看对方的逃跑率,逃跑率高的人大多是宁愿自己扣分,也不愿意对手拿分的仁兄.对于这种人,你一旦下棋,就要有个心理准备,要么就不下,要么就要中盘之前别领先太多,否则对方就要逃跑了,让你竹篮打水一场空.
  其次,为了避免对方利用点目耗时间,就不要同意点目!!!!晕,不点目怎么赢啊?我的意思是不要轻易同意点目,而是在正式点目之前先做好一些准备工作.
  工作如下:首先点一下"道具"旁边的"功能",进入"强制数子"(这个是QQ游戏留给大家唯一的救生圈),再然后把对方的死棋全部吃光提光,当然对方大多也会提光的(不提你的没所谓).这个时候,对方就主动跟你点目了,意图是开始使用无赖招数耗时间了.但是想不到的是,只要你一同意,系统马上就会自动判断胜负了.也就是说,对方无赖招数失败!本人曾接过不少于15次这招,对方全部失败!!!
  最好说说填空法无赖破解.对于有这类企图爱好的仁弟,我们只好对他象秋风扫落叶般的干掉!!!!
  工作如下:为了避免对方在终局阶段耍填空法,
  首先,我们如果要100%安全的话,就要启动"功能(强制数子)".
  其次不要轻易使用难得的5次PASS机会!!!(大家目数接近时,就这点就可以决定胜负,所以很重要!!)
  最后,看见对方忽然无故的在自己棋里造眼时(或送死往你空里扔棋,其实对方是在收缩你的眼位.),马上就要警觉了,你也要马上破眼(让对方收缩眼位),跟着就自己造眼.一旦这样,在最后阶段,当双方都把自己的填到不能再填的时候,就开始用PASS功能了.
  知道了吗?5次PASS功能一旦你早前用完了,也就是说你丧失了5手棋,看着对方PASS着在那里得意洋洋,而你只能看着时间过而无法PASS,(除非你自杀)那种心情可想而知有多悲痛!!
  当然你早前没使用PASS的话,那么难受的就是对方了,因为大家一齐开始PASS的时候,系统就会自动判定胜负!!!!(条件是吃光对方的子!)
  通过以上几点,基本上都可以避免对方耍赖得逞
建议您使用IE5.0以上版本的浏览器,800*600以上分辨率浏览本站
Copyright& qqjia, All Rights Reserved
版权所有:碧云轩-QQ(OICQ)家园 (AlphaGo 对围棋的理解比人类高一个境界,不禁为柯洁捏了把汗
AlphaGo「理解」围棋吗?
不会功夫的潘达,围棋文化
还是先上结论。我认为AlphaGo 理解围棋,而且 AlphaGo 比人类对围棋的理解高一个层次。
这个问题下面, @SIY.Z 的答案对我很有启发,推荐大家可以看看。
这位答主提到,
你或许还是不能接受 AlphaGo 这个样子,我想这是因为,人们下围棋,一定要先理解“围棋”什么东西,下面才可以操作。但是 AlphaGo 却是在不知道(或者没有被提供数据)“围棋是一种 2 个人的,而且两个人面对面做的,对抗的,零和的,棋盘 19*19 的,棋盘是方的,上面是打格子的,格子也是方的,有黑白两个子的,黑子先下的,两个轮流下的,要下在格点而不是格子中间的,有限时要求的,棋子数量足够的,一个棋子不会占超过一格的,棋子是圆的,两边凸起的,中国古代发明的,一种博弈游戏”中的任何一点的时候,可以战胜人类。
说得好。不过,AlphaGo 眼里其实是有“围棋”这个概念的。计算机围棋界有基于中国规则的 Tromp-Taylor 规则()。详细的条文就不在这里贴了,我简单转述一下。Tromp-Taylor 规则定义,围棋是一个在 19*19 格点上进行,两个玩家“小黑”、“小白”,轮流分别把棋盘上的某一个格点染成黑色或白色的游戏。再加上提子和禁循环的规则,以及终局判断,就是完整的 Tromp-Taylor 规则。请各位想一想,这样的围棋,和我们眼中的围棋,有什么本质区别吗?如果不考虑围棋文化,那么我可以肯定地说,没有区别。
既然对于 AlphaGo,“围棋”这个概念本身,和人类理解的“围棋”这个概念没有区别,那我们就先聊聊我们人类,特别是职业棋手,是怎么理解围棋的。
这里引用一段我去年写的文章。
围棋是世界上最复杂的游戏之一。所谓“一着不慎,满盘皆输”,每一步棋都可能左右全局的结果。一般来说,一手棋的决策分两步。第一步,“选点”:凭经验或感觉给出几个候选的点;第二步,“判断”:分别对这几个点做形式判断,并进行比较。这两步,说来容易,但要做到笑傲众生的水平,对于天赋和勤勉的要求,不亚于一个优秀数学家所需要的。
从初学者成长为大师,棋手需要先学会基本的布局理论、掌握基本的死活、对杀常识,然后熟记数百个定式及掌握其主要分支(飞刀)、练习数万死活题,同时在大量对局中磨练。有些外行据此认为,围棋只是复杂一点的“体力劳动”。对于这一观点,下图古力同学白 1 这一招抵得上千言万语。
图中右上的形状,在任何一本死活题的书中都不曾出现。实战白棋这一招的位置,也属于一般“选点”思路下的盲点。但小明同学在短时间内看到了这一招,一举扭转乾坤。
“体力劳动”让天赋平平者能够成为业余高手,但山巅最美的风景只属于天才。
我们再说“判断”。判断很难吗?在中国象棋或者国际象棋中,形势判断对于程序来说并非难事:只需观察双方子力的差距就可以大致判断出形式的好坏。当年战胜卡斯帕罗夫的“深蓝”,其形式判断算法大致就是如此,非常简洁。而围棋的形势判断是个真正的难题。围棋的胜负由终局时双方控制地盘的多寡决定。然而棋局进行到一半,双方的地盘都尚未封闭,怎么判断形势呢?
职业棋手采用的算法是估算双方的目数(地盘大小)差距。那如果地盘的边界没有完全确定怎么办呢?如果有先手官子就判给先手方,如果是双方后手官子就算一人一半。如果有一些模糊的地方,比如说一块厚势折算成几目呢?这时候就只能凭经验感觉了。职业棋手之间微妙的水平差异,很多时候也体现在模糊判断能力上。
对于如图所示的中盘阶段末期的局面,职业棋手一般能在一到两分钟内大致判断出双方地盘的差距,并据此决定接下来的策略是保守或是激进。这样的判断速度和准确度,和“搜索”能力的训练一样,背后也是数千盘对局积累下来的经验。
小结一下,对于高手来说,除了十几年日复一日训练的积累以外,灵感和天赋也是必不可少的。在复杂局面下,棋手的选点需要灵光一现,而模糊判断的准确性,离不开棋手的天赋。
这听上去有点像艺术创作。确实,围棋自古以来与琴、书、画并称君子四艺,现在我们仍然这么提。但是,围棋终究是一个游戏。如果你对博弈论有所涉猎,大概会知道,围棋是一种“完全信息”博弈。更懂行一点的读者知道,根据策梅洛定理,像围棋这样的二人、完全信息、无运气成分、有限回合、且不存在和棋的游戏,对局的其中一方是有必胜策略的。(这里有必要解释一下“有限回合”和“不存在和棋”。围棋的中国规则中,有“禁循环”一条,这就杜绝了棋局无限制进行下去的可能。另外,如果严格执行“禁循环”规则,三劫循环、长生等特殊棋型,相当于打一个普通的劫争,不必判和棋。现实中将三劫循环判和,只是一种权宜之计,相信未来可能会改变。)
那么,既然必胜策略一定存在,为什么围棋手不去研究必胜策略,搞什么选点、判断?为什么围棋手不能踏踏实实用逻辑推理解决战斗,是不是他们在故弄玄虚,或者说装逼?
当然不是。
因为围棋太难了。
1950 年,“信息论之父”克劳德·香农在论文“Programming a Computer for Playing Chess” 中给出了国际象棋复杂度的一个下限。香农写道,一盘象棋一般有 40 个回合,平均每回合的变化总量大约在 10^3 这个数量级,那么国际象棋的变化总数至少是 10^120 这个数量级。后人把 10^120 这个数称作“香农数(Shannon Number)”。香农用此计算说明,利用纯暴力搜索破解国际象棋是不现实的。
如果我们估计一下围棋的香农数呢?19 路围棋盘上,一盘棋大约是 120 个回合(240 手),平均每回合的变化数总量在 10^5 以上,这样算下来,围棋的变化总数不少于 10^600。可观测宇宙的原子总量 10^80,相形之下,真是小巫见大巫。刘慈欣的小说《诗云》中写道,就算把宇宙中的每一个原子都做成储存器,而且技术先进到一个原子能储存一比特信息,也只能存下很小一部分的棋局。
诚然,计算,或者说单纯的逻辑推理,是围棋技艺的基础。不过,当计算量远远超出人脑的能力之时,减少计算量的技巧,选点、判断,就必须出场了。经验性的选点,让棋手快速将有限的计算力集中到几个重要分支上;而准确的判断,能够让棋手在优势局面下鸣金收兵,避免复杂计算,减小风险;或者在劣势局面下放弃幻想,奋力一搏。当然,选点、判断时的模糊性,在逻辑上难免不严谨,有一定风险,这就要求棋手权衡利弊,合理分配时间。
讲了很多人类棋手的事,是时候让 AlphaGo 出场了。事实上,摆在 AlphaGo 面前的最大问题,和人类棋手是一样的:围棋太难了,计算力不够。“深蓝”战胜卡斯帕罗夫那一套,对国际象棋还行,套用到围棋上根本不可能,毕竟围棋的复杂度远超国际象棋。想要战胜人类,只能把有限的计算力用在刀刃上。怎么办?AlphaGo 团队的做法是,像人类棋手一样,去选点和判断。
深度卷积神经网络,是 AlphaGo 采用的一项先进技术。我们可以把神经网络看成一个黑箱。
如上图。给定一个输入,神经网络经过一系列处理后输出结果。具体到 AlphaGo 的架构,可以用下图粗略地解释。
请看上图。人类棋手的思维方式,是根据输入的局面,输出候选招法和形势判断,综合以后给出最终输出。AlphaGo 的大框架与此非常相似。AlphaGo 的策略网络,大致对应人类“选点”的决策;AlphaGo 的价值网络,大致对应人类“判断”的决策。
在此基础上,蒙特卡洛搜索树算法将策略网络和价值网络串联起来,形成完整的决策系统。
AlphaGo 基于蒙特卡洛搜索树的单次决策过程,附有我的诠释。进行此循环多次以后,AlphaGo 选择在过程中重复次数最多的分支为最终落子点。
以上我对 AlphaGo 的解读为了方便大家理解,有不严谨之处。关于 AlphaGo 原理的深度解读,推荐 @袁行远 的答案。轻松一点的解读,也可以看,我和 @Haochen Liu 以及 @云天外 一起做的 Live 的逐字稿。
前面的内容讲到,AlphaGo 下棋时决策的方式和人类相似,因此可以说 AlphaGo“理解”围棋。接下来进入我要论证的主题,AlphaGo 比人类更懂围棋。
AlphaGo 以 4:1 战胜李世乭,又化名 Master 在快棋中横扫职业棋手,实力无疑超过所有人类棋手。然而,还有更恐怖的事情。棋手们在这一年多以来,一直在向 AlphaGo 学习。在具体招法上,也有了不少心得。但是,AlphaGo 的判断力是人类永远没法学习或者模仿的。下面这一段,我将人类与 AlphaGo 的判断能力做个简单比较。
人类“数地盘”式的判断常有失灵之时。除了模糊判断可能带来的误差以外,对于某一块地盘归属的错判也是经常发生的。李世乭 -AlphaGo 五番棋第一局中,职业棋手们就在局中集体给我们演示了一次这样的错判。
这是棋局进行到第 101 手时的局面。李世乭在棋盘上落下的这一手确保了右上黑棋的安全。由于 AlphaGo 在左下步伐紊乱,黑棋收获颇丰。沉浸在乐观情绪中的职业棋手们一致判断黑棋明显优势。直观来看,此局面的判断并不复杂:黑方下边一块确定的目数,基本可以和白方全局确定的目数 + 厚味抗衡;黑方额外多出右边红框里的地盘,意味着黑棋盘面(即不计贴目)领先 15 目左右。然而,当时没有人想到,右边红框范围内看上去已经万无一失属于黑棋的地盘,即将被 AlphaGo 掏空。
敏锐如柯洁者,第一时间看到了白棋在 R10(图中绿圈)打入的手段。不过,柯洁当时的说法是,这是落后一方孤注一掷的手法。局后回顾,才发现此处黑棋已无法全身而退,而 AlphaGo 对此早已成竹在胸。从 DeepMind 公布的数据来看,AlphaGo 认为此局面下白方的胜率超过 75%,这意味着 AlphaGo 对 R10 打入之后的变化充满信心。棋局的走向证明了 AlphaGo 判断的正确,而职业棋手的直觉在此处集体失灵。
AlphaGo 在复杂局面下的形势判断,比职业棋手的判断更精准。
更重要的是,AlphaGo 基于概率的形势判断,比人类棋手比较地盘多寡的判断,更接近围棋的本质。学棋的时候,老师常说,赢半目和赢一百目没有区别。围棋十诀第一条就是“不得贪胜”。说明人类棋手都认同,保住胜利果实,比拿到更多地盘更重要(也许藤泽秀行棋圣是个例外)。然而,具体操作中,人类的形势判断算法并不能实现这一目标。
为了帮助理解,我举个例子。
在某一盘棋的后半盘,黑方确定目数 70 目,没有潜力。白方确定目数 40 目,有一块 40 目潜力的大空。如果黑方立即打入(选项 A)并活出(结局 A1),则 40 目的潜力只能转化成 10 目的实地,黑方获胜。如果黑方打入失败(结局 A2),则白棋 40 目大空围成,白方获胜。黑棋也可以选择保守的浅消(选项 B),则白方的 40 目潜力大约能转换为 25 目实地。
这个局面下,如果选择浅消(选项 B),虽然最后差距会缩小,然而其实胜机也很少。很遗憾,这种局面下,职业棋手很难准确估算打入成活的概率,然而 AlphaGo 可以。于是心存幻想的人类棋手觉得落后不多,而打入无成算,选择浅消白棋大空,结果白方 40 目的潜力转化成 25 目实地,黑棋盘面仅多 5 目,从而落败。阿尔法狗估算出选择打入(选项 A)的胜率是 40%,而选择浅消胜率仅为 25%,于是毅然选择打入。不论最后胜负如何,选择打入显然是更好的策略。
换句话说,只“领先两目”而胜率 80%,和“领先五目”而胜率 70%,其实是前者优势更大,然而人类会认为后者优势更大。
AlphaGo 有能力精确地估算胜率,人类棋手不能。因此我说,AlphaGo 对围棋的理解,比人类高一个境界。
我们可以进一步想象,假如有一天,人类造出了一台能够做无限快计算,且储存能力无限大的机器。那么这台机器判断一个围棋局面,不会输出胜率,而是会输出“此局面黑棋(白棋)必胜”。这就又比 AlphaGo 对围棋的理解高一个境界,是真正破解了围棋。
不过,由于围棋的复杂度,我不认为这样的机器能够在一千年以内被发明出来。换句话说,AlphaGo 的算法,是目前我们能做到的对围棋问题的最好解决方案。此后的围棋 AI,大概只需要在这个框架的基础上修修补补了吧。
而人类也没必要为此感到悲哀。AlphaGo 是个好老师。虽然学不了她的判断方法,但是具体招法可以借鉴。将来 AlphaGo 或者其他 AI 的形势判断,也可供参考。将来十年,围棋技术一定会快速发展变化,我等棋迷有好戏可以看了。
相关文章:
更多讨论,查看 ·
客官,这篇文章有意思吗?

我要回帖

更多关于 尼姆游戏必胜策略 的文章

 

随机推荐