弈学园99围棋网上下棋提高效率高是多下棋还是多做死活

豆丁微信公众号
君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
成人学围棋
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口围棋与人工智能_新浪网
北京时间10月19日凌晨,DeepMind 如约公布了他们最新版AlphaGo论文,文中透露最新版本的AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个神经网络,3天训练后就以100比0击败了上一版本的AlphaGo,也就是那个4-1战胜李世石的版本。
分享专题至:
【AIWORLD2017世界人工智能大会倒计时20天】“AI达摩”齐聚世界人工智能大会,AIWORLD2017议程嘉宾重磅发布大会早鸟票已经售罄,现正式进入全额
中国古人下棋,无论输多赢少,都是要走到最后数下子的。在自身棋力的基础上,追求最好的结果,这是锤炼智慧和磨砺心性的一种方式。正因如此,围棋才被归到琴棋书画“四艺”之中,成为修身养性的道。然而近代围棋受日本和韩国的影响,围棋在竞技的道路上走得太远,胜负被看得太重了,直到人工智能的横空出世,才敲醒了正在“装睡”的围棋界。
为了竞技,围棋比赛的时间越来越短,惊心动魄的逆转虽然多了,却少了那种轰然天成的美感;关于贴目的分歧导致世界上到现在都没有一套统一的围棋比赛规则; 职业棋手们的棋力越高,却越离社会越来越远……
不久前柯洁说 能够遇到AlphaGo是棋手们的幸运
未来若干年后,站在一个历史的高度,看我们这段时间的围棋发展的话,恐怕会是条曲曲折折的路线。好在AlphaGo出现了,它不仅带来了围棋技术上的革新,更给整个围棋行业的发展前路扫清了雾霾。
在新的时代,围棋赛制要怎么改变,围棋明星要如何定位,围棋与文化要怎样融合,在大时代变迁的关头围棋行业究竟面临着什么,这些都值得仔细思考。有幸的是,参加第二届商界棋王赛的八位棋王,从围棋爱好者和商界精英双重视角给了我们很有价值的分享。
围棋赛制新论
关于贴目贴多少的争论,围棋界就一直没停过。其实沿用中国古人的做法,可以有一种非常公平的比赛方式,那就是两人对阵,黑白各下一局,两局比总子数。这种比赛方式是乐工场董事长杨乐涛提出来的。这种算子的比赛模式在高尔夫围棋比赛中也得到了测试,很有合理性。
这样的比赛会出现势均力敌的和棋,但概率依旧非常低;铤而走险的不合理下法也要考虑承担更差的后果;两盘棋子数一起计算,胜负的博弈变得更加微妙;最关键的是公平。
乐工场董事长 杨乐涛
在发起人聂卫平的建议下,本届商界棋王赛采用了人机结合的赛制。棋手在比赛中有两次向人工智能求助的机会,由人工智能提供下法,辅助人类来做决策。金立集团董事长刘立荣认为这项赛制是个创举,而且非常有趣,令比赛增加了更多的变数。比赛的过程中也印证了这一点,刘立荣有着业余6段左右的实力,但在人工智能的参谋下,虽然次数有限,但发挥出接近职业水准的实力。
金立集团董事长刘立荣
不久前在东盟国际围棋邀请赛的论坛上,林建超将军说:“无论人工智能的围棋水平变得多强,也改变不了人类才是围棋活动主体的事实。改变规则是我们最大的武器。”未来的围棋比赛方式会变得多种多样,人们在其中体会到快乐才是最关键的因素。
围棋需要明星
“如果有再来一次的机会的话,我们可能不会让柯洁学围棋,就让他练他喜欢的舞蹈,正常的读书上学,慢慢成长,过普通的人生。”柯国凡说。胜负的世界已经如此残酷,柯洁还要肩负着整个围棋的推广,对这样一个20岁的少年来说,胜利和光鲜背后的付出,只有身边的人才知道。
特邀参赛嘉宾 柯国凡
从另外一种意义上讲,柯洁似乎又是为了这个时代而生的。柯洁从围甲连胜开始暂露头角,到雄踞世界第一的位置,再到人机大战的豪情,也才不过三年而已。而发生在柯洁身上的事情,已经可以拍好几部电影了。柯洁也以惊人的速度成长着,不仅是棋艺,更多的是为人处世的练达。
济南明仁置业董事长 周天乐
30年前,很多人因为聂卫平在擂台赛上神勇而接触围棋,成为棋迷;30年后,因为柯洁和AlphaGo他们又重新回到棋盘前,找到了当年的热情。济南明仁置业董事长周天乐就是这样。“柯洁其实已经成为一个品牌了,不仅限于围棋界,在全社会范围内都已经得到了认可。”周天乐与柯国凡是好朋友,经常会为柯洁提一些建议:“这些年柯洁最重要的事情当然是比赛下棋,但也应该有个长远的发展规划,甚至对接一些真正专业的经济团队。”
其实,需要包装和规划的又何止柯洁一个棋手,整个围棋行业都需要全方位的提升内涵和形象设计。
围棋与文化的融合
女子围甲联赛是中国棋界一项非常独特的风景线,虽然女子围棋的竞技水平还远不如男子,但这项比赛所引发的关注尤其是在围棋圈外的影响力非常惊人,各地分站赛主办的规格都非常之高。公益围棋教室捐赠、棋迷多面打指导棋更是让高高在上的职业比赛,有个更多贴近普通人的机会。
中信置业董事长 胡东海
中信置业从女子围甲联赛之初就一直鼎力支持,董事长胡东海只要时间允许,女子围甲的活动都会义不容辞的出场站台。明年女子围甲联赛的主题是 “扶贫”,到偏远不发达地区,帮助人们“启智”,胡东海表示要加大投入:“这是我们中信集团的社会责任。”
中信置业河南总经理 章广跃
同样与女子围甲有着千丝万缕联系的是中信置业河南总经理章广跃,女子围甲河南队一直是他在背后支撑,洛阳的很多围棋活动也有着他的支持。章广跃对围棋文化情有独钟,在他的全力以赴和中信集团的坚强后盾下,中国第一个围棋小镇将在洛阳正式启动了。这可能将是中国围棋行业发展历史上,堪比首个世界大赛创立的壮举。
整个时代面临的变革
华奥星空董事长 王平
王平作为华奥星空的董事长,看到的不局限于围棋,整个体育行业都面临着大时代的变革。一方面是中国正处在高速发展的阶段,体育产业正面临着与全社会接轨的关键时期,是提升人们幸福指数的关键一环,围棋也有着属于自己的机会。另一方面,人工智能的出现让体育行业以前很多不敢想象的设想和服务都成为了可能,还是以围棋为例,人工智能辅助工具就能大大缓解现有的围棋培训行业师资短缺的瓶颈。
信柏科技创始人 柏林森
柏林森创立的信柏科技最开始做的就是大数据领域的应用,随着人工智能技术的成熟,他的团队已经开始在金融和医疗领域拓展实际应用的场景。柏林森最大的爱好是看DeepMind的各种论文,他说人工智能代表着这个时代的先进生产力,我们要想办法离它近一点,在大变革到来的时候才能不被淘汰。
  来源:围棋编辑部博客
原址:https://book.mynavi.jp/igo/blog/detail/id=87113
大家好。我是编辑部的山本,现在很希望家里能有个被炉。
今天来介绍一款软件。锵锵!
天顶围棋7 ZEN
这一版本的ZEN最高棋力达到了职业九段!
发售前我们请了职业棋手与其以分先进行对局,据说ZEN能与职业棋手势均力敌,还赢了几盘。
当然,对局时的性能也很重要,但最能帮助使用者增长棋力的还要数研讨功能了。
棋手中首屈一指的围棋AI研究家大桥拓文老师对ZEN做了以下评论:
让大家翘首以盼的天顶围棋7终于发售了。
无愧于此前流传的高评价,天顶围棋7的确是有职业水平,有时会下出连我都觉得伤脑筋的严厉招法。
我在和它玩时也发现了许多有意思的使用方法。
我想大家肯定都各自有拿手的作战策略、喜欢的布局。如果你想进一步完善自己的策略、布局的话,这时就该轮到天顶围棋7华丽登场了。摆出自己拿手的布局,点一下右上的研讨按钮试试吧。它会为你提供若干十分有力的下一步的候选,还会显示这些候选点的评估值(即胜率)与搜索次数。虽然大家一般都会比较在意评估值,但模拟次数也十分重要。搜索次数越多,评估值也就越准确。同时参照着这两项参数来思索、制定策略是件十分有意思的事。
评估值是以胜率来表示的,我想有人可能不太习惯,所以在此简单介绍一下(天顶围棋7所表示的)胜率的基准。
显示50的话也就是50%,自然就是双方不相上下的局面。60%是略好。70%是优势。80%的话可以说胜利就在眼前了。差不多就是这样。但要注意一点,即使只领先1目半左右,到终盘时也有可能会显示胜率为90%。90%给人感觉差距很大,但1目半对人类而言只是很小的差距。了解这一点,有助于更好地使用天顶围棋7的研讨功能。
至于序盘,评估值在40%~60%之间时可以理解为某一方只有极小的优势。而双方不相上下时胜率则会在45%~55%的范围之间波动。
为了研究序盘下法,我也开始使用天顶围棋7了。它给出了好多特别有意思的下法,我感觉我一时半会儿是放不下电脑了。
——大桥拓文。
研讨画面示意图如下:
ZEN7研讨画面
红框框起来的部分显示有“候选点”、“搜索次数”、“评估值”。
天顶围棋7显示的这些参数都非常准确,甚至连职业棋手都能从中学到很多。如果好好利用,想必棋力能够大幅提高吧。
购买地址:https://book.mynavi.jp/ec/products/detail/id=77803
英文版:https://book.mynavi.jp/ec/products/detail/id=79528
天顶围棋主题网站:https://book.mynavi.jp/tencho7/
今后还想写一些关于天顶围棋7的推荐使用方法一类的文章。
那么还请大家多多支持天顶围棋了!
天顶围棋作者加藤英树
(朱东冬)
  晚上好各位,11.15深圳大学围棋节拉开序幕,晚上有聂老和诸位名手的座谈会,吸引了诸多学子到场。封面为女子世界冠军徐莹老师隆重介绍聂老。
场面十分热烈
现场嘉宾包括世界冠军、聂老弟子常昊老师
深大学子世界冠军唐韦星
深大学子世界冠军周睿羊
擂台赛当然是聂老座谈会不能略过的话题,聂老:我赢了大竹英雄以后,邓小平亲自给我家里打了电话,但是那时候我还没回去呢。
聂老:我上场前坚信我能赢小林光一
徐莹老师:您为什么这么坚信啊
聂老:凭实力啊!
聂老:我赛前研究了很多小林光一的棋谱,发现他的对角胜率要比一边的低,所以我和他那盘选择了对角
聂老:听说当年财政部要降低围棋的伙食标准,我说这不行啊,就给总书记打了个电话,总书记说,谁敢降低你们的伙食?我说财政部,总书记说,谁敢降低你们的伙食,给我降低财政部的伙食。
随后聂老和学子们分享了对AI围棋的一些心得
聂老:李世石和AlphaGo第五盘,当时角上一个局部,大部分职业棋手都觉得李世石好,或者好不少,我当时觉得AlphaGo略好,后来看AlphaGo要好的多
  2016年的年初,柯洁和李世石完成了经典的五番棋对决。坐在棋盘一端的,是统治围棋世界过去十年的王者,另一端的,是如狂风呼啸,席卷棋坛的天才少年。这样的场景,曾经在十多年前发生过,那时候的李世石,还是有着青涩笑颜的,刚从飞禽岛走出的不败棋客,而当他带着一身少年意气,坐在了李昌镐的对面,我们都知道,围棋世界,将要翻开新的篇章。
少年子弟江湖老,旧日的少年成了今日的王者,而今日的王者也将面对新的少年。围棋世界的代际交替,像是春秋迭换里注定绽放的花朵与注定凋零的秋叶,是造物写就人力难敌的残忍与动人。决赛前,柯洁说,“李世石之前说他有五成希望取胜,我想如果一共是一百成的话,他有五成。另外我想说,传奇是时候落幕了”。围棋世界里,已经有多漫长的岁月,没有听到过这般裹挟着万千少年气天才气的话语了?
上一句,大概正是当年李世石对着李昌镐说出的,“在所有高手中,昌镐的力量应该是最差的”。十三年流光电逝,如果李世石想得起当年旧事,大概也会笑这岁月写就的剧本。更有趣的,是当年李昌镐和李世石,如今的李世石和柯洁,五番棋对决的结果,都是3:2。唯一的不同,只是这一次,更年轻的那个人赢了。
对于李世石而言,这是悬崖边上的战斗。他已经过了而立的年岁,在更新换代越来越快的围棋世界里,他只能一直赢下去,一旦他输掉,“李世石老了”的舆论,就会像潮水一样涌来,将他瘦削的身形淹没。此前,哪怕他立于围棋世界绝巅的时候,他也像是一只遗世独立睥睨天下的狼王,和他一生的好朋友好对手古力相比,他更敏感纤弱,却也更凌厉狂傲。他刚出道的时候,《围棋天地》做了一期专题,题目简简单单,“世石如豹”。十年匆匆,当我们在世界大赛里一次又一次的看见李世石的身影,当他做出的一件又一件事情惹得我们惊叹不已,我们或许才能真正看出他的真正样子—他从来,都是狼王。
而如今,这只站在围棋世界最高处的狼王,已经老了。可是,守在自己领地上的老狼王,大概,才是最让人恐惧的事物。
2015年全年执白不败的柯洁,在年末的五番棋第一局,终于破了不败金身。李世石厚重稳健的棋风收到了效果,在对手棋风的突然转变面前,柯洁仿佛并没有准备好,他对中后盘的判断始终太过于乐观,而当发觉不妙时,已经为时太晚。这是日,柯洁这一年的白棋战绩,也终究定格成了34胜1负,白壁微瑕,终有遗憾,却也是对于这位新科世界王者的提醒,因为不圆满,所以在新的年份里,才有更多的进步可能。
这是老狼王的回应,是面对侵入自己领地的年轻人,最直接最决绝的回答。想要王座,那就用撕咬,用战斗,用血和泪,亲手拿过去。
决赛第四局,柯洁不敌李世石
第二盘,开盘未久,柯洁便出现了误算,黑棋长考后下出101、103两手粘,被李世石脱先分断,将右侧黑棋直接歼灭,研究室里的聂卫平棋圣留下一句“败局已定”便离开研究室,对于所有人而言,仿佛0:2的结局已然注定,柯洁这一次向着王座的冲击,也终将蒙上一层太深重的阴影。所有人都这样想,除了正在下棋的柯洁自己。从网棋世界的摸爬滚打里,从围甲难求一胜的境遇里走出的“潜伏”大帝,从不会轻易将“失败”当成理所当然。而柯洁的坚持也终于等到了奇迹的诞生,进入读秒阶段之后,李世石连续出现失误,柯洁用屠龙的方式,完成了死里逃生的神奇逆转,也让胜利的天平,再度回到了双方均衡的位置上。
第三盘,李世石再度早早进入读秒,也再一次在读秒阶段输的溃不成军,然后,在李世石两盘误算之后,柯洁用第四盘149、153两手致命败着当做回应。这是战斗,是新老王者们为了权杖,也为了他们身后代表的国家棋运的殊死搏杀,“争棋无名局”,这样的对局,是拳拳到肉,是剑影漫天,我们看得到柯洁和李世石所有的情绪,那些欢喜与黯然,都在脸上写的明明白白。因为太重要,因为太渴盼,所以才会在这样的对阵里,留下不那么精彩的棋谱,毕竟,哪怕天才超卓如他们,也终究,是有血有肉有喜有泪的,活生生的人。
而围棋,也正是在这样的战斗里,才拥有了让我们心驰神迷的魅力。那些失误与突然死亡,那些奇迹与惊天逆转,那些执子的手与对视的眼眸,那些一直鲜活的可能性,他们留下棋谱,留下故事,让我们依旧此时此刻依旧感知得到他们当年的紧张与焦灼,身下万丈绝顶,身前璀璨群星。
柯洁夺得梦百合杯
柯洁夺得第二届梦百合杯冠军
2:2,决胜局,一战决胜败。没有比这更传奇的剧本,而这传奇的一战,也终于用传奇的方式告终。前半盘柯洁优势的情况下,却在一处打劫中不慎误算,揪着自己头发表情痛苦的柯洁,牵动了万千棋迷的内心。赛后,柯洁表示,自己一直点错目,以为自己输了,中间甚至一度要认输。还想过输了之后要“削发明志”。但看起来,围棋女神似乎比较喜欢柯洁的头型,并没有让他换造型的打算,直到最后一刻才被看清楚的胜负,以黑棋粘劫收后,半目胜利而告终。这是中国特有的规则,胜的惊险,胜的艰难,但归根结底,少年走出了那一步。他从前辈手里,接过围棋世界王者的权杖,一年三冠,海阔天空。
在那一刻,我们看着领奖台上意气风发的天才少年。那是中国围棋的荣耀,他已经成为了中国围棋漫长历史上,古力、常昊、孔杰后的第三位三冠王,他已经走在了李昌镐李世石曹薰铉们曾经走过的,独属于大棋士的传奇道路上。
如果,一切外力都未曾发生,此后的围棋世界,大概将会流淌的波澜不惊。像是曾经发生过的,新王者接过老王者的权杖,于是战国时代,终究又归成一人独尊,围棋世界,也依旧会按照自己的逻辑,安宁又缓慢的运行。但是,2016年3月,当在那个凛冽初春里,李世石和人工智能相遇的时候,我们早已预想的那个未来,却仿佛被蝴蝶扇了一下翅膀,从此,整个围棋世界,地覆天翻。
和李世石决战之前,AlphaGo最好的战绩,是击败了职业棋手,欧洲冠军樊麾。但是,欧洲冠军和世界冠军的差距,让所有职业棋手都依然相信李世石能够轻松获得胜利。在人们眼里,这项世界上最难的智力游戏,还远远没有到被人工智能轻易击败的时分。崔丙圭九段说,“计算机向人类顶尖棋手挑战,怎么说也得先摆上两三子吧?计算机程序战胜人类,时机还是尚早”,李世石自己也说,要争取“不让电脑赢到两盘”。
但是,当在首尔四季酒店沸沸扬扬的记者人群里,当在全世界的镁光灯下,我们看着棋局走向一个我们想不到的结尾,那是历史性的时刻,人类冠军终究在人工智能面前败下阵来,而且,一败就是三场。从遗憾到绝望,从震惊到麻木,我们仿佛已经在接受这样一个事实,人工智能已经确确实实的在围棋领域超过了人类高手,我们在曾经引以为傲的,不可能被电脑攻克的领域,溃不成军。
而也正因为如此,我们才如此珍视李世石在第四局中的这一胜,我们也都知道,在这一胜之后,下一场胜利,已经不知道会在何年何月,甚至,不知道它还会不会到来。78一手挖,这是如鬼似神般的一击,过去十年里人类棋坛无敌的王者,在最需要他站出来的当口,用他瘦削的身形,给围棋世界,也给所有关注着人机大战的人们留下一个永远闪耀着的背影。新浪从首尔发回的新闻,最后是沉甸甸的几个字,“李世石,谢谢你”。
人机大战第四局李世石改变历史的一胜
我们希望李世石失败了太久,而这一次,当我们终于希望他不要失败的时候,他没有让我们失望。
“三连败后终于一胜,此刻的喜悦真是难以形容,这一胜太有价值,我不会用任何东西来换”。颤抖的嗓音和如释重负的神情里,我们见到的,是我们从来没有认识过的那个李世石。有报道说,在连续输掉三局之后,李世石在路上只要见到围棋相关的人就会连续说“对不起”,李世石的夫人说,晚上偶尔睡醒,就能看到李世石在凉台上对着棋盘叹气。一生意气纵横,一生不弱于人,那一刻李世石的心绪,也许只有未来一年的柯洁能感同身受。我们都知道,这一次,李世石是真的发了狠,要把整个人类的胜负,扛在自己肩上。
神雕侠侣里,杨过问郭靖,“郭伯伯,你说襄阳守得住么”,郭靖沉吟良久,手指西方郁郁葱葱的丘陵树木,说道,“襄阳古往今来最了不起的人物,当然是诸葛亮。此去以西二十里的隆中,便是诸葛亮当年耕田隐居的地方。诸葛亮治国安民的才略,我们粗人也懂不了,他曾说只知道“鞠躬尽瘁,死而后已”,至于最后成功失败,他也看不透了”。我与你郭伯母谈论襄阳守得住守不住,到最后,也总只是“鞠躬尽瘁,死而后已”这八个字。
襄阳终究是守不住的。才气卓绝如李世石,当然也知道,他所坚守的阵地,总会被人工智能攻克。但他依然奋力搏杀到了最后,正是因为这一胜,我们才等来了第二年里,人工智能和人类王者的又一次交锋,我们才能在失败面前,依旧骄傲的讲出,我们要向人类“脱帽致敬”。
但是,这一切,却终究只是在命运写好的轨迹里,以个人的风华绝代,带来的那么一点微小的改变。1:4和0:5,太不一样,却同样是人类的败北,我们都已经明白,人工智能只会将人类越抛越远。2016年年末,当Master在野狐和奕城横扫人类高手完成六十连胜,当一位位人类棋手决绝的冲向人工智能,却收获一次又一次失败的棋局,一切的结果,其实早在柯洁和AlphaGo的江南决战之前,就已经板上钉钉。
围棋世界的浩荡长河,在命运的重重一击下,刹那间变了走向,翻卷着无数身处在这个变革时代的小小浪花,走向了茫然不可知的星辰大海。浪花们愿意按照原有的轨迹流淌,还是像如今这般,毅然决然的冲上礁石、冲向未知、冲向我们称之为“道”的渺远未来?个人的命运在宏大的时代叙事之前,显得微小又虚无。即便他们,是这项人类最难的智力游戏中最卓绝的天才,但终究,也只是这个伟大时代里,充盈着喜怒哀乐的,同样看不清自己前路走向的小小的“人”。
你看着他们,用坚忍不拔的勇气和永不放弃的决心,飞蛾扑火一样的,冲向注定将远远把他们抛在身后的人工智能,以对天拔剑的勇气,收获早已注定的败局,求仁得仁,求义得义,他们在变革的时代里用自己落下的每一颗棋子堂堂正正硬硬朗朗的写下“棋士”两个传承千年的名字,但是,一生争胜从不言败的他们,却终究因为失败,而被史笔记下,被更多的人记住。
多喜悦,多悲哀。
当然,这还不是最后的时刻,在来年的五月,在江南水乡青砖白瓦,人类新王和人工智能,还会完成让世人瞩目的番棋较量,但是,那,已经是这绵延了太久的,属于“人机大战”这个意蕴万千的名词的,一个意味深长的终结符。
在开年的时候,在柯洁和李世石对战的时候,我们不会想到这一切。我们依旧可以选择留在过去,但围棋不能,它在用比我们想象的快得多的速度前行,我们每个人都依旧微小,但这,确实已经是围棋的大时代了。
谨以此,献给刚刚过去的,变革的2016。
2016年中国围棋大事录:
2016年1月,柯洁击败李世石,获得梦百合杯冠军
2016年10月,唐韦星击败朴廷桓,获得应氏杯冠军
2016年11月,党毅飞、周睿羊会师LG杯决赛
2016年12月,陈耀烨击败柯洁,获得百灵杯冠军
2016年12月,柯洁击败柁嘉熹,获得三星杯冠军
2016年年末,范廷钰在应氏杯完成七连胜
(未完待续)
(谢天舒)
  来源:柳渝的博客& 作者:柳渝。
摘要:继AlphaGo完胜人类棋手后,AlphaGo Zero完胜AlphaGo Master,恰恰表明了作为人工智能的围棋机器的技术性本质。中国古围棋在日本的职业化也是围棋的技术化,这是今日围棋机器完胜人类的必然。中国围棋的文化本质蕴含于棋艺和棋道之中。围棋的棋理只有在科学与人文和中、西文化的交叉视域中才能得到真正的阐释。
一,AlphaGo Zero的“白板”学习与人工智能的“先天”性赋予
二,围棋盘棋上的棋理
三,围棋的职业化与技术化
四,围棋的棋艺与棋道
AlphaGo以学习人类经验棋谱而战胜了人类棋手,成为了人工智能的时代标志,而AlphaGoZero则以“白板”(tabular rasa)学习而再次成为头号新闻,英国经验主义哲学家洛克(John Locke,)著名的“白板”说(theory of tabula rasa)认为,人出生时心灵像白板一样空白,通过人的经验心灵中才有了观念和知识,洛克认为经验是观念、知识的惟一来源。AlphaGo Zero的“白板”是指与人类经验棋谱相对的空棋盘,即从0开始的“学习”,但洛克的心灵“白板”是人从现实经验中认知或学习,两者的区别就在于AlphaGo Zero不需要人类的棋谱经验而是自己与自己在棋盘上对战的“经验”,这个区别的微妙之处就在于人类的经验与机器的“经验”有何本质的不同,这与AlphaGo对人类的伦理挑战不同,AlphaGo Zero的“白板”是对人类哲学问题的一个挑战,这些问题都深刻地与我们对人工智能的本质的理解和定义有关,实际上已经成为了今天我们对人的智能的基本认知理论的更新,其意义远超过AlphaGo Zero的成功。
就AlphaGo Zero的具体情况来说,本文讨论1。AlphaGo Zero的“白板”与人类的心灵“白板”有何不同?2。AlphaGo Zero自我对弈的经验与人类的经验有何本质的不同?我们可以在智能哲学的论域中研究这些问题的深刻意义。
一、AlphaGo Zero的“白板”学习与人工智能的“先天”性赋予
DeepMind团队在“自然”杂志上发表的论文,推出了人工智能围棋程序的最新版本的更强大的“学习”能力,AlphaGo Zero:Mastering the game of Go without human knowledge (无需人类知识的围棋大师),据称,AlphaGo Zero以100 : 0的成绩击败李世乭版本的AlphaGo。(http://nature.com/articles/doi:10.1038/nature24270,中文介绍可见:http://mp.weixin.qq.com/s/68GTn-BaiRPmzi9F-0sCyw)最引人注意的地方是,“我们介绍一种单独基于强化学习方法的算法,无需人类数据、人类的指导,或超越围棋规则的领域知识。AlphaGo成为了它自己的老师,”(we introduce an algorithm based solelyon reinforcement learning, without human data, guidance, or domain knowledgebeyond game rules。 AlphaGo becomes its own teacher)。
这篇论文的第一作者、AlphaGo项目负责人DeepMind的David Silver在采访中这样解释说:
-AlphaGo Zero完全从“乱打”(随机)开始,不需要任何人类数据从最初原理开始而取得最高的综合棋艺水平。AlphaGo Zero最重要的理念就是它完全从无知状态开始学习,也就是从白板(tabular rasa)上开始,从自我对弈中领悟,不需要任何人类知识或人类数据,不需要任何人类经验、特征或人类的干预。它去发现如何从基本原理开始下围棋。因此白板学习对我们DeepMind的目标和雄心非常重要,因为如果你能得到白板学习,你就得到了一个代理,它可以从围棋移植到任何其它领域。你就从你所在的专业领域解放了出来,你得到了一个算法,它具有普遍性可以应用到任何地方。对于我们来说AlphaGo的意义不在于下棋战胜人类,而是去发现从事科学工作的意义,从程序的自我学习能力中了解知识是什么。我们开始发现,AlphaGo Zero不仅重新发现了人类下棋时的常用模式和开局,以及人类下在棋角上的定式,不仅是学习、发现这些而且最终放弃它们而采用自己的模式,其中有些甚至是人类不知道的或现在还没有用过的。因此我们可以说,事实上在短时间内AlphaGo Zero学到了人类上千年积累的围棋实战知识。AlphaGo Zero下棋中分析,靠自己发现更多的知识。有时候它的选择甚至超过这些,得到一些人类在这个时候尚未发现的东西,在不同的方式上发展出具有创意的新的知识点。
(AlphaGo Zero which haslearned completely from scratch, from first principles withoutusing any human data and has achieved the highest level of performance overall。 The most important idea in AlphaGo Zero isthat it learns completely tabular rasa。 That meansit starts completely from a blank slate and figuresout for itself only from self-play, without any human knowledge, without anyhuman date, without any human examples or features or intervention from humans.It discovers how to play the game of Go completely from fist principles。 Sotabular rasa learning is extremely important to our goals and ambitions at DeepMind。 And the reason is that if you can achieve tabularasa leaning, you really have an agent that can be transplanted from the gameof Go to any other domain。 You untie yourself from the specifics of the domainyou’re in and you come up with an algorithm which is so general that it can beapplied anywhere。 For us the idea of AlphaGo is not to go out and defeathumans, but actually to discover what it means to do science, and for a programto be able to lean for itself what knowledge is。 So, what we start to see wasthat AlphaGo Zero not only rediscovered the common patterns and openings thathuman tend to play, these joseki patterns that human play in the corners。 Italso leaned them, discovered them and ultimately discarded them in preferencefor its own variants which humans don’t even know about or play at the moment。 And so wecan say that really what’s happened is that in a short space of time, AlphaGo Zero has understood all of the Go knowledgethat has been accumulated by humans over thousands of years of playing。 And it’s analyzedit and started to look at it and discover much of this knowledge for itself.And sometimes it’s chosen to actually to beyond that and come up with something which thehuman hadn’t even discovered in this time period。 And developed new pieces ofknowledge which were creative and novel in many ways。 )
DeepMind强调AlphaGo Zero从白板上开始自我学习,这是指机器进入包括训练或实战状态时不从学习巨量的人类数据开始(People tend to assume that machine learning is allabout big data massive amounts of computation),但这时的AlphaGoZero本身并非白板(裸机),也并非只包含了“操作系统”的纯净机器,而是具有了强大的机器学习能力的机器,David Silver说 “但实际上我们从AlphaGo Zero中发现,算法比所谓计算或可用数据更重要,事实上我们在AlphaGo Zero上使用的计算(量)比过去在AlphaGo上要少一个数量级,这是因为我们使用了更多原则性算法。“(But actually what we saw in AlphaGoZero is that algorithms matter much more than either compute or dataavailability。 In fact in AlphaGo Zero, we use morethan an order of magnitudes less computation than we used in previous versionsof AlphaGo。 And yet it was able to perform much higher level due to using muchmore principled algorithms than we had before。)正是由于AlphaGo Zero具有这种“先天”的学习能力它才能一开始就可以自己学习自己。
DeepMind在AlphaGo Zero建造中使用了包括AlphaGo在内的很多精练的算法。因此实际情况是非常复杂的,AlphaGo Zero开始工作时并不是一台“裸机”,也不是只有操作系统的“纯净机”,而是一台“智能机”。这里不仅有传统图灵计算的算法,也有人工神经网络“代理”计算能力,即有机器本身的操作系统,也有功能计算能力和解决具体问题的功能算法或智能代理能力,这些高能力算法不是AlphaGo Zero自己学习得到的,而是人类赋予的“先天”性的人工智能,这也是AlphaGo Zero一开始就能向自己学习的原因。
二、围棋盘棋上的棋理
今年的法国科学节上,儒勒·凡尔纳公立综合大学(Université de PicardieJules Verne)第一次以科学介绍方式向公众展示中国围棋和包含其中的文化因素(亚眠“科学节”——围棋从中国到法国的旅行),在向完全不懂围棋为何物的观众简单地演示如何学下棋时,采用了两种现场教学方法。第一种是先介绍最基本的下棋规则,然后让学习者下子,这时参与者每下一子要费周折,第一粒棋子放在什么地方是很大的困惑;第二种方法是先让观众任意下子,然后在教学者的陪练中亦步亦趋地学习可行的落子方法。很明显,后者不但使事前完全不懂围棋的观众能够马上下棋,而基本上知道了什么是围棋,领会他任意落下的棋子都充满了奥秘,对围棋产生了兴趣。这个情况引发了我们进一步的思考,围棋的规则虽然简单,但与棋盘上的直接经验相比,对新手的认知、学习具有很大的区别。围棋的规则是围棋作为游戏的设计性思想的体现,而棋盘上的直接落子则是在现成的游戏世界中的经验行为,前者是人类知识的体现,而后者是作为游戏角色的经验,对于一个新手来说,后者是在棋盘上的经验中的学习。为此,我们研究作为围棋棋盘的特殊性。
围棋是在平面直交空间上的占领游戏,这对不懂围棋的人特别是西方人有一种困惑:是不是只要将棋盘上放满棋子了就可以决定胜负了?这样几乎等于没有规则,这也就没有游戏的意义了。与一般游戏规则不同,下围棋不仅是按游戏规则的“以棋行事”,而且是对弈过程中对棋盘与棋子所形成的“局面”不断地认知更新与决策,围棋的“局面”就建立在棋盘的平面直交网格的几何特殊性上。
围棋的棋盘是一种简单的平面直交网格,是平面几何空间上最基本的形式结构,围棋就是在这种最简单的直交网格上占领对弈。平面直交网格实际就是欧氏几何平面上的坐标系,在这种平面直交网格上的游戏的形成或设计实质就是对欧氏平面的基本性质甚至是潜在性质的利用和开发,中国围棋内涵的丰富性正是基于这种几何性质的深刻性。首先,在围棋中,棋盘上的直交网格的每一位置被赋予非几何的意义:空或占有、死或活、0或1,实现了几何性和数学性的人为超越结合,这是围棋棋理研究的理论基础。
以数学眼光对围棋进行过精深研究的英国数学家 John Horton Conway 发明的“生命游戏”(Game of Life)或称“元胞自动机”(Cellular Automaton)就是在直交网络上进行的一种位置格局迭代过程,每一格局的迭代由一个选定位置与其邻接位置的相互控制关系决定。这种迭代过程是算法能行的(可以程序化),但这种迭代产生的平面复杂格局可以表现为一种有规则的图形,这种事前无法预见的复杂现象就像生命现象的涌现和演化一样引人注意(注意这里有一种错觉,屏幕上生命游戏中的图案仍是由机器以算法形式产生的)。但由于平面上的位置组合是指数增长的,现有设计的可以实现的生命游戏的算法程序都无法穷尽,这种情况造成一种误解,只要有无限的空间和时间,生命游戏就可能演化出任意复杂事物,但实际上并没有进行这样的大规模研究的意义。生命游戏就是平面直交网格的几何性质表现为图案形式的算法的一个范例,但作为电子“游戏”,只能说是一种知识性的娱乐。
与“生命游戏”的图案迭代变化不同,围棋不是棋子与盘面之间的简单占领关系,围棋对网格位置的占有是对抗性的,即在直交网格上已经人为的赋予基本结构性意义的情况下,再以黑、白落子表示对抗性地占有,因此围棋的盘面是双方对抗性布子所形成的“局面”,就是说,围棋的“局面”形成既不是由程序(递归)决定的,没有如生命游戏事前的变量设定产生的算法制约性,而是不断的认知更新和决策的对抗游戏,任何“局面”不只是棋盘上的棋子与棋盘网格的占有关系,更是双方对潜在盘面的认知、信念和决策。因此弈棋不是上一局面的算法的连续迭代,而是双方棋手独自看局的直觉判断和策略的博弈,同一个盘面各人所看的局面并不相同,在双方的视野中可以有具有很不同的意义,因此围棋能体现个人的智力直觉,围棋规则简单但“易学难精”,就是对人的直觉的自然性与自觉性的超越要求。对同一个盘面双方对抗性地具有不同的理解和控制的智力竞技才是围棋表现为一种高级游戏的原因。相比于象棋等各自组织攻防战术的游戏,围棋具有更强的不完全格局和盘面全局性关系直觉与理解能力的要求。
人类围棋的高手是经历了自己的长期实战和对历史棋谱的无数揣摩而形成的,每一盘棋从落子“开局”起是在弈棋过程中个人与历史经验的综合后的再实践。而AlphaGo Zero之所以能够从白板开始(实质是“随机”开始,区别于“监督学习”喂入人类棋谱)学习,是因为它已经具有的人工赋予的人工智能的先天性。
AlphaGo Zero真正的区别性应在两方面考虑,1。区别于人,人类心灵的“白板”是指人类和知识来源于经验,人类棋手是有了围棋的规则和历史经验的知识,不同经验者之间的对抗性竞争。2。区别于AlphaGo的“监督学习”,AlphaGo Zero是在包括AlphaGo研究、设计、建造和实用所有经验基础上的围棋游戏的算法重建。
AlphaGo Zero的随机性“白板”开始实际是受其内置的人工性智能和盘面上直交网格的几何-数学性质两方面约束的。AlphaGo Zero本身就是“智能机”,能够在棋盘这种有限世界中重建一种机器对机器的对抗性。AlphaGo Zero真正的进步是作为人工智能的“机器学习”的“强化学习”(reinforcement learning)的一次成功实现。
我们可以看到,AlphaGo Zero并没有创造一种不同于现有围棋的新规则的围棋,只是在不断的自我对弈中重建了已有的围棋系统。AlphaGo Zero凭借并其巨大的机器时、空能力,以超过人的生物时空能力而取得对人的全胜,以对以往AlphaGo版本研究经验的综合和提高取得对以前的AlphaGo的全胜。
三、围棋的职业化与技术化
围棋在中国诞生,大约七世纪在日本流行,围棋的中国文化性与日本文化之间的混合具有很特殊的文化研究价值。
据有关记载,奈良时代(公元710—794)围棋开始在日本宫廷盛行,并有出入于宫中的职业棋师。镰仓时代(),围棋在习惯于战场生活的武士中传播开来,几大封建领主(大名)织田信长、丰臣秀吉、德川家康都具有相当的棋力,民间出现围棋大家,如先后侍奉于织田信长、丰臣秀吉和德川家康的僧人日海(),被誉为围棋“名人”、“棋所”,享有优厚俸禄,得到“官命”,并总理围棋事务,指导将军弈棋,垄断围棋等级证书的颁发等权力。1644年幕府建立了“御城棋”制度,参加“御城棋”被看作与武士们在将军面前比武同等高尚,这样,围棋对弈植入了武士道精神。日本武士道崇尚正直、信义、忠诚、礼节、廉耻、简朴、坚毅、胆识、诚实等种种美德,武士道精神以个人荣誉立命,一但丧失个人荣誉,武士不得不进行切腹自杀以保全最终武士荣誉。因此,职业化的围棋赛事程式、规则、棋手段位、个人棋风等等都与荣誉相关,正式赛事中战败者被迫降低交手棋分,这种在赛事中的降格被视为棋手的奇耻大辱,因此棋枰上的血腥之气迎面扑来,正式棋赛中的棋手几乎是押上自己一生名誉和身家性命作孤注一掷,甚有在对局中口吐鲜血或当场死亡的事例。
围棋的职业化使围棋成为一种正式的社会活动,吸引了广泛的社会参与。以当时的“棋所”四家(本因坊、安井家、井上家、林家)为核心,民间和名门望族的六段棋手均可参加棋赛,日本在职业化的道路上进一步成为日本社会生活的一部份,一直影响到以后围棋在日本社会生活中的地位。
进入现代以后的日本围棋文化受到商业和新闻业的强力支持,大体以棋院形式组织起了所有的围棋活动,围棋文化进一步普及化,全国和国际赛事成为了重要的社会性事件。围棋的职业化使棋赛的胜负之争成为主要目的,日本围棋的某些规则也与中国围棋不同,段位等级的激烈棋赛和社会强烈关注使围棋的职业化更加突出,也就使正式的围棋活动成为了竞争技术和职业化的高级技术训练。
围棋界的高手都不同程度地强调下棋的心态、境界,这主要是为了得到对棋盘局面的深度理解,由于围棋局面的形成是平面几何空间中的直交网格结构的深度重组,落子意味着对棋局发展趋势的决策,是历史经验与当前态势的偶合,因此棋手必须专心致志,使经验与个人气质结合而形成个人的棋风,棋赛中要排除一切杂念,凝集精力于直觉(棋感),使个人形成特殊的风格在当前不确定性的棋局上产生偶合,以期得到“妙手”、“鬼手”、“神之一手”,使一子之后产生一个全新的局面。所以这种基于战杀的心态培养和训练仍然是一种心理性的技术性的准备。
围棋的职业化使棋手把下棋作为社会生存的方式或手段,从而在本质上使围棋与个人的一般生活区分开来,成为某种个人的社会生存方式,同时,围棋职业化、专业化也就使职业化围棋必然走向技术化的道路。正是这种围棋的职业化和技术化使AlphaGo成为了今天人工智能研究项目中最大的成功,这也就是AlphaGo和AlphaGo Zero完胜人类的必然性前提。
四、围棋的棋艺与棋道
围棋在中国文化中大体是文人雅士的修性、娱情的文化活动,中国的古棋优雅、自由、超越,弈棋轻松、理性互动、无言而喻,故称“手谈”、“坐隐”。 “坐隐不知岩月乐,手谈胜与俗人言” (黄庭坚,弈棋二首呈任公渐),虽然偶尔以兵喻棋(“略技”),但非以棋为兵,更没有争命的意义,相反,常以棋局喻世态而求超然,与中国特色的神仙思想相呼应,人在棋局中,又在棋局外。“烂柯”这个故事的喻意就深得人心,南朝梁任坊的《述异记》和历代其他一些笔记中均有记述,其大意是,樵夫王质入山伐木,见两人在松下石台上对弈。王质观棋入迷,一人递了一枚枣子给王质,王质吃后不知肚饥,后来一人提醒王质:“你怎么还不回去?”王质回头看他的斧头,斧柄竟已烂掉,当他下山回家时,人间已逾百年。甚至宋徽宗赵括也说“忘忧清乐在棋枰”。
“礼、乐、射、御、书、数”是士人在受教育阶段接受的主要内容,“琴、棋、书、画、诗、酒、花、茶”是文人所谓八大雅事,围棋是所有这些项目中直觉理性最专门化的一种,专心也就是一种人性的基本修炼,围棋专注于理性的直觉,对于学子来说,“一心以为有鸿鹄将至”是入不了门的,但真正的修炼是对棋局的直觉理解,这是一种无言表达、基于文化的质朴理性。
相对而言,机器无所谓文化,所以也无所谓直觉。作为人工智能的智能代理(Agent)不同于算法的机器(图灵机)在于后者的输入是数值数字,而下围棋的机器如AlphaGo输入的是已经具有结构性的数据集(棋谱),即使是AlphaGo Zero也是研究人员赋予了算法的先天性,如果不学习人类的经验,研究人员不继承以前的成果是无法得到AlphaGo系列的成功的。
机器能够战胜人是围棋技术上的胜利,机器不会受到感情、情绪、现场气氛的影响,因此对于机器来说,谈不上“棋艺”。人的本质是文化的人,人能够艺术地使用技术,艺术家对人生和社会的态度、理解、和认识成为艺术品中的理性因素,虽称“艺术”并非匠艺的“技术”而是美和审美的艺术。艺术也是艺术家、批评家和观众之间的交流和相互理解,对于机器而言,只有棋盘和棋子之间的复杂关系,不会具有人性和文化的因素。机器在技术上胜过人并不奇怪,人使用工具就是因为工具是对人的技术能力的替代,对机器胜过人的担忧或恐惧并不来自机器与人在力量或思维这样的能力上强大于人,而在于迄今为止我们对于机器与人在本质上究竟有什么不同的认识和理解上并未形成共识。 “人只不过是大自然中最脆弱的芦苇,但他是会思想的芦苇”,帕斯卡尔的骄傲并未过时,机器没有人这种既是最脆弱的同时又是最强大的这个本质性。
“艺术”通常是指艺术形象的创造,但围棋的棋艺并不创造一种具象的形象,围棋的局面是一种简单形式中的抽象的形象,围棋是抽象的局面的创造,因此与直觉的审美和情感不同,棋艺要求基于几何性的一种直觉的超层次的理解和创造,这种创造性又是在双方对抗性的个性与共性中进行的,所以围棋对局不仅是技术的较量,更是从感受到对方的气质,性格,修养的内在性的无言沟通,所以围棋的棋艺是一种抽象形象的共同创造和互动中的内在交流。
日本的围棋文化重视棋艺中的礼仪(艺、品、理、规、礼),对棋具和相关的小道也非常用心,围棋与花道、茶道等一样,成为了一个非常精细的文化生活体系,体现了日本文化的特质。
围棋界普遍承认,围棋棋手的人品也就是人的棋品,这是指棋手的修养与棋术的关系,人们普遍地把棋赛的临场心态,对战略思想、战术机会的把握等作为高级棋术素质,都是以棋为人,称之为“棋道”,实际上,棋艺建立在人品之上,真正的棋道是人道,是中国文化和中国学术理性的一种无穷境界:“弈之为道,数叶天垣,理参河洛、阴阳之体用,奇正之经权,无不寓焉。是以变化无穷,古今各异,非心与天游、神与物会者,未易臻其至也。”(清,施定庵,弈理指归,序)
中国传统文化中文人的纯文化生活能够将世俗人生消融在理性的超越之中,琴棋书画、诗词歌赋创造的境界是实在世界的超越,这与中国围棋的直觉纯粹和超越性具有一种共同的理性美感,所以中国文人以诗言志的本能在以围棋为诗的表达中能得到一种越界的融和:
黄梅时节家家雨, 青草池塘处处蛙,有约不来过夜半, 闲敲棋子落灯花。(赵秀师,约客)——棋为人境,相约相忘。
山僧对棋坐,局上竹阴清,映竹无人见,时闻下子声。(白居易,池上二绝)——人在局中,又在局外。
玉子纹楸一路饶,最宜檐雨竹萧萧。羸形暗去春泉长,拔势横来野火烧。守道还如周柱史,鏖兵不羡霍嫖姚。浮生七十更万日,与子期于局上销。(杜牧,送国棋王逢)——人、棋相喻是棋艺,人、棋同境是棋道。
闲看数招烂樵柯,涧草山花一刹那,五百年来棋一局,仙家岁月也无多。(徐文长,题王质烂柯图)——棋局也是历史剧,中国本土文化特色的人、仙同质,是中国传统文人的最后的精神寄托。
当我们迷惑于机器是否会有感情、意识时,不妨首先去体会、研究一下,作为文化的“人”的实质是什么?这有助于我们走出人工智能给我们带来的忧思。
本文相关内容和参考资料除已有文内夹注外,可参见周剑铭、柳渝:中国文化和中国思想;中、西文化和科学、人文两种“两种文化”的交汇;算法、不确定性和不确定性问题(NP)理论;智能哲学等网上系列文章。
  GoogleDeepMind研究科学家、《星际争霸》AI计划负责人OriolVinyals将在EmTechChina全球新兴科技峰会(-30日
  今年5月在乌镇大战谷歌人工智能AlphaGo惨遭三连败的世界围棋职业九段棋手柯洁8日再次现身乌镇,出席2017首届智能金融知识图谱论坛。这一次,他是为人工智能站台。
他在现场表示,未来是属于人工智能的,自己再与人工智能对抗是没有任何意义的。
他说,围棋界是崇拜强者的,自己输给AlphaGo有幸和不幸,不幸是遇到了无法超越的对手,而幸运的是作为棋手,有幸见到了真正无敌的存在。
未来,在围棋之外,他也希望能往金融或教育领域进行探索尝试,比如将人工智能应用到围棋教育上。
“结果不出意外的,我成为了人工智能的垫脚石。”
他本人也很感慨,很多围棋圈外的人知道自己可能并不是因为围棋,而可能是因为AlphaGo,因为人工智能。“对于我而言,人工智能始终是一个避不开,必须面对的话题。”
时隔半年,他已经成为人工智能的“推崇者”,他在多个场合表态“未来是属于人工智能的。”。
他说,围棋界的人应该说是最早与人工智能接触的一批人类,未来90%的行业都可能遭遇人工智能的冲击,围棋界正好先接触,迷茫之后,会发现人类有自身价值,情感是机器无法代替的。比如机器人也可以给人送咖啡,但总归没有人类的亲切与和平相处的感觉。
而对最近刚刚拿到沙特公民身份,成为历史上首位机器人公民的Sophie,柯洁坦言还是觉得有些恐怖。
今后,柯洁是否还要在围棋上继续大战人工智能?
他表示,以自己现在的状态,无论怎么努力,这一辈子都不可能赢AlphaGo。因为它的棋远远超出了我们的想象,超出了我们所认知的境界。
“如果是大家真的很喜欢看我被虐的话,我会义无反顾地去对战;如果有一天,科技已经能让我植入芯片,我也会义不容辞的植入芯片,我也会去报仇。”
现在看来,柯洁对未来的规划似乎与人工智能挂上了点钩。“人工智能在未来绝对是不可限量的,潜力也都是无限的。”
他说,棋手可以通过AlphaGo行棋的思路从中获益。传统印象中下出一些理所当然的棋,在人工智能的眼中都是错误的。它有一条更简洁、更快捷、更有效的方法颠覆传统的下法和认知。
通过学习,人类的棋艺也会比过去更强大一些,理论也会比过去更先进。人工智能也可以对人类棋手下的每一步棋做估值评分,可以对每一步棋打分。
“说职业棋手苦中作乐也好,一种全新的观赏方式也好,这也是之前没有想到AI带来的好处。学围棋的人越来越多,非常感谢AlphaGo为围棋带来这么好的宣传,也感谢人工智能。”
“我只会下一点围棋罢了,能够改变生活,改变未来的是这些非常强的人工智能。”
贵为世界排名第一的棋手,他一直提的是人工智能大数据如何改变了人们的出行方式。他相信,在其它行业,比如教育行业,人工智能会带来非常大的改变。
他表示,自己在围棋之外,也想在工作闲暇之余多做一些推广,和更多跨界的人士交流。“我可能会关注金融、教育行业,这都是我可以去跨界,多开拓自己的思路,我觉得这也是未来的一个方向。”
(本文作者:赵小燕)
  来源:弈客围棋& 作者:侯靖哲、何旸团队
本局摘自AlphaGo Zero VS AlphaGo Master 第14局。(master执白)
进行至第17手是双方出现率最高的布局
右上定型大致两分,其中白28有反击的手段——
白1.3是最容易想到的反击手段,如果黑4强吃白棋,将被白棋简明击溃。
白1如果简单地长一个,黑2先手立完尖在4位,黑棋好调。
白2.4扳粘,黑5尖顶只此一手,白6.8简明处理,由于左边白棋太厚、右上黑四子略显凝重,黑战斗不利。
白2.4最强抵抗,黑5.7必然,白8先夹一下破坏眼位,黑13扳住强硬!白14扳被黑15妙手一断!白动弹不得。
35至45是比较正常的进行。
这样虽然是正常的定式,但在这个场合黑A.B二子太过重复,黑明显不好。
白58神来之笔!60是连贯的好手!
黑1若粘,白2简单飞一个,之前的交换明显得利。
黑1若还是尖出,白2压住,黑3.5扳断,白6打吃黑已无法连回黑1一子,这样就可以看出白58的巧妙之处!
弈至64白调子不错。
黑65打入好点!白76.80意在攻击黑棋左边几子,黑91.93整形好手,94~102这几步棋体现了AI对局面的掌控能力
黑139寻求眼位,白140灭眼,黑141以下形成劫争,
弈至174形成大转换,可谓是沧海变桑田!白成功确立优势。
黑197殊死一搏!
但无奈白198以下计算精准,黑大龙被杀已无力回天。
  来源:弈客围棋& 作者:白石勇一& 翻译:王振飞
继续介绍AlphaGo Lee对Zero的第6局。
1图(实战)
Lee执黑先行。
下至白△,与第3局的布局完全一致。
第3局时,双方选择了黑A白B的顺序来下。
黑△是棋筋,通常这里总是要补的。
2图(实战)
Lee黑1居然脱先了!!
白2断,黑棋外势崩溃。白4之后,将来还留有A位枷的手段。
一般都认为黑棋这样是不可取的。但执黑的Lee继续黑5点三三攻击白角。
我的理解是:Lee认为右上角白棋反正已经活了,继续在这里下,也只不过是继续扩大实地而已。所以此时抢占别处非常重要!虽然这么说,但老实讲,Lee君,我还是觉得右上角不能脱先啊!!
在AlphaGo的系列软件中,Lee的棋谱,其实我们之前只见过8盘棋(译者注释:与李世石人机大战5盘,自我对弈3盘,每步5秒),所以我们直到现在为止方才知道Lee下棋时的全面表现。
但是既然Lee这么下,也就说明之前人类认为这里无论如何是一定要补的,未必就是正确。
那么点三三之后,白棋通常有B,C,D三种应法。那么Zero会怎么选呢?
3图(实战)
Zero一种都不选,直接1,3吃掉黑点三三一子,粗俗有力。下法非常实战化。
4图(实战)
黑1,5拔花。棋形很厚。
这里我们注意一个细节——黑△一子的位置有点美中不足。考虑到厚薄关系,此时黑△一子明显摆在A位更加理想。这也为之后白棋的打入埋下了契机。
感想:Lee在面对Zero时,感觉策略有些不足,只会一味硬怼是不行的呀。
  作者:王丹蕾 陈庚 吴婉瑜
央广网厦门11月5日消息(记者陈庚 吴婉瑜)第十届海峡两岸(厦门)文化产业博览交易会海峡两岸围棋与人工智能邀请赛于11月3-6日在厦门举行,围棋界和人工智能围棋大咖云集,共襄盛举。本次围棋和人工智能邀请赛有聂卫平、马晓春、王立诚、罗洗河、林至涵等棋界大咖助阵,也有来自世界排名第二的CGI和第四的天壤等围棋人工智能机器前来参战。4日举行的聂卫平携手天壤人工智能机器对战王立诚及其携手的CGI人工智能机器战队共进行了237手棋,王立诚、CGI中盘战胜聂卫平、天壤人机组合。
本届比赛有别于以往的围棋比赛,11月4日,聂卫平携手天壤人工智能机器对战王立诚及其携手的CGI人工智能机器战队。11月5日举行两岸大学生人机队际赛及世界冠军人机对战赛。世界冠军人机对战赛由世界冠军马晓春九段迎战台湾CGI人工智能机器,同时世界冠军王立诚九段也将与大陆人工智能机器天壤对阵。
薛贵荣:人工智能在“自我学习”
“四位的人机配对赛有很大的不确定性,棋风都不一样,比赛的时候如果思路比较一致就下得比较流畅,如果思路不同的话下起来就比较麻烦。”天壤创始人及CEO薛贵荣介绍道。来自上海的天壤是人工智能的新星,公司成立仅一年多,在人工智能围棋领域突飞猛进,首届世界智能围棋赛中多次屠龙被冠以“死活达人”称号,最终杀入四强。“以前比赛我们只需要考虑两台机器,这次是我们第一次人机配对赛。我们也在探索,将来比赛中,应该是以谁为主的,比如说以人为主还是以机器为主,像今天的聂老师、王老师都是有棋风,之后机器怎么调整。”薛贵荣表示,人工智能也像人一样需要通过不断实战来“自我学习”,通过对抗来总结和改进。“我们的人工智能每天要生产几十万盘的棋局,数据大了之后,从中学习棋局的特征。这场活动可以帮我们收集变数增加的情况下的数据。人工智能进步很重要,人机协作在一段时间内也非常重要,我们接下来会关注人机协作时有差异的话应该怎么发展。”
林至涵:人机配对赛能吸引更多围棋爱好者加入
5日,在厦门机电设备展示交易中心将举行两岸大学生人机队际赛。台湾参赛队伍由林至涵担任主教练,带领CGI人工智能机器和4名台湾大学生与大陆参赛队伍对技。林至涵来自台湾棋院,是台湾四大九段之一。“我们已经知道人类与人工智能对抗时候的弱势,那今天的活动这种人机搭档的方式很好,以前的围棋世界赛里就有类似的两人协作的,现在把其中一个人换做机器。”林至涵认为,围棋有两个发展层面,一个是追求自己的围棋造诣,一个是推广。“人类一直都在追求自己越来越强。但在人工智能面前突然发现人类下不赢人工智能。我们需要找一个方式再去推广,让大家觉得围棋是个好玩的东西。围棋很难,大家要多认识才能产生兴趣,透过人机配对赛的方式可以吸引更多围棋爱好者加入。”
叶彧熏:我们是一群热爱围棋的科技人
“原本我们网络下棋只能看到冷冰冰的棋子和打字,但是透过我们的平台可以直播、对话、打赏,还可以通过AI和世界冠军对弈,促进人面对面对弈的形式。”90年的叶彧熏来自台北,是围棋业余七段棋手,如今,他与一群围棋爱好者共同创办了围棋人科技股份有限公司。叶彧熏小时候在北京围棋机构训练了两年,大学又在厦大做了半年的交换学生,叶彧熏熟悉两岸围棋文化,看到今天的两岸围棋与人工智能邀请赛感到很兴奋。“这次活动很盛大,大陆在围棋产业的促进推广上很下大气力。我们是一群热爱围棋的科技人,我们公司致力于成为全球性的围棋网络平台,希望多一些大陆的棋友来交流。未来会继续寻找两岸创业合作的机会。”
  来源:围棋编辑部博客
原址:https://book.mynavi.jp/igo/blog/detail/id=87113
大家好。我是编辑部的山本,现在很希望家里能有个被炉。
今天来介绍一款软件。锵锵!
天顶围棋7 ZEN
这一版本的ZEN最高棋力达到了职业九段!
发售前我们请了职业棋手与其以分先进行对局,据说ZEN能与职业棋手势均力敌,还赢了几盘。
当然,对局时的性能也很重要,但最能帮助使用者增长棋力的还要数研讨功能了。
棋手中首屈一指的围棋AI研究家大桥拓文老师对ZEN做了以下评论:
让大家翘首以盼的天顶围棋7终于发售了。
无愧于此前流传的高评价,天顶围棋7的确是有职业水平,有时会下出连我都觉得伤脑筋的严厉招法。
我在和它玩时也发现了许多有意思的使用方法。
我想大家肯定都各自有拿手的作战策略、喜欢的布局。如果你想进一步完善自己的策略、布局的话,这时就该轮到天顶围棋7华丽登场了。摆出自己拿手的布局,点一下右上的研讨按钮试试吧。它会为你提供若干十分有力的下一步的候选,还会显示这些候选点的评估值(即胜率)与搜索次数。虽然大家一般都会比较在意评估值,但模拟次数也十分重要。搜索次数越多,评估值也就越准确。同时参照着这两项参数来思索、制定策略是件十分有意思的事。
评估值是以胜率来表示的,我想有人可能不太习惯,所以在此简单介绍一下(天顶围棋7所表示的)胜率的基准。
显示50的话也就是50%,自然就是双方不相上下的局面。60%是略好。70%是优势。80%的话可以说胜利就在眼前了。差不多就是这样。但要注意一点,即使只领先1目半左右,到终盘时也有可能会显示胜率为90%。90%给人感觉差距很大,但1目半对人类而言只是很小的差距。了解这一点,有助于更好地使用天顶围棋7的研讨功能。
至于序盘,评估值在40%~60%之间时可以理解为某一方只有极小的优势。而双方不相上下时胜率则会在45%~55%的范围之间波动。
为了研究序盘下法,我也开始使用天顶围棋7了。它给出了好多特别有意思的下法,我感觉我一时半会儿是放不下电脑了。
——大桥拓文。
研讨画面示意图如下:
ZEN7研讨画面
红框框起来的部分显示有“候选点”、“搜索次数”、“评估值”。
天顶围棋7显示的这些参数都非常准确,甚至连职业棋手都能从中学到很多。如果好好利用,想必棋力能够大幅提高吧。
购买地址:https://book.mynavi.jp/ec/products/detail/id=77803
英文版:https://book.mynavi.jp/ec/products/detail/id=79528
天顶围棋主题网站:https://book.mynavi.jp/tencho7/
今后还想写一些关于天顶围棋7的推荐使用方法一类的文章。
那么还请大家多多支持天顶围棋了!
天顶围棋作者加藤英树
(朱东冬)
  晚上好各位,11.15深圳大学围棋节拉开序幕,晚上有聂老和诸位名手的座谈会,吸引了诸多学子到场。封面为女子世界冠军徐莹老师隆重介绍聂老。
场面十分热烈
现场嘉宾包括世界冠军、聂老弟子常昊老师
深大学子世界冠军唐韦星
深大学子世界冠军周睿羊
擂台赛当然是聂老座谈会不能略过的话题,聂老:我赢了大竹英雄以后,邓小平亲自给我家里打了电话,但是那时候我还没回去呢。
聂老:我上场前坚信我能赢小林光一
徐莹老师:您为什么这么坚信啊
聂老:凭实力啊!
聂老:我赛前研究了很多小林光一的棋谱,发现他的对角胜率要比一边的低,所以我和他那盘选择了对角
聂老:听说当年财政部要降低围棋的伙食标准,我说这不行啊,就给总书记打了个电话,总书记说,谁敢降低你们的伙食?我说财政部,总书记说,谁敢降低你们的伙食,给我降低财政部的伙食。
随后聂老和学子们分享了对AI围棋的一些心得
聂老:李世石和AlphaGo第五盘,当时角上一个局部,大部分职业棋手都觉得李世石好,或者好不少,我当时觉得AlphaGo略好,后来看AlphaGo要好的多
  2016年的年初,柯洁和李世石完成了经典的五番棋对决。坐在棋盘一端的,是统治围棋世界过去十年的王者,另一端的,是如狂风呼啸,席卷棋坛的天才少年。这样的场景,曾经在十多年前发生过,那时候的李世石,还是有着青涩笑颜的,刚从飞禽岛走出的不败棋客,而当他带着一身少年意气,坐在了李昌镐的对面,我们都知道,围棋世界,将要翻开新的篇章。
少年子弟江湖老,旧日的少年成了今日的王者,而今日的王者也将面对新的少年。围棋世界的代际交替,像是春秋迭换里注定绽放的花朵与注定凋零的秋叶,是造物写就人力难敌的残忍与动人。决赛前,柯洁说,“李世石之前说他有五成希望取胜,我想如果一共是一百成的话,他有五成。另外我想说,传奇是时候落幕了”。围棋世界里,已经有多漫长的岁月,没有听到过这般裹挟着万千少年气天才气的话语了?
上一句,大概正是当年李世石对着李昌镐说出的,“在所有高手中,昌镐的力量应该是最差的”。十三年流光电逝,如果李世石想得起当年旧事,大概也会笑这岁月写就的剧本。更有趣的,是当年李昌镐和李世石,如今的李世石和柯洁,五番棋对决的结果,都是3:2。唯一的不同,只是这一次,更年轻的那个人赢了。
对于李世石而言,这是悬崖边上的战斗。他已经过了而立的年岁,在更新换代越来越快的围棋世界里,他只能一直赢下去,一旦他输掉,“李世石老了”的舆论,就会像潮水一样涌来,将他瘦削的身形淹没。此前,哪怕他立于围棋世界绝巅的时候,他也像是一只遗世独立睥睨天下的狼王,和他一生的好朋友好对手古力相比,他更敏感纤弱,却也更凌厉狂傲。他刚出道的时候,《围棋天地》做了一期专题,题目简简单单,“世石如豹”。十年匆匆,当我们在世界大赛里一次又一次的看见李世石的身影,当他做出的一件又一件事情惹得我们惊叹不已,我们或许才能真正看出他的真正样子—他从来,都是狼王。
而如今,这只站在围棋世界最高处的狼王,已经老了。可是,守在自己领地上的老狼王,大概,才是最让人恐惧的事物。
2015年全年执白不败的柯洁,在年末的五番棋第一局,终于破了不败金身。李世石厚重稳健的棋风收到了效果,在对手棋风的突然转变面前,柯洁仿佛并没有准备好,他对中后盘的判断始终太过于乐观,而当发觉不妙时,已经为时太晚。这是日,柯洁这一年的白棋战绩,也终究定格成了34胜1负,白壁微瑕,终有遗憾,却也是对于这位新科世界王者的提醒,因为不圆满,所以在新的年份里,才有更多的进步可能。
这是老狼王的回应,是面对侵入自己领地的年轻人,最直接最决绝的回答。想要王座,那就用撕咬,用战斗,用血和泪,亲手拿过去。
决赛第四局,柯洁不敌李世石
第二盘,开盘未久,柯洁便出现了误算,黑棋长考后下出101、103两手粘,被李世石脱先分断,将右侧黑棋直接歼灭,研究室里的聂卫平棋圣留下一句“败局已定”便离开研究室,对于所有人而言,仿佛0:2的结局已然注定,柯洁这一次向着王座的冲击,也终将蒙上一层太深重的阴影。所有人都这样想,除了正在下棋的柯洁自己。从网棋世界的摸爬滚打里,从围甲难求一胜的境遇里走出的“潜伏”大帝,从不会轻易将“失败”当成理所当然。而柯洁的坚持也终于等到了奇迹的诞生,进入读秒阶段之后,李世石连续出现失误,柯洁用屠龙的方式,完成了死里逃生的神奇逆转,也让胜利的天平,再度回到了双方均衡的位置上。
第三盘,李世石再度早早进入读秒,也再一次在读秒阶段输的溃不成军,然后,在李世石两盘误算之后,柯洁用第四盘149、153两手致命败着当做回应。这是战斗,是新老王者们为了权杖,也为了他们身后代表的国家棋运的殊死搏杀,“争棋无名局”,这样的对局,是拳拳到肉,是剑影漫天,我们看得到柯洁和李世石所有的情绪,那些欢喜与黯然,都在脸上写的明明白白。因为太重要,因为太渴盼,所以才会在这样的对阵里,留下不那么精彩的棋谱,毕竟,哪怕天才超卓如他们,也终究,是有血有肉有喜有泪的,活生生的人。
而围棋,也正是在这样的战斗里,才拥有了让我们心驰神迷的魅力。那些失误与突然死亡,那些奇迹与惊天逆转,那些执子的手与对视的眼眸,那些一直鲜活的可能性,他们留下棋谱,留下故事,让我们依旧此时此刻依旧感知得到他们当年的紧张与焦灼,身下万丈绝顶,身前璀璨群星。
柯洁夺得梦百合杯
柯洁夺得第二届梦百合杯冠军
2:2,决胜局,一战决胜败。没有比这更传奇的剧本,而这传奇的一战,也终于用传奇的方式告终。前半盘柯洁优势的情况下,却在一处打劫中不慎误算,揪着自己头发表情痛苦的柯洁,牵动了万千棋迷的内心。赛后,柯洁表示,自己一直点错目,以为自己输了,中间甚至一度要认输。还想过输了之后要“削发明志”。但看起来,围棋女神似乎比较喜欢柯洁的头型,并没有让他换造型的打算,直到最后一刻才被看清楚的胜负,以黑棋粘劫收后,半目胜利而告终。这是中国特有的规则,胜的惊险,胜的艰难,但归根结底,少年走出了那一步。他从前辈手里,接过围棋世界王者的权杖,一年三冠,海阔天空。
在那一刻,我们看着领奖台上意气风发的天才少年。那是中国围棋的荣耀,他已经成为了中国围棋漫长历史上,古力、常昊、孔杰后的第三位三冠王,他已经走在了李昌镐李世石曹薰铉们曾经走过的,独属于大棋士的传奇道路上。
如果,一切外力都未曾发生,此后的围棋世界,大概将会流淌的波澜不惊。像是曾经发生过的,新王者接过老王者的权杖,于是战国时代,终究又归成一人独尊,围棋世界,也依旧会按照自己的逻辑,安宁又缓慢的运行。但是,2016年3月,当在那个凛冽初春里,李世石和人工智能相遇的时候,我们早已预想的那个未来,却仿佛被蝴蝶扇了一下翅膀,从此,整个围棋世界,地覆天翻。
和李世石决战之前,AlphaGo最好的战绩,是击败了职业棋手,欧洲冠军樊麾。但是,欧洲冠军和世界冠军的差距,让所有职业棋手都依然相信李世石能够轻松获得胜利。在人们眼里,这项世界上最难的智力游戏,还远远没有到被人工智能轻易击败的时分。崔丙圭九段说,“计算机向人类顶尖棋手挑战,怎么说也得先摆上两三子吧?计算机程序战胜人类,时机还是尚早”,李世石自己也说,要争取“不让电脑赢到两盘”。
但是,当在首尔四季酒店沸沸扬扬的记者人群里,当在全世界的镁光灯下,我们看着棋局走向一个我们想不到的结尾,那是历史性的时刻,人类冠军终究在人工智能面前败下阵来,而且,一败就是三场。从遗憾到绝望,从震惊到麻木,我们仿佛已经在接受这样一个事实,人工智能已经确确实实的在围棋领域超过了人类高手,我们在曾经引以为傲的,不可能被电脑攻克的领域,溃不成军。
而也正因为如此,我们才如此珍视李世石在第四局中的这一胜,我们也都知道,在这一胜之后,下一场胜利,已经不知道会在何年何月,甚至,不知道它还会不会到来。78一手挖,这是如鬼似神般的一击,过去十年里人类棋坛无敌的王者,在最需要他站出来的当口,用他瘦削的身形,给围棋世界,也给所有关注着人机大战的人们留下一个永远闪耀着的背影。新浪从首尔发回的新闻,最后是沉甸甸的几个字,“李世石,谢谢你”。
人机大战第四局李世石改变历史的一胜
我们希望李世石失败了太久,而这一次,当我们终于希望他不要失败的时候,他没有让我们失望。
“三连败后终于一胜,此刻的喜悦真是难以形容,这一胜太有价值,我不会用任何东西来换”。颤抖的嗓音和如释重负的神情里,我们见到的,是我们从来没有认识过的那个李世石。有报道说,在连续输掉三局之后,李世石在路上只要见到围棋相关的人就会连续说“对不起”,李世石的夫人说,晚上偶尔睡醒,就能看到李世石在凉台上对着棋盘叹气。一生意气纵横,一生不弱于人,那一刻李世石的心绪,也许只有未来一年的柯洁能感同身受。我们都知道,这一次,李世石是真的发了狠,要把整个人类的胜负,扛在自己肩上。
神雕侠侣里,杨过问郭靖,“郭伯伯,你说襄阳守得住么”,郭靖沉吟良久,手指西方郁郁葱葱的丘陵树木,说道,“襄阳古往今来最了不起的人物,当然是诸葛亮。此去以西二十里的隆中,便是诸葛亮当年耕田隐居的地方。诸葛亮治国安民的才略,我们粗人也懂不了,他曾说只知道“鞠躬尽瘁,死而后已”,至于最后成功失败,他也看不透了”。我与你郭伯母谈论襄阳守得住守不住,到最后,也总只是“鞠躬尽瘁,死而后已”这八个字。
襄阳终究是守不住的。才气卓绝如李世石,当然也知道,他所坚守的阵地,总会被人工智能攻克。但他依然奋力搏杀到了最后,正是因为这一胜,我们才等来了第二年里,人工智能和人类王者的又一次交锋,我们才能在失败面前,依旧骄傲的讲出,我们要向人类“脱帽致敬”。
但是,这一切,却终究只是在命运写好的轨迹里,以个人的风华绝代,带来的那么一点微小的改变。1:4和0:5,太不一样,却同样是人类的败北,我们都已经明白,人工智能只会将人类越抛越远。2016年年末,当Master在野狐和奕城横扫人类高手完成六十连胜,当一位位人类棋手决绝的冲向人工智能,却收获一次又一次失败的棋局,一切的结果,其实早在柯洁和AlphaGo的江南决战之前,就已经板上钉钉。
围棋世界的浩荡长河,在命运的重重一击下,刹那间变了走向,翻卷着无数身处在这个变革时代的小小浪花,走向了茫然不可知的星辰大海。浪花们愿意按照原有的轨迹流淌,还是像如今这般,毅然决然的冲上礁石、冲向未知、冲向我们称之为“道”的渺远未来?个人的命运在宏大的时代叙事之前,显得微小又虚无。即便他们,是这项人类最难的智力游戏中最卓绝的天才,但终究,也只是这个伟大时代里,充盈着喜怒哀乐的,同样看不清自己前路走向的小小的“人”。
你看着他们,用坚忍不拔的勇气和永不放弃的决心,飞蛾扑火一样的,冲向注定将远远把他们抛在身后的人工智能,以对天拔剑的勇气,收获早已注定的败局,求仁得仁,求义得义,他们在变革的时代里用自己落下的每一颗棋子堂堂正正硬硬朗朗的写下“棋士”两个传承千年的名字,但是,一生争胜从不言败的他们,却终究因为失败,而被史笔记下,被更多的人记住。
多喜悦,多悲哀。
当然,这还不是最后的时刻,在来年的五月,在江南水乡青砖白瓦,人类新王和人工智能,还会完成让世人瞩目的番棋较量,但是,那,已经是这绵延了太久的,属于“人机大战”这个意蕴万千的名词的,一个意味深长的终结符。
在开年的时候,在柯洁和李世石对战的时候,我们不会想到这一切。我们依旧可以选择留在过去,但围棋不能,它在用比我们想象的快得多的速度前行,我们每个人都依旧微小,但这,确实已经是围棋的大时代了。
谨以此,献给刚刚过去的,变革的2016。
2016年中国围棋大事录:
2016年1月,柯洁击败李世石,获得梦百合杯冠军
2016年10月,唐韦星击败朴廷桓,获得应氏杯冠军
2016年11月,党毅飞、周睿羊会师LG杯决赛
2016年12月,陈耀烨击败柯洁,获得百灵杯冠军
2016年12月,柯洁击败柁嘉熹,获得三星杯冠军
2016年年末,范廷钰在应氏杯完成七连胜
(未完待续)
(谢天舒)
  来源:柳渝的博客& 作者:柳渝。
摘要:继AlphaGo完胜人类棋手后,AlphaGo Zero完胜AlphaGo Master,恰恰表明了作为人工智能的围棋机器的技术性本质。中国古围棋在日本的职业化也是围棋的技术化,这是今日围棋机器完胜人类的必然。中国围棋的文化本质蕴含于棋艺和棋道之中。围棋的棋理只有在科学与人文和中、西文化的交叉视域中才能得到真正的阐释。
一,AlphaGo Zero的“白板”学习与人工智能的“先天”性赋予
二,围棋盘棋上的棋理
三,围棋的职业化与技术化
四,围棋的棋艺与棋道
AlphaGo以学习人类经验棋谱而战胜了人类棋手,成为了人工智能的时代标志,而AlphaGoZero则以“白板”(tabular rasa)学习而再次成为头号新闻,英国经验主义哲学家洛克(John Locke,)著名的“白板”说(theory of tabula rasa)认为,人出生时心灵像白板一样空白,通过人的经验心灵中才有了观念和知识,洛克认为经验是观念、知识的惟一来源。AlphaGo Zero的“白板”是指与人类经验棋谱相对的空棋盘,即从0开始的“学习”,但洛克的心灵“白板”是人从现实经验中认知或学习,两者的区别就在于AlphaGo Zero不需要人类的棋谱经验而是自己与自己在棋盘上对战的“经验”,这个区别的微妙之处就在于人类的经验与机器的“经验”有何本质的不同,这与AlphaGo对人类的伦理挑战不同,AlphaGo Zero的“白板”是对人类哲学问题的一个挑战,这些问题都深刻地与我们对人工智能的本质的理解和定义有关,实际上已经成为了今天我们对人的智能的基本认知理论的更新,其意义远超过AlphaGo Zero的成功。
就AlphaGo Zero的具体情况来说,本文讨论1。AlphaGo Zero的“白板”与人类的心灵“白板”有何不同?2。AlphaGo Zero自我对弈的经验与人类的经验有何本质的不同?我们可以在智能哲学的论域中研究这些问题的深刻意义。
一、AlphaGo Zero的“白板”学习与人工智能的“先天”性赋予
DeepMind团队在“自然”杂志上发表的论文,推出了人工智能围棋程序的最新版本的更强大的“学习”能力,AlphaGo Zero:Mastering the game of Go without human knowledge (无需人类知识的围棋大师),据称,AlphaGo Zero以100 : 0的成绩击败李世乭版本的AlphaGo。(http://nature.com/articles/doi:10.1038/nature24270,中文介绍可见:http://mp.weixin.qq.com/s/68GTn-BaiRPmzi9F-0sCyw)最引人注意的地方是,“我们介绍一种单独基于强化学习方法的算法,无需人类数据、人类的指导,或超越围棋规则的领域知识。AlphaGo成为了它自己的老师,”(we introduce an algorithm based solelyon reinforcement learning, without human data, guidance, or domain knowledgebeyond game rules。 AlphaGo becomes its own teacher)。
这篇论文的第一作者、AlphaGo项目负责人DeepMind的David Silver在采访中这样解释说:
-AlphaGo Zero完全从“乱打”(随机)开始,不需要任何人类数据从最初原理开始而取得最高的综合棋艺水平。AlphaGo Zero最重要的理念就是它完全从无知状态开始学习,也就是从白板(tabular rasa)上开始,从自我对弈中领悟,不需要任何人类知识或人类数据,不需要任何人类经验、特征或人类的干预。它去发现如何从基本原理开始下围棋。因此白板学习对我们DeepMind的目标和雄心非常重要,因为如果你能得到白板学习,你就得到了一个代理,它可以从围棋移植到任何其它领域。你就从你所在的专业领域解放了出来,你得到了一个算法,它具有普遍性可以应用到任何地方。对于我们来说AlphaGo的意义不在于下棋战胜人类,而是去发现从事科学工作的意义,从程序的自我学习能力中了解知识是什么。我们开始发现,AlphaGo Zero不仅重新发现了人类下棋时的常用模式和开局,以及人类下在棋角上的定式,不仅是学习、发现这些而且最终放弃它们而采用自己的模式,其中有些甚至是人类不知道的或现在还没有用过的。因此我们可以说,事实上在短时间内AlphaGo Zero学到了人类上千年积累的围棋实战知识。AlphaGo Zero下棋中分析,靠自己发现更多的知识。有时候它的选择甚至超过这些,得到一些人类在这个时候尚未发现的东西,在不同的方式上发展出具有创意的新的知识点。
(AlphaGo Zero which haslearned completely from scratch, from first principles withoutusing any human data and has achieved the highest level of performance overall。 The most important idea in AlphaGo Zero isthat it learns completely tabular rasa。 That meansit starts completely from a blank slate and figuresout for itself only from self-play, without any human knowledge, without anyhuman date, without any human examples or features or intervention from humans.It discovers how to play the game of Go completely from fist principles。 Sotabular rasa learning is extremely important to our goals and ambitions at DeepMind。 And the reason is that if you can achieve tabularasa leaning, you really have an agent that can be transplanted from the gameof Go to any other domain。 You untie yourself from the specifics of the domainyou’re in and you come up with an algorithm which is so general that it can beapplied anywhere。 For us the idea of AlphaGo is not to go out and defeathumans, but actually to discover what it means to do science, and for a programto be able to lean for itself what knowledge is。 So, what we start to see wasthat AlphaGo Zero not only rediscovered the common patterns and openings thathuman tend to play, these joseki patterns that human play in the corners。 Italso leaned them, discovered them and ultimately discarded them in preferencefor its own variants which humans don’t even know about or play at the moment。 And so wecan say that really what’s happened is that in a short space of time, AlphaGo Zero has understood all of the Go knowledgethat has been accumulated by humans over thousands of years of playing。 And it’s analyzedit and started to look at it and discover much of this knowledge for itself.And sometimes it’s chosen to actually to beyond that and come up with something which thehuman hadn’t even discovered in this time period。 And developed new pieces ofknowledge which were creative and novel in many ways。 )
DeepMind强调AlphaGo Zero从白板上开始自我学习,这是指机器进入包括训练或实战状态时不从学习巨量的人类数据开始(People tend to assume that machine learning is allabout big data massive amounts of computation),但这时的AlphaGoZero本身并非白板(裸机),也并非只包含了“操作系统”的纯净机器,而是具有了强大的机器学习能力的机器,David Silver说 “但实际上我们从AlphaGo Zero中发现,算法比所谓计算或可用数据更重要,事实上我们在AlphaGo Zero上使用的计算(量)比过去在AlphaGo上要少一个数量级,这是因为我们使用了更多原则性算法。“(But actually what we saw in AlphaGoZero is that algorithms matter much more than either compute or dataavailability。 In fact in AlphaGo Zero, we use morethan an order of magnitudes less computation than we used in previous versionsof AlphaGo。 And yet it was able to perform much higher level due to using muchmore principled algorithms than we had before。)正是由于AlphaGo Zero具有这种“先天”的学习能力它才能一开始就可以自己学习自己。
DeepMind在AlphaGo Zero建造中使用了包括AlphaGo在内的很多精练的算法。因此实际情况是非常复杂的,AlphaGo Zero开始工作时并不是一台“裸机”,也不是只有操作系统的“纯净机”,而是一台“智能机”。这里不仅有传统图灵计算的算法,也有人工神经网络“代理”计算能力,即有机器本身的操作系统,也有功能计算能力和解决具体问题的功能算法或智能代理能力,这些高能力算法不是AlphaGo Zero自己学习得到的,而是人类赋予的“先天”性的人工智能,这也是AlphaGo Zero一开始就能向自己学习的原因。
二、围棋盘棋上的棋理
今年的法国科学节上,儒勒·凡尔纳公立综合大学(Université de PicardieJules Verne)第一次以科学介绍方式向公众展示中国围棋和包含其中的文化因素(亚眠“科学节”——围棋从中国到法国的旅行),在向完全不懂围棋为何物的观众简单地演示如何学下棋时,采用了两种现场教学方法。第一种是先介绍最基本的下棋规则,然后让学习者下子,这时参与者每下一子要费周折,第一粒棋子放在什么地方是很大的困惑;第二种方法是先让观众任意下子,然后在教学者的陪练中亦步亦趋地学习可行的落子方法。很明显,后者不但使事前完全不懂围棋的观众能够马上下棋,而基本上知道了什么是围棋,领会他任意落下的棋子都充满了奥秘,对围棋产生了兴趣。这个情况引发了我们进一步的思考,围棋的规则虽然简单,但与棋盘上的直接经验相比,对新手的认知、学习具有很大的区别。围棋的规则是围棋作为游戏的设计性思想的体现,而棋盘上的直接落子则是在现成的游戏世界中的经验行为,前者是人类知识的体现,而后者是作为游戏角色的经验,对于一个新手来说,后者是在棋盘上的经验中的学习。为此,我们研究作为围棋棋盘的特殊性。
围棋是在平面直交空间上的占领游戏,这对不懂围棋的人特别是西方人有一种困惑:是不是只要将棋盘上放满棋子了就可以决定胜负了?这样几乎等于没有规则,这也就没有游戏的意义了。与一般游戏规则不同,下围棋不仅是按游戏规则的“以棋行事”,而且是对弈过程中对棋盘与棋子所形成的“局面”不断地认知更新与决策,围棋的“局面”就建立在棋盘的平面直交网格的几何特殊性上。
围棋的棋盘是一种简单的平面直交网格,是平面几何空间上最基本的形式结构,围棋就是在这种最简单的直交网格上占领对弈。平面直交网格实际就是欧氏几何平面上的坐标系,在这种平面直交网格上的游戏的形成或设计实质就是对欧氏平面的基本性质甚至是潜在性质的利用和开发,中国围棋内涵的丰富性正是基于这种几何性质的深刻性。首先,在围棋中,棋盘上的直交网格的每一位置被赋予非几何的意义:空或占有、死或活、0或1,实现了几何性和数学性的人为超越结合,这是围棋棋理研究的理论基础。
以数学眼光对围棋进行过精深研究的英国数学家 John Horton Conway 发明的“生命游戏”(Game of Life)或称“元胞自动机”(Cellular Automaton)就是在直交网络上进行的一种位置格局迭代过程,每一格局的迭代由一个选定位置与其邻接位置的相互控制关系决定。这种迭代过程是算法能行的(可以程序化),但这种迭代产生的平面复杂格局可以表现为一种有规则的图形,这种事前无法预见的复杂现象就像生命现象的涌现和演化一样引人注意(注意这里有一种错觉,屏幕上生命游戏中的图案仍是由机器以算法形式产生的)。但由于平面上的位置组合是指数增长的,现有设计的可以实现的生命游戏的算法程序都无法穷尽,这种情况造成一种误解,只要有无限的空间和时间,生命游戏就可能演化出任意复杂事物,但实际上并没有进行这样的大规模研究的意义。生命游戏就是平面直交网格的几何性质表现为图案形式的算法的一个范例,但作为电子“游戏”,只能说是一种知识性的娱乐。
与“生命游戏”的图案迭代变化不同,围棋不是棋子与盘面之间的简单占领关系,围棋对网格位置的占有是对抗性的,即在直交网格上已经人为的赋予基本结构性意义的情况下,再以黑、白落子表示对抗性地占有,因此围棋的盘面是双方对抗性布子所形成的“局面”,就是说,围棋的“局面”形成既不是由程序(递归)决定的,没有如生命游戏事前的变量设定产生的算法制约性,而是不断的认知更新和决策的对抗游戏,任何“局面”不只是棋盘上的棋子与棋盘网格的占有关系,更是双方对潜在盘面的认知、信念和决策。因此弈棋不是上一局面的算法的连续迭代,而是双方棋手独自看局的直觉判断和策略的博弈,同一个盘面各人所看的局面并不相同,在双方的视野中可以有具有很不同的意义,因此围棋能体现个人的智力直觉,围棋规则简单但“易学难精”,就是对人的直觉的自然性与自觉性的超越要求。对同一个盘面双方对抗性地具有不同的理解和控制的智力竞技才是围棋表现为一种高级游戏的原因。相比于象棋等各自组织攻防战术的游戏,围棋具有更强的不完全格局和盘面全局性关系直觉与理解能力的要求。
人类围棋的高手是经历了自己的长期实战和对历史棋谱的无数揣摩而形成的,每一盘棋从落子“开局”起是在弈棋过程中个人与历史经验的综合后的再实践。而AlphaGo Zero之所以能够从白板开始(实质是“随机”开始,区别于“监督学习”喂入人类棋谱)学习,是因为它已经具有的人工赋予的人工智能的先天性。
AlphaGo Zero真正的区别性应在两方面考虑,1。区别于人,人类心灵的“白板”是指人类和知识来源于经验,人类棋手是有了围棋的规则和历史经验的知识,不同经验者之间的对抗性竞争。2。区别于AlphaGo的“监督学习”,AlphaGo Zero是在包括AlphaGo研究、设计、建造和实用所有经验基础上的围棋游戏的算法重建。
AlphaGo Zero的随机性“白板”开始实际是受其内置的人工性智能和盘面上直交网格的几何-数学性质两方面约束的。AlphaGo Zero本身就是“智能机”,能够在棋盘这种有限世界中重建一种机器对机器的对抗性。AlphaGo Zero真正的进步是作为人工智能的“机器学习”的“强化学习

我要回帖

更多关于 我要学围棋 的文章

 

随机推荐