红色选手智商高还是蓝色选手智商高,围棋 智商

高智商选手一周特训后,能挑战围棋九段吗?
北京青年报褚鹏
  柯洁又为口无遮拦引发争议  普通人经过五天半的围棋特训,可以击败世界冠军吗?上周四位最强大脑人气选手,勇敢地坐在了世界冠军芈昱廷的对面,却没创造奇迹。挑战并未成功,几人的享受和成就感却溢于言表。挑战失败了,话题仍在。围棋是否要改变,棋界也吵翻了天。  速成法被证伪 聪明人没创奇迹  网名为“真疯叔叔”的围棋教练李振沣,用一条微博震动了围棋界。他宣称能在一周内把普通人训练成围棋业余一段。如今号称最强大脑的几位聪明人接受了训练,却未创造奇迹。  魔方盲拧达人贾立平,在五天半里着急上火,口腔溃疡。而面对芈昱廷,又感受到对手如山的气场。虽然受让9子,贾立平难以和对方形成战斗,退让过多。虽然没有死棋,但官子收完盘面已差了30多目。此后芈昱廷与李威的比试,也以李威中盘认输结束。  这场比试后,有人戏称这是场关公战秦琼的非对称战争。无论是超级辨脸王李威,还是盲拧魔方达人贾立平,都是普通人中的智商超人,但面对围棋,也被试出了局限。  李威表示,他虽然擅长记忆,但对学习围棋帮助不大。“可能在记忆一些定式的时候有些帮助,但围棋更多的时候是需要自己的理解和判断。”  最强大脑挑战失败,在聂卫平看来非常正常。他表示,老师可以用60个小时传授围棋知识,但围棋考验的不是单一背诵能力和记忆能力,还需要消化和吸收,在一天9个小时的学习中,单凭老师教学,不进行实战演练吸收的话是不行的。  是否需要速成 棋界爆发争论  “最强大脑”挑战失败证明,即使是最聪明的人,在短短6天的时间内也速成不到业余一段的水平。但速成法是否对普及围棋有用,这个话题却让棋界引发争议。  担任主考官的芈昱廷赛后表示,听说最强大脑们在下面练习的时候,已经下得很不错了,但可能是太紧张了。古力也在赛后点评此事:“其实应该感谢最强大脑的选手们,比赛结果并不重要。相信这次学习也让他们以及更多的朋友了解到围棋这项东方智慧瑰宝的魅力。”柯洁则在微博上口无遮拦 :“我评论的话可能有点伤人,借用棋界一位著名高手的评价:‘这简直就是杀猪啊!’”也许是这条微博引发的网上反弹过于强烈,柯洁迅速做出令人意外的回应:“本人快人快语,经常一不小心就会得罪人。这是个很大的毛病,得改。从现在起卸载微博,直到应氏杯,勿回! ”  老聂态度急转弯 最强大脑领略围棋之美  这场普通人与世界冠军之间的比试,还是此前的“人机大战”间接促成的。聂卫平曾经对“真疯叔叔”的训练法不屑一顾,但在阿尔法狗4比1完胜李世石后,聂卫平认为,也许围棋的训练和推广方法是时候改进了。从公开抨击速成法不靠谱,到这次站台助威,聂卫平的态度转变得很快。“如果真的能够把现有的围棋教学方法做些改善,让普通人能够在短时间内大致了解围棋,对围棋的推广当然是有不小的作用。”  挑战结束后 ,魔方盲拧达人贾立平表示,这五天半让他可以完整地下完一盘围棋,领略围棋之美,太值了。  五天半,最强大脑们证实,“真疯叔叔”的教学方法,在成人普及方面有所作用,也有所欠缺。但整体来说取得了非常不错的效果。用他们队长王昱珩的话说:“人机大战的时候我可以得意地告诉别人,我知道李世石和阿尔法在做什么了。”  而芈昱廷在获胜后,对几人评价很高。他认为,其实所谓围棋速成法更大的意义,在于快速普及,至于精深是以后的事。“人机大战上亿人的关注,但其中能看懂一二的观众凤毛麟角。更多的人是看热闹,甚至笑话。何不利用好人机大战带来的围棋热呢?” 文/本报记者 褚鹏(北京青年报)
正文已结束,您可以按alt+4进行评论
相关搜索:
看过本文的人还看了
[责任编辑:wytaozzhang]
热门搜索:
Copyright & 1998 - 2018 Tencent. All Rights Reserved智商高就好吗?智商高的人容易有的这 9 个问题
我的图书馆
智商高就好吗?智商高的人容易有的这 9 个问题
#时间不会等你##每周多一点思考#彭萦:聪明反被聪明误。你们先看智商高容易有的那 9 个问题。看完了,我再给你们看一段话。智商高就好吗?智商高的人容易有的这 9 个问题by Lachel(L先生)& Owl of Minerva&@Lachel(L先生)生活中,你也许见过很多这样的人。他们脑子很活,思维敏捷,学习一样事物时往往很快上手。比如,学习吉他,别人还在练习 ,他们已经可以完整弹唱一首歌了;学习编程,别人还在死记硬背算法、函数,他们已经可以编出一个小程序了。但是,当学习进展到一定阶段——比如正式入门之后,他们的热情却消退得和刚上手时一样快。这时,他们的进度往往会停滞不前,导致对许多事物均有涉猎,也能说出个子丑寅卯来,却没什么精通的领域。为什么会这样呢?其实,很有可能,这正是由他们的「聪明」导致的。学习的本质,是一个在大脑中建立「联系」的过程。每个人的思维,可以看作一张由许许多多个「节点」,通过逻辑关系连接在一起的网络。这些「节点」,就是一个个「观念」。而学习,就是在这张固有的网络之间,插入新的节点,并重建与这个节点的连接。亦即改变固有的思考模式。这个过程是艰辛的,所以无论对于谁,学习都是一件难事。那么,推动我们去学习的动力,是什么呢?是反馈。反馈,就是由你的行为产生的、同时又反作用于你身上的结果。反馈有正反馈和负反馈,每一种反馈又可分成即时反馈和预期反馈。正反馈促进我们去做某些行为,负反馈促进我们停止某些行为。例如,按照六线谱练习几分钟指法,就能弹出一首简单的伴奏,这个从无到有的过程,就是「即时反馈」。它会给予你成就感,鼓励你继续练习下去。例如,背英语单词的时候,每背一个单词,就想象自己离托福 110 又近了一步,离自己出国的目标又近了一步,这就是「预期反馈」。又例如,你 15 岁才开始学围棋,然后得知别人学棋都比你早了 10 年,你这辈子都下不出什么成绩了,就会萌生悲观和放弃的心理。这就是「负反馈」。负反馈的意义,是警示我们远离不利于生存的事物,包括将精力耗费在得不到预期结果的事物上。为什么我们能够学得进去一样东西?就是因为我们在学习的时候,不断地受到「即时正反馈」和「预期正反馈」的鼓励。有些人,可能学到一个新的知识点,解出一道难题,便会非常兴奋,对他来说,这就是正反馈。而有些人,可能学到一个东西,感到又比别人更进了一步,满足优越感,这也是一种正反馈。正是这种反馈,抵消了学习过程中的艰辛和枯燥。学东西比较快的人,他们的记忆力、理解能力、思维速度通常比较出众,将知识转化为联系的速度较快,因此,他们比较容易「理解」一个概念,并应用这个概念去解决固有的问题,这就是一种「正反馈」。对他们来说,这种过程是新奇、有趣、充满刺激的,他们陶醉于这种新事物对大脑不断的刺激中。因此,一开始的时候,他们表示出来的是浓厚的兴趣和极快的学习速度。但是,这样的模式,也容易产生这些问题:1 追求不间断的刺激流,忽视对概念的深入掌握。结果就是,不断地学习新的知识,但能深刻记住的和沉淀下来的却不多。也就是过于重视速度而忽视了质量。2 重视刺激甚于知识本身,舍本逐末,似是而非。他们可能会沉溺于「原来是这样!」的刺激中(也就是西方所说的 aha! moment),满足于这种感觉,而事实上他们的理解可能是似是而非的,甚至纯属曲解,但由于他们足够聪明,能在比较低的层面上自洽解释,因此自以为掌握了这个知识点。也就是说,他们学习的潜在动力并非为了获得知识,而是为了获得快感。3 积累不够扎实。相比起新事物的刺激,复习、背诵、记忆显得更枯燥无味,所以,他们更喜欢学习新东西,而忽视了将学到的知识纳入自己的知识体系之中,导致积累不够扎实。我们知道,任何一个领域,入门往往都是比较快的,但随着学习的深入,前面学到的东西,会成为后面知识的铺垫和基础。这时,不但要求你有较高的理解能力,也要求你能够将已经学到的东西「内化」,让它们彻底为你所用,才能进一步学习。而一开始学习较快的人,他们最缺乏的,恰恰就是这种将知识「内化」的能力。而当他们遇上障碍时,因为前期的学习过程相当顺利,「刺激流」一直不断,因此,对比之下,他们更容易放弃。举个例子:学习好比走迷宫。聪明的人,也许用不了一分钟就能解开这一层的谜题,找到出口,前往下一层。但也许这一层某处隐藏着一个重要道具,过了十层之后,需要使用这个道具了,他们就傻眼了。回去找吧,又不知道在哪一层,而且面对着已经走过的迷宫,实在不想重新遍历一次。再加上又没有攻略帮忙,很多人也许就选择放弃了。而一开始就仔仔细细将迷宫每一层都走遍的人,花的时间更多,入门更慢,但每一层都走得踏踏实实,就不容易有这样的遗漏。如何解决这样的问题呢?1 找到你真正热爱的东西。全才固然是好的,但懂得很多又有专长,是最理想的状态。前面已经说过,浅尝辄止的人,多半并不是真的热爱这个领域,只是对其有基本的兴趣而已,因此一旦「刺激流」停止,便很容易放弃。所以,找到你真正热爱、愿意钻研的内容,让每一步都成为你的「预期反馈」,让自己拒绝刺激的诱惑,抱着真心想了解这个领域的心态,去学习,去钻研,才有可能走下去。2 每走一步都反省、检视自己,将知识体系化。主要有这么三步:1)学习一个新的概念时,将它解释给别人听,或者跟自己对话。你理解一个概念时,可能只是理解一个侧面,而当你试图解释一个概念时,你会动用到它在你脑海中的一切「联系」。这样一来,你是否掌握到它足够的特点,是否存在似是而非的情况,是否对它的前因后果、逻辑关联都一清二楚,就明明白白地显示出来了。在这个过程中,你遇到的一切障碍,都要立刻弄明白,因为这些就是你在正常学习中忽略了的东西。2)做笔记,画图,理清逻辑,建立联系。3)将这个知识点纳入你的知识体系。3 多与人交流,多应用,多触类旁通。多交流,交换想法,一来加深理解,二来也可以通过交流的快感建立你的「反馈」。多应用,学习的最终目的是应用,为学到的东西写一篇文章,试着去解释日常生活的问题,都是建立反馈、自我检查的良好方式。多触类旁通,学习的本质是联系,不要埋头于一个领域,多去接触其他相关领域的东西,会开阔你的思路,了解更多不同角度,从而更好地加深理解。4 保持好心态,不要过分注重结果。学习是一个长期过程,不要太注重眼前的收益。@Owl of Minerva极高智商是有实实在在的危险的,多体现在精神压力/状态和某些精神疾病上。具体表现包括:1 酗酒和成瘾性药物滥用在酒精消耗上,具有高平均 IQ 的国家,人均年度消耗量显著更高 [1] 。这一结论来自于99个国家的数据。数据同时显示,酒精消耗跟 IQ 之间的显著相关不受经济和教育等其他参数的影响。上面数据由于考虑的是国家平均 IQ,所以并没有很好的显示高智商跟饮酒的关系。排出文化参数,考虑在同一国家内 IQ 跟饮酒量,可以更明显的看到这一正相关趋势 [2, 9]:另外,来自大量数据的调查研究还证明,儿童时期 (10岁) 的高 IQ 跟成人 (30之后) 的成瘾性药物滥用有显著相关性 [3,4] 。具体的,在 IQ 比平均值高出一个方差 (15分) 的人群中,成瘾药物滥用的比例显著增加 (不是线性的) 。2 躁郁症(Bipolar disorder)风险经验告诉我们,极聪明极富有创造力的人很可能躁狂。来自瑞典军队一百万人口的调查数据也证明了这一点 [5]:该数据显示,儿童时期的 IQ 与成年后的纯躁郁症发病率呈反 J 曲线关系,即儿童时期 IQ 较低人群和 IQ 较高人群均有较高的躁郁症发病率。该研究的缺陷在于,IQ scale 里的 9 分仅仅是代表 IQ120 左右的人群,并不包括极高 IQ 者,使得这种关系不太明显。另一项考虑了 IQ130 以上人群的研究更好的证明了这一关系 [6]:3 好奇的危险高的智商以为着你/妳有更好的记忆力,以及脑内个区域的协同工作能力。这些特征可能由一类蛋白质( neuronal calcium sensor-1, NCS-1)驱动,同时该蛋白质还与躁郁症 (上文第2部分) 和精神分裂有关。新的研究证明,该蛋白质还与好奇行为有直接关系 [7]:抑制不住的好奇,好处不表,其害处除了有上文 1 部分提到的酗酒和药物滥用之外,还会导致一些花样作死行为以及由尝试导致的意外。4 他人期望的压力以及难以满足的自我期望智商极高的人通常在儿童时期就表现出远优异与周围孩子的能力,这让 TA 的亲人和朋友对 TA 有很高的期望。但是个人生活的成功取决于多方面因素,除了自己的努力,还有社会和时代因素的极大影响——即成功是有偶然性的,而大部分人不足以优秀到认识这一点。这些高期望给聪明孩子留下深远的影响,贯穿 TA 的一生。研究数据证明,在儿童时期就被成为神童的孩子群体,在 TA 们中年时期普遍对自己的生活状态失望,认为没有发挥出自己的智商优势。在 TA 们 80 岁左右时候,自己的心理状态( psychological well-being )也低于普通智商人群 [8]。大量数据已经证明,高的智商并不能给人的说明满足感带来帮助。相反的,如果自我期望与现实的关系没有调整好,会导致生活满足感的损失,包括对自己健康和人际关系的满足感损失 [9]:5 对日常事务更多的担忧,以及对过去窘境的念念不忘高智商人群的担忧具有一个特征:TA 们不怎么担忧生活和人类的大事,反而在日常生活的小事上处处留心和紧张。比如。TA 们会更担忧上课和上班迟到,考试中某道题没有做出来或者完美解决。TA 们过多的担忧这些小的缺陷,使得自己对事情的担忧水平远超旁观者的担忧水平——比如学霸们会在每次考试后都哀叹要挂。与之对应的是,高智商者会更多的回顾过去犯错的境况、丢人的瞬间,对此念念不忘,翻来覆去的担忧 [10]。另外,研究数据还显示,在患有广泛性焦虑症(Generalized Anxiety Disorder)的人群中,高智商者通常症状更严重 [11]。6 偏见陷阱及赌徒心理高智商者通常对自己的方法论具有非常的自信,因此忽视了自己一个人不可能看到事情的完整面。这使得 TA 们在面对错误时更少可能反思,反而固执于旧结论或偏见(Myside Bias, 自我偏见),难以认识自己的缺点 [12]。反映在经济和投资策略上,高智商者更可能陷入赌徒谬误,以为随机序列中一个事件发生的机会率与之前发生的事件有关,即其发生的机会率会随着之前没有发生该事件的次数而上升[13]。同时,高智商者可能因为这一因素在投资和消费上不理智[14], 虽然有更好的风控能力,但冒的经济风险更大:......以上这么多问题,相当部分是因为认知偏差造成的。我们这个社会中的规则和教材是为普通人写,如果高智商者过多相信于此,不可避免的会导致错误的认知和不合理的期望。Reference[1] Belasen, Ariel, and Rik W. Hafer. 'IQ and alcohol consumption: International data.' Intelligence 41.5 (2013): 615-621.[2] Mortensen L H, S?rensen T I A, Gr?nb?k M. Intelligence in relation to later beverage preference and alcohol intake[J]. Addiction, ): .[3] White, James, and G. David Batty. 'Intelligence across childhood in relation to illegal drug use in adulthood: 1970 British Cohort Study.' Journal of epidemiology and community health (2011): jech-2011.[4] White, James W., Catharine R. Gale, and G. David Batty. 'Intelligence quotient in childhood and the risk of illegal drug use in middle-age: the 1958 National Child Development Survey.' Annals of epidemiology 22.9 (2012): 654-657.[5] Gale, Catharine R., et al. 'Is bipolar disorder more common in highly intelligent people& A cohort study of a million men.' Molecular psychiatry 18.2 (2013): 190-194.[6] Smith, Daniel J., et al. 'Childhood IQ and risk of bipolar disorder in adulthood: prospective birth cohort study.' British Journal of Psychiatry Open 1.1 (2015): 74-80.[7] Saab, Bechara J., et al. 'NCS-1 in the dentate gyrus promotes exploration, synaptic plasticity, and rapid acquisition of spatial memory.' Neuron 63.5 (2009): 643-656.[8] Holahan, Carole K., and Charles J. Holahan. 'Being labeled as gifted, self-appraisal, and psychological well-being: A life span developmental perspective.' The International Journal of Aging and Human Development 48.3 (1999): 161-173.[9] Zettergren, Peter, and Lars R. Bergman. 'Adolescents with high IQ and their adjustment in adolescence and midlife.' Research in Human Development 11.3 (2014): 186-203.[10] Penney, Alexander M., Victoria C. Miedema, and Dwight Mazmanian. 'Intelligence and emotional disorders: Is the worrying and ruminating mind a more intelligent mind?.' Personality and Individual Differences 74 (2015): 90-93.[11] Coplan, Jeremy D., et al. 'The relationship between intelligence and anxiety: an association with subcortical white matter metabolism.' Frontiers in evolutionary neuroscience 3 (2011).[12] Stanovich, Keith E., Richard F. West, and Maggie E. Toplak. 'Myside bias, rational thinking, and intelligence.' Current Directions in Psychological Science 22.4 (2013): 259-264.[13] Xue, Gui, et al. 'The gambler’s fallacy is associated with weak affective decision making but strong cognitive ability.' PloS one 7.10 (2012): e47019.[14] Zagorsky, Jay L. 'Do you have to be smart to be rich? The impact of IQ on wealth, income and financial distress.' Intelligence 35.5 (2007): 489-501.第一篇授权转载自公众号: L先生的猫(ID:lxianshengmiao)作者Lachel,公关、互联网人,知乎18万赞答主,心理学达人,多家媒体特约作者第二篇授权转载自知乎的@Owl of Minerva,中科院、德国马普学会博士封面图 by&Davide Abbati彭萦:我前几天刚好看见这段关于智商的定义,很喜欢:「Intelligence isn't just about how many levels of math courses you've taken, how fast you can slove an algorithm, or how many vocabulary words you know that are over 6 characters. It's about being able to approach a new problem, recognize its important components, and solve it — then take that knowledge gained and put it towards solving the next, more complex problem. It's about innovation and imagination, and about being able to put that to use to make the world a better place. This is the kind of intelligence that is valuable, and this is the type of intelligence we should be striving for and encouraging.」小播报彭萦招一个新的个人助理,感兴趣的可在后台回复「彭萦助理」了解更多今天我做了什么改变投资自己是很多人总在说的事情,可是比投资自己时间更重要的是,投资自己的注意力。彭萦她是怎么追踪她的注意力的?又是如何控制她的注意力的?把注意力放在哪是错的?放在哪是对的?你们又有什么其它控制注意力的好方法?以下是改变自己会员对彭萦期语音《比钱贵的是时间,比时间还贵的是注意力,我是怎么把注意力投资在正确的事情上的?》的反馈。@会员 静静新成员:)第一次听到一万小时倒计时法~觉得很受用。会发现自己在专业领域花的时间远远不够,才会遇到许多力不从心的事。嗯,接下来开始尝试一万小时倒计时法~彭萦:哦?第一次听说一万小时倒计时?那读读我的这两篇文章吧。@会员 汤圆很受用,感恩!加入改变会,就是想成为更好的自己,一直以来都认为自己的专注注意力这块做得很差,经常想一心多用,一件事情正在进行的时候,想的往往是下一件事情,或者着手下一件事情,没有专注于当下,其实注意力不只会影响到当下,还会对一个人的生活,工作,时间,多方面都造成影响,而且影响根深蒂固。听了语音之后,我想改变下接下来每日的计划内容,每天给自己定三件事情,晚上回顾下有没有完成,借由提高自己的注意力和专注力,希望自己能每天自省和坚持!@会员 杨之薇有的时候,时间的合理控制就是你对今天的生命的延长,听了这篇分享之后,我对自己的目标控制在方法上有了些新的思路。在这周希望能用到工作上来。注册会员之后第一次听到语音分享~希望共同进步。彭萦:生命的延长,并不一定是增长生命的长度。多想想如何增长生命的宽度。限时福利(截止时间-10.16,本周日下午6点):现在加入会员,可以在周日晚上额外听到彭萦上一周的会员语音:《比钱贵的是时间,比时间还贵的是注意力,我是怎么把注意力投资在正确的事情上的?》
TA的最新馆藏
喜欢该文的人也喜欢最厉害的人类围棋选手也被电脑打败了。关于人工智能,这里有 38 个你可能感兴趣的事实_智能_好奇心日报
好奇心日报好奇驱动你的世界
84632最厉害的人类围棋选手也被电脑打败了。关于人工智能,这里有 38 个你可能感兴趣的事实龚方毅 周韶宏 唐云路 马若飞|
AlphaGo 战胜人类最好围棋选手,似曾相识的感觉
“以前柯洁和人类棋手下,始终显得很从容,但今天脸上充血,显得很紧张。”韩国围棋九段金庭贤说。
跟白皙的手臂相比,柯洁脸部涨的通红。图/Google
Google 黑板报整理了一段 22 秒的短视频,柯洁揪了自己 4 次头发,剩下时间单手抵住下巴或者扶额。解说嘉宾常昊表示柯洁揪头发是紧张的表现。
其它一些比如皱眉、咬手指、侧身坐、身子前倾等小动作和神情,频繁被摄像机镜头捕捉到。
“他(柯洁)以往在国内比赛,相对来说,他用的时间是比对手少。今天跟 AlphaGo 之间,他几乎多用了一个小时。”常昊说。
似乎所有人,都在期待柯洁有多紧张。
柯洁所处的对局室里只有寥寥数人,除了几家摄影媒体,还有 3 名工作人员、代替 AlphaGo 落子的黄士杰博士以及柯洁自己。整场比赛,黄士杰博士几乎面无表情地坐着,几乎匀速地执行 AlphaGo 计算出的最佳落子。
比赛进行到 4 小时 25 分钟时,柯洁输掉了比赛。
一年多前,AlphaGo 首战战胜李世乭,柯洁说“就算 AlphaGo 战胜了李世乭,但它赢不了我。”
输了比赛后,柯洁自陈 AlphaGo 越来越像围棋上帝,“我还是想和人类下棋,因为到未来,我们与 AlphaGo 的差距可能越来越大。”
这个画面似曾相识。
2016 年 1 月,AlphaGo 战胜欧洲冠军樊麾。
“AlphaGo 目前还没到与我谈论胜负的程度,对决结果将会是 5:0 或者 4:1。”李世乭在自己 AlphaGo 比赛的赛前记者招待会上报出出师表。他并不认为樊麾输给 AlphaGo 对自己起到什么威胁,在他看来,樊麾是业余棋手里的顶尖高手。
两个月后李世乭 1:4 输掉比赛。这位时年 33 岁的韩国围棋世界冠军如此评价 AlphaGo, “它(AlphaGo)可以始终保持心理平静和精神专注,就这方面而言,我觉得人类比不过它,尽管我还不大愿意承认,AlphaGo 在棋艺上胜过人类。”
AlphaGo 几乎不出错的落子让李世乭显得有些绝望。他正用手扶着额头。图/CNBC
同样的情况你也可以在国际象棋棋王卡斯帕罗夫 1997 年对战 IBM 深蓝时看到。
他没有考虑过自己会输给深蓝,之前还说过”
卡斯帕罗夫在 1999 年达到 2851 国际棋联国际等级分、2005 年退役。之后 8 年一直没人能超过他,直到 2013 年才由挪威人卡尔森打破记录。
但现在更多让人们记住、知道卡斯帕罗夫的事情,还是他在 1997 年输给国际象棋人工智能“更深的蓝”。
左边双手捧头的就是卡斯帕罗夫。图/Mashable
1997 年 5 月 11 日,国际象棋人工智能只用 19 步就战胜了卡斯帕罗夫。棋王这张双手捧头的照片成了他最广为流传的照片之一。
这次柯洁输的很少,但 AlphaGo 用的处理器功耗也只有去年的 1/10。下围棋,人被计算机超过,已经没有任何悬念。
关于 AlpaGo 和柯洁比赛本身的 7 个问题
1. 赛前,外界已经不对人类报什么希望
博彩网站预测给出 AlphaGo 获胜赔率 1.05、柯洁获胜赔率 8。也就是说买 100 元柯洁获胜,将能获得 800 元;买 100 元 AlphaGo 胜,能拿回 105元,只赚 5 块钱。
这和去年李世乭比赛前大不相同,当时还有很多人觉得人类能赢,包括人工智能专家。
“一年前我期待李世乭 3:2 或者 4:1 战胜 AlphaGo,我当时没预料它那么强大。今年的结果毫无疑问,AlphaGO 三场全胜。”曾带队制作跳棋和国际象棋程序的乔纳森·谢弗尔教授告诉《好奇心日报》。
2. 从围棋来看,柯洁是人脑的最后防线
如果说围棋是“人类智慧皇冠上的明珠”,那么这一次和 AlphaGo 对局的中国棋手柯洁九段无疑是最有资格守卫这份珍宝的人之一。
柯洁 1997 年出生,自幼学棋。2008 年取得初段段位,2014 年获得第二届百灵杯世界围棋公开赛冠军,成为中国大陆第 16 位围棋世界冠军,年仅 17 岁升九段。截至目前,柯洁共在以个人资格出赛的国际围棋比赛中取得 4 次冠军。
2016 年 3 月败于 AlphaGo 的韩国棋手李世乭九段比柯洁年长许多。李世乭 1983 年出生,至今在以个人资格出赛的国际围棋比赛中获得 18 次冠军。
柯洁出席赛前新闻发布会。左边是 DeepMind CEO Demis Hassabis,右边是 Alphabet 董事长 Eric Schmidt。图/Google
国际上有一个非常简单粗暴的办法评价围棋选手的实力:定级分。法国计算机专家,也是围棋人工智能程序 CrazyStone 的作者 Rémi Coulom 利用选手的历史成绩结合 Elo 算法,建立了一个给这些选手打分的网站 Go Ratings。因为世界上并没有一个统一的围棋国际组织,这个网站的分数在很多时候被引用作为围棋选手世界排名。
从 1991 年到 2006 年,韩国名将棋手李昌镐连续 16 年在 Go Ratings 排名第一,李世乭则从 2007 年到 2011 年连续五年排名第一,柯洁从 2015 年开始成为世界榜首。
但柯洁本人认为,Go Ratings 的评分并不科学,认为它没有公信力。
目前,在 Go Ratings 的排名上,柯洁、韩国棋手朴廷桓、中国棋手芈昱廷、韩国棋手申真谞、中国棋手连笑分列前五名。李世乭排名第 6。
在去年李世乭败给 AlphaGo 后,柯洁曾发微博称,自己能战胜 AlphaGo。他也曾多次在国际大赛赛前,公开表示自己对比赛的信心。历史上,国际个人大赛中,柯洁和李世乭共有 8 次对弈,大比分为 8 比 2,柯洁占有明显优势。
3. 之前柯洁已经输给了 Master,这次对弈的意义是什么?
2016 年 12 月 29 日至 2017 年 1 月 4 日,一个神秘的账号 Master 出现在中国大陆的围棋在线平台奕城围棋网和野狐围棋上。奕城围棋和野狐围棋是最热门的围棋对弈平台,包括柯洁、井山裕太、朴廷桓、芈昱廷、连笑、古力等等众多日韩三国众多的围棋冠军和高手都注册有账号。
但 Master 在快棋比赛中展现出了针对人类的绝对优势。Master 和全世界 60 位世界冠军、国内冠军,包括中国著名围棋大师聂卫平在内对局 60 场,规则定为每 30 秒下一步的快棋。这 60 场比赛无一例外全部获胜。
Master 背后就是 AlphaGo。
在和李世乭和柯洁的比赛中,AlphaGo 的算法表现出了非常稳定的性能,能够以很稳定的节奏,平均几分钟一步下完整盘,而作为人类的柯洁和李世乭都多次陷入“长考”,花费很长时间思考落子的位置。和限时数小时的正式比赛相比,快棋对于 AlphaGo 这样的机器来说优势显著。
当年深蓝战胜卡斯帕罗夫也是这样。1994年卡斯帕罗夫就在快棋比赛里输给过一次人工智能,但两年后他在不限时的正式比赛里赢了深蓝。
真正被认为人类战败,是 1997 年,升级版深蓝战胜卡斯帕罗夫。
换句话说,在正式比赛里打败柯洁,AlphaGo 才能说战胜最厉害的人类围棋棋手。
4. 柯洁自己觉得有希望么?
看上去是没有。
赛前深夜,柯洁在微博上发了一篇题为的短文。他在文中写道:“无论输赢,这都将是我与人工智能最后的三盘对局。因为现在的 AI 进步之快远超我们的想象。”
柯洁在去年李世乭与 AlphaGo 对阵中曾经发过这样一条微博:“就算阿法狗战胜了李世石,但它赢不了我。”那条微博被转发了三万次。
但是在今年赛前,柯洁写道:“我相信未来是属于人工智能的。”
去年年末与 Master 对战之后,柯洁深夜写道:“人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个人沾到围棋真理的边。”
但他也继续说棋手会结合计算机,迈进全新的领域,达到全新的境界,就像“新的风暴继续来袭”。
5. 机器,AlphaGo 和一年前有什么变化?
从比赛形式上看,柯洁和 AlphaGo 的三番棋对决和去年李世乭的比赛没什么差别——AlphaGo 调用云端的运算资源,一位工作人员和人类旗手对坐,负责摆出棋子。
不同的是这次比赛增加了团体赛,柯洁还会在 5 月 25 日和 5 月 27 日与 AlphaGo 再下两盘。在 5 月 26 日,数名中国顶尖职业围棋选手还会组成团队和 AlphaGo 进行两盘团体和配对比赛。
实际上这一次 Alpha Go AlphaGo 背后的计算能力。去年战胜李世乭时,AlphaGo 的程序需要依靠全世界 Google 很多机房提供计算能力。
而今天的 AlphaGo 的算力需求更小,它不再是分布式运算,整个程序仅运行在一个单一的云服务器 TPU 上。这是 Google 去年在开发者大会上发布的用于人工智能计算的单处理器计算机,全称是 Tensor processing unit。
从计算机消耗的能耗来看,去年李世乭相当于面对 10 台计算机打比赛。而今年柯洁的比赛是货真价实的一比一对抗,AlphaGo 的程序性能提升了至少 10 倍。
除了柯洁,这次还有两个人类群殴 AlphaGo 的比赛, 有什么意义?
这次的团队赛还分为两种:一种是人类组队对阵机器,第二种是,人和人工智能算法合作,对阵人类。
意义很明确:如果人工智能算法能够打败单个人类,那么用人类的集体智慧和写作文对应人工智能是否能赢?人+机器这样的组合,能不能产生更好的结果?
这样的比赛之前也有过。2005 年,Playchess.com 举行了一场“自由式”象棋大赛,参赛者可以任意和其他人或者电脑组队。通常情况下,象棋网站都会运用“反作弊”算法来防止参赛者用电脑程序作弊。
重赏之下,好几位特级大师都携多台电脑参加了比赛。一开始,结果不出预料。人和电脑组队,要远远胜过最强的电脑。“九头蛇”(Hydra)和“深蓝”一样,是一台专业象棋超级电脑,而面对棋力较强的人类选手和一台较弱的笔记本电脑的组合,它却败下阵来。人类的战略引导加上电脑精确的战术计算。
但更有意思的是,最后的赢家并不是“人+高配置电脑”的组合,而是两位美国业余选手和三台电脑的组合。
他们的技巧是通过干预和“教导”,让电脑们更深入地搜索可能的局面。这一策略不仅胜过了特级大师们对象棋的精深理解,也胜过了其它参赛者的超强计算能力。
“棋力较弱的人类+机器+优化的步骤”比强力的电脑本身技高一筹,也优于“棋力较强的人类+机器+较差的步骤”。
李世乭在赛后怎么看待自己的失败?
李世乭在去年 6 月的,赛前自己存在判断失误,低估了对手的水平:
“当时我看了它和樊麾的比赛,之后我觉得 AlphaGo 应该不是我的对手,比较确信我会赢。但是没想到,深度学习在六个月期间有这么大的进步。”
他说人类和机器对弈的时候,人是处在不利地位的。AlphaGo 始终如一,没有情绪波动,甚至也不会意识到下到第几局、整个场面是什么情况。
“我再也不想和 AlphaGo 比赛了。”李世乭说。
AlphaGo 具体是什么?它背后的公司在干什么?
8. AlphaGo 到底是什么?
AlphaGo 是一款围棋人工智能,Google 人工智能团队 DeepMind 创造了它。
DeepMind CEO 哈萨比斯今年 5 月 19 日接受 时表示,AlphaGo 是面向围棋这一“狭窄领域”的人工智能,简单说,虽然它能打败世界冠军,但 AlphaGo 也只能下棋。
9. AlphaGo 怎么学会下棋,提升棋艺的?
说起这个,“穷举”、“蒙特卡罗树算法”、“深度学习”等等一大堆术语经常出现,但没有这些基础也能看懂。
所谓 “深度学习”,是 AlphaGo 围棋训练的第一步,将人类棋谱输入计算机,学习人类的落子习惯。这种“识别”与人脸识别、图像分类等搜索技术类似。
第一步:把棋盘分拆成小块,输入数据。AlphaGo 会把输入系统的人类棋谱的每一步进行分拆,棋盘上每个落子以及随后的应对落子算作一个样本,AlphaGo 从这些人类棋局中分解出了三千多万个样本。
这些样本集合在一起,能够识别出每个特定的落子之后,哪一种应对方法的概率最高,这个最高的概率其实就是人类棋手最喜欢的应对方法。
虽然说围棋“千古无同局”,但是局部来看还是有很多相似的模式反复出现,AlphaGo 就学会了这些最受欢迎的下法。
AlphaGo 的蒙特卡罗树搜索。图片来自 Nature
第二步:乱下棋,不过比纯粹乱下要好一点。
AlphaGo 的思考结合了蒙特卡罗树搜索。
假设一个从来都没下过围棋的人,用了分身术分成两个人开始在棋盘上乱下,最终这盘棋也会分出个胜负。
第二盘,上一盘赢的那个分身不再完全是乱下了,开始使用赢的那一盘中的一些对应,第三盘棋,第二盘赢的那个分身开始使用第一盘和第二盘中的对应。当第 N 盘棋下完之后,这个始终赢棋的分身就会获得最有可能获胜的落子方法。
以上这 N 盘棋就是一步使用蒙特卡罗树搜索的思考过程,思考结束后的下一个落子,就是被是推演过次数最多,获胜概率最高的那一步。
AlphaGo 团队还改进了以上这种传统的蒙特卡罗树搜索算法。
上面我们说过的深度神经网络得出了一套人类棋手概率最高的下法,假设蒙特卡罗树搜索故事中那个完全不会下棋的人学习了这套下法,那么之后的“乱下”思考过程的起点就会提高很多。这样一来,蒙特卡罗树算法的计算量就减少很多,提高了效率。
第三步:AlphaGo 自己和自己下棋,来学习棋局。围棋毕竟变化太多,AlphaGo 需要更多的棋局来学习,于是通过自我对弈产生新的棋局。
AlphaGo 自己和自己下棋,棋力的来源就是第一步通过学习人类棋局得到的落子方法。AlphaGo 左右互搏,自我对弈几万盘,就能总结出赢棋概率更高的新下法,接下来再用新下法自我对弈几万盘,以此类推,最终得到了一套棋力比最初只学习人类下法厉害很多的新策略。
那用这新的策略和蒙特卡罗树搜索结合是不是更厉害呢?答案却是否。
因为使用概率来训练的这种策略会让下法高度集中,变化太少,而蒙特卡罗树搜索需要更多的变化才更有效。
AlphaGo 在与樊麾对决时的局面评估。图片来自 Nature
第四步:局面评估。
这也是 AlphaGo 最厉害的地方是,它可以像人类一样在比赛过程中估计局面的优劣,这样才有第四局它判断获胜几率太小,选择中盘认输。
当一盘棋开始的时候,AlphaGo 先用第一步训练的下法下若干步,然后乱下一步,接着用第三步自我对弈训练产生的更厉害的下法下完整盘棋,然后对结果做一个评估,评估出“乱下”的那步棋造成的局面是好是坏。
AlphaGo 可以在一步的思考中乱下很多次,总有一次能匹配到真实对下棋的状况。而对这一步乱下以及后续结果的评估,就是对当前局面的判断。
10. 对弈柯洁的 AlphaGo,有着怎样的计算能力?
上一次战胜李世乭的 AlphaGo,根据 Deepmind 的说法,是一部运行在云端,由全世界的 Google 机房协作运算的人工智能。5 月 23 日 AlphaGo 战胜柯洁之后,Deepmind 老大哈撒比斯说明,这一次 AlphaGo 是全新的版本,不再使用分布式计算的方案,调用的计算能力只有李世乭版本的十分之一。
具体来说,这一次的 AlphaGo 只用了一个 Google TPU 的计算能力。
Google TPU 是 Google 去年首次发布的用于人工智能运算的专用硬件,全称 Tensor Processing Unit,中文可以翻译成张量处理单元,是一个饭盒大小的专用硬件。在人工智能研究里,包括 Google 在内都在大量使用通用处理器 CPU 和图形处理器 GPU 进行运算。比如曾经公布过的一个版本的 AlphaGo,使用了 1920 个 CPU 和 280 个 GPU,取得了 Go Ratings 网站的 3168 等级分,世界第一柯洁的等级分为 3625。
TPU 这种专用硬件的效率比 CPU 加 GPU 快很多。
上周的 Google I/O 大会上,Google 宣布了 TPU 2.0,它具有四个专用芯片,每秒可处理 180 万亿次浮点运算。64 个 TPU 可以拼在一起组成 TPU Pod,可提供大约 11500 万亿次浮点运算能力。Google 同时公布了一个数字,说 Google 的大型翻译模型如果在 32 块性能最好的 GPU 上训练需要一整天,而 8 块 TPU 就可以在 6 个小时内完成同样的任务。
2017 年底,Google 就会把 TPU 计算服务变成云服务,全世界的人工智能研究者都可以租用这种云服务,帮助加速人工智能研究。和亚马逊等公司提供的,基于 CPU 和 GPU 的人工智能云服务相比,Google 的 TPU 更有效率优势,从成本上来讲,也更便宜。
11. DeepMind 公司有什么来头?
、总部位于英国伦敦的初创公司,主要研究人工智能。2014 年 Google 以 4 亿英镑(约合 6.6 亿美元)的价格打败 Facebook,买下 DeepMind。这笔交易金额可以排进 2014 年全球初创公司收购金额前十。
公司创始人哈萨比斯曾有过数次创业经历,最后为了创造一个通用的、真正能思考的人工智能,创办 DeepMind。
12. 今天 DeepMind 在 Google 承担着什么角色?
DeepMind 的研究围绕人工智能展开。2016 年 7 月前后,Google 用 DeepMind AlphaGo 的,预测 Google 内部 120 个数据中心和连带冷却风扇的各个时段用电量,然后分配能源,达到控制冷却系统和计算机服务器的耗电量的目的。
现在 DeepMind 的办公室还在距离伦敦国王十字车站约 2 公里的一处办公楼里,那里已经聚集 400 多位计算机和神经科学家。。
13. 除了 DeepMind 之外,Google 还收购了什么人工智能公司?
2014 年收购英国 DeepMind 公司不是个例,Google 在最近 5 年间投资收购了不少人工智能公司,例如 api.ai、Timeful、Kaggle 等等。
从 2013 年开始到现在,Google 已经收购了 16 家人工智能公司了。可以说是各大科技公司里收购最多、布局最早的。
主要是来自策略的转变。Google CEO 桑达·皮蔡在 2016 年 5 月宣布将公司从“移动为先”的策略转变成“人工智能为先”(AI First)。根据 Google 员工的说法,他们已经在公司的每一个产品上都应用了机器学习的算法。
Google 买下的公司主要用于拓展现有业务。比如 2013 年 Google 收购了聚焦于深度学习和神经网络的初创企业 DNNresearch,用于帮助提升图像搜索功能。
它也收购了像 Deepmind 这样本身发展成熟的团队,收购后依然保持独立运营。今年,Google 主要收购了一家做视觉搜索的初创公司 Moodstock,以及语音识别开放平台 Api.ai。
AlphaGo 打败人类了,之后它要做什么?
14. AlphaGo 对 Google 有什么影响?
去年 2 月,AlphaGo 在围棋上打败李世乭的消息,让不少人开始关注人工智能。
而也是在这次比赛之后,Google 制定“人工智能为先”的策略,今年 5 月举行的开发者大会上皮蔡再次强调这一点,现场还做了不少人工智能都能做什么的演示,例如这样的用语音控制的调酒机:
AlphaGo 之后还要打更多游戏么?
更多的比赛只有营销价值。围棋就是终极比赛,是人脑在公平游戏里的最后防线。
这是因为围棋棋盘一共有 361 个落子点,围棋每一步的可能性都是天文数字,靠计算机穷举原理上就是不可能的。其它游戏的限制少很多,人工智能更有机会依靠穷举法取得比赛胜利。
对于把下棋当作人工智能测试平台的研究者来说,1997 年 IBM 超级计算机“深蓝”(Deep Blue)在战胜国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)之后,围棋就一直是最大的挑战。
之前有报道称 AlphaGo 要和人类选手比赛《星际争霸 2》,你能想象人类和计算机比操控单位的速度么?
那 DeepMind 接下来要干什么?
在医疗领域,DeepMind 已经有所建树,他们跟伦敦皇家免费医院(Royal Free London)签订一纸为期五年的,处理后者 170 万条患者记录。
DeepMind 的第一项医疗研究是帮助医生诊断眼部疾病,2016 年 7 月,他们宣布了与的最新合作项目,与伦敦摩菲眼科医院一起,让人工智能帮助医生诊断,预防眼部疾病。
这个长达五年的研究项目将利用摩菲眼科医院超过百万的患者数据库,让人工智能学会“看”眼部扫描。简单来说就是让人工智能把这些扫描结果全部“看”一遍,从而训练出能够发现病变征兆的模型。
DeepMind 还被运用在了 Google 的数据中心:帮 Google 省电费。它被用来预测 Google 内部 120 个数据中心和连带冷却风扇的各个时段用电量,然后分配能源。据称,现在整套算法能将 Google 的能源利用提高 15%。
DeepMind 还和哈佛一起研究了读唇语的软件,他们研发的这个唇语阅读软件 LipNet 准确率高达 93.4%。这个准确率远高于此前研发出来的其他唇语设备。
去年 11 月,DeepMind 宣布将与暴雪娱乐合作,让人工智能学会玩《星际争霸 II》游戏,因为与棋类比起来,《星际争霸》更能模拟真实世界的混乱状况。
对于 DeepMind 来说,无论是让人工智能学会围棋还是打游戏,目的都是研发“通用型人工智能”,DeepMind 创始人哈萨比斯去年在剑桥大学的一场演讲中表示:“我们的首要使命便是解决人工智能问题;一旦这个问题解决了,理论上任何问题都可以被解决。这就是我们的两大使命了。”
今年 3 月,省电这件事被 DeepMind 用到了公司之外,他们与英国国家电网公司讨论,计划用人工智能技术帮助英国节省 10%的用电量。
打赢柯洁不等于人工智能有智力
人工智能真的会下围棋么?这得看你怎么理解下棋这回事
这个看上去有点明显的问题,可以套用在很多东西上。人工智能是不是真的懂 365 种语言?人工智能是不是真的会写诗?
哲学家 John R. Searle 在 1980 年(一段人工智能很热的时期)提出过一个关于人工智能的思维游戏,叫“中文屋子”。
游戏假设人工智能的研究已经可以成功造出一台表现起来懂中文的电脑。它能输入中文,然后在电脑程序的指导下输出一个个中文字符。这台电脑执行起任务来叫人如此信服,能轻松通过图灵测试:让一个讲中文的人以为电脑程序也是一个懂中文的人,对所有中文提问它都能给出合适的回答,因而会有人相信他们正在和一个懂中文的人聊天。
所以本质上说,即使人工智能靠模仿骗过人类,但它对问题仍然没有任何理解,因此不具备真正的智能。
通过图灵测试,也不等于人工智能有智力
计算机科学之父在 1950 年首次提出了这个关于机器人是否可以思考的著名实验:人类测试员在不知情的情况下面对计算机,用文字和其交谈,如果计算机成功欺骗了测试人员假装成一个真实的人类,那么该计算机便被证实“会思考”。
后来英国皇家学会将图灵的标准具体化:在一系列时长为 5 分钟的键盘对话中,只要计算机被误认为是人类的比例超过 30%,那么这台计算机就被认为通过了图灵测试。
一年一度的
比赛便以此标准,这个大赛也早就出现了“通过测试”的机器人,比如 2011 年的 Cleverbot 程序达到 。
2014 年还出现过这样的新闻标题《俄罗斯团队开发人工智能机器人,首次通过图灵测试。》这台名为 Eugene Goostman 的计算机被描述为“把自己伪装成骗过了超过 30% 的评测人员。”
Eugene Goostman 的,这个所谓机器人就是单纯地为了通过这个 5 分钟测试而设计的,编写者还颇有心机地把它设定成一个 13 岁的非英语母语的小孩,以便在很多问题无法回答或者出现错误的时候,让裁判误以为这是因为他年龄小而产生的语无伦次。也就是说,Goostman
既不是“第一个通过测试”的程序,也不是一台人工智能机器人。
话说,想让计算机蒙混过关并不复杂,这里还有 ,有兴趣的话可以看看。
很显然人类也没有创造出像人脑一样的计算机
今天大小科技公司都在,而神经网络计算则是说明自己技术前沿的最佳例证。当它的原理被市场部们几经简化之后,已经变成“”。
但是 1980 年就已经出现的神经网络计算和人脑只有极为模糊的联系。一个大问题是科学家目前根本不知道人脑里那张由无数神经元突触组成的网络究竟是怎么“计算”的。
正如伯克利大学人工智能与机器学习专家:“我们完全不知道大脑是怎样存储信息和运作的,这里头的规则是什么?是什么算法?因此我们现在还不能说用大脑的理论去指导人工智能系统。”
Google(Alphabet)董事长施密特也说:“我们不认为让计算机模仿大脑可以去做人工智能,我觉得这个太复杂,大脑的神经元太多了,计算机只是借助了人类大脑的一些概念。”
人工智能也还不会自我繁殖并进化
自我繁殖,并且在这个过程里进化,是生命的重要一步。但这还没实现。
现代计算机创始人之一(John von Neumann)在 1940 年代就提出了的概念。冯·诺伊曼认为,任何能够自我繁殖的系统,都应该同时具有两个基本功能:第一,它必须能够构建某一个元素,并且用这些元素组装和自己一样的下一代;第二,它必须能够把对自身的描述传递给下一代。
现代计算机创始人之一(John von Neumann)。图/Wiki
曾经有人依据这个理论提出了一个名叫的项目,给这个机器人安装高温熔炉,让它在沙漠里获取原料和能量。不过这个项目最终连概念图都没有实现。
直接上传思维和记忆也还不可能,因为我们还不知道大脑是怎么运作的
这也是影视作品中的经典设定,比如里,德普饰演的科学家把自己的意识“上传”到云端,继而成为了不死的虚拟人。英剧《黑镜》也有人死后把意识存放在云端“天堂”从而永生的故事。
但现在还没有任何人有办法移植记忆,原因在于没人知道大脑。事实上,就连记忆存在大脑的什么地方都是未解之谜,更别提什么保存记忆了。
或者让我们更(笨拙地)哲学一点,到底什么才算是“记忆”?你记得的那些,还是你认为你记得的那些?
就算人工智能没有真正的智力,也不代表它就不会抢走人的工作
这几年,人工智能“学会”了不少人的技能
美国的第四大通信运营商 Sprint 从去年 1 月份大刀阔斧地裁撤了 2500 名电话接线客服人员,取而代之的是能自动为客户提供咨询服务的 app 工具。
处理保险理赔。日本富国生命保险相互公司从今年 1 月开始,用“IBM Watson Explorer” 取代原本公司的 34 名理赔人员,他们过去的工作主要是查阅投保人的就医记录等文件来确定理赔钱数,定损并且处理相关手续,人工智能可以提高 30% 的工作效率。
资产管理,选股票。管理 5.1 万亿美元资产的全球最大投资管理公司贝莱德也在更多建立自动化流程,用人工智能来选购股票,并裁减了 30 多名分析师和基金经理——占所在部门总人数的 7% 左右。
全球最大的新闻通讯社——美联社平台上大多涉及数字的财经报道是与人工智能合作完成的。腾讯也推出过写财经和体育新闻的机器人。
人工智能领域的专家 Roland Meertens 通过自己训练的算法将 1998 年 由 Game Boy 外置摄像头所拍摄的渣画质照片修复成了彩色并且像素更高的图片。
处理和筛选照片。Google Photos 会给你的照片自动归类、添加滤镜、制作相册。
Google 甚至用人工智能画了抽象画,卖出了一万美元的价格。
。Google Translate 已经全面引入图像识别,把镜头对准不认识的文字,它会自动翻译成目标语言。Google 表示他们的神经机器翻译系统(GNMT) 能降低 80% 的翻译错误率,并且十分接近人类译员的翻译水平。
驾车。特斯拉、各大车厂推出的辅助驾驶系统,实际上相当于一个机器人在帮你开车。Google 的完全自动驾驶也做到了全程无人。
一个叫 Benjamin 的人工智能写了一段科幻短片,还被拍了出来参加伦敦科幻电影节的 48 小时短片制作挑战赛。
机器可能不会真的学习,但很多人还不如机器
日本国立情报研究所(NII)于 2011 年发起了“”(Todai Robot Project)。自 2013 年以来,团队每年都让机器人在真实的考场接受演练。
在去年的中心考试(日本大学招生的统一考试)中,Todai 机器人排名在前 20%, 达到了超过 60% 的大学的入学标准。团队的目标是,2020 年以前能让 Todai 机器人考进东京大学。
Todai Robot 的考试技能依靠于 AI 的检索和优化能力。
有趣的是,机器不会理解题目的真实内涵。
问题是,很多人类考生也好不到哪里去。大部分学生都还停留在死记硬背的水平,像 AI 一样不能理解、不会或者根本不仔细阅读。
实际工作中,只会照着公司做好的流程处理问题的人并不少见。比如有的电话客服人员就只会跟着公司预先设置的 QA 回答。
同样并不理解自己学习的技能,计算机快无数倍,还完全不会违规。人被抢走工作也是理所应当的了。
机器已经抢走了不少工作
美国最大的经济研究机构——全国经济研究所(NBER,全美超过一半的诺奖经济学得主都曾是该机构的成员),全面分析了 1990 到 2007 年的劳动力市场情况主要针对蓝领工作。
他们发现,每增加一个机器人,意味着要干掉 3 - 5.6 个本地岗位。同时薪资水平也受到影响,在 1000 名工人中每增加 1 个机器人,所有人的平均薪资将降低 0.25 - 0.5 个百分点。这也意味着当 1000 人运作的生产线上出现 20 个机器人时,留下来的工人的平均收入就会降低 5 - 10%。
这份报告针对的是自动化机器人,和 AlphaGo 这种人工智能相比还很初级。
哪些类型的工作会被人工智能取代?
认为今天人类 50% 的工作活动将在 2055 年被自动化,因为各种影响因素和经济状况的不确定性,这个时间可能会早 20 年,也可能会晚 20 年。
调查涵盖了美国 800 多种工作岗位的 2000 多种工作,认为当这些工作岗位涉及收集数据、处理数据、以及可预测环境下的体力劳动这些活动最有可能被机器取代,这些岗位需要为员工提供的工资约为 2.7 万亿美元,它们在制造业、住宿和食品服务、零售领域最为普遍。
花旗银行全球视角及解决方案部门曾发布一份报告称,欧美银行预计在
这十年间将会裁员 30%,数量最多将达到 170 万人,约相当于 6 个冰岛的人口,这其中,最重要的影响因素就是 Fintech(金融科技),互联网技术将越来越多地取代银行的中介作用,消费者直接和机器互动的时间会越来越多。
投资机构,接下来 20 年美国会有 7600 万个工作岗位因为 AI 而消失,这个数字是奥巴马执政 8 年创造的工作岗位数量的 10 倍。英格兰银行估计,48% 的人类工作都将会被机器人和算法取代。
为什么非要下棋?AlphaGo 获胜又会如何影响围棋?
26. 跳棋、国际象棋、围棋……为什么棋总被当作人工智能的发展标志?
加拿大阿尔伯塔大学的教授乔纳森·谢弗在早先接受《好奇心日报》采访时表示:因为规则是固定的,每步棋子可能性是有限的,下棋的能力有分数可以评估,还有人类的对手可以和程序对垒……所以研究人工智能的先锋们总是把棋牌游戏当做是人工智能测试的最完美方式。
谢弗带领的团队曾经写出了跳棋程序 Chinook,在 1995 年打败人类冠军。
27. 这些棋类是怎样一个一个被打败的?
跳棋:1992 年,跳棋程序 Chinook 挑战跳棋高手马里恩·廷斯利(Marion Tinsley),战败。1995 年,Chinook 再次挑战,6 局平手,之后廷斯利因病退赛,Chinook 最终取得了冠军。现在 Chinook 已经不会输(跳棋容易平局)。
国际象棋:卡斯帕罗夫 1985 年连续跟 32 台电脑下棋并取得胜利、1996 年 4:2 战胜深蓝,但在 1997 年,卡斯帕罗夫 2.5:3.5 败给深蓝。
围棋:AlphaGo 在 2015 年 5:0 战胜樊麾;2016 年 3 月以 3:1 战胜李世乭;2017 年 5 月,暂时 1:0 领先柯洁。
28. AlphaGo 的进化看上去更快?
确实如此。
可以参考国际象棋比赛里,人工智能和象棋大师卡斯帕罗夫的对弈。
卡斯帕罗夫不只是世界冠军,他在很长一段时间被认为是人类历史上最厉害的棋手。
即便在卡斯帕罗夫退役后,他的定级分也等了 8 年才被目前的世界冠军,挪威棋手芒努斯·卡尔森(Magnus Carlsen)超过——而早已变成政治运动家的卡斯帕罗夫从 2009 年就开始帮着培训卡尔森。
1989:深思 vs. 卡斯帕罗夫
台湾学生许峰雄(Feng-Hsuing Hsu),写了一个象棋程序深思(Deep Thought),由此开始了一个惯例,即在程序前加个前缀“deep”来表示它运行在并行处理器上。比赛中,电脑根本不是对手。
1994:Fritz, Genius 在快棋赛 vs. 卡斯帕罗夫
1994 年上半年,英特尔在慕尼黑组织了可能是史上最强的闪电战大赛,有 17 名特级大师参加。Fritz 最后和卡斯帕罗夫并列第一。在复赛中,卡斯帕罗夫 4:1 大胜。
英国人 Richard Lang 编写的程序 Geniu 举行的英特尔职业国际象棋联合会拉力赛中战胜卡斯帕罗夫,并把他淘汰出局。不过那是 25 分钟的快棋赛。
1996:深蓝 VS 卡斯帕罗夫
许峰雄加入 IBM,和协作程序员莫雷·坎贝尔(Murray Campbell)开发深蓝。首局深蓝获胜,但之后卡斯帕罗夫两和、三胜打败深蓝。
1997 深蓝 vs帕罗夫 
1997 年版本的深蓝运算速度为每秒 2 亿步棋,是其 1996 年版本的 2 倍。1997 年 6 月,深蓝在世界超级电脑中排名第 259 位。一个说法是,深蓝可搜索及估计随后的 12 步棋,而一名人类象棋好手大约可估计随后的 10 步棋。
最后卡斯帕罗夫以 1 胜、2 负、3 和,总比分 2.5:3.5 输掉了比赛。再之后,就没有人类象棋冠军能在正式规则比赛中打赢人工智能。
AlphaGo 会改变围棋选手的训练方法
在国际象棋领域,卡斯帕罗夫被深蓝战胜之后一样,一个人机对战的时代结束了,一个人与电脑一起探索棋力的时代开始了。
人工智能的胜利,并不意味着这门游戏的终结,它帮助提升了棋手的水平,廉价、智能的国际象棋软件也吸引到了更多的人来参与这项运动。
卡斯帕罗夫之后,国际象棋界仍然有明星诞生,克拉姆尼克、阿南德和近年最耀眼的卡尔森,都是普通人可能听说过的名字。
十多年来,提供计算机和大量数据分析,已经成为国际象棋顶级赛事的常规服务,顶级国际象棋选手也越来越多借助超级电脑制定竞赛计划。前国际象棋世界冠军阿南德曾表示:“电脑对于提高(国际象棋)水平有很大帮助。”
尤其是用电脑进行开局的准备。国际象棋特级大师王皓告诉《好奇心日报》,他们平时都会依靠软件训练,比赛结束之后也会用计算机分析棋局。
2014 年,23 岁的挪威人马格努斯·卡尔森卫冕国际象棋之后,《金融时报》发表了一篇题为《卡尔森:战胜电脑的国象大师》的文章,这并不是说那场赛事有计算机选手参赛,而是说卡尔森的对手们都习惯用超级计算机来计算开局,卡尔森则不像他的对手们那样依赖计算机分析。卡尔森的做法,已经成了特例。
在深蓝战胜人类国际象棋大师之后的十几年后,不使用计算机的人类棋手成为了罕见的特例。但是卡尔森也曾接受过人工智能的训练,他也被认为是所有人类棋手中最接近电脑的棋手。
可以想象,围棋的未来也会是类似的方向。
去年年末与 Master 对战之后,柯洁深夜写道:“人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个人沾到围棋真理的边。”
但他也继续说棋手会结合计算机,迈进全新的领域,达到全新的境界,就像“新的风暴继续来袭”。
围棋,应该也不会例外。只是未来不会再有超越电脑的围棋大师,只会有最接近电脑的棋手。
人工智能历史很久,但最近突然热了起来
人工智能可以往前追溯到神话,但它真正接近我们是从电子计算机开始的
1950 年代的黑客马文·明斯基被普遍认为是人工智能之父,他在去年年初去世。。
另一位从如何看待“思考”考虑人工智能的先驱则是计算机之父阿兰·图灵。1950 年,图灵写了一份关于机器思考的论文,叫做“机器会思考吗?”,里面提到了一个测试机器是否有“感觉”的方法,简单来说就是让人透过屏幕跟机器聊天,看看能否判断屏幕背后的是真人还是机器,这个方法后来被称作是“图灵测试”。
他的图灵测试是多年来人工智能研究者的目标,2015 年,首次人工智能算法通过了图灵测试。
话说回来,图灵还是世界上第一个象棋计算机程序的创作者。不过当时他的程序没有计算机有足够的计算能力去执行,每下一步棋需要 30 分钟。
人工智能研究经历过两次高潮和低谷
人工智能研究在高潮和低谷之间不断交替。
第一次低谷出现在
年,这时候人工智能研究开始遭遇批评,随之而来研究所缺少资金支持。批评主要集中在,研究者们过于乐观,承诺无法兑现。美国英国政府这期间停止向没有明确目标的人工智能研究项目拨款。
年这一轮低谷主要在于人工智能商业化的失败。受到日本政府研究规划的刺激,美国政府和企业再次在人工智能领域投入数十亿美元的研究经费,但到了 80 年代末他们重新撤回了投资。一个征兆在于,1987 年的硬件市场需求下跌同时 XCON 等最初大获成功的专家系统维护费用居高不下。
到了 80 年代晚期,战略计算促进会决定大幅削减对人工智能的资助,认为人工智能不是“下一个浪潮”。到 1991 年,人们发现十年前日本宏伟的“第五代工程”也并没有实现。
近 5 年的人工智能发展可能是史上最快的
据彭博社,2015 年是 AI 的,Google 内部应用 AI 的项目从 2012 年的“零星几个”扩展到 2700 个。
2016 年,超过 30 个公司说要做自动驾驶。由于数据和人才的关系,人工智能是一个大公司占优的关系。但行业内的大公司都在积极收购。根据
,过去两年时间收购人工智能公司最多的是 Google,买了 9 家公司,包括 AlphaGo。接着是苹果买了 5 家人工智能创业公司,以及同样买了 4 家人工智能公司的英特尔和 Twitter。
2012 年到 2015 年,在代表计算机智能图像识别最前沿发展水平的 ImageNet 竞赛(ILSVRC)中,参赛的人工智能算法在识别准确率上突飞猛进。 2014 年,在识别图片中的人、动物、车辆或其他常见对象时,基于深度学习的计算机程序超过了普通人类的肉眼识别准确率。
这次热,背后有实际的应用驱动
这一次浪潮背后, 是机器学习在商业产品上的应用,现在它可以解决实际问题了。Google 工程师杰夫·迪恩(Jeff Dean)说:“我认为在过去 5 年,最重大的突破应该是对于深度学习的使用。这项技术目前已经成功地被应用到许许多多的场景中,从语音识别到图像识别,再到语言理解。而且有意思的是,目前我们还没有看到有什么是深度学习做不了的。希望在未来我们能看到更多更有影响力的技术。”
实际上最积极推动人工智能的公司,已经把 AI 放进可用的产品之中、解决各种日常问题了。Google 不仅要知道你搜索过什么,还能看懂你上传的图片内容。亚马逊用人工智能帮助推荐商品、调整定价。整个 Facebook 上,用户看到什么信息也都是由人工智能决定。这些看上去突然对人工智能热衷起来的公司,已经投入了多年研发。
关于 AlphaGo,经常提到深度学习,这是什么?
在今年的 Google I/O 开发者大会上,Google 公司的 CEO 桑达·皮蔡解释了未来战略:“我们将会在人工智能和机器学习上加大赌注。”“因为深度学习的优势,我们现在可以让图片、视频变得更有用了。”
这样的发言不少,很多科技公司都会声称自己进入了人工智能领域,靠深度学习。
传统程序是根据事件条件,给出结果。“机器学习”的定义是不用明确编写程序,就能让计算机学习——让机器大量接触数据,自己从中找到规律,改进判断。而深度学习则是机器学习里最热门的分支,被认为推动了这次人工智能跃进。
“深度学习就是一种人工智能学习技术,通过把大量数据‘喂’进系统,尝试自己建立模型,通过模型自己做决定,就像我们现在认为的人类大脑工作的原理那样。”英国阿尔斯特大学计算机科学教授、IEEE 安全技术专家,专门研究计算机网络和系统凯文·科伦(Kevin Curran)在早先的采访中这么对《好奇心日报》解释深度学习是什么。
具体到 AlphaGo 身上。深度学习是通过审视记忆来做出决定的,因为 AlphaGo 已经看过那么多的例子,接下来深度神经网络中会自动权衡重要性然后进一步做出决定。
所以说,深度学习是通过审视记忆来做出决定的,因为 AlphaGo 已经看过那么多的例子,接下来深度神经网络中会自动权衡重要性然后进一步做出决定。
之前开发跳棋应用打败所有人类的计算机教授乔纳森·谢弗用地图来解释深度学习的工作方式:
你可以把它想象成一个带有点和连接的网络吧。就像一个地图一样,我们假设城市是点,然后连接是路。
我们来假设这地图上的连接会动态变化。例如,本来从 A 到 B 点只需要走 10 分钟,但现在看着这条路的实时路况,系统自动调整了时间,例如上下班高峰期 13 分钟,其他时间 9 分钟。这就是一个学习的例子。更进一步说,这个网络还可以建新的路,所以 A 和 B 之间的最佳路径还可能会改变。
对应到 AlphaGo 上,每一个“城市”就是一个知识点,他们之间连接的“路”就是知识与知识之间的连接。想象使用一个地图在城市中导航,每个城市的计算价值,是连接它的路数量的总和。同样的,一个知识点的价值,也依赖于它的连接情况。
当我们看纸质地图的时候,这个地图是二维的。然后想想两张地图叠在一起,在地图上不同的连接也交织着。AlphaGo 使用的是十三层的网络,所以也能让不同的知识点有更多连接的可能。
在一场围棋比赛中的特定时刻,有些知识点会使用,而另一些则不会。就像是你能去某一些城市,另外一些则禁止你入境一样。知道这些信息,会改变“城市点”的连接情况,更会改变这个城市的连接价值——这也就是每一个棋步的来源。
人工智能引起的争议不少,也没有一边倒的定论
人工智能显然会抢走工作,但它会创造新的么?
一方面,人工智能取代人类就业的。
网景创始人、著名风险投资人,“就像今天我们大多数人都从事着 100 年前不存在的工作一样,100 年后也会是如此。”
目前来看人类的某些技能机器很难复制,比如常识、适应性和创造力。麻省理工学院的经济学家 David Autor 说,“即使是实现了自动化的工作岗位,常常也需要人工的参与,比如自动化麻醉设备旁边,就需要有医生值守协助操作。”
再比如用机器人为新闻媒体写稿,这并没有导致记者数量的减少。人工智能写的只是需要速度但不需要深入分析的东西,比如体育比赛结果快讯、以及不那么模板一致的公司财报快讯。它们做了许多人没有精力做的工作,让有经验的记者去写更有价值的报道。
但如果没有经历低价值的“笨工作”的训练,刚走出学校的人又有多少能一下获得经验、找到一个不能被人工智能替代的高级工作呢?
如果人工智能真的抢了工作,人们的生活方式会发生怎样的变化?
未来学家马丁·福特(Martin Ford)在今年的 TED 大会做了一场演讲,为我们描述了一个人工智能主导社会生产的社会。
从积极的一面来看,人们有了更多的时间休闲,有更多时间来陪伴家人,这似乎是我们现在努力追求的东西,但是问题也出现了。
未来或许人类可以接受没有工作,或者只领少许的薪水,但是这一切都会给社会造成经济压力,因为人类没有有工作、或者只拥有少量收入,消费能力就就会减弱,从现有的社会经济制度来看,社会产品和通货紧缩,容易造成社会动荡。
福特认为,我们必须在传统的工作中找到分离收入的办法,在他看来,最好的解决方案是从保证最低收入开始,这么做很可能会变得必不可少。
但是需要在基本工资的基础上增加“奖励机制”,鼓励那些没有工作的人去完成教育、参加社区服务,因此获得更多的奖励薪资。更重要的是,人们要知道如何在不需要工作的社会里还能找到生活的意义和满足感。
而这一切都需要社会的机制、体系进行改革和重塑,不会是件容易事。
福特的观点可以看他的畅销书。
悲观主义者包括霍金、马斯克还有比尔·盖茨,他们相信无节制发展人工智能可能导致人类的毁灭
这三位都在最近表示过对人工智能的担忧。
史提芬·霍金:“我们已经拥有原始形式的人工智能,而且已经证明非常有用。但我认为人工智能的完全发展会导致人类的终结。”
埃隆·马斯克:“我们需要万分警惕人工智能,它们比核武器更加危险。”
比尔·盖茨:“如果我们处理得好,人工智能具有积极意义……我同意伊隆·马斯克和其他一些人的说法,不明白为什么有些人并不关心。”
去年 4 月,马斯克和美国初创公司孵化机构 Y Combinator 成立了一个非营利组织 OpenAI,准备筹集 10 亿美元的资金,去对抗人工智能可能会带来的问题。
去年 9 月,亚马逊、Facebook、Google、IBM 和微软五家公司在去年 9 月联合发起人工智能联盟 Partnership on AI,旨在努力减轻公众对于正在学习自主思考的机器的恐慌。基于这五个巨头的共识,这一行业联合组织制定了一系列用于工程开发和科学研究的基本道德标准。
就连机器人是不是应该决定人类生死,今天都还没有定论
科幻小说家阿西莫夫在 1942 提出了著名的“”:机器人不得伤害人类,或因不作为使人类受到伤害;除非违背第一法则,机器人必须服从人类的命令;在不违背第一及第二法则下,机器人必须保护自己。
但这只是阿西莫夫的设想,不是各国军队的共识。事实上机器可以轻而易举地决定人类的生死。目前在全球已经有超过 30 个国家配备了“致命性自主武器系统”,未来战争的一些区域可能是人工智能在自主决定是否射杀屏幕上出现的运动物体。
美国国防部让无人机自己判断地面上谁是需要被消灭的敌人。
从军队角度,人工智能决定生死有诸多好处,比如它效率更高、几乎一定比人更准确,并且杀人不会有负罪感和战后创伤。这引起巨大争议。2013 年 5 月,由它引发的道义、伦理、人权问题首次被提到联合国人权理事会。但这并不是一场一边倒的争论,阿西莫夫的三定律不一定是我们将会面对的未来。
用 MIT 斯隆商学院研究员 Michael Schrage 的话说,“如果库布里克再拍《奇爱博士》,他会拍这些自动化的武器。”
AlphaGo 战胜人类最好围棋选手,似曾相识的感觉
“以前柯洁和人类棋手下,始终显得很从容,但今天脸上充血,显得很紧张。”韩国围棋九段金庭贤说。
跟白皙的手臂相比,柯洁脸部涨的通红。图/Google
Google 黑板报整理了一段 22 秒的短视频,柯洁揪了自己 4 次头发,剩下时间单手抵住下巴或者扶额。解说嘉宾常昊表示柯洁揪头发是紧张的表现。
其它一些比如皱眉、咬手指、侧身坐、身子前倾等小动作和神情,频繁被摄像机镜头捕捉到。
“他(柯洁)以往在国内比赛,相对来说,他用的时间是比对手少。今天跟 AlphaGo 之间,他几乎多用了一个小时。”常昊说。
似乎所有人,都在期待柯洁有多紧张。
柯洁所处的对局室里只有寥寥数人,除了几家摄影媒体,还有 3 名工作人员、代替 AlphaGo 落子的黄士杰博士以及柯洁自己。整场比赛,黄士杰博士几乎面无表情地坐着,几乎匀速地执行 AlphaGo 计算出的最佳落子。
比赛进行到 4 小时 25 分钟时,柯洁输掉了比赛。
一年多前,AlphaGo 首战战胜李世乭,柯洁说“就算 AlphaGo 战胜了李世乭,但它赢不了我。”
输了比赛后,柯洁自陈 AlphaGo 越来越像围棋上帝,“我还是想和人类下棋,因为到未来,我们与 AlphaGo 的差距可能越来越大。”
这个画面似曾相识。
2016 年 1 月,AlphaGo 战胜欧洲冠军樊麾。
“AlphaGo 目前还没到与我谈论胜负的程度,对决结果将会是 5:0 或者 4:1。”李世乭在自己 AlphaGo 比赛的赛前记者招待会上报出出师表。他并不认为樊麾输给 AlphaGo 对自己起到什么威胁,在他看来,樊麾是业余棋手里的顶尖高手。
两个月后李世乭 1:4 输掉比赛。这位时年 33 岁的韩国围棋世界冠军如此评价 AlphaGo, “它(AlphaGo)可以始终保持心理平静和精神专注,就这方面而言,我觉得人类比不过它,尽管我还不大愿意承认,AlphaGo 在棋艺上胜过人类。”
AlphaGo 几乎不出错的落子让李世乭显得有些绝望。他正用手扶着额头。图/CNBC
同样的情况你也可以在国际象棋棋王卡斯帕罗夫 1997 年对战 IBM 深蓝时看到。
他没有考虑过自己会输给深蓝,之前还说过”
卡斯帕罗夫在 1999 年达到 2851 国际棋联国际等级分、2005 年退役。之后 8 年一直没人能超过他,直到 2013 年才由挪威人卡尔森打破记录。
但现在更多让人们记住、知道卡斯帕罗夫的事情,还是他在 1997 年输给国际象棋人工智能“更深的蓝”。
左边双手捧头的就是卡斯帕罗夫。图/Mashable
1997 年 5 月 11 日,国际象棋人工智能只用 19 步就战胜了卡斯帕罗夫。棋王这张双手捧头的照片成了他最广为流传的照片之一。
这次柯洁输的很少,但 AlphaGo 用的处理器功耗也只有去年的 1/10。下围棋,人被计算机超过,已经没有任何悬念。
关于 AlpaGo 和柯洁比赛本身的 7 个问题
1. 赛前,外界已经不对人类报什么希望
博彩网站预测给出 AlphaGo 获胜赔率 1.05、柯洁获胜赔率 8。也就是说买 100 元柯洁获胜,将能获得 800 元;买 100 元 AlphaGo 胜,能拿回 105元,只赚 5 块钱。
这和去年李世乭比赛前大不相同,当时还有很多人觉得人类能赢,包括人工智能专家。
“一年前我期待李世乭 3:2 或者 4:1 战胜 AlphaGo,我当时没预料它那么强大。今年的结果毫无疑问,AlphaGO 三场全胜。”曾带队制作跳棋和国际象棋程序的乔纳森·谢弗尔教授告诉《好奇心日报》。
2. 从围棋来看,柯洁是人脑的最后防线
如果说围棋是“人类智慧皇冠上的明珠”,那么这一次和 AlphaGo 对局的中国棋手柯洁九段无疑是最有资格守卫这份珍宝的人之一。
柯洁 1997 年出生,自幼学棋。2008 年取得初段段位,2014 年获得第二届百灵杯世界围棋公开赛冠军,成为中国大陆第 16 位围棋世界冠军,年仅 17 岁升九段。截至目前,柯洁共在以个人资格出赛的国际围棋比赛中取得 4 次冠军。
2016 年 3 月败于 AlphaGo 的韩国棋手李世乭九段比柯洁年长许多。李世乭 1983 年出生,至今在以个人资格出赛的国际围棋比赛中获得 18 次冠军。
柯洁出席赛前新闻发布会。左边是 DeepMind CEO Demis Hassabis,右边是 Alphabet 董事长 Eric Schmidt。图/Google
国际上有一个非常简单粗暴的办法评价围棋选手的实力:定级分。法国计算机专家,也是围棋人工智能程序 CrazyStone 的作者 Rémi Coulom 利用选手的历史成绩结合 Elo 算法,建立了一个给这些选手打分的网站 Go Ratings。因为世界上并没有一个统一的围棋国际组织,这个网站的分数在很多时候被引用作为围棋选手世界排名。
从 1991 年到 2006 年,韩国名将棋手李昌镐连续 16 年在 Go Ratings 排名第一,李世乭则从 2007 年到 2011 年连续五年排名第一,柯洁从 2015 年开始成为世界榜首。
但柯洁本人认为,Go Ratings 的评分并不科学,认为它没有公信力。
目前,在 Go Ratings 的排名上,柯洁、韩国棋手朴廷桓、中国棋手芈昱廷、韩国棋手申真谞、中国棋手连笑分列前五名。李世乭排名第 6。
在去年李世乭败给 AlphaGo 后,柯洁曾发微博称,自己能战胜 AlphaGo。他也曾多次在国际大赛赛前,公开表示自己对比赛的信心。历史上,国际个人大赛中,柯洁和李世乭共有 8 次对弈,大比分为 8 比 2,柯洁占有明显优势。
3. 之前柯洁已经输给了 Master,这次对弈的意义是什么?
2016 年 12 月 29 日至 2017 年 1 月 4 日,一个神秘的账号 Master 出现在中国大陆的围棋在线平台奕城围棋网和野狐围棋上。奕城围棋和野狐围棋是最热门的围棋对弈平台,包括柯洁、井山裕太、朴廷桓、芈昱廷、连笑、古力等等众多日韩三国众多的围棋冠军和高手都注册有账号。
但 Master 在快棋比赛中展现出了针对人类的绝对优势。Master 和全世界 60 位世界冠军、国内冠军,包括中国著名围棋大师聂卫平在内对局 60 场,规则定为每 30 秒下一步的快棋。这 60 场比赛无一例外全部获胜。
Master 背后就是 AlphaGo。
在和李世乭和柯洁的比赛中,AlphaGo 的算法表现出了非常稳定的性能,能够以很稳定的节奏,平均几分钟一步下完整盘,而作为人类的柯洁和李世乭都多次陷入“长考”,花费很长时间思考落子的位置。和限时数小时的正式比赛相比,快棋对于 AlphaGo 这样的机器来说优势显著。
当年深蓝战胜卡斯帕罗夫也是这样。1994年卡斯帕罗夫就在快棋比赛里输给过一次人工智能,但两年后他在不限时的正式比赛里赢了深蓝。
真正被认为人类战败,是 1997 年,升级版深蓝战胜卡斯帕罗夫。
换句话说,在正式比赛里打败柯洁,AlphaGo 才能说战胜最厉害的人类围棋棋手。
4. 柯洁自己觉得有希望么?
看上去是没有。
赛前深夜,柯洁在微博上发了一篇题为的短文。他在文中写道:“无论输赢,这都将是我与人工智能最后的三盘对局。因为现在的 AI 进步之快远超我们的想象。”
柯洁在去年李世乭与 AlphaGo 对阵中曾经发过这样一条微博:“就算阿法狗战胜了李世石,但它赢不了我。”那条微博被转发了三万次。
但是在今年赛前,柯洁写道:“我相信未来是属于人工智能的。”
去年年末与 Master 对战之后,柯洁深夜写道:“人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个人沾到围棋真理的边。”
但他也继续说棋手会结合计算机,迈进全新的领域,达到全新的境界,就像“新的风暴继续来袭”。
5. 机器,AlphaGo 和一年前有什么变化?
从比赛形式上看,柯洁和 AlphaGo 的三番棋对决和去年李世乭的比赛没什么差别——AlphaGo 调用云端的运算资源,一位工作人员和人类旗手对坐,负责摆出棋子。
不同的是这次比赛增加了团体赛,柯洁还会在 5 月 25 日和 5 月 27 日与 AlphaGo 再下两盘。在 5 月 26 日,数名中国顶尖职业围棋选手还会组成团队和 AlphaGo 进行两盘团体和配对比赛。
实际上这一次 Alpha Go AlphaGo 背后的计算能力。去年战胜李世乭时,AlphaGo 的程序需要依靠全世界 Google 很多机房提供计算能力。
而今天的 AlphaGo 的算力需求更小,它不再是分布式运算,整个程序仅运行在一个单一的云服务器 TPU 上。这是 Google 去年在开发者大会上发布的用于人工智能计算的单处理器计算机,全称是 Tensor processing unit。
从计算机消耗的能耗来看,去年李世乭相当于面对 10 台计算机打比赛。而今年柯洁的比赛是货真价实的一比一对抗,AlphaGo 的程序性能提升了至少 10 倍。
除了柯洁,这次还有两个人类群殴 AlphaGo 的比赛, 有什么意义?
这次的团队赛还分为两种:一种是人类组队对阵机器,第二种是,人和人工智能算法合作,对阵人类。
意义很明确:如果人工智能算法能够打败单个人类,那么用人类的集体智慧和写作文对应人工智能是否能赢?人+机器这样的组合,能不能产生更好的结果?
这样的比赛之前也有过。2005 年,Playchess.com 举行了一场“自由式”象棋大赛,参赛者可以任意和其他人或者电脑组队。通常情况下,象棋网站都会运用“反作弊”算法来防止参赛者用电脑程序作弊。
重赏之下,好几位特级大师都携多台电脑参加了比赛。一开始,结果不出预料。人和电脑组队,要远远胜过最强的电脑。“九头蛇”(Hydra)和“深蓝”一样,是一台专业象棋超级电脑,而面对棋力较强的人类选手和一台较弱的笔记本电脑的组合,它却败下阵来。人类的战略引导加上电脑精确的战术计算。
但更有意思的是,最后的赢家并不是“人+高配置电脑”的组合,而是两位美国业余选手和三台电脑的组合。
他们的技巧是通过干预和“教导”,让电脑们更深入地搜索可能的局面。这一策略不仅胜过了特级大师们对象棋的精深理解,也胜过了其它参赛者的超强计算能力。
“棋力较弱的人类+机器+优化的步骤”比强力的电脑本身技高一筹,也优于“棋力较强的人类+机器+较差的步骤”。
李世乭在赛后怎么看待自己的失败?
李世乭在去年 6 月的,赛前自己存在判断失误,低估了对手的水平:
“当时我看了它和樊麾的比赛,之后我觉得 AlphaGo 应该不是我的对手,比较确信我会赢。但是没想到,深度学习在六个月期间有这么大的进步。”
他说人类和机器对弈的时候,人是处在不利地位的。AlphaGo 始终如一,没有情绪波动,甚至也不会意识到下到第几局、整个场面是什么情况。
“我再也不想和 AlphaGo 比赛了。”李世乭说。
AlphaGo 具体是什么?它背后的公司在干什么?
8. AlphaGo 到底是什么?
AlphaGo 是一款围棋人工智能,Google 人工智能团队 DeepMind 创造了它。
DeepMind CEO 哈萨比斯今年 5 月 19 日接受 时表示,AlphaGo 是面向围棋这一“狭窄领域”的人工智能,简单说,虽然它能打败世界冠军,但 AlphaGo 也只能下棋。
9. AlphaGo 怎么学会下棋,提升棋艺的?
说起这个,“穷举”、“蒙特卡罗树算法”、“深度学习”等等一大堆术语经常出现,但没有这些基础也能看懂。
所谓 “深度学习”,是 AlphaGo 围棋训练的第一步,将人类棋谱输入计算机,学习人类的落子习惯。这种“识别”与人脸识别、图像分类等搜索技术类似。
第一步:把棋盘分拆成小块,输入数据。AlphaGo 会把输入系统的人类棋谱的每一步进行分拆,棋盘上每个落子以及随后的应对落子算作一个样本,AlphaGo 从这些人类棋局中分解出了三千多万个样本。
这些样本集合在一起,能够识别出每个特定的落子之后,哪一种应对方法的概率最高,这个最高的概率其实就是人类棋手最喜欢的应对方法。
虽然说围棋“千古无同局”,但是局部来看还是有很多相似的模式反复出现,AlphaGo 就学会了这些最受欢迎的下法。
AlphaGo 的蒙特卡罗树搜索。图片来自 Nature
第二步:乱下棋,不过比纯粹乱下要好一点。
AlphaGo 的思考结合了蒙特卡罗树搜索。
假设一个从来都没下过围棋的人,用了分身术分成两个人开始在棋盘上乱下,最终这盘棋也会分出个胜负。
第二盘,上一盘赢的那个分身不再完全是乱下了,开始使用赢的那一盘中的一些对应,第三盘棋,第二盘赢的那个分身开始使用第一盘和第二盘中的对应。当第 N 盘棋下完之后,这个始终赢棋的分身就会获得最有可能获胜的落子方法。
以上这 N 盘棋就是一步使用蒙特卡罗树搜索的思考过程,思考结束后的下一个落子,就是被是推演过次数最多,获胜概率最高的那一步。
AlphaGo 团队还改进了以上这种传统的蒙特卡罗树搜索算法。
上面我们说过的深度神经网络得出了一套人类棋手概率最高的下法,假设蒙特卡罗树搜索故事中那个完全不会下棋的人学习了这套下法,那么之后的“乱下”思考过程的起点就会提高很多。这样一来,蒙特卡罗树算法的计算量就减少很多,提高了效率。
第三步:AlphaGo 自己和自己下棋,来学习棋局。围棋毕竟变化太多,AlphaGo 需要更多的棋局来学习,于是通过自我对弈产生新的棋局。
AlphaGo 自己和自己下棋,棋力的来源就是第一步通过学习人类棋局得到的落子方法。AlphaGo 左右互搏,自我对弈几万盘,就能总结出赢棋概率更高的新下法,接下来再用新下法自我对弈几万盘,以此类推,最终得到了一套棋力比最初只学习人类下法厉害很多的新策略。
那用这新的策略和蒙特卡罗树搜索结合是不是更厉害呢?答案却是否。
因为使用概率来训练的这种策略会让下法高度集中,变化太少,而蒙特卡罗树搜索需要更多的变化才更有效。
AlphaGo 在与樊麾对决时的局面评估。图片来自 Nature
第四步:局面评估。
这也是 AlphaGo 最厉害的地方是,它可以像人类一样在比赛过程中估计局面的优劣,这样才有第四局它判断获胜几率太小,选择中盘认输。
当一盘棋开始的时候,AlphaGo 先用第一步训练的下法下若干步,然后乱下一步,接着用第三步自我对弈训练产生的更厉害的下法下完整盘棋,然后对结果做一个评估,评估出“乱下”的那步棋造成的局面是好是坏。
AlphaGo 可以在一步的思考中乱下很多次,总有一次能匹配到真实对下棋的状况。而对这一步乱下以及后续结果的评估,就是对当前局面的判断。
10. 对弈柯洁的 AlphaGo,有着怎样的计算能力?
上一次战胜李世乭的 AlphaGo,根据 Deepmind 的说法,是一部运行在云端,由全世界的 Google 机房协作运算的人工智能。5 月 23 日 AlphaGo 战胜柯洁之后,Deepmind 老大哈撒比斯说明,这一次 AlphaGo 是全新的版本,不再使用分布式计算的方案,调用的计算能力只有李世乭版本的十分之一。
具体来说,这一次的 AlphaGo 只用了一个 Google TPU 的计算能力。
Google TPU 是 Google 去年首次发布的用于人工智能运算的专用硬件,全称 Tensor Processing Unit,中文可以翻译成张量处理单元,是一个饭盒大小的专用硬件。在人工智能研究里,包括 Google 在内都在大量使用通用处理器 CPU 和图形处理器 GPU 进行运算。比如曾经公布过的一个版本的 AlphaGo,使用了 1920 个 CPU 和 280 个 GPU,取得了 Go Ratings 网站的 3168 等级分,世界第一柯洁的等级分为 3625。
TPU 这种专用硬件的效率比 CPU 加 GPU 快很多。
上周的 Google I/O 大会上,Google 宣布了 TPU 2.0,它具有四个专用芯片,每秒可处理 180 万亿次浮点运算。64 个 TPU 可以拼在一起组成 TPU Pod,可提供大约 11500 万亿次浮点运算能力。Google 同时公布了一个数字,说 Google 的大型翻译模型如果在 32 块性能最好的 GPU 上训练需要一整天,而 8 块 TPU 就可以在 6 个小时内完成同样的任务。
2017 年底,Google 就会把 TPU 计算服务变成云服务,全世界的人工智能研究者都可以租用这种云服务,帮助加速人工智能研究。和亚马逊等公司提供的,基于 CPU 和 GPU 的人工智能云服务相比,Google 的 TPU 更有效率优势,从成本上来讲,也更便宜。
11. DeepMind 公司有什么来头?
、总部位于英国伦敦的初创公司,主要研究人工智能。2014 年 Google 以 4 亿英镑(约合 6.6 亿美元)的价格打败 Facebook,买下 DeepMind。这笔交易金额可以排进 2014 年全球初创公司收购金额前十。
公司创始人哈萨比斯曾有过数次创业经历,最后为了创造一个通用的、真正能思考的人工智能,创办 DeepMind。
12. 今天 DeepMind 在 Google 承担着什么角色?
DeepMind 的研究围绕人工智能展开。2016 年 7 月前后,Google 用 DeepMind AlphaGo 的,预测 Google 内部 120 个数据中心和连带冷却风扇的各个时段用电量,然后分配能源,达到控制冷却系统和计算机服务器的耗电量的目的。
现在 DeepMind 的办公室还在距离伦敦国王十字车站约 2 公里的一处办公楼里,那里已经聚集 400 多位计算机和神经科学家。。
13. 除了 DeepMind 之外,Google 还收购了什么人工智能公司?
2014 年收购英国 DeepMind 公司不是个例,Google 在最近 5 年间投资收购了不少人工智能公司,例如 api.ai、Timeful、Kaggle 等等。
从 2013 年开始到现在,Google 已经收购了 16 家人工智能公司了。可以说是各大科技公司里收购最多、布局最早的。
主要是来自策略的转变。Google CEO 桑达·皮蔡在 2016 年 5 月宣布将公司从“移动为先”的策略转变成“人工智能为先”(AI First)。根据 Google 员工的说法,他们已经在公司的每一个产品上都应用了机器学习的算法。
Google 买下的公司主要用于拓展现有业务。比如 2013 年 Google 收购了聚焦于深度学习和神经网络的初创企业 DNNresearch,用于帮助提升图像搜索功能。
它也收购了像 Deepmind 这样本身发展成熟的团队,收购后依然保持独立运营。今年,Google 主要收购了一家做视觉搜索的初创公司 Moodstock,以及语音识别开放平台 Api.ai。
AlphaGo 打败人类了,之后它要做什么?
14. AlphaGo 对 Google 有什么影响?
去年 2 月,AlphaGo 在围棋上打败李世乭的消息,让不少人开始关注人工智能。
而也是在这次比赛之后,Google 制定“人工智能为先”的策略,今年 5 月举行的开发者大会上皮蔡再次强调这一点,现场还做了不少人工智能都能做什么的演示,例如这样的用语音控制的调酒机:
AlphaGo 之后还要打更多游戏么?
更多的比赛只有营销价值。围棋就是终极比赛,是人脑在公平游戏里的最后防线。
这是因为围棋棋

我要回帖

更多关于 围棋 高智商 的文章

 

随机推荐