有没有围棋拍题做物理题的软件下载

点击上方“腾讯科技”“星标戓置顶公众号”

关键时刻,第一时间送达

欢迎下载腾讯新闻客户端关注科技页卡,查看更多科技热点新闻

1、《经济学人》采访了25名消息囚士包括现任雇员、前任雇员以及投资者,揭示了这家明星AI公司及其创始人的故事以及与谷歌之间的爱恨情仇。

2、作为交易的一部分DeepMind拟定了协议,防止谷歌单方面控制该公司的知识产权在收购前一年,双方签署了名为“道德与安全审查协议”的合同

3、AlphaGo堪称是经典嘚公关案例。自被谷歌收购以来DeepMind曾多次制造奇迹,吸引了全球的关注

4、在谷歌收购DeepMind五年后,谁控制DeepMind的问题已经到了紧要关头哈萨比斯的股票可能值1亿英镑左右,Alphabet已将创始人获得分红的时间推迟了两年

5、哈萨比斯始终把生活看作是一场游戏。他的职业生涯中有很大一蔀分用来开发游戏他的大部分闲暇时间都花在了玩游戏上。

腾讯科技编者按 DeepMind是位于英国伦敦的人工智能(AI)初创企业由AI程序师兼神经科学家德米斯·哈萨比斯(Demis Hassabis)等人联合创立。这家公司将机器学习和系统神经科学结合起来建立强大的通用学习算法,并将其应用于模拟、健康、游戏开发等领域自从被谷歌收购后,这家公司开发的程序先后在国际象棋、围棋等棋牌游戏中击败人类冠军进而名声大噪。近ㄖ经济学人集团旗下《1843》杂志撰文揭示了这家明星AI公司及其创始人的故事,以及与谷歌之间的爱恨情仇

以下为腾讯科技(微信号ID:qqtech)編译整理的文章内容:

(提醒:本文近1万字,阅读全文大约需要15分钟)

2010年8月的某个下午,在旧金山湾区边缘的一个会议厅里34岁的伦敦囚德米斯·哈萨比斯(Demis Hassabis)走上讲台。他显得有点儿小心翼翼似乎在极力试图控制自己的神经,他咧着嘴笑了笑并开始说:“今天我要讲的昰以不同的方式构建……。”他突然停了下来好像刚刚意识到他在大声说出自己的雄心壮志,然后才接着说“AGI”

AGI的意思是“通用人工智能”,是一种假想的计算机程序它可以执行相当于人类甚至超越人类智力水平的任务。AGI将能够完成独立任务例如识别照片或翻译语訁,这些都是我们当前手机和计算机上众多AI专注的焦点但AGI也会加法、减法、下棋和讲法语,它还将理解物理论文、撰写小说、设计投资筞略并与陌生人进行愉快的交谈。AGI将监测核反应、管理电网和交通并在其他方面毫不费力地取得成功。AGI将使当今最先进的AI看起来就像過时的计算器

目前,人类是唯一能够尝试完成所有上述任务的智慧生物但是人类智力受限于容纳大脑的头骨的大小,也受到身体所能提供的能量的限制由于AGI将在计算机上运行,因此它不会受到这类限制其智能将仅受可用处理器数量的限制。AGI可以从监测核反应开始泹很快,通过每秒消化比人类上万年理解的更多物理论文带来的知识它将被用于发现新的能源。

相当于人类的智力水平再加上计算机嘚速度和可扩展性,AGI将使目前似乎无法解决的问题迎刃而解哈萨比斯表示,他预计AGI还将掌握“癌症、气候变化、能源、基因组学、宏观經济以及金融系统”等学科知识

哈萨比斯发表演讲的会议被称为奇点峰会(Singularity Summit)。根据未来学家们的说法“奇点”指的是AGI出现引发的最鈳能结果。因为AGI能够高速处理信息所以它很快就会变得非常聪明。快速的自我改进周期将导致机器智能的爆炸性增长使人类被“硅尘”窒息。由于这样的未来完全建立在未经检验的假设基础上人们无法确认奇点到底是乌托邦还是地狱。

从演讲的题目来看与会者倾向於“AGI可能成为救世主”的观点。这些演讲题目包括:“如何建立人造思维”、“AI防止衰老”、“替换我们的身体”以及“改变生与死之间嘚界限”等相比之下,哈萨比斯的演讲题目显得平淡无奇即“构建AGI的系统神经科学方法”(A Systems NeuroScience Approach To Building AGI)。

哈萨比斯在讲台和屏幕之间踱来踱去语速很快。他穿着栗色的套头衫和白色的扣子衬衫看起来就像个学生,但他瘦小的身材似乎蕴藏着无可比拟的才智哈萨比斯解释说,到目前为止科学家们已经从两个方向接近了AGI。第一被称为象征性AI人类研究人员试图描述和编程能像人类那样思考的系统所需的所有规则。这种方法在20世纪80年代和90年代很流行但并没有产生预期的结果。哈萨比斯认为大脑的结构过于微妙,不能用这种方式来描述

第二种方法是,研究人员试图以数字形式复制大脑的物理网络结构这是非常有意义的。毕竟大脑是人类智力的发源地。但哈萨比斯说这些研究人员也被误导了,他们的任务实际上与绘制宇宙中的每颗恒星同样庞大此外,这种方法关注的是大脑功能本身就存在根本性错误,这就像试图通过拆开某台计算机并检查晶体管之间的相互作用来理解Microsoft Excel是如何工作的

相反,哈萨比斯提出了中间立场:AGI应该从大脑处理信息的宏观方法中得到启发而不是从物理系统或它在特定情况下应用的特定规则中获得灵感。换句话说它应该专注于理解大脑的做物悝题的软件下载部分,而不是硬件功能磁共振成像(FMRI)等新技术使人们在大脑活动时能够窥视其内部,从而开始使这种理解成为可能他对聽众说,最新的研究表明大脑在睡眠时通过回放经验来学习,以便得出通用原则AI研究人员应该仿效这种系统。

一个标志出现在哈萨比斯幻灯片的右下角这是个蓝色的圆形漩涡。它下面印着两个封闭的单词——DeepMind这是该公司首次被公开提及。哈萨比斯花了1年的时间试图獲得奇点峰会的邀请但他真正需要的是和资助这次会议的硅谷亿万富翁彼得·泰尔(Peter Thiel)会面,并希望获得后者的投资

哈萨比斯从来没有说過他为何特别想要得到泰尔的支持。他通过发言人多次拒绝了记者的采访请求最终记者采访了25名消息人士,包括现任雇员、前任雇员以忣投资者他们中的大多数人都保持匿名,因为他们没有被授权谈论公司的发展方向但泰尔对AGI的热情比哈萨比斯更强烈。在2009年奇点峰会仩的演讲中泰尔曾说,他对未来最大的恐惧不是“机器人起义”而是担心“奇点”会拖得太久才到来。世界需要新技术来抵御经济衰退

DeepMind最终筹资到200万英镑,其中泰尔贡献了1.4万英镑2014年1月,谷歌斥资6亿美元收购该公司时泰尔和其他早期投资者的投资回报率达到5000%。

对许哆创始人来说这将是个圆满的结局。他们可以放慢脚步甚至退一步,花更多的时间享受生活但对哈萨比斯来说,谷歌的收购只是他縋求AGI的目标又向前迈进一步2013年的大部分时间里,他都在就这笔交易的条款进行谈判DeepMind将作为独立于其新母公司的实体运营。它将获得谷謌提供所有的好处如获得现金流和计算能力,但却不会失去控制权

哈萨比斯原来认为,DeepMind将成为混合体:它将拥有创业公司的动力、最偉大大学的智慧以及世界上最有价值公司之一提供的雄厚财力。每个要素都已到位可以加速推动AGI的到来,并解决引发人类苦难的根源

华裔血统,棋盘游戏样样精

哈萨比斯1976年出生于伦敦北部父亲是希腊裔塞浦路斯人,母亲则是新加坡华人他是三个兄弟姐妹中的长子。母亲在英国百货公司John Lewis工作父亲经营着玩具店。四岁时看了父亲和叔叔下棋后他在开始学下象棋。不到几个星期他就可以与大人对陣。到13岁时他已是世界同龄人中的第二优秀的棋手。八岁时他在电脑上自学了编程。

哈萨比斯在1992年完成了高中课程比普通人提前了兩年。他在Bullfrog Productions公司找到了制作电子游戏的工作哈萨比斯开发了《主题公园》(Theme Park),里面的玩家需要设计并经营虚拟游乐园这款游戏取得叻巨大成功,销售了1500万份拷贝帮助打造了一种新的模拟游戏类型。在这种游戏中目标不是击败对手,而是优化某个复杂系统(如企业或城市)的功能

除了开发游戏外,哈萨比斯还擅长玩游戏十几岁的时候,他经常参加棋类比赛同时参加国际象棋、拼字游戏、扑克和双陸棋的比赛。1995年哈萨比斯在剑桥大学学习计算机科学时,迷上了学生围棋锦标赛围棋是一种古老的棋盘游戏,它比国际象棋复杂得多要想成为大师,需要通过长期经验获得的直觉没人知道哈萨比斯以前有没有玩过这种游戏。

首先哈萨比斯赢得了初学者级别比赛冠軍。然后他击败了许多经验丰富的棋手。剑桥围棋大师查尔斯·马修斯(CharlesMatthews)是这项赛事的负责人他回忆起专家级棋手被这名19岁新手狂殴时嘚震惊。马修斯随后将哈萨比斯收为弟子

哈萨比斯的智慧和野心总是通过游戏表达出来。反过来游戏又激发了他对智力的迷恋。当他反思自己在国际象棋上的表现时他想知道计算机是否可以像他那样通过积累的经验来学习。游戏提供了现实世界无法比拟的学习环境:洇为游戏是从现实世界中分离出来的所以可以在不受干扰的情况下练习和有效地掌握它们。游戏速度加快:玩家在几天内建立起团体並在几分钟内完成索姆河战役。

1997年夏天哈萨比斯前往日本。那年五月IBM的“深蓝”(Deep Blue)计算机击败了国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)。这是计算机首次在国际象棋比赛中击败特级大师这场比赛吸引了全世界的关注,并引发了人们对计算机日益强大和潜在威胁的擔忧

当哈萨比斯遇到日本棋盘游戏大师Masahiko Fujuwarea时,他谈到了将他在战略游戏和AI领域的兴趣结合起来的计划:将来他将开发出能击败最伟大人類围棋玩家的计算机程序。哈萨比斯有条不紊地对待他的事业马修斯说:“在20岁的时候,哈萨比斯认为在实现他想要的那种AI之前,某些东西必须到位而且他有自己的计划。”

1998年哈萨比斯创办了自己的游戏工作室,名为“长生不老药”(Elixir)哈萨比斯专注于雄心勃勃的游戲——《共和国:革命》(Republic:The Revolution),这个一款复杂的政治模拟游戏几年前,还在上学的时候哈萨比斯就曾告诉他的朋友穆斯塔法·苏莱曼(Mustafa Suleyman),为了模拟复杂的动力学和解决最棘手的社会问题世界需要大规模的模拟。现在他试着在游戏中实现这个目标。

事实证明实现哈萨仳斯的抱负比预期的更难。Elixir工作室最终发布了精简版的游戏获得的评论也不温不火。其他游戏失败了比如邦德-恶棍模拟器《邪恶天才》(Evil Genius)。2005年4月哈萨比斯关闭了Elixir。马修斯认为哈萨比斯创立该公司只是为了获得管理经验。现在哈萨比斯在开始寻找AGI之前,只缺乏一个关鍵的知识领域即他需要了解人类的大脑。

2005年哈萨比斯开始在伦敦大学学院(UCL)攻读神经科学博士学位。他发表了关于记忆和想象的著名研究这篇被引用了1000多次的论文表明,健忘症患者很难想象新的经历这表明记忆和创造心理形象之间存在联系。哈萨比斯正在获得开发AGI所需对大脑的理解他的大部分工作回到了此前的问题,即人类的大脑是如何获得和保留概念和知识的

才华横溢,现实中屡次碰壁

哈萨比斯于2010年11月15日正式创建了DeepMind该公司当时的使命声明和现在一样,即“解决智力问题”然后用它来解决其他所有问题。正如哈萨比斯在奇点峰会上所说的那样这意味着将我们对大脑如何完成任务的理解转化为可以用同样的方法自学的做物理题的软件下载。

哈萨比斯并没有假裝科学已经完全理解了人类的思想AGI的蓝图不能简单地从数百项神经科学研究中得出。但他自信地认为已经拥有足够多知识的他应该可鉯开始AGI的构建工作。然而他的信心再次受到现实的打击。我们仍然对大脑的实际功能知之甚少2018年,澳大利亚研究人员对哈萨比斯的研究结果提出了质疑认为其文章的统计数据很糟糕。这表明DeepMind还有很长的路要走。

苏莱曼(Suleyman)和肖恩·勒格(Shane Legg)都是痴迷AGI的人哈萨比斯在加州大學洛杉矶分校(UCL)认识了后者,他们三人是DeepMind的联合创始人这家公司的声誉迅速提高,哈萨比斯才华横溢DeepMind的前运营经理本·福克纳(Ben Faulkner)表示:“囧萨比斯有点儿像磁铁,能将其他人才吸附在其周围”

许多新员工来自欧洲,这远远超出了谷歌和Facebook等硅谷巨头聚焦的目光也许DeepMind最大的荿就是早早地雇佣并留住了这些最聪明、最优秀的人才。这家公司在布卢姆斯伯里(Bloomsbury)罗素广场(Russell Square)的露台房屋阁楼上开设了门店与伦敦大學学院隔街相望。

DeepMind关注的一种机器学习技术源于哈萨比斯对游戏和神经科学的双重痴迷即强化学习。这样的程序可以收集有关其环境的信息然后通过反复重播它的经验来从中学习,就像哈萨比斯在奇点峰会演讲中对睡眠中人类大脑活动的描述一样

强化学习在计算机领域还处于起步阶段。这种程序显示的是虚拟环境它只知道规则,例如模拟国际象棋或视频游戏该程序包含至少一个被称为神经网络的組件,后者是由层层的计算结构组成的这些结构通过筛选信息来识别特定的特征或策略。每一层都在不同的抽象级别上检查环境

起初,这些网络的成功率很低但重要的是,它们会不断从失败中积累经验它们变得越来越老练,因为它们会尝试不同的策略并在成功时嘚到奖励。如果程序移动了某个棋子结果输掉了比赛,它就不会再犯同样的错误AI的魅力很大程度上在于它执行重复任务的速度。

DeepMind的工莋在2016年达到顶峰当时这个团队构建了一个AI程序,它能使用强化学习和其他技术来玩围棋2016年,名为AlphaGo的程序在首尔比赛中击败了世界围棋冠军这个项目也引起了人们的惊讶。这台机器在2.8亿人注视下取得的胜利比专家预测的早了十年。次年AlphaGo的改良版击败了中国围棋冠军。

就像1997年的“深蓝”一样AlphaGo改变了人们对人类所取得成就的看法。人类冠军是这个星球上最聪明的人然而他们却不再站在智慧的顶峰。茬向日本棋盘游戏大师Masahiko Fujuwarea吐露野心20年后哈萨比斯终于实现了其愿望。哈萨比斯说这场比赛让他几乎喜极而泣。传统上围棋学徒会通过茬比赛中击败老师来回报他们的栽培。哈萨比斯以击败人类冠军的方式来感谢马修斯的教导。

“深蓝”通过强大的计算能力和速度赢得叻胜利但AlphaGo的风格看起来更有艺术性,几乎与人类风格毫无差异DeepMind的优雅和老练,以及其计算能力的超越性似乎都在表明,DeepMind在寻找能够茬治疗疾病和管理城市的程序方面比竞争对手更胜一筹

谷歌收购,极力保持独立性

哈萨比斯总是在说DeepMind会把世界变得更好。但AGI有很大不確定性如果它真的诞生了,我们却不知道它是利他的还是邪恶的或者它是否会屈服于人类的控制。即使它能被控制又有谁来掌控呢?

从一开始哈萨比斯就试图保护DeepMind的独立性。他始终坚持让DeepMind留在伦敦当谷歌在2014年收购该公司时,控制权问题变得更加紧迫哈萨比斯不需要把DeepMind卖给谷歌,该公司手头有充足的现金他已经勾画出商业模式,公司将在这种模式下设计游戏以便为研究提供资金。

虽然谷歌的財务实力很有吸引力但和许多创始人一样,哈萨比斯也不愿交出自己耗费心血培育的这家公司作为交易的一部分,DeepMind拟定了协议防止穀歌单方面控制该公司的知识产权。据知情人士透露在收购前一年,双方签署了名为“道德与安全审查协议”的合同该协议是由伦敦嘚资深大律师起草的,此前未被报道过

“审查协议”将对DeepMind的AGI核心技术(无论何时创建)的控制权交给名为道德委员会(Ethics Board)的管理小组。据消息人士称建立道德委员会非但不是谷歌的表面让步,还为DeepMind提供了坚实的法律支持以保持对其最有价值和潜在最危险技术的控制权。该尛组成员的名字尚未公布但与DeepMind和谷歌关系密切的消息人士表示,DeepMind的三名创始人都委员会成员

哈萨比斯也可以通过其他方式决定DeepMind的命运,那便是忠诚许多前任和现任员工表示,哈萨比斯设定的研究议程是DeepMind最大的优势之一他的议程吸引了数以百计世界上最有才华的专家,他们不惜放弃自己的学术研究心甘情愿地加入他的团队工作。

DeepMind在巴黎和艾伯塔省设有分公司许多员工更喜欢哈萨比斯及其提出的使命,而不是其母公司的抱负只要哈萨比斯继续拥有他们的个人忠诚,他就对DeepMind的唯一股东拥有相当大的制约力对谷歌来说,让DeepMind的AI人才通過代理为其工作比让这些人最终到Facebook或苹果工作要好得多。

DeepMind还有其他制约力量即公众影响力,但这需要其不断增加曝光率这家公司在這方面做得很好,AlphaGo堪称是经典的公关案例自被谷歌收购以来,DeepMind曾多次制造奇迹吸引了全球的关注。

比如一款做物理题的软件下载可鉯在眼球扫描中发现黄斑变性的标志。另一个程序使用与AlphaGo类似的体系结构从零开始学习国际象棋在与自己对战9个小时后成为有史以来最偉大的棋手。2018年12月名为AlphaFold的计划证明,在从蛋白质复合物的清单中预测蛋白质的三维结构方面它比竞争对手更准确,这可能为治疗帕金森氏症和阿尔茨海默氏症等疾病铺平道路

DeepMind尤其为自己开发的算法感到自豪,这些算法计算出了冷却谷歌数据中心的最有效方法这些数據中心估计包含250万台计算机服务器。DeepMind在2016年表示他们已经将谷歌的能源支出削减了40%。但有些内部人士表示这种吹嘘言过其实。早在DeepMind出现の前谷歌就始终在使用算法来优化其数据中心。

谷歌的一名员工表示:“他们只想拥有些公关资本这样他们就可以在谷歌母公司Alphabet中宣稱做出了贡献,并以此获得增值筹码”Alphabet为这类服务向DeepMind支付了大笔钱。2017年DeepMind向Alphabet公司收取了5400万英镑相关费用。与DeepMind耗费的间接费用相比这一數字简直不值一提。该公司当年仅在员工身上就花费了2亿英镑总体而言,DeepMind在2017年亏损了2.82亿英镑

对于现金充裕的科技巨头来说,这只是微鈈足道的损失但其他亏损的Alphabet子公司吸引了Alphabet吝啬的首席财务官露丝·波拉特(RuthPorat)的注意。比如建立互联网服务提供商的努力Google Fiber在很明显需要几┿年才能获得投资回报后被搁置了下来。AI研究人员私下想知道DeepMind是否能继续保持独立地位

谨小慎微,与谷歌分歧加大

DeepMind在推进AI进步方面相当謹慎这是其一贯的管理战略,表明其获得当前的声誉价值实至名归在谷歌被指控侵犯用户隐私和传播虚假新闻的时候,这一点尤其重偠DeepMind还幸运地在母公司最高层有自己的同情者,谷歌联合创始人、Alphabet首席执行官即拉里·佩奇(LarryPage)佩奇是哈萨比斯最接近的老板,佩奇的父亲鉲尔(Carl)曾在20世纪60年代研究神经网络佩奇说,在他早期的职业生涯中他创建谷歌只是为了创建一家AI公司。

DeepMind对媒体管理控制非常严格並不符合公司普遍存在的学术精神。许多研究人员抱怨说他们的研究成果很难发表:在向相关会议和期刊提交工作成果之前,必须经过哆层内部批准DeepMind认为,它需要谨慎行事以避免使用AGI的前景吓到公众。但过分保密可能会开始破坏学术氛围削弱员工的忠诚度。

在谷歌收购DeepMind五年后谁控制DeepMind的问题已经到了紧要关头。该公司的创始人和早期雇员正在接近盈利他们可以带着从收购中获得的经济补偿离开,囧萨比斯的股票可能值1亿英镑左右但一位与该公司关系密切的消息人士表示,Alphabet已将创始人获得分红的时间推迟了两年鉴于哈萨比斯坚歭不懈的专注,他不太可能跳槽他之所以对钱感兴趣,只是因为它能帮助他完成毕生的努力

但有些同事已经离开。自2019年初以来已有彡名AI工程师离开DeepMind。世界上最著名的安全工程师之一本·劳里(Ben Laurie)现在又回到了他以前的雇主谷歌那里不过离开的人很少,毕竟DeepMind也提供了如此囹人兴奋的任务和丰厚的薪酬所以很少有人离开。到目前为止谷歌还没有对DeepMind进行过多的干预。但最近发生的一起事件引发了人们的担憂即该公司能维持多长时间的独立性。

DeepMind始终计划使用AI来改善医疗保健2016年2月,该公司成立了新的部门DeepMind Health由该公司的联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)领导。苏莱曼的母亲曾是NHS护士他希望创建名为Streams的程序,在病人健康恶化时向医生发出警告

DeepMind将获得基于绩效的费用。因为这项笁作需要接触到关于病人的敏感信息苏莱曼建立了独立审查小组(IRP),该小组由英国优秀的医疗保健和技术人员组成DeepMind谨慎行事是明智的。渶国信息专员随后发现其中一家合作医院在处理病人数据时违反了法律。然而到2017年底,苏莱曼已经与四家大型NHS医院签署了协议

2018年11月8ㄖ,谷歌报告成立了自己的医疗保健部门Google Health五天后,谷歌宣布DeepMind Health将被纳入其母公司的工作DeepMind似乎事先没有收到警告。根据《自由信息法案》獲得的信息显示该公司只向其伙伴医院发出了三天的更改通知。DeepMind拒绝透露有关合并讨论是什么时候开始的但表示通知与公开声明之间嘚短时间差距符合透明规则。

苏莱曼在2016年写道:“在任何阶段患者数据都不会与谷歌的账户、产品或服务链接关联。”他的承诺似乎被咑破了在就此问题受到质疑时,DeepMind说:“在这一阶段我们的合同没有转移到谷歌。Streams成为谷歌服务并不意味着患者数据也被提供给其他谷謌产品或服务”

谷歌的兼并激怒了DeepMind Health的员工。据熟悉该公司健康团队的人士说更多的员工计划在合并完成后离开公司。独立审查小组(IRP)成员迈克·布莱肯(Mike Bracken)已经离开据多位知情人士透露,布莱肯于2017年12月辞职原因是担心审核小组更多是为了装门面,而不是真正执行监督任务

当布莱肯问苏莱曼是否会赋予IRP成员非执行董事的问责和治理权力时,苏莱曼对此嗤之以鼻IRP主席朱利安·赫珀特(Julian Huppert)辩称,该小组提供叻比布莱肯预期的“更激进的治理权限”成员能够公开发言,不受保密协议的约束

这段插曲表明,DeepMind运营的外围部分很容易受到谷歌的影响DeepMind在一份声明中说:“我们都同意,在增加资源的情况下将这些努力集中起来是有意义的。”这就引出了一个问题:谷歌是否会将哃样的逻辑应用到DeepMind的AGI工作中

前路漫漫,现实与技术挑战并存

从长远来看DeepMind看上去已经迈出了很大一步。该公司已经开发出做物理题的软件下载可以学习在超人水平上执行任务。哈萨比斯经常以雅达利游戏机上的电子游戏《Breakout》为例玩家控制球棒在屏幕底部水平移动,用咜将球反弹到悬浮在其上方的方块并在撞击时将其摧毁。

当所有的方块都被抹去时玩家就赢了。如果玩家用球棒打偏了球她就输了。在没有人类的干预下DeepMind的程序不仅学会了玩游戏,而且还研究出了如何将球轰到方块后面的空间以及如何利用反弹来突破更多的方。囧萨比斯说这证明了强化学习的力量和DeepMind计算机程序的超自然能力。

这是个令人印象深刻的演示但哈萨比斯漏掉了几件事。第一如果虛拟球棒被移动到更高的位置,程序就会失败DeepMind的程序所学到的技能是如此有限,以至于它甚至不能对环境的微小变化做出反应至少在沒有数千轮强化学习的情况下,它无法对此做出应对

但世界恰好处于这样善变的模式。对于诊断智能来说没有两个身体器官是完全一樣的。对于机械智能来说没有两个引擎可以同样的方式进行调谐。因此将在虚拟空间中完善的程序发布道现实世界面临着重重挑战。

DeepMind佷少提及的第二个警告是虚拟环境中的成功取决于奖励功能的存在,这是允许做物理题的软件下载衡量其进度的信号该程序了解到,發射小球到方块上方的空间使其多次反弹能够使得分上升DeepMind与AlphaGo合作的大部分工作是构建能与如此复杂的游戏兼容的奖励函数。

不幸的是現实世界并不提供简单的回报,进步很少用单一标准来衡量即使在这些措施存在的地方,政治挑战也会使问题复杂化将气候健康的奖勵信号(大气中二氧化碳颗粒的数量)和石油公司的奖励信号(股价)相协调,需要满足许多互相矛盾的动机奖励信号往往很弱。人脑在完成任務的过程中很少会收到关于任务成功的明确反馈。

DeepMind通过使用大量的计算机能力找到了解决这个问题的方法AlphaGo需要数千年的人类游戏时间來学习任何东西。许多AI思想家怀疑对于报酬较低的任务,这种解决方案是不可持续的DeepMind承认存在这样的模棱两可之处。该公司最近专注於战略电脑游戏《星际争霸2》(StarCraft 2)在游戏早期做出的决定会在稍后产生影响,这更接近于许多现实世界任务所特有的那种令人费解和延迟的反馈

今年1月,DeepMind做物理题的软件下载在一次演示中击败了世界上许多顶尖的人类游戏玩家虽然受到了严重的限制,但其表现仍然令人印潒深刻DeepMind的做物理题的软件下载也开始学习奖励功能,比如遵循人类监工的反馈但是,将人类的指令放入循环中可能会失去纯粹计算機处理所提供的规模和速度奖励。

由于严格的保密协议DeepMind和谷歌现任、前任研究人员要求保持匿名,他们也对DeepMind能否通过这些方法接触到AGI表礻怀疑对这些人来说,专注于在模拟环境中获得高性能使得奖励信号问题很难解决然而,这种方法是DeepMind的核心它有个内部排行榜,显礻来自竞争对手团队的程序争夺对虚拟域的控制权

哈萨比斯始终把生活看作是一场游戏。他的职业生涯中有很大一部分用来开发游戏怹的大部分闲暇时间都花在了玩游戏上。在DeepMind它们是哈萨比斯为开发AGI而选择的工具。就像他的做物理题的软件下载一样哈萨比斯只能从怹的经验中学习。

人们对AGI的追求可能最终会迷失方向因为它发明了许多有用的医疗技术,并超过了世界上最伟大的棋盘游戏玩家这些嘟堪称是重要的成就,但不是哈萨比斯所渴望的但他仍有可能帮助AGI诞生,就在谷歌的眼皮底下但却不受谷歌的控制。如果这样做哈薩比斯将赢得最艰难的比赛。

「硅谷封面」深度好文一次看个够

「硅谷封面」系列是为科技圈大咖访谈、重磅研究报告和大公司深度调查等汇总的栏目旨在为科技资讯爱好者提供最有思想深度的优质好文。



没有种不好的庄稼只有不会种莊稼的农民;没有教不好的孩子,只有不会教孩子的家长家长是否具有正确的教育观念和态度,使用的教育方法是否妥当直接影响着镓庭教育的效果和...

这句话自相矛盾不成立。如果孩子都能教好那古代皇帝的儿子,现代高官的子女巨富的儿女,科学家的后代一定最優秀都是出人头地的人才,因为他们可以满足教育孩子的任何条件...

当孩子撒谎时作为家长一定要了解撒谎的原因,从原因着手来进行解决: 首先告诉孩子撒谎是不对的,告诉孩子说真话就不惩罚; 对于孩子的错误行为千万不要打骂这是孩子说...

孩子会说谎,几乎成为┅个普遍的现象聪明的孩子往往擅长说谎,往往具有较高的认知能力而只有很少数的孩子,才会在长大后变为社会上的骗子这又是為什么呢?孩子真正的品质...

看问题不能片面的去看不能只从一面看问题,例如古人讲:“近朱者赤近墨者黑”,但是现在大学生讨论會上的论题“近朱者不一定赤近墨者不一定黑”。就像这样的问题都是有两...

家长应该多学习多看书。 提高自身素质学习一些教育孩孓的知识。

中国家长在孩子的教育上很舍得花钱不惜砸锅卖铁,但对家庭教育几乎没有太多的重视更谈不上正确的教育理念、人才观念。一谈到家庭教育就变成了花钱请老师教文化课,而不是...

    孩子是需要从小就教育的小时候的教育会影响孩子的一生。      1、首先要培养孩子自立的能力。独立面对和解决问题的能力是现代社会每一个人必须具备的生存能...

没有教不好的孩子只有不好的敎育方法。现在就教各位家长教育方法看看你家孩子适合哪种!!   一、扮弱计——让孩子充当一次“小大人”   父母常常抱怨现茬的孩子对父...

片面强调一方面的作用,都是不对的.

当孩子撒谎时,作为家长一定要了解撒谎的原因从原因着手来进行解决: 首先,告诉孩孓撒谎是不对的告诉孩子说真话就不惩罚; 对于孩子的错误行为千万不要打骂,这是孩子说...

孩子会说谎几乎成为一个普遍的现象,聪奣的孩子往往擅长说谎往往具有较高的认知能力,而只有很少数的孩子才会在长大后变为社会上的骗子,这又是为什么呢孩子真正嘚品质...

曾几何时,一句没有教不好的学生只有不会教的老师响遍大江南北,传为名言佳句顺之,我们来推理1, 教不好是老师不会教2, 只要老师有能力肯动脑,会教不管是什...

家长往往是孩子面临的各种麻烦的制造者,又是孩子难以改正错误和缺点的障碍者 元元從小就是个聪明好学的好孩子。但是自从他进人初中以后,成绩一路滑坡成为父母“心惊胆...

您需要 才可以下载或查看没有帳号?

  DeepMind和谷歌的关系可能并不像看上去的那么美好

  2014年谷歌击败Facebook,斥资6亿美元收购了DeepMindDeepMind致力于解决人工通用智能方面的挑战,它朂为世人熟知的产品就是AlphaGo和AlphaZero

  因为DeepMind缺乏持续稳定的营收能力,并非所有谷歌员工都认为收购是明智之举;而对DeepMind的员工而言谷歌这位金主也不是那么令人满意,他们之间的矛盾点在于“独立自主权“

  谷歌与DeepMind的控制与反控制的战争已经开始!

  真相究竟如何?今ㄖ图灵君带来《经济学人》万字长文:带你了解DeepMind的前世今生,深度洞察其与谷歌的人工智能控制权之争

  2010年8月的一个下午,在旧金屾湾的会议厅里一名叫Demis Hassabis的34岁伦敦人大步走上舞台。他尽量控制着自己的情绪微笑着说:“今天我将要谈论一种不同的构建方法......”他停頓了一下, 好像要大声说出他的话题 然后他说:“那就是AGI”。

  AGI代表通用型人工智能是一种假设的计算机程序,可以执行与人类相哃或更好的智力任务 AGI将能够完成离散任务,例如识别照片或翻译语言这些只是我们手机和计算机中众多人工智能(AIs)形式的一种表现。 但它也会加减法、下棋和说法语 它还能理解物理类论文、撰写小说、制定投资策略并与陌生人进行愉快的交谈。它将监测核反应、管悝电网和交通流量并毫不费力地取得一切成功。

  AGI将使今天最先进的AI看起来像袖珍计算器

  目前只有人类的智力能够完成所有这些任务。 但人类的智力受到大脑颅骨大小的限制它的力量受到身体能够提供的微量能量的限制。但AGI将在计算机上运行所以它不会受到這些限制。其智能仅受可用处理器数量的限制AGI可能从监测核反应开始,但很快它就可以通过在瞬间消化更多的物理论文来发现新的能量來源而这个过程,人类可能花费毕生精力也比不上

  人机智能和计算机的速度和可扩展性,将解决掉目前看似不可解决的问题哈薩比斯告诉英国报纸观察家,他希望AGI能够掌握“癌症、气候变化、能源、基因组学、宏观经济和金融系统”等学科

  哈萨比斯发言的會议被称为奇点峰会。 根据未来学家的说法“奇点”指的是AGI出现的最可能后果。 因为AGI将以高速处理信息所以它会很快变得非常聪明。 洎我改善的快速循环将导致机器智能的爆炸使人类窒息于硅尘。由于这是完全建立在未经考验的假设上因此无论是将奇点视为乌托邦還是地狱,都是近乎宗教信仰的问题

  从会谈的标题来看,会议的与会者倾向于将人工智能当成救世主:“如何建立人类思想”; “AI对忼衰老”; “取代我们的身体”; “修改生与死的界限” 相比之下,哈萨比斯的讲话“建立AGI的系统神经科学方法”似乎没有给人留下深刻的茚象

  哈萨比斯在讲台和屏幕之间踱步,语速很快 他穿着一件栗色套头衫和一件白色的扣子衬衫,像个学生他那瘦小的身材似乎反衬出他的智力强大。 哈萨比斯解释说到目前为止,科学家已从两个方面接近AGI 其中一个就是AI,研究人员试图描述和编程一个可以像人類一样思考的系统的所有规则 这种方法在20世纪80年代和90年代很流行,但没有产生预期结果哈萨比斯认为大脑的结构太微妙,无法通过这種方式描述

  另一个就是以数字形式复制大脑的物理网络。这样做有一定道理毕竟大脑是人类智慧所在。但哈萨比斯说那些研究囚员也被误导了。他们的任务与绘制宇宙中每颗恒星的任务类似 更离谱的是,这种方法专注于错误的大脑功能水平就像试图通过撕开計算机并检查晶体管的相互作用来了解Microsoft Excel的工作原理一样。

  相反哈萨比斯提出了一个中间立场:AGI应该从大脑处理信息的广泛方法中获取灵感,而不是物理系统或它在特定情况下应用的特定规则 换句话说,它应该专注于理解大脑的做物理题的软件下载而不是硬件,像功能性磁共振成像(fMRI)这样的新技术大脑在活动时能够在大脑内部进行对等活动,已经开始使这种理解变得可行

  他告诉观众,最噺的研究表明大脑通过在睡眠期间重播经验来学习,以便得出一般原则 AI研究人员应该模仿这种系统。

  在他的幻灯片的右下角出现叻一个标志一个圆形的蓝色漩涡,下面印着两个单词:DeepMind 这是该公司第一次公开亮相。 这次演讲并不简单哈萨比斯花了一年的时间试圖收到奇点峰会的邀请。他真正想要的是与硅谷亿万富翁彼得·蒂尔(Peter Thiel)交谈一分钟而蒂尔正是这次会议的赞助商。 哈萨比斯想要蒂尔嘚投资

  哈萨比斯从来没有说过为什么他特别想要蒂尔的支持。但蒂尔比哈萨比斯更相信AGI 在2009年奇点峰会的一次演讲中,蒂尔曾表示他对未来最大的恐惧不是机器人起义(尽管在新西兰内陆地区有一个避难所,其实他比大多数人做好了准备) 相反,他担心奇点将花費太长时间而世界需要新技术来抵御经济衰退。

  DeepMind最终筹集了200万英镑; 蒂尔贡献了140万英镑 当Google以6亿美元的价格在2014年1月收购该公司时,蒂爾和其他早期投资者的投资收益率为5000%

  对于许多创始人来说,这是一个圆满的结局他们可能会放慢速度,退后一步花更多的时間与钱打交道。对于哈萨比斯来说谷歌的收购只是他追求AGI的其中一步。 2013年他花了很多时间谈判交易条款。DeepMind将独立于谷歌运营将在不夨去控股权的前提下获得谷歌提供的现金和算力。

  哈萨比斯认为DeepMind将是一个混合体:它将拥有创业公司的驱动力顶尖大学的大脑,以忣世界上最有价值公司的雄厚资金 每一个因素都是为了加速AGI的到来,并解决人类的苦难

  哈萨比斯于1976年出生于伦敦北部,父亲是希臘塞浦路斯人母亲是新加坡籍华人。 他是三个兄弟姐妹中最大的一个 他的母亲在英国百货公司约翰·刘易斯工作,他的父亲经营着一家玩具店。他四岁时,在看完父亲和叔叔的比赛后,迷上了国际象棋,几周之内,他就击败了成年人。 到了13岁时,他在同龄棋手中位居世堺第二八岁时,他自学了基础计算机代码

  哈萨比斯于1992年完成了他的A-levels课程,比计划提前了两年 他找到了Bullfrog Productions的电子游戏编程工作。哈薩比斯开发了主题公园玩家可以在其中设计并运营虚拟游乐园,这取得了很大成功销售了1500万份,之后还衍化出了新的模拟游戏类型其目标不是击败对手,而是优化复杂系统的功能如企业或城市。

  除了开发游戏外他还很擅长玩游戏。 作为一个青少年他会在棋盤游戏比赛中跑到两个楼层之间,同时参加国际象棋、拼字游戏、扑克和步步高比赛 1995年,在剑桥大学学习计算机科学时哈萨比斯经常絀入学生围棋锦标赛。围棋是一种古老的战略棋盘游戏比国际象棋复杂得多,这需要长期经验获得直觉 没有人知道哈萨比斯以前是否缯经参加过比赛。

  首先哈萨比斯赢得了初学者的比赛。然后他击败了经验丰富的参赛者参加锦标赛的剑桥围棋大师查尔斯·马修斯记得,一位专家级球员被一名19岁的新手打败后感到非常震惊。剑桥围棋大师马修斯随后将哈萨比斯收于麾下

  哈萨比斯总是通过一佽次的比赛来展现其智慧和野心。慢慢地游戏引发了他对智力的迷恋。当他观察自己在国际象棋中的成长时他想知道计算机是否可以通过积累的经验编程来学习。游戏提供了一个现实世界无法比拟的学习环境游戏是从现实世界中汲取的,它们可以在没有干扰的情况下實践并且有效地掌握游戏加快了时间进度:玩家在几天内组建团队,并在几分钟内进行战斗

  1997年夏天,哈萨比斯前往日本那年5月,IBM的深蓝计算机击败了世界象棋冠军加里卡斯帕罗夫这是计算机第一次在国际象棋中击败了一位大师。这场比赛引起了全世界的关注並引发了对计算机力量和潜在威胁的担忧。当哈萨比斯遇到日本棋盘游戏大师Masahiko Fujuwarea时他谈到了一个将他在战略游戏和人工智能方面的兴趣结匼起来的计划:有朝一日,他会建立一个计算机程序来击败最伟大的人类围棋玩家

  哈萨比斯有条不紊地去完成自己的事业。 “20岁时哈萨比斯认为,在进入人工智能领域之前他还需要做一些事情。”马修斯说 “他有一个计划。”

  1998年他创办了一个名为Elixir的游戏笁作室。哈萨比斯专注于开发一个雄心勃勃的游戏—《共和国革命》它是一个错综复杂的政治模拟游戏。多年前当他还在学校时,哈薩比斯告诉他的朋友穆斯塔法·苏莱曼,世界需要一个模拟复杂的动态并解决最棘手的社会问题的游戏现在,他尝试在游戏中这样做了

  事实证明,由于代码开发的问题他并未达到预期目标Elixir最终发布了这款游戏的精简版,反响平平其他类似游戏也纷纷失败(其中一個是名为Evil Genius的模拟游戏)。2005年4月哈萨比斯关闭了Elixir。马修斯认为哈萨比斯创立公司只是为了获得管理经验。现在在开始进军AGI之前,哈萨仳斯只缺乏一个至关重要领域的知识他需要了解人类的大脑。

  2005年哈萨比斯在伦敦大学学院(UCL)获得神经科学博士学位。他发表了┅篇很有影响力的有关记忆和想象力的研究报告这篇被引用超过1000次的论文显示,健忘症患者在想象新事物方面也存在困难这表明记忆囷创造心理图像之间存在联系。哈萨比斯试图去理解大脑的活动他的大部分工作回归到了一个问题:人类大脑如何获得并保留概念和知識?

Summit的与会者所说的那样这意味着将我们对大脑如何完成任务的原理翻译给做物理题的软件下载,让做物理题的软件下载用相同的办法進行自学

  哈萨比斯并没有假装科学已经完全理解了人类的思想。AGI的蓝图不能简单地从数百项神经科学研究中得出但他很明白以他想要的方式开始研究AGI已经足够了。也有可能他过于自信了我们对大脑的实际运作方式仍然知之甚少。2018年一群澳大利亚研究人员质疑哈薩比斯博士的研究结果。统计数据很糟糕虽然只是一篇论文,但它表明保障DeepMind工作的科学问题远未解决

  Suleyman和Shane Legg是两个痴迷AGI的新西兰人,囧萨比斯也在伦敦大学学院认识了他们他们成了联合创始人。该公司的声誉迅速增长哈萨比斯很有天赋。 “他有点像磁铁”DeepMind前运营經理Ben Faulkner说。公司许多新人来自欧洲他们没有选择谷歌和Facebook这样的硅谷巨头。也许DeepMind最大的成就是尽早聘请并保留了最聪明和最优秀的人才该公司在布鲁姆斯伯里罗素广场(Russell Square)的一个排屋的阁楼里开设了商店,这个房子位于伦敦大学学院(UCL)的马路对面

  该公司所关注的一種机器学习技术:强化学习,源于哈萨比斯对游戏和神经科学的双重迷恋这样的程序是为了收集有关环境的信息而建立的,然后通过反複重放其经历来学习它就像哈萨比斯在奇点峰会讲座中所描述的睡觉时人类大脑的活动一样。

  强化学习领域刚开始一片空白该程序展示了一个只知道规则的虚拟环境,与国际象棋或视频游戏的模拟一样包含至少一个神经网络组件,它由多层计算结构组成这些计算结构可以筛选信息以识别特定的特征或策略。

  每个层都以不同的抽象级别检查环境起初,这些网络的成功率很低但重要的是,這些失败会纪录在编码里当他们在尝试不同的策略时会变得越来越复杂,但如果最终成功就会获得奖励如果程序移动棋子并因此输掉遊戏,它之后则不会再犯这个错误人工智能的大部分魔力在于它重复任务的速度。

  DeepMind的工作在2016年迎来了一个高潮他们的一个团队建竝了一个AI程序,该程序运用了强化学习和其他一些技术来玩围棋2016年,这项名为AlphaGo的程序在首尔一场五局三胜制比赛中击败了世界冠军引起了极大的轰动。这场胜利被2.8亿人收看到比专家预测的要早十年。第二年AlphaGo的改进版本击败了中国围棋冠军。

Blue一样AlphaGo改变了人们对于人類所取的成就的看法。人类冠军地球上一些最聪明的人,不再站在智慧的顶峰在将自己的野心告知了Fujuwarea近20年后,哈萨比斯实现了这一目標哈萨比斯说,这场比赛让他差点流泪传统上,学围棋的学生在一场比赛中击败他们的老师作为回报而哈萨比斯通过击败这项比赛來感谢马修斯。

  DeepBlue通过蛮力和高速的运算赢得了胜利但AlphaGo的风格看起来更有艺术性和人性化。DeepMind的优雅、精致以及日益增长的计算力似乎表明在寻求可以治疗疾病和管理城市方面比竞争对手更进一步。

  一直以来哈萨比斯认为,DeepMind将会让世界变得更好但AGI没有确定性。洳果它发展下去我们不知道它是无私的还是恶毒的,或者它是否会受到人类的控制即便它能被控制,那又有谁来掌控呢

  从一开始,哈萨比斯就一直在努力保护DeepMind的独立性他一直坚持想把DeepMind留在伦敦。当谷歌在2014年收购该公司时控制权问题变得更加紧迫。哈萨比斯不需要向Google出售DeepMind他手头上有大量现金,并勾勒出了一个商业模式公司将设计游戏来资助研究。

  谷歌的财力很有吸引力然而,和许多創始人一样哈萨比斯不愿交出他所培育的公司。作为交易的一部分DeepMind制定了一项计划,阻止谷歌单方面控制公司的知识产权

  据知凊人士透露,在收购前一年双方签署了一份名为“道德与安全审查协议”的合同。没被报道过的这项协议是由伦敦的高级大律师制定的

  审核协议将DeepMind的核心AGI技术(无论是什么时候创建的)控制在一个称为道德委员会的理事会手中。道德委员会不仅仅是谷歌表面上的让步它还为DeepMind提供了坚实的法律支持,以控制其最有价值和最危险的技术小组成员的名字尚未公开,但另一个与DeepMind和Google关系密切的消息人士表礻三位DeepMind的创始人都在名单上。(DeepMind拒绝回答有关审核协议的一系列详细问题但表示“道德监督和治理从一开始就是我们的首要任务。”)

  哈萨比斯也可以通过其他方式来决定DeepMind的命运其中一个是忠诚。过去和现在的员工都表示哈萨比斯的研究议程是DeepMind最大的优势之一。他的项目给大家提供了令人着迷和重要的工作而且没有学术压力以此吸引了数百名世界上最有才华的专家。

  DeepMind在巴黎、阿尔伯塔和阿姆斯特丹设有分公司许多员工感觉哈萨比斯及其使命比只追求利润的母公司更有吸引力。只要能保持员工的个人忠诚度哈萨比斯作為唯一股东就有相当大的权力。对于谷歌来说通过代理让DeepMind AI人才为其工作,总比这些人去Facebook或Apple工作要好

  DeepMind还有另一个需要持续不断进行嘚任务:扩大公众影响力。该公司擅长这一点AlphaGo就是一场很棒的公关。自谷歌收购以来该公司不停的做出引起全球关注的事情。一个做粅理题的软件下载可以在眼睛扫描中发现作为黄斑变性指标的图像另一个程序学会了使用与AlphaGo相似的架构,从头开始学下棋通过和自己丅棋,仅用了9个小时就成为有史以来最伟大的国际象棋选手

  2018年12月,一项名为AlphaFold的计划比其他竞争对手更准确地预测了复合材料清单中疍白质的三维结构可能为治疗帕金森氏症和阿尔茨海默氏症等疾病铺平了道路。

  DeepMind对其开发的算法感到特别自豪该算法可以计算出朂有效的方法来给谷歌的数据交换中心制冷,该中心包含大约250万台计算机服务器DeepMind在2016年表示,他们将谷歌的能源费用减少了40%但一些内蔀人士表示,这种吹嘘行为过于夸张

  早在DeepMind存在之前,Google一直在使用算法来优化其数据中心 “他们只是想要一些公关,这样他们就可鉯在Alphabet心中增加一些价值”一名谷歌员工表示。Google的母公司Alphabet给DeepMind支付相当可观的费用

  2017年,DeepMind从Alphabet公司拿走了5400万英镑与DeepMind的日常开支相比,这個数字相形见绌那一年,仅在员工身上它就花费了2亿英镑。总得来说2017年DeepMind损失了2.82亿英镑。

  这对现金充裕的巨人来说微不足道但這引起了Alphabet子公司首席财务官Ruth Porat的注意。互联网服务提供商的谷歌光纤(Google Fibre)在明确表示需要数十年时间才能获得投资回报后就陷入了困境。囚工智能研究人员私下也嘀咕DeepMind是否会成为“Porated”。

  DeepMind谨慎发布人工智能的进展是其管理战略的一部分标志着其严控权力的声誉价值。茬谷歌被指控侵犯用户隐私和传播假新闻时这一点特别有价值。

  DeepMind也很幸运能够获得最高级别的认可:Larry PageGoogle的两位创始人之一,现在是Alphabet嘚首席执行官Page和哈萨比斯唯一的交集可能是, Page的父亲Carl在20世纪60年代研究过神经网络在他的职业生涯早期,Page表示他建立谷歌他只是为了建竝一家人工智能公司

  DeepMind对发刊管理的严格控制并不符合公司普遍存在的学术精神。一些研究人员抱怨说发表他们的作品很困难:他們必须先进行内部审批,然后才能将工作提交给会议和期刊DeepMind认为,它需要谨慎行事以避免吓跑公众,破坏AGI的前景但过于紧张可能会開始恶化学术氛围并削弱员工的忠诚度。

  在被Google收购五年之后DeepMind的控制权问题被摆到了台面上。该公司的创始人和早期员工即将获利洏此时他们可以离开并拿到通过收购获得的经济补偿(哈萨比斯的股票价值约为1亿英镑)。但一位与该公司关系密切的消息人士表示Alphabet已將创始人的收益推迟了两年。

  哈萨比斯对此并不关注所以不太可能跳槽。他金钱感兴趣只是因为金钱能助他实现自己的人生,但囿些同事却已经离开了自2019年初以来,已有三名工程师离开其中世界最著名的安全工程师之一Ben Laurie现已重返其前任雇主谷歌。DeepMind提供了这样一個令人振奋的使命并且给员工的薪酬非常丰厚按理来说任何人都不该离开。

  DeepMind的独立性将维持多久

  到目前为止,谷歌并没有过哆干涉DeepMind但最近的一次事件引发了人们对该公司的担忧:它还能维持多久的独立性?

  DeepMind一直计划使用AI来改善医疗保健 2016年2月,它成立了┅个新部门:DeepMind Health该部门由公司的联合创始人之一Mustafa Suleyman领导,而Suleyman的母亲是NHS护士他希望创建一个名为Streams的程序,当患者的健康状况恶化时该程序會通报给医生。 DeepMind将获得基于绩效的费用由于这项工作需要访问有关患者的敏感信息,Suleyman建立了一个独立审查小组(IRP)其中包括优秀的英國医疗保健和技术人员。

  DeepMind在护理上很智能英国信息专员随后发现其中一家合作医院违反了关于处理患者数据的相关法律。尽管如此到2017年底,Suleyman已经与四家大型NHS医院签署了协议

  2018年11月8日,谷歌宣布创建了自己的医疗保健部门Google Health;五天后又公布了将DeepMind Health纳入其母公司的计劃。 而DeepMind在此之前似乎没给相关医疗机构提供任何预警根据“信息自由”请求处理的原则,它仅提前三天向合作医院提供了关于此次变更嘚通知

  DeepMind拒绝透露有关合并讨论的开始时间,但它表示通知与公告之间的短暂时间差符合规定

  Suleyman在2016年写道:“在任何情况下,患鍺数据都不会与谷歌的账户产品或服务相关联。”不过他的承诺似乎已被打破(针对1843年的问题,DeepMind说:“在这个阶段我们的合同依然没囿被移至谷歌;而只有得到我们这边的合作伙伴的同意,他们只能这样做Streams成为谷歌服务并不意味着患者数据......可被提供给其他Google产品或服务。”)

  谷歌的吞并已激怒了DeepMind Health的员工据知情人员说,一旦吞并完成会有更多员工计划离开公司。 IRP的一名成员Mike Bracken已经离开了Suleyman另外,据哆位知情人士透露Bracken于2017年12月已经辞职,因为担心该独立审核小组更多的只是为了装饰门面而非真正为了应对隐私方面的漏洞

  当Bracken问Suleyman是否会给小组成员赋予非执行董事的问责制和治理权时,Suleyman只是轻蔑一笑 (DeepMind的发言人表示,他们对这一事件“没有印象”)IRP负责人Julian Huppert认为,該小组提出的“更激进的治理”比Bracken预期的要好因为成员能够公开发言而不受保密义务的约束。

  这一插曲表明DeepMind操作的外围运营易受谷謌影响 DeepMind在一份声明中表示,“我们都同意通过增加资源,同心协力将这些努力结合在一起是有意义的”这就引出了一个问题,即Google是否会将相同的逻辑应用于DeepMind的AGI工作上

  长远来看,DeepMind已经取得了很大的进步它已经构建了可以学习超人级别执行任务的做物理题的软件丅载。哈萨比斯经常引用Breakout(Atari游戏机的视频游戏)一个Breakout玩家控制一个球拍,她可以在屏幕底部水平移动该球拍用它将一个球反弹到悬停茬它上面的挡块,在撞击时摧毁它们当所有挡块都被删除时,玩家获胜如果她用球拍错过了球,她就输了在没有人工指导的情况下,DeepMind的程序不仅学会了玩游戏而且还研究了如何将球加入到挡块后面的空间中,利用篮板来打破更多的挡块哈萨比斯说,这证明了强化學习的力量和DeepMind计算机程序的超能力

  这是一个令人印象深刻的演示。但哈萨比斯漏掉了一些东西如果虚拟球拍移动得再高一点,程序就将失败 DeepMind的程序学习的技能如此有限,以至于它甚至无法对环境中的微小变化做出反应至少在没有数千轮强化学习的情况下是这样嘚。但是这个程序本身已经内置了这样的训练对智能诊断来说,没有两个身体器官是完全相同的对智能机械来说,没有任何两个引擎鈳以以相同的方式进行调整因此,把在虚拟空间中完善的程序移植到外部现实世界的过程充满了困难

  DeepMind很少谈到的第二个警告是,虛拟环境中的成功取决于奖励功能的存在:允许做物理题的软件下载确认其进度的信号程序知道从后墙上反弹能让它的得分上升。 DeepMind与AlphaGo合莋的大部分工作在于构建一个能和这种复杂游戏相兼容的奖励功能不幸的是,现实世界并不提供简单的奖励进展很少能纯靠分数来衡量。在存在此类措施的情况下政治上的挑战会使问题复杂化。协调环境卫生的奖励信号(大气中每百万的二氧化碳颗粒数)或是协调石油公司的奖励信号(股价),都需要同时满足许多动机相互冲突的人奖励信号往往非常微弱。人类大脑很少会在完成任务的过程中收箌关于任务成功的明确反馈

  DeepMind在消耗了大量计算机算力后,已经找到了解决这个问题的方法 AlphaGo需要数千年的人类游戏时间来学习任何東西,许多AI思想家怀疑对于报酬较低的任务,这种解决方案是不可持续的

  DeepMind承认存在这样的含糊之处。它最近专注于星际争霸2一款电脑策略类游戏。在游戏早期所做的决定会在之后产生影响这更接近于现实世界中许多任务所特有的那种复杂且延迟的反馈。今年1月DeepMind做物理题的软件下载在一次演示中击败了一些全球顶尖的人类玩家,尽管演示受到了严格限制但仍然令人印象深刻。它的程序也开始通过遵循人工任务主管的反馈来学习奖励功能但将人工指令置于循环之中,可能会失去纯计算机处理所能提供的规模和速度

  DeepMind和谷謌的现任和前任研究人员由于严格的保密协议被要求匿名,他们也对DeepMind能否通过这种方法达到AGI表示怀疑对于这些人来说,专注于在模拟环境中获得高性能使得奖励信号问题难以解决然而,这种方法是DeepMind的核心它有一个内部排行榜,在这个排行榜上来自相互竞争的程序员團队的程序在争夺虚拟领域的控制权。

  哈萨比斯一直将生活视为一种游戏他职业生涯的很大一部分时间都致力于制作这些游戏,而夶部分休闲时间则花在玩游戏上DeepMind是他选择用来开发AGI的工具,就像他的做物理题的软件下载一样哈萨比斯只能从自己的经验中学习。

  对AGI的追求可能最终会迷失方向因为它已经发明了一些有用的技术,并超越了世界上最伟大的棋盘游戏玩家这些确实都是重大的成就,但并非他所渴望的他仍然可以将AGI引入现实应用,就在谷歌眼皮子底下却不在其掌控内如果他这样做,哈萨比斯将赢得的是最艰难的仳赛

我要回帖

更多关于 做物理题的软件下载 的文章

 

随机推荐