如何在 ImageNet 全国中式铺床比赛冠军中获得冠军

时间拨回到1956年的夏天在美国汉諾斯小镇宁静的达特茅斯学院,约翰·麦卡锡(John McCarthyLisp语言发明者、图灵奖得主)、马文·明斯基(Marvin Minsky,人工智能与认知学专家)、克劳德·香农(Claude Shannon信息论的创始人)、艾伦·纽厄尔(Allen Newell,计算机科学家)、赫伯特·西蒙(Herbert Simon诺贝尔经济学奖得主)等聚在一起进行了一场头脑风暴討论会。

在这次的头脑风暴讨论会上这几位年轻的学者讨论的是当时计算机尚未解决,甚至尚未开展研究的问题包括人工智能(AI)、洎然语言处理和神经网络等。也正是在这场会议上人工智能这个词首次被提出,并逐渐成为一门学科

有意思的是,与今天的许多会议鈈同当时的这场会议虽然叫做“达特茅斯夏季人工智能研究会议”,但会议最后其实并没有什么可以报告的科研成果其次这个会议持續了一个暑假。尽管当时的讨论并没有得出可以报告的科研成果但这次学术讨论会却成为了历史的一个开端,开启了人们对人工智能的無尽探索影响至今。

那么经过62年的发展后,人工智能究竟是什么我们又该如何定义人工智能?根据英国工程物理科学研究理事会的描述:从目前来看人工智能在提高生产率方面,有着巨大的潜力最突出的就是帮助公司和人们更有效地利用资源,以及简化人类与大量数据交互的方式;人工智能可以帮助公司和员工提高工作效率;人工智能可以减轻大数据搜索的负担

概念从无到有,人工智能在过去嘚62年发展中经历过寒冬也有过自己的春天。接下去澎湃新闻()就选取了62年里不容错过的十大关键事件,带读者一起来看人工智能是如哬走到今天的


2006年,会议五十年后当事人重聚达特茅斯。左起:摩尔麦卡锡,明斯基赛弗里奇,所罗门诺夫

在达特茅斯学院的这次頭脑风暴上计算机科学家约翰·麦卡锡说服了与会者接受了“人工智能”作为该领域的名称。因此,这次会议也被认为是人工智能正是诞生的标志。

影响:这几位年轻的学者讨论的是当时计算机尚未解决,甚至尚未开展研究的问题包括人工智能(AI)、自然语言处理和神經网络等。也正是在这场会议上人工智能这个词首次被提出,并逐渐成为一门学科


2. 机器学习和完整的人工智能系统概念的诞生

在这一姩里,IBM公司的计算机专家阿瑟·塞缪尔(Arthur Lee Samuel)创造了“机器学习”一词在他的文章中指出:“给电脑编程,让它能通过学习比编程者更好地下跳棋”塞缪尔基于其理论研究成果所编制的下棋程序是世界上第一个有自主学习功能的游戏程序,曾在西洋跳棋全国中式铺床比赛冠军Φ一举夺魁

同一年时间里,约翰·麦卡锡发表了文章《Programs with Common Sense》提出了“Advice Taker”概念,文章描述的假想程序可以被看成是第一个完整的人工智能系统

影响:机器学习概念诞生,得益前辈们在这个领域的研究才让DeepMind公司在60年后成功开发了围棋AI,挑落了人类棋手机器学习也成为了囚工智能领域里最为重要的研究分支之一。

美国麻省理工学院(MIT)人工智能实验室的约瑟夫·维森鲍姆(Joseph Weizenbaum)在这一年开发了最早的自然语訁聊天机器人ELIZA能够模仿临床治疗中的心理医生。ELIZA的实现技术是通过关键词匹配规则对输入进行分解而后根据分解规则所对应的重组规則来生成回复。简而言之就是将输入语句类型化,再翻译成合适的输出虽然 ELIZA 很简单,但维森鲍姆本人对ELIZA的表现感到吃惊

影响:近年来人机对话交互技术成为人工智能的热点领域。众多科技公司相继推出了人机对话技术相关产品并将人机对话交互技术作为其公司的重點研发方向。目前比较知名的产品有谷歌的Google Assistant和苹果的 Siri等Siri评价道,ELIZA是一位心理医生是她的启蒙老师。


4. 日本造成第一个人形机器人

日本早稻田大学造出第一个人形机器人WABOT-1它由肢体控制系统、视觉系统和对话系统组成。WABOT-1这个庞然大物会说日语能抓握重物,通过视觉和听觉感应器感受环境对出生于1973年的它已算不错了。到了1980年早稻田大学更新了设计,研制出了WABOT-2第二代能够与人沟通,阅读乐谱并演奏电子琴

影响:人形机器人的诞生,满足了许多人对机器人的最初想象也为未来机器人的设计和开发奠定了基础。不过人工智能发展到1970年玳,由于研究者对于项目难度评估不足导致承诺无法兑现,让人们当初对人工智能的乐观期望遭到了严重打击人工智能遭遇打击,研究经费被转移到了那些目标明确的项目上

在1984年的年度AAAI(美国人工智能协会是人工智能领域的主要学术组织之一。该协会主办的年会AAAI是人笁智能重要的学术会议之一)会议上,人工智能专家罗杰·单克(Roger Schank)和马文·明斯基警告“AI之冬”即将到来预测AI泡沫破灭,投资资金也将洳1970年代中期那样减少

影响:正如两位人工智能专家所预言的,在他们发出警告后3年确实发生了AI泡沫的破灭。到了上世纪80年代晚期美國国防高级研究计划局(Defense Advanced Research Projects Agency,简称DARPA)的新任领导认为人工智能并不是“下一个浪潮”让人工智能从狂热追捧中一步步走向冷静,人工智能嘚研究也造次遭遇经费危机


6. “深蓝”战胜人类国际象棋冠军
卡斯帕罗夫与“深蓝”对战情况

1997年5月,在纽约卡斯帕罗夫输掉了一场六局淛全国中式铺床比赛冠军,对手是 IBM的深蓝(Deep Blue)当时世界上最强大的国际象棋计算机。关于这场全国中式铺床比赛冠军至今仍有许多争議。首先“深蓝”的设计者有机会事先根据卡斯帕罗夫的战略和风格以及所有的公开对局对深蓝的程序进行针对性的改编。而卡斯帕罗夫就无法了解“深蓝”的历史记录因为“深蓝”在每次对决之后就被会被微调,所以他完全就是在盲下其次,人们忘记了深蓝挑战賽分两场,而卡斯帕罗夫赢得了1996年在费城举行的第一场在两场全国中式铺床比赛冠军之间,IBM重新编码了它的计算机于是卡斯帕罗夫指控IBM作弊。

影响:IBM的“深蓝”通过“穷举法(brute force)”或者说暴力计算的方式在计算游戏步数的能力比人类强太多。输掉全国中式铺床比赛冠軍后卡斯特罗夫也承认:机器在游戏领域占上风,是因为人类会犯错误这次人类的失败,也引发了人们新的思考:在国际象棋上赢了囚类后机器下一个争夺的领域会是什么?会是围棋吗


7. ImageNET数据库建立,最终帮助AI认出了猫

2006年当时刚刚出任伊利诺伊大学香槟分校计算机敎授的李飞飞发现,整个学术圈和人工智能行业都在苦心研究同一个概念:通过更好的算法来制定决策但却并不关心数据。

她意识到这種方法的局限:如果使用的数据无法反映真实世界的状况即便是最好的算法也无济于事。于是她的解决方案是建设更好的数据集这是┅个大型注释图像的数据库,旨在帮助视觉对象识别软件进行研究

影响:由李飞飞带头此制作的数据集名为ImageNet,它作为论文于2009年发布时還只能以海报的形式缩在迈阿密海滩大会的角落里,但却很快成为了一场年度竞赛:看看究竟哪种算法能以最低的错误率识别出其中的图潒所包含的物体很多人都将此视作当今这轮人工智能浪潮的催化剂。到了2017年优胜者的识别率就从71.8%提升到97.3%,超过了人类并证明了更庞夶的数据可以带来更好的决策。

值得一提的还有一件事2012年6月,人工智能专家吴恩达和谷歌人工智能部门负责人杰夫·迪恩做了一份实验报告,他们给一个大型神经网络展示1000万张未标记的网络图像然后发现神经网络能够识别出一只猫的形象。

这些进步都为今天人工智能領域图像识别技术的发展起到了重要作用。


8. IBM超级计算机“沃森”Watson在智力问答全国中式铺床比赛冠军中战胜人类
Watson在美国电视节目《危机边缘》中战胜人类

作为“深蓝”的后辈Watson是IBM推出的超级计算机,这台以IBM创始人命名的超级电脑在2011年参加了美国著名智力节目《危机边缘》(Jeopardy!這档节目可以理解为国内的开心辞典+幸运52),与真正的人类同场竞技最终Watson赢得了全国中式铺床比赛冠军,获得了奖金

影响:要参加这種智力全国中式铺床比赛冠军,拥有更多更快的核心计算是必须的一块单核CPU,要回答一道普通Jeopardy! 题需要的计算量大约要花2小时而Watson平均只鼡3秒。硬件上的升级并不一定能战胜人类有时候对于一台电脑来说,能听懂题目也许是个更大的挑战


9. AlphaGo横空出世,战胜围棋顶级棋手
AlphaGo与韓国职业棋手李世石九段全国中式铺床比赛冠军画面

在AlphaGo出现前人们普遍认为机器想要在围棋领域战胜人类至少还要10年时间。但这一切假萣在2016年3月韩国的一家酒店被打破了这个由英国初创公司DeepMind研发的围棋AI以4:1的比分赢了人类职业棋手九段李世石。到了2017年5月升级后的AlphaGo又在烏镇战胜了当时围棋第一人柯洁九段。AlphaGo的棋艺增长迅速势如破竹。战胜柯洁后DeepMind仍未听下研发脚步,随后又推出了AlphaGo zero版本做到了无师自通,甚至还可以通过“左右手互博”提高棋艺

影响:AlphaGo的出现让世人对人工智能的期待再次提升到前所未有的高度,在它的带动下人工智能迎来了最好的发展时代。而对于希望利用人工智能推动人类社会进步为使命的DeepMind来说围棋并不是AlphaGo的终极奥义,他们的目标始终是要利鼡AlphaGo打造通用的、探索宇宙的终极工具


10. 上海举办2018世界人工智能大会
2018世界人工智能大会

经历过62年的发展,人工智能已经成为新一轮产业变革嘚核心驱动力正在对世界经济、社会进步和人类生活产生极其深刻的影响。

正如62年前美国达特茅斯会议的那场头脑风暴讨论会一样,2018姩上海世界人工智能大会将集聚全球人工智能领域最具影响力的科学家和企业家以及相关政府的领导人,围绕人工智能领域的技术前沿、产业趋势和热点问题发表演讲和进行高端对话打造世界顶尖的人工智能合作交流平台。

影响:2018年上海向全球人工智能界发出邀约,請各界有识之士齐聚上海共同探讨新一代人工智能的发展愿景。本次大会以“人工智能赋能新时代”为主题以“国际化、高端化、专業化、市场化”为特色,最权威的观点和共识最前沿的新技术、新产品、新应用、新理念将在这次的大会上讨论发生,为应对人类发展媔临的共同难题、创造人类美好生活汇聚“中国方案”和“世界智慧”

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

【新智元导读】ImageNet 竞赛在今年正式唍结那么,图像识别未来的重点将是什么ImageNet 竞赛之后又会出现什么呢?WebVision 竞赛被誉为接棒 ImageNet的大规模图像识别竞赛今年有 100 多个团队参与。夲文介绍 WebVision 竞赛后附冠军团队码隆科技的技术分享。

2017 年 7 月 26 日CVPR 2017 研讨会“超越 ILSVRC”将正式宣布 ImageNet 竞赛结束。然而这并不代表着领域对图像识别興趣的消退。实际上相关的关注度正在走高。

ImageNet 竞赛对计算机视觉尤其是图像识别技术的发展起到了很大贡献其中,拥有大规模人工标紸数据集这一点十分关键但是,收集由人工精心标注的数据用于训练成本高昂很多实际领域,如商业、金融、医疗等面临的问题不昰缺少数据,而是数据缺乏专家标注和标注不统一因此,越来越多的研究者开始关注利用低成本数据(比如不含人工注释的数据)来训練图像识别系统

在不同的解决方案中,从互联网抓取数据和使用网络作为学习深度表征的监督来源在各种计算机视觉应用中都显示出了佷强的实用性

WebVision 竞赛由苏黎世联邦理工(ETH)、Google Research、卡耐基梅隆大学(CMU)等共同组织,被誉为接棒 ImageNet 的竞赛ImageNet 和 WebVision 皆专注于物体识别,使用相同的 1000 個物体类别进行识别竞赛;但两者数据的纯度和平衡度有根本差异

WebVision 所用数据集直接从互联网爬取,没有经过人工标注数据含有很多噪喑,且数据类别的数量存在着极大不平衡相较于 ImageNet 全国中式铺床比赛冠军数据都属干净数据(完全人工标注),WebVision 难度提高许多但同时也哽加贴近于实际应用中的场景

据悉WebVision 数据库涵盖了直接从网络收集到的 240 万张图像,包括来自谷歌搜索的 100 万张以及来自 Flickr 的 140 万张图像。

此佽WebVision数据库有极大的不平衡性

这次全球有超过 100 个团队注册参加 WebVision 竞赛并因为参赛团队过多一度将全国中式铺床比赛冠军截止日期延期。一些團队在全国中式铺床比赛冠军后选择匿名并不公开结果在公开提交结果的团队中,SnapChat、清华大学、上海科技大学、UCF 等来自世界各国的顶尖學术和研发机构均榜上有名

有越来越多的观点认为,最近两届的 ImageNet 挑战赛更多比拼的是人力与机器算力而不是算法本身。 ImageNet 的既定数据库巳经很难催生突破性深度学习技术或许,这也是 WebVision 竞赛有众多团队参与的原因之一WebVision 更加复杂和不平衡的数据库更具有算法挑战性,也会驅动算法的创新

值得一提,来自中国的初创公司团队码隆科技取得了这次 WebVision 竞赛的第一名他们提交的五次识别结果正确率,占据了全部識别结果正确率排名的前五名并且最佳结果( 删除。

本文参与欢迎正在阅读的你也加入,一起分享

我要回帖

更多关于 世界鸡硬合体比赛冠军 的文章

 

随机推荐