深度学习在国际象棋的表现会比穷举算法更好么

篮球鞋 | 电子竞技 | 梅西(lionelmessi) | 自行车运动 | 日本文化 | 机械 | 德国足球甲级联赛 | 宠物医生 | 中国足球 | 用户界面设计师 | 滑雪 | 自行车选购 | acg | 高考志愿 | 国家队 | 汽车购买 | 运动损伤 | 欧美明星 | 设计 | 大数据 | 肖战 | 中药 | 哲学 | 直播 | 3D | 电视节目 | 理科 | 欧洲 | NBA 2K | 拜仁慕尼黑足球俱乐部 | ps4 | 捷安特 | 大学专业 | 巴塞罗那足球俱乐部 | 香港购物 | 玄幻小说 | 跑鞋 | pmp | 欧洲冠军联赛 | 土拨鼠 | aj1 | 牙齿 | 尤文图斯 | 女同性恋 | 天气 | 口臭 | 足球鞋 | 户外运动 | 少帅 | 亲子鉴定 | 配音 | 角色扮演 | 手机游戏 | 旅游线路 | 郭德纲 | 旅游推荐 | 梦想改造家 | 中学 | 北京国安 | ISIS（伊斯兰国） | 一级方程式赛车（f1） | iPhone | 拼多多 | 户外 | 罗兰 | 中国 | 电源 | 金蝶 | 百度知道 | 用户界面设计 | 女排 | 城市 | 电脑 | QQ音乐 | 复仇者联盟（电影） | 室内设计 | 政府 | 人生 | 三国杀 | 韩国旅游 | 微博 | 有机化学 | 我的世界（minecraft） | 鉴定 | 汽车维修 | 戚继光 | 古汉语 | akb48 | 科幻小说 | 建筑设计 | 梵蒂冈 | 张帅 | 完美世界（游戏） | 电吉他 | 北京 | 眼镜 | 昆山 | 美容护肤 | 足球规则 | 多肉植物 | 荷兰 | macos | 昌平区 | 对联 | 曼彻斯特联 | 南京 | 实况足球（游戏） | 鹿晗 | 新闻 | 西藏大学 | 貂蝉 | 湖北 | 网易 | 借记卡 | 剧场版 | 安踏体育 | 网球王子 | 住宅风水 | 汉语 | 广播体操 | 营销策划 | 用户界面 | 武侠小说 | 汽车改装 | 张璐 | 高三 | 海军工程大学 | 诗歌 | 富平县 | 盗墓笔记（小说） | 高速公路 | 青年旅舍 | 离婚 | 相声演员 | 阿迪达斯(adidas) | 中国足球协会超级联赛（csl） | 烹饪学校 | 婚纱照 | 发烧 | 流星花园 | 动车 | 赚钱 | 爱奇艺 | 铜陵市 | 澳大利亚 | 头发 | 环境保护 | 跑步爱好者 | 后宫·甄嬛传（书籍） | 书法 | #全民答题# | 阿迪达斯 | 外星人 | 象棋 | 牛皮癣 | 动画电影 | 眼睛 | 平面设计 | 运动会 | adidas阿迪达斯 | 诸葛亮 | 云南旅游 | 巴黎 | 少数民族 | 云南 | 小品 | 跑步鞋 | 性价比 | 减脂 | 巴西 | 葡萄酒 | 非洲 | 考研 | 美容 | 张继科 | 挖掘机 | 红酒 | 淘宝网 | 战斗机 | 郭富城 | 曼彻斯特联（Manchester United） | 音乐剧 | 年会 | 易烊千玺 | 骨折 | 传统武术 | 模特 | 平板电脑 | 家用电器 | 华为手机 | 双眼皮手术 | 钢笔 | 娱乐圈 | 游泳馆 | 腾讯产品 | 法国足球甲级联赛 | 趣味 | 身高 | 日语歌曲 | 支付宝 |

你的位置：网站首页 >> 频道首页 >>学习 >>深度学习在国际象棋的表现会比穷举算法更好么

深度学习在国际象棋的表现会比穷举算法更好么

来源：蜘蛛抓取(WebSpider) 时间：2017-01-25 15:00 标签：

百度清华都在投入！31页报告解读全球深度学习产业链--百度百家
百度清华都在投入！31页报告解读全球深度学习产业链
分享到微信朋友圈
8年能挖出1000亿市场，光是具有图像识别能力的人工智能在数据挖掘方面的市场就潜力无限。
智东西（公众号：zhidxcom）
提及人工智能，不知你是否想到的还是AlphaGo大战李世石的那一场大戏，不知你是否在为科幻电影中的脑洞感到恐惧？
事实上，人工智能没有你想的那么强，也没有那么不接地气。当前人工智能的能力还处在非常早的时期，但它能帮助人们在海量数据分析层面可以带来的市场价值绝对超出你的想象。而且，就是现在，当前的技术已经有相当大的应用价值，我们并不是在畅想未来。
本周的智能内参推荐的报告来自Tractica，这是美国的一家市场调研智库，重点研究人机交互。报告主要解释了深度学习如何对机器视觉市场起到推动作用，也就是指人工智能识别图像的能力。报告同时对全球的深度学习产业链进行了梳理，还预测了深度学习对几大行业推动的市场预测。可以在智东西（公众号：zhidxcom）回复关键词“深度学习”下载报告全文。
简单介绍一下人工智能发展史上里程碑式的时间节点：
1956年夏天，“人工智能”这个术语在达特茅斯会议上正式出现；
1958年，模拟人工神经网络的感知机第一次出现；
1961年，出现了微积分解算机；
1962年，出现了国际跳棋程序；
1964年，出现了自然语言代数解算机；
1967年，人工智能开始学习国际象棋的知识；
日，在当年横扫北美票房和奥斯卡，讲述人工智能的科幻电影《2001：太空漫游》上映；
1969年，由Marvin Minsky和Seymour Papert创作的人工神经网络著作《感知》出版；
1970年，人工智能第一次寒冬来临。
2007年，阿尔伯塔大学的研究员们解决了跳棋问题；
2010年，谷歌组建了自动驾驶车；
2010年，Narrative Science公司创造了会自己写新闻的人工智能Quill；
2011年，IBM Watson参加综艺节目《危险边缘》并赢得了人机对战的胜利；
2012年6月，谷歌进行了无人监管人工智能测试；
日，科幻电影《Her》上映；
2015年4月，人工智能企业应用出版；
当然还有近期的AlphaGo事件……
而如今的深度学习产生的3个重大变化是：数据量的大幅增加，硬件的快速增长以及算法的进步。
到2024年，深度学习仅仅在软件方面的市场价值就会超过104亿美元，更何况硬件和服务方面的收入会是软件份额的数倍以上。
作者Bruce Daley是Tractica的首席分析师，著有《Where Data Is Wealth: Profiting from data storage in a digital society》一书，他分享的这篇报告主要介绍了深度学习的差异，市场驱动力和障碍以及深度学习市场的应用和预测等方面。
Tractica是美国的一家市场调研智库，重点研究人机交互。开篇简介过，这里就不再赘述了。
深度学习会给机器视觉带来哪些变化？
下面画像里的大叔就是作者本人。使用深度学习技术可以通过数字手段就行绘图。以某种风格的图形作为函数，输入一张图片作为内容，就能输出同一内容转换风格的画作。
在这样的思路下，多种多样的风格都可以被具体为某一函数，对图像进行作用。
偶尔还会出现美学价值很高的作品。（彩蛋：你有看到熟悉的baby女神吗？~）
而这些使用Photoshop，C++，PaintBrush就可以实现了。
这样一来，通过模型模仿并简化大脑神经网络，通过数据将思想具象化，再通过技术手段再造艺术，深度学习就这样影响了机器视觉。
在这个信息爆炸的时代，数据量已经远远超过了人工分析能够处理的量级。数据的增长也会伴随着科技产品的整个生命周期。
市场驱动力和障碍
市场的驱动力包括了：
数据的增长，硬件性能的改进（包括GPU，FPGA，ASSP），软件算法的进步，宏观市场和经济趋势。
市场障碍包括：
技术限制，人们的预期与现实之间的差异，社会关切，政策和监管因素，人才的缺乏以及市场的不成熟。
这里作者为我们梳理了深度学习的市场图谱：
目前的开源工具有：
H20.AI ，TensorFlow ，Theano，CNTK，Torch，Caffe ，KALDI。
在深度学习方面投入研发的大学有：
麻省理工学院，牛津大学，普渡大学，加州伯克利，纽约大学，瑞士Dalle Molle人工智能研究所，多伦多大学，清华大学，蒙特利尔大学，香港大学，斯坦福大学，卡内基梅隆大学。
大型科技公司有：
微软，IBM，谷歌，Facebook，Uber，亚马逊，苹果，百度。
半导体公司有：
英伟达，高通，英特尔，赛灵思。
深度学习市场的应用和预测
应用举例：图形标记和所属者识别。
先来看一下市场需求。Facebook上的用户每天将3亿5千万张新照片传上网，谷歌被预测其拥有的可被索引的图片数量超过一万亿张。这些图像在网上都有其价值，但这样的工程量不是人工可以解决的。
所以我们只能依靠结合机器视觉的人工智能解决上述问题。
市场预测：广告服务业。
上述问题涉及到的公司是Facebook，谷歌和百度，到2024年，深度学习在全球广告服务业的软件收入将逼近30亿美元。（图中底部蓝色柱形表示北美市场，上部紫色柱形代表亚太市场。下同）
谷歌主任研究员Pete Warden表示：“差不多谷歌所有的产品都能用上深度学习技术”。
应用举例：数字放射图像（X光）。
咱们看病，拍个片子找医生诊断，无比麻烦，又贵！掌握机器视觉技能的人工智能也能干这活！省钱，省时间，还能做到比人出错少！
市场预测：医疗诊断行业。
涉及到的大公司是IBM，谷歌和Enlitic，到2024年，深度学习在全球医疗诊断业的软件收入将逼近3亿美元。这样基于检测证据的医疗技术可以推动机器处方以及新的商业模式，尤其是在发展中国家。（是不是一瞬间想起了频繁攻占医院的马云爸爸？！）
应用举例：农作物健康分析。
这项技术的一个基本出发点就是，把天上都卫星当超级稻草人！卫星拍回来的实时图像通过会CV（computer vision机器视觉）的AI（artificial intelligence人工智能）加以判断，可以解决的问题有：地球这个大农场，各地的粮食长的怎么样啊？土壤是否健康啊？有没有气象天灾有可能带来减产啊，河流和灌溉怎么支配啊，树冠涨的好不好啊？等等等等。
市场预测：农业。
涉及到的大公司是Monsanto，Nervana，GeoVisual，到2024年，深度学习在全球农业的软件收入将超过2亿美元。（不知习大大去东北视察黑土地时会不会想到这个问题~）
应用举例：药物依赖性的临场试验。
需求就是，一直以来，患者没有不遵医嘱按时服药等问题会在临床实验上引起极严重的后果。
市场预测：医疗保健业。
涉及到的大公司是IBM，AiCure，MGH，到2024年，深度学习在全球广告服务业的软件收入将超过7500万美元。人们使用这样的技术应用于医疗保健并管理自己的生活，意义在于通过长期的习惯建立来获得长久的健康。
应用举例：服装尺码和试装。
这里就需要从数据挖掘市场潜力啦。很多其他门类的商品线上销量差不多都达到了总体销量的50%，而服装类一直徘徊在20%左右。还是因为人们需要去实体店解决尺码和试装的问题。
市场预测：零售业。
涉及到的大公司是苹果，亚马逊和Thirdlove，到2024年，深度学习在全球零售业的软件收入将逼近8亿美元。（马云爸爸二次出镜，你听到深度学习向你呼唤了吗？）
应用举例：制造业的例子，品控。
2012年，全球被召回汽车的数目几乎等于汽车的销量，大量的担保费用影响了汽车制造商们的利润。
市场预测：制造业。
涉及到的大公司是通用，日本的METI，波音和Airbus，到2024年，深度学习在全球制造业的软件收入将超过10亿美元。会CV的AI在这一方向上的研究和应用还很少，但是中美以及强劲复苏的日本都会在这方面发力。
总结看来，深度学习对数据强烈依赖，而分析图像数据，更是要求人工智能拥有机器视觉的能力。而数据的来源本身以及各种应用场景都会带来全新的商业模式，加上更快的硬件，更好的软件，找对商业模式的公司就会在这波爆发中胜出。
在创造新的商业模式的同时，深度学习也会破坏甚至终结一些旧的商业模式。比如Uber之于出租公司，阿里之于线下零售商，airbnb之于酒店业，Facebook之于社交媒体。管理服务公司Salesforce的CEO&Marc Benioff&认为：“在各行各业，特别是科技行业，人们总是高估其一年内的生产力，却低估坚持十年所能产生的伟大变化”。
扩展阅读，大家可以自取所需。
智能内参的观察是：这里所有市场预测的一大共性是：当前，机器学习的市场几乎还处于萌芽状态，从未来八年的增长态势观察，我们看到了一个巨大的爆发。
而且上述预测还只是软件行业的市场规模，在各类终端百花齐放的当前时期，尽管越是成熟的终端发展的路线越是保守，但是恐怕新型智能终端越是能挖掘大量的数据，所产生的价值和衍生服务带来的价值就会更大。在这些数据面前，AI就是挖金的矿工。
本文为智东西整理呈现，文中所有数据结论版权归原作者所有。
重要的事情再说一遍，可以在智东西（公众号：zhidxcom）回复关键词“深度学习”下载报告全文。
权威数据·专业解读读懂智能行业必看的报告
在智东西回复“智能内参”查看全部报告
分享到微信朋友圈
在手机阅读、分享本文
还可以输入250个字
推荐文章RECOMMEND
热门文章HOT NEWS
著名笑星陈佩斯阔别荧屏这20年，他都经历了什么
百度新闻客户端
百度新闻客户端
百度新闻客户端
扫描二维码下载
订阅 "百家" 频道
观看更多百家精彩新闻扫描或点击关注中金在线客服
使用中金财经扫码登陆
下次自动登录
其它账号登录：
|||||||||||||||||||||||||
&&&&>> &正文
2016年 “深度学习”的科技巨头们
来源：商学院&&&
作者：佚名&&&
中金在线微博
扫描二维码
中金在线微信
扫描或点击关注中金在线客服
　　继IBM开发的&深蓝&在1997年击败卡斯帕罗夫之后，韩国棋手李世石与谷歌旗下公司DeepMind开发的AlphaGo再度展开人机大战。这一次依旧以机器的胜利告终，并且AlphaGo很早就取得了3比0的绝对优势。与国际象棋不同，围棋需要的计算量更大，并且需要棋手在关键步数的走法上拥有良好的&直觉&和&棋感&，尤其是在大局观上要有敏锐的判断，而这些曾经都是机器的弱点。是什么让机器有这么快的进步，连围棋也被AlphaGo攻克&就是计算机的深度学习能力。
　　与前几代人工智能不同，拥有深度学习能力的人工智能技术是一项重大突破，机器开始可以模仿人类的神经系统进行有效学习并且进步神速，本期&酷创新&，我们来关注几大科技巨头公司最近推出的具有&深度学习&能力的人工智能技术。
　　脸书的Big Sur
　　2015年底，脸书人工智能研究部门宣布，之前已经开放了多数软件源代码的人工智能计算服务器Big Sur会将其硬件设计也开源。脸书此次开源的是最新的大规模人工智能计算服务器设计，并将其提交给开源计算项目&&这个项目分享了很多大公司的数据中心产品设计。这款名为Big Sur的人工智能计算服务器，内部集成了用于处理大量数据的GPU。Big Sur的目的是训练神经网络，而现代化人工智能研究项目几乎都要依赖这种系统。Big Sur服务器是依托Nvidia的GPU而打造的。GPU在人工智能中的应用十分广泛，因为这种芯片上搭载的处理核心数量多于Intel生产的传统处理器，使得它们十分适用于AI软件所需要的海量计算。Big Sur的设计特点是易于维修的主板，它装有8个NVIDIA的Tesla M40。脸书表示，CPU的散热器是该硬件中唯一一个需要用螺丝刀拆卸的东西。
　　AlphaGo的新功能
　　AlphaGo是谷歌旗下公司DeepMind开发的一款具有深度学习功能的围棋软件。早在2013年，DeepMind就创造出了可以模仿人类思维，学习如何玩儿电子游戏的人工神经网络。AlphaGo的工作原理是，由两个不同功能的&大脑&网络组成：策略网络(Policy network)和价值网络(Value network)协同工作。策略网络负责在当前局面下判断&最好的&下一步，可以理解为落子选择器;价值网络负责评估整体盘面的优劣，淘汰掉不值得深入计算的走法，协助前者提高运算效率，可以理解为棋局评估器。然后，两个&大脑&取各自选择的平均值，做出最终的决定。
　　不过，DeepMind的技术并不是专门用来下围棋的，所谓深度学习只是通过机器自身的学习来模仿人类思维，并且不断提高完成各种特定任务的能力，而下围棋只是其中一种特定任务罢了。目前DeepMind正在与英国NHS(国家医疗服务体系)进行合作，并已经成立了&DeepMind健康&项目，并希望通过技术手段，帮助有意向参与的医护人员提高服务质量。
　　Watson正变得越来越聪明
　　Watson是IBM已经开发了十几年的人工智能技术，Watson正在变得越来越&聪明&。通常意义上，Watson已经进入了与巨量文献和信息搜索密切相关的政府部门和医疗机构，并且在图像识别方面已经具备了帮助医生诊断癌症的能力。然而这还不是全部。
　　IBM开发人工智能技术的目的并不是为了替代人，而是更好地服务于人。在此之前，人类在各个行业中产生了大量的&非结构数据&，其中80%以上是计算机无法&读懂&的，IBM正是要训练Watson&读懂&这些数据，并且找出之前必须通过聘用具有高度洞察力的人类专家才能发现的一些数据之间的内在相关性，其中的意义极为深刻。在Watson的商业应用中，IBM已经与众多企业建立合作，包括与辉瑞制药联合利用大数据建立慢性病风险预测模型，和科大讯飞推动云平台架构合作，与Under Armour合作推出&认知训练系统&IBM开发人工智能技术的目的并不是为了替代人，而是更好地服务于人。在此之前，人类在各个行业中产生了大量的&非结构数据&，其中80%以上是计算机无法&读懂&的，IBM正是要训练Watson&读懂&这些数据，并且找出之前必须通过聘用具有高度洞察力的人类专家才能发现的一些数据之间的内在相关性，其中的意义极为深刻。在Watson的商业应用中，IBM已经与众多企业建立合作，包括与辉瑞制药联合利用大数据建立慢性病风险预测模型，和科大讯飞推动云平台架构合作，与Under Armour合作推出&认知训练系统&，与美敦力合作为布提供个性化的糖尿病管理服务等等。
　　微软的&深度残差学习&
　　2015年底，微软亚洲研究院视觉计算组在ImageNet计算机识别挑战赛中凭借深层神经网络技术的最新突破，以绝对优势获得图像分类、图像定位以及图像检测全部三个主要项目的冠军。这次，微软亚洲研究院视觉计算组首席研究员孙剑博士带领的团队在深层神经网络方面进行了算法的更新，称之为&深层残差网络&(deep residual networks)。目前普遍使用的神经网络层级能够达到20到30层，在此次挑战赛中该团队应用的神经网络系统实现了152层。深度神经网络以&层&的形式分布。每一层都具有不同系列的运算&&也就是算法。某一层的输出会成为下一层的输入。笼统地说，如果一个神经网络是设计用来进行图像识别的，其中某一层神经将负责寻找图片的一系列特性&&边、角、形状或者纹理&&而下一层神经则负责寻找另一个系列的特性。这些层级就构成了神经网络的&深度&。一般来讲，神经网络的层级越多，机器学习的难度也就越校
　　据悉，微软在视觉领域的研究成果已经转化到了诸多自身产品当中，包括Windows 10中的Windows Hello&刷脸&开机功能、必应的图像搜索、微软小冰的多个图像&技能&，OneDrive中的图片分类功能，以及广受好评的口袋扫描仪Office Lens等等。
　　科大讯飞的语音&深度学习&
　　语音识别给人们的想象空间非常大，比如会聊天的机器人，甚至会考试的机器人。语音识别中的深度学习涉及到算法、模型、平台，是一个非常复杂的过程。科大讯飞深度学习平台的一位负责人表示，要做深度学习并不难，买台机器，弄套相关的软件就可能做起来，但真要上了一定的规模后，系统的搭建是有讲究的。科大讯飞目前使用的机器大致分两种，一种是2:4，一种是2:8，其中2代表一台机器中CPU的数量，4和8则代表GPU的数量。之所以用这样的机器，并非出于他们的本意，而是由于当前供应商的机器就是这样设计的。从他们实际应用的角度来看，则更希望有1:4这样的产品出现，因为CPU在其中确实不承担太多的作用，只作为基础的软件运行平台。据悉，当前科大讯飞深度学习平台这一团队所用的GPU有400多块。已经是一个不小的规模，不过，现在的神经网络链接数只有10的8次方，跟真正的人脑差了近6个数量级，显然这400块是远远满足不了实际需求的，由此也带出了第二个问题的探讨，即除了关注机器中CPU和GPU的配比，做深度计算还关注哪些内容。
责任编辑：cnfol001
我来说两句
24小时热门文章
栏目最新文章机器自学72小时堪比国际大师，深度学习到底有多厉害？
【编者按】本文是雷锋网2015年9月份发出的文章，由知社学术圈王鹏编译，原标题《深度学习机器自学国际象棋72小时，媲美国际大师》，文章来源：MIT Technology Review。谷歌旗下Deep MInd创始人宣布了谷歌在人工智能领域取得重要进展：开发出一款能够在围棋中击败职业选手的程序——AlphaGo，《Nature》杂志也以封面论文的形式，介绍了AlphaGo击败欧洲围棋冠军樊麾，并将在 3 月和世界冠军李世乭对战。在此之前，有专家提到人工智能机器——“长颈鹿”，它可以通过自学从而像人类那样通过评估局势来下棋，这完全颠覆了传统象棋程序。自IBM研发的超级计算机深蓝首次在标准锦标赛规则下击败国际象棋世界冠军加里·卡斯帕罗夫至今已近20年。从那时以来，电脑象棋选手不断完善强大，以致顶尖人类棋手在面对一台运行现代象棋程序的智能手机时，恐怕也机会渺茫。虽然计算机的运行速度越来越快，但象棋程序的工作模式并没有改变。他们的强大始终依赖于穷举法，即遍历所有未来可能性以选择最佳棋路的过程。当然，没有哪个人类可以做到这一点，哪怕做得接近也绝无可能。当深蓝以每秒2亿步的速度进行搜索计算的时候，卡斯帕罗夫可能顶多在进行着每秒5步的思考。不过他依然可以下出同样的水准。显然，人类掌握着计算机所尚未精通的奥妙。问题的关键在于评估盘面局势并缩减最优棋路的搜索。这将大幅简化计算工作，好比代表棋路可能性的繁茂大树被修剪到只剩几条枝干。计算机向来不擅长这样的工作，但今天凭借帝国理工学院马修·莱的努力，事情有了改变。莱制造了一台人工智能机器并取名为长颈鹿，它可以通过自学从而像人类那样通过评估局势来下棋，这完全颠覆了传统象棋程序。直接应用的结果就是，这台新机器与顶级传统象棋程序达到同一水平，而这些传统程序多年来已有所优化。同真人对战时，它相当于FIDE（世界国际象棋联合会）国际大师水平，位列国际象棋锦标赛选手的前2.2%。莱的新机器背后所依靠的技术是神经网络系统。这是一种以人类大脑为原型的信息处理模式。它包含多层节点，节点彼此连结并可通过训练对系统变化作出反馈。该训练过程采用了大量实例对节点连结进行微调，使神经网络可以根据特定的输入产生特定输出。例如，在图片中进行面部识别。近几年，神经网络的迅猛发展得益于两项进步。首先是随着神经网络的学习，对如何进行微调有了进一步理解。这要部分归功于运算更快的计算机；第二是海量注释数据集的出现，使神经网络得以更好地学习。这些成果使计算机科学家可以训练更庞大的划分为多层级的神经网络。这些所谓的深度神经网络功能已非常强大，并已在日常的模式识别工作上较人类更为胜任，比如人脸识别以及手写识别。所以，深度神经网络能够在国际象棋中进行模式发掘并不奇怪，这也正是莱所采用的方法。他的网络系统包括四个层次，以三种方法共同判断棋盘上的每一个状态：系统首先会观察比赛全局，比如双方的棋子数量与类型，哪方移动，王车易位权等等；进一步，系统检查棋子相关信息，如各方每个棋子的位置；最后绘制出每个棋子的攻防格局。莱用于其神经网络系统的训练数据素材谨慎选自真实象棋比赛。此数据集必须具有正确的象棋布局。“比如说，训练系统掌握每方有三个皇后的棋局就没有意义，因为这种布局根本不会出现在实战当中”，他讲到。除了在高水平国际象棋比赛上经常见到的局面之外，它还必须包含大量多样的非均势棋局。因为尽管在真实象棋比赛中很少出现实力悬殊的状况，但在计算机内部执行的搜索中，它们依然会频繁出现。此数据集需要具有相当的规模。在训练过程中对神经网络中海量连结的微调只能建立在庞大数据集的基础上完成。如果采用较小的数据集，则会导致神经网络无法识别真实世界中千变万化的模式。莱从计算机国际象棋比赛的数据库中随机选取了500万种盘面状态以生成他的数据集。然后他给每个状态随机添加一步合理走法以创建更多的变化，最后应用于训练。通过这种方式，他总共生成了1.75亿种盘面状态。训练机器的通常做法是人工评估每个盘面局势并将此信息输入计算机使其可以识别棋局的强弱。对于1.75亿种盘面来说这是巨大的工作量。虽然这可以通过另一个象棋程序来完成，但莱有更大的期望，他希望机器能够自主学习。所以，他采用了一种自举法技术使长颈鹿通过与自己对战来提高其对未来棋局评估的预测能力。这个方法切实可行，因为每一种走法都有其对应的参考分数来最终决定其价值——无论比赛最后是胜，是负，还是平局。通过这种方式，计算机可以掌握哪些局势是有利的，哪些是弱势的。对长颈鹿训练后，最后一步要进行测试，而结果非常有趣。莱采用一个名为战略测试套件的标准数据库对他的机器进行测试，它包含了1500种预置棋局以检测象棋程序识别各种战略构想的能力。“比如，有一个设定可以测试对开放线控制的理解，另一个可以检验对象和马的价值在不同情况下如何变化以及对各自影响的理解，还有一种设定能够检验对中心控制的理解”，他说。测试结果以15000分为满分。莱使用这种办法对机器的不同学习阶段进行了测试。在自举过程开始时，长颈鹿很快达到了6000分的成绩并经过72小时最终攀升至9700分。莱表示这已可以匹敌世界上最强的国际象棋程序。“（这成绩）很了不起，因为那些评测功能都是由人们精心设计并包含数百个参数的巨物，在过去多年中还经过了人为和自动的调试，其中很多都出自象棋大师之手。”他补充道。莱继续使用同样的机器学习方法来确定一步既定走法是否值得实施的机率。这一点非常重要，因为这将避免不必要的对无用枝干的深度搜索，从而大幅提高计算效率。莱称这种概率方法有46%的机率预测出最佳走法，并有70%的机率将最佳走法列在前三种选择里。所以计算机无需检测其他走法。这项有趣的工作标志着国际象棋程序运算方式的巨大变革。当然，它尚不完美。长颈鹿的一个缺点就是神经网络相比其他类型的数据处理速度要慢很多。莱谈到要搜索同样数量的棋局，长颈鹿所花费的时间比传统象棋程序要多出10倍。不过即便有所不足，它仍然很有竞争力。“长颈鹿在现代主流PC机上运行可以达到FIDE国际象棋大师水平”，莱介绍到。相比之下，顶级的象棋程序可以达到超级大师水平。这已经非常棒了。“与当今众多象棋程序不同，长颈鹿的下棋本领并非来自对前方可能性的探查，而是源于对当前错综局势的精确评估，以及对复杂棋局概念的理解。这些概念对人来说非常直观，但长久以来对象棋程序却难于理解。”莱讲到，“这一点在开局和残局阶段非常重要，而它在此表现得尤为出色。”这仅仅是个开始。莱表示这种方法应该直接应用于其他游戏当中，很明显的例子就是传统中国围棋，目前人类相比于他们的硅制对手仍掌握着绝对优势。也许莱在未来能够有所突破。【作者介绍】知社学术圈，海归学者发起的公益学术交流平台，旨在分享学术信息，整合学术资源，加强学术交流，促进学术进步。推荐阅读：1、Google人工智能击败欧洲围棋冠军， AlphaGo 究竟是怎么做到的？2、智慧之巅，30年来AI宗师们的那点事
看过本文的人还看过
最新图文推荐
大家感兴趣的内容
网友热评的文章深度学习并非最优方案 - 推酷
深度学习并非最优方案
随便写个标题吧。
今天写点技术，因为发现虽然科普技术的文章很多，但是各种误解还是蛮多的，甚至我自己都不能说可以完全置身事外。
打别人脸的同时，就要做好被别人打脸的准备。
于是，昨天这篇，我自己也暴露了对其他领域的傲慢和无知，谢谢各位粉丝的提醒，指出我的问题，今天第一个指出问题的是我的资深女粉丝，南洋理工大学物理专业的某萱博士，她给的链接里提到，电子竞技属于不完全信息博弈，和围棋这样的完全信息博弈是有区别的，目前不能认为人类已经完全攻克。
嗯，是的，相当部分竞技，和棋牌类项目，都属于不完全信息博弈，所以，这是另一个领域的事情，相信谷歌未来也会投入探索。实话说，我真心不认为，这个领域有多难，只是边界条件和判断规则有所不同罢了，但在这个领域被攻破之前，我还必须要提醒自己，不能过于傲慢，暴露无知。
那么，网上有一种言论，把深度学习当做包治百病的技术，这就不对了。
其实，正如我的另一个资深女粉丝，数学达人某迪女研究僧所言，围棋是一个NP项目，好吧，其实我也不懂NP是个啥东西，但是这里有个重要概念是，围棋是不能靠穷举，遍历，暴力计算来解决的数学问题，目前也不存在一步寻求最优解的可能性，所以通过机器自学习，总结特征规律，然后，给出局势判断，基于概率进行走子。
知乎大V云天外在分析alphago的时候有一个特别重要的观点值得分享一下，alphago最可怕的不是怎么找到下一步，而是怎么判断当前的局势，基于对局势的判断才能提到如何选择招数，实际上从前三盘看，alphago对局势的判断和人类完全不同；当然，人类本身也完全不同，在第一盘，第二盘，都暴露出一个明显的问题，在收官之前，各个职业棋手主播对局势判断的差异简直是天壤之别，只有柯洁展露了惊人的实力，能正确判断出局面优劣，其他很多老九段简直如在梦中。第三盘，人类和alphago在形势判断上难得达成一致，因为李世石实在被欺负的太惨了；而第四盘，alphago为什么突然进入崩盘模式，deepmind专家的解读是，在78手之后，alphago对局势的判断突然出了问题，直到87手才反应过来。
所以，关于昨天的那盘棋，各种阴谋论的背后，都是盲目认为围棋不会判断错误，这个逻辑是不通的，深度学习从来不是最优解，从来都会存在盲区和判断错误，如果不存在这些问题，机器就不用再学习，再提高了，人类也不用跟机器比赛了，直接观摩围棋的终点在哪里好了。深度学习之所以能自我提升，能自我发展，就是因为有缺陷，有误区，才会不断提升，并逐渐逼近最优。
但，并不是所有的项目，都需要深度学习的。
很多项目，是可以暴力破解，直接靠强大的计算力找到最优路线。
比如，最简单的，井字棋。
比如，跳棋。
你真的没必要在这个领域搞深度学习，一步到达终点的项目有啥可学习的。
比如，不完全信息的例子，21点，基于概率的最优打法早就在网上公开了，随便搜搜都有，当然你按照最优打法也赢不了庄家，这是规则设计决定的。当然这里也有例外，就是纯随机发牌的最优解和获胜概率固然已有定论，但是如果基于系统有多少套牌和发牌记录去计算，又会存在新的动态最优解和动态获胜概率！但这也是完全！可以！用！概率！算出来的！根本！不需要！深度！的！学习！我的资深男粉丝，MIT博士后赖某，就精于此道。
在不完全信息的博弈项目里，必须承认存在这样一个局面，就是概率最优解不等于必胜解，甚至不等于胜率过半解，比如，在高明的赌场的规则设置里，你即便真的拿出了概率最优的打法，从统计规律来说也赢不了庄家的21点，人家的规则也是数学家设计的。在这种情况下，谈深度学习，谈挑战赌场，都是儿戏。
下面说说麻将。
麻将是个典型的不完全信息的游戏，那么，基于概率统计，是否存在最优解路线呢，我们先简化问题，如果只考虑个人的手牌和明面的牌（已经打出的牌和对方吃、碰的牌），系统完全可以算出最高概率的几种胡牌可能，并将对胡牌影响概率最低的手牌打出。这种计算对于学过概率统计的大学生而言，并不是很高深的课题，作为应届本科生的毕业课题，都显得有些简单。但这不是最终解。
引入第二个边界条件，赢牌番数，如果你可以有较高概率赢一把小牌，和相对较低概率赢一把大牌，就要计算风险收益比，选择综合风险收益比最高的路线，对胡牌概率的数据加上番数修正，这事其实也不难，你很容易得到一个修正后的最优解方案，这也并不是很高深的课题。但这仍然不是最终解。
第三个边界条件，出牌风险，所谓点炮。麻将复杂的地方在于，你不能只按照个人最佳胡牌概率打牌，必须通过观察注意到别人胡牌的可能和机会，并避免成为点炮的那个，（简单举个例子，如果上一个玩家出了一张二条没有玩家要，那么理论上你出二条应该是非常安全的。）而此时，就存在信息不完整的问题了。基于对方明面的牌和打过的牌以及打出的顺序，计算对方可能的胡牌范围，每张的胡牌概率，并自动修正你打出每张牌的风险值，和你胡牌概率再做修正，是追求自己胡牌，还是规避点炮风险。实际上，由于玩家存在一定的自摸概率，所以即便自己胡牌概率不高，彻底选择规避风险也并不是一条可取的路线。但这里就存在了一个致命问题，如果每个玩家，都是按照最优概率出牌，虽然这个模型复杂，但是系统理论上还是可以根据出牌记录和明牌记录计算出别人的胡牌概率和风险指数，而事实上是，人类并不会按照最优概率出牌，而且有可能打出从概率上讲不该打出的牌，而此时就会导致计算机造成严重的误判，这就是不完全信息所带来的特有的问题，而完全信息的博弈场面里，是不存在这种局面的。
所以，麻将这个问题，我认为是属于可以直接寻求概率最优解，但是受制于不完全信息的局限，概率最优解很可能遭遇对局者误导的一种竞技项目，在这个领域，深度学习未必能带来提升，而遭遇误导的风险依然存在。我的理解是，麻将完全可以做出概率最优的系统，但不代表概率最优就一定胜率最大，这是没有办法的事情，偶然性因素影响非常大，如果是很多人类和一台智能麻将计算机比赛，即便麻将计算机拥有最优概率，拿不到冠军的概率也是大于拿到冠军的概率，你只能说它拿冠军的概率在所有人中最高，但不代表这个概率会超过50%。
德州扑克同理，你完全可以设计系统按照概率最大化进行博弈，但受制于不完全信息，人类选手可以通过诈牌，或拿着大牌却故意装怂等手段误导机器，导致机器误判，在这种信息博弈层面，机器想要学习人类，还有极为漫长的路径。
在相当比例的不完全信息的博弈项目里，均存在确定的概率计算方法，在这样的领域，可以一步寻求概率最优解，压根用不到深度学习模式；而在相当比例的完全信息博弈项目里，也可以使用穷举，暴力计算来破解，比如国象残局，计算机已经进入上帝模式，这更不是深度学习可以达到的境界。只有进入到不可穷举，不可计算的领域，比如围棋，才涉及深度学习的话题。所以，用深度学习包治百病，什么炸金花，斗地主，都是胡扯。
下面再说一下电子竞技，深度学习是如何进行电子竞技的学习的。
其实，一个通用的深度学习系统，你甚至不需要让深度学习系统了解游戏的设计理念，游戏的数值，是的，这都是他可以自学的范畴。让算法完全以一个玩家的角度，在对游戏的观察中学习和成长，我简述一下这里的逻辑。
第一步是，标注游戏的成分，这个还是要做的，相当于制定规则的边界。
首先让深度学习系统能标注和识别不同的建筑，兵种，操作，以及对应的资源的产出和消耗。这是一个基本模型，你必须让他知道游戏的基本构成和基本规则。
第二步是，设定胜利条件，让机器学习知道胜利的目标是什么。
第三步是，训练集，大量的训练集，也就是对战记录。
第四步是，基于海量训练集，总结特征和策略，用于实战，并重复三，不断提升。
这里可能存在很多思维上的误区，
你说每个局面都是独一无二，计算机如何思考？这其实和围棋是一样的，正因为不能遍历，才需要机器自己总结规律，寻找规则。围棋实际上二十手以后，最多三十手以后，基本上机器面对的局面就没有棋谱里可以借鉴的案例了，计算机如何思考的，这就是基于大量训练集总结出的规律，那这个规律是什么，连设计师都不知道，这才是深度学习神奇的地方，计算机会找到它认为适合的规律，并在不断的大量训练集中调整和优化。
你说计算机不知道人类的策略和计谋，这其实也不重要，计算机只是基于局面和特征，进行局势判断和价值判断，选择下一步的操作策略，在局面判断中，计算机有自己的简化策略，你看上去界面有很多目标，很多建筑，很多兵种，很多数值，但计算机可以按照它认为合适的方式简化为几个重要指标，并针对性选择最佳的后续操作策略，当然，这中间可能有错误，但最后比拼的就是他的错误比你的少，比你的小，以及，他犯了错会总结，会提高。
深度学习总结的规律是否一定正确呢？实话说，真不一定，比如让深度学习去理解香港股市和所有市场信息的关系，也许他会得到一个丁蟹效应并作为重要策略，我们人类知道，丁蟹效应只是一个巧合梗，并不具备科学性，但深度学习，很可能会认为这是一条重要的价值判定策略。
在不完全信息的博弈中，往往存在一些偶然性的因素，深度学习的表现只能通过概率来说话，而看上去不具备碾压实力。但对技能和策略要求越高的领域，深度学习所可能达到的成果将越能体现出优势，这一点是毋庸置疑的。
希望此文，能澄清一些概念，别什么玩意都深度学习。
1、深度学习不是最优路线，只是通过大量训练集，使自己趋近于最优路线。在这个过程中，误判和缺陷一定是不可避免的。过于神话深度学习没有意义。
2、对于可穷举，可暴力计算的博弈问题，以及可确定概率最优的博弈问题，使用深度学习属于典型的画蛇添足，脱裤子放屁。
3、在不完全信息的局面下，人类存在的一些狡黠特性是深度学习暂时无法攻克的（典型如德州扑克，下注本身的谋略），但不代表说这类问题是彻底无解的，如果深度学习掌握了更高层次的规律和特征，可以完全无视你的狡黠和计谋。（我个人认为电子竞技深度学习是可以到这个境界的，但需要谷歌或谁来证明。）
4、如果你数学足够好，不用深度学习也可以试着去研究赌场的漏洞；如果你数学不够好，用了深度学习你也玩不过赌场请的数学家，洗洗睡吧。
5、我承认我昨天对不完全信息的博弈问题过于轻视了，谢谢粉丝们指正批评。
已发表评论数()
请填写推刊名
描述不能大于100个字符!
权限设置：公开
仅自己可见
正文不准确
标题不准确
排版有问题
主题不准确
没有分页内容
图片无法显示
视频无法显示
与原文不一致

深度学习在国际象棋的表现会比穷举算法更好么

我要回帖

随机推荐