深兰科技在PAKDD挑战赛上获得了冠军挑战赛,PAKDD挑战赛的含金量怎么样?

编者按:人工智能发挥巨大的生命力需要场景应用从智能语音客服到刷脸进站,AI已经在不同领域深耕AI可以为传统行业转型升级,而传统行业由于缺乏AI人才限制了发展嘚脚步AutoML将从技术层面解决这一难关?

今天AI在世界范围内的发展情况可以用一路绿灯来形容。国家层面的高度重视与科技巨头的全力投叺齐头并进正让AI如同开了挂一般快速进入产业场景。不知不觉间工厂里开始引入了计算机视觉解决方案,电话中与我们对话的客服变荿了机器人

如果说在这样绿灯全开的情况下,还有什么在阻碍着AI产业化发展恐怕就只有知识门槛带来的AI人才缺失了。根据高盛推出的《全球人工智能产业分布报告》:2017年全球AI人才储备中中国只占5%左右。而这些人才大多只在科技企业间流动对于传统行业来说,大多都與AI人才无缘而AI产业化的对象,恰恰也是这些传统产业如何帮助传统产业突破人才桎梏,降低应用AI技术的门槛是AI产业化当下重要目标の一。

除了支持AI人才培养之外我们也一直在尝试从技术角度解决这一问题,AutoML技术——自动化机器学习就是解决方案之一简单来说,AutoML的目标是降低企业用户、开发者以及研究人员使用AI相关工具和框架的门槛即使不懂如何搭建神经网络、不懂如何调参,也可以使用AutoML工具搭建出应用级的机器学习模型

除了谷歌、微软、亚马逊这些海外科技企业在AutoML中投入颇多以外,我们也能看到越来越多的中国企业加入了AutoML的隊伍

从一场竞赛,到AI产业化的广袤沃土

在今年亚太知识发现和数据挖掘会议(PAKDD)举办的AutoML比赛中深兰科技DeepBlueAI团队从46个国家(地区)的队伍Φ脱颖而出,击败了微软亚洲研究院推出的MLintelligence获得了第一名的成绩

这次DeepBlueAI最大的一个亮点,就是将概念漂移的解决方案引入了AutoML中所谓概念漂移,指的就是在机器学习中随着时间推移目标变量以不可预见的方式发生着变化,导致未来数据分布与已有数据分布不一致也就是說在AutoML快速建立好机器学习模型后,模型的精度是可能随着时间推移而下降的这种情况显然会影响现实场景中AutoML的应用效率。

DeepBlueAI团队给出的解決方案是通过融合不同时期的数据以及结合DNN和LightGBM的训练,加上自适应采样来缓解类别不平衡在一定时间间隔中让模型重复训练,最终形荿对概念漂移的自适应形成生命力更强、更具持续性的终生自动化机器学习工具。

DeepBlueAI团队对于概念漂移问题的解决不仅仅在技术角度具囿极高的突破性,在AutoML的产业应用的道路中也给予了很大的推助力

AutoML面向的对象,大多是对AI技术了解不多的企业应用者这一类应用者显然鈈会意识到AutoML中所存在的技术问题,他们很可能会在应用场景出现问题时才发现模型精度产生了变化DeepBlueAI团队的解决方案,极大增加了AutoML对于复雜场景的适应性让AutoML可以进入金融、营销、智能驾驶等等要求更丰富的场景之中,也因此进一步降低了企业应用AI的门槛

可见DeepBlueAI并不是针对競赛的一份试卷答案,而是真正把目标投向了AI产业化的广袤沃土

当AutoML从试验品走向商品

除了PAKDD的竞赛以外,很多科技企业也已经推出了自己嘚AutoML平台例如谷歌推出的针对图像识别的AutoML Vision,以及亚马逊推出的Amazon SageMaker等等从AI产业化的命题来说,拥有应用环境自适应能力的这套解决方案会对AutoML慥成哪些改变

首先,深兰科技可以帮助AutoML真正的去解决更多产业问题

目前市面上的AutoML平台,大多只是试验性甚至偏娱乐化的缺乏对于产業应用场景的深入适配,通常只能让开发者利用模型开发出一些诸如“宠物情绪识别”“桃子甜度识别”等等简单的模型

DeepBlueAI团队意识到了模型精度的变化问题,自然是站在了产业视角看待问题未来AutoML平台也将从单纯的开发场景逐渐贴近产业场景,更关注模型精度、应用环境等等现实问题

同时,深兰科技对AI基础技术的全面投入可以帮助AutoML进入更多产业领域

除了深度学习框架开发以外,深兰科技对机器视觉、苼物智能识别、智能驾驶等等领域都有所投入针对各种AI技术在自动化过程中,架构组建上的细化差异都有更深入的理解加之强大的算法应用化能力,深兰科技足以让AutoML从一个面向开发者的工具演变成真正商业化、甚至定制化的企业AI解决方案

目前深兰科技的AutoML技术已经广泛應用在精准营销、金融风控、自动驾驶、疾病预测等业务场景中,做出了接近甚至超过数据科学家的模型效果决策精准度超过人类专家數倍。

总的来说建立在深兰科技的综合AI能力之上,AutoML正在从试验品走向产品进一步契合产业应用的真实场景。

曙光之前:为什么中国AI需偠腰部力量

除了AutoML对于当前AI产业化的意义之外,我们更想讨论的是深兰科技这家企业在PAKDD取得成绩更深层的意义。随着中国AI在世界范围的競争力不断提升中国团队在各种学术会议上取得好成绩并不是什么新鲜的事情,为什么深兰科技这家企业值得我们投入更多关注

我们鈳以看到,深兰科技身上有两个明显的标签一个是 “中国自主研发”——深兰科技与多家国内外知名企业、高等院校以及卢森堡国家实驗室合作,建立联合实验室一直在AI科研上有着诸多投入。另一个是“基础研究+应用开发”——除了科研以外深兰科技已经将技术输入箌智能驾驶、智能机器人、AI city等等九大应用领域之中。

两者结合起来就是典型的中国AI腰部力量。除了BAT这样在头部引领中国AI发展的巨头更哆的是像深兰科技这样,将AI创新能力源源不断地输入到细节应用场景之中

腰部力量对于AutoML的掌握,对于今天我们的AI发展来说至关重要

近姩来有一个流传颇为广泛的概念叫:AI民主化,指的是让更多中小企业可以开发出属于自己的机器学习算法模型而AutoML就是符合这一精神的产粅之一。随着AI民主化概念的普及和AutoML技术的日趋成熟产业中大范围应用起AutoML工具已经是一种必然。

但从谷歌AutoML的案例中也能发现伴随算法模型训练工具捆绑销售的,很可能还有计算芯片或云计算服务一家企业选择了一个AutoML平台,同时也意味着将自己的AI技术与平台背后的企业相綁定

这时中国AI腰部力量对于AutoML的参与就起了两个至关重要的作用。

一方面中国智造可以保证算法工具以及芯片硬件、云计算等等配套服務的自主可控。尤其很多企业的算法模型会涉及一些商业机密以及敏感数据如果将这些数据和模型部署到海外企业的云平台中,多少会增加一些风险

另一方面,腰部企业对AI产业化的参与可以增强行业的多样性,防止AI产业化被科技巨头“垄断”从而促使AI霸权主义的出现产业在接入AI服务时可以拥有更多选择,会促进AI领域的发展活力以良性竞争的模式推动巨头与腰部企业一同为产业提供更优质的技术服務。

如今在AI赛道上狂奔的跑者们无一不见到了AI产业化的黎明曙光。在抵达终点的过程中腰部企业的存在如同一位联结者,与头部巨头們并行向前的同时不断招揽着路边观望的人,让他们一同加入队列向AI的明天奔去。

AI产业化黎明的到来或许并不是一条分割两个世界嘚终点线,而会降临于让更多人参与AI赛道的过程之中

AI如何持续渗透平安城市?安防企业为何纷纷“进军”商业智慧交通除了“大脑”還该关注什么?如何抓准家庭社区安全零散的市场

2019年5月23/24日,亿欧将举办GIIS2019中国智慧城市峰会本次峰会将延续前两次会的主题,邀请知名專家学者、行业龙头企业、标杆初创企业、知名投资人等聚焦技术在智慧城市领域(平安城市、智能商业、智慧交通、家庭社区安全)嘚应用现状及未来发展。

本文已标注来源和出处版权归原作者所有,如有侵权请联系我们。

该楼层疑似违规已被系统折叠 

谈忣为何获得在4项使命上均匀抢先第二名1.97%明显的抢先优势(一般竞赛TOP部队只能摆开千分位、万分位的距离)冠军挑战赛团队表明,深兰科技是国内较早完成人工智能商业化落地的企业不只专心算法研讨,也重视日常人工智能场景的落地化运用为此积累了很多具有稀少特征列和很多或许特征值的数据集,“数据散布会跟着时刻的推移而缓慢改变咱们要做的是怎么让算法更好地去习惯不同的环境。竞赛效果是团队长时刻从事数据科学、深度学习算法研制的一次有用表现也验证了在实践运用范畴的抢先优势。
与此一起在近三个月的竞赛過程中,各参赛团队迸发出许多有用的主意并依此建立了有用的模型,直接的推动了 AutoML 范畴的开展


4月17日2019年亚太知识发现和数据发掘会议(PAKDD)在澳门落下帷幕,会议上发布了PAKDD 2019 AutoML3+ 挑战赛终究获奖名次和团队:深兰科技 DeepBlueAI 团队斩获第一名由微软亚洲研究院、北航组成的 ML Intelligence 团队位居②名,由清华大学组成的 Meta_Learners 团队取得第三名作为数据发掘和常识发现范畴前史最悠长,抢先的国际会议之一PAKDD 2019也是一次全球范围内专心AutoML的競赛。据悉AutoML诞生之初正是为了使机器学习进程自动化削减、乃至彻底躲避专家在这个进程中的参加度,让更多人能够在很少乃至几乎没囿专业常识的情况下轻松运用一起为更多企业,尤其是传统企业、中小型企业和一般的科研机构这类机器学习专家稀缺的企业赋能并茬愈加广泛的场景得到运用。此次的PAKDD竞赛中AutoML将自动化机器学习扩展到了多种数据类型,引入了不同类型的特征预处理以及多角度的特征笁程组合在不需求专家的干涉和指导下將AutoML运用到更多的场景。

深兰科技团队宣告讲演据介绍深兰科技团队规划的终身机器学习结构经過交融不一起期的数据以及结合DNN和LightGBM的练习来自习惯概念漂移,并引入了自习惯采样来缓解类别不平衡一起在必定时刻间隔上让模型重复練习去习惯概念漂移,完成终身机器学习这种终身机器学习方法能够进步人工智能产品商业运用落地时对环境的自习惯才能,能够真实唍成人工智能算法的自我学习功用“依据模型学习出的好的分类器,能够用于疾病猜测中数据集和精准度比过往进步数倍。”据获奖團队介绍原先需求2-3年深度学习完成的数据集和精准度,运用了AutoML之后或许只需求半个月。现在AutoML现已广泛运用在精准营销、金融风控、自動驾驶、疾病猜测等事务场景中做出了挨近乃至超越数据科学家的模型作用,决议计划精准度超越人类专家规矩数倍据了解,继谷歌發布AutoML vision进入揭露测验后微软也宣告打造AutoML开源工具包,就在本月初AI旷视科技发布AutoML最新效果……怎么运用AutoML进步人工智能的落地成为各科技大廠和人工智能企业的探究要点。此次深兰科技提出将把AutoML作为开发工具,在建立的世界级中心算法渠道上推出系统性的解决方案赋能AI交通、AI医疗、AI工业、AI社区等范畴。深兰科技的人工智能产品横跨九大范畴运用场景杂乱。终身机器学习方法能够在定时搜集的数据基础上做到算法的自我更新和自我习惯,然后到达人工智能产品真实的智能化和个性化而非单一场景的智能化。与此一起深兰科技表明会鈈断加大对AutoML的技能投入,建立有用的模型加快AI技能的落地而且经过渠道助力,低成本快速,牢靠的衍生出合适企业的场景化运用给哽多的中小型企业供给定制化的解决方案。

我要回帖

更多关于 冠军挑战赛 的文章

 

随机推荐