有哪些有关NLP的赛车比赛有哪些

百度上线NLP智能问答大赛,10万元奖金邀你来战
去年11月百度世界大会 AI 技术与平台论坛上,百度3D视觉首席科学家杨睿刚宣布推出了百度 AI 公开数据集计划——BROAD(Baidu Research Open-Access Dataset),并确认首批室外场景理解、视频精彩片段、阅读理解3个数据集即日起对公众公开。
在大量而真实的数据基础上,百度的深度学习框架PaddlePaddle部门联合科赛上线了一系列基于前沿真实问题的赛题,最先发布和完成的是聚焦于综艺领域的智能视频剪辑AI大赛。
上月,该赛事已顺利收官。比赛采用了科赛自有的在线数据分析工具K-Lab,在K-Lab中可直接调用PaddlePaddle深度学习框架,并在线挂载BROAD数据集。赛事将K-Lab搭载在百度云CPU/GPU上,选手可直接提交模型结果到评测系统,即得模型分数。至赛事结束之时,共281支队伍合计496人报名,总提交数高达909次。
这次上线的NLP智能问答赛事则要挑战人工智能领域里的难题——阅读理解。
目前世界上已有不少关于NLP的经典赛题,如斯坦福大学发起的SQuAD挑战赛、微软的MS Marco挑战赛、Google DeepMind阅读理解公开数据测试集、Facebook阅读理解公开数据测试集。这些多为英文数据集,且部分基于词义识别(spanof words)或文字标签分类。而通过机器学习实现真正阅读理解,难度远高于词义精准识别和搜索结果调用,一方面需要通过算法对语意进行全方面的分析理解,另一方面也需要引入优质的数据集配合训练。
BROAD中包含着迄今为止规模最大的中文公开领域阅读理解数据集,DuReader。该数据集基于真实应用需求,所有问题均来源于百度搜索用户的真实问题,文档来自全网真实采样的网页文档和百度知道 UGC 文档,答案基于问题与文档由人工撰写生成。
本次PaddlePaddle AI系列赛事-智能问答赛事会为选手提供百度云CPU与GPU计算资源,选手需要根据数据建立基于文本与问题,输出正确答案的模型,考验模型的归纳总结与改述能力。通过提供对人工智能回答实际问题的模型训练,将来可能出现不用打开网页,无需手动筛选答案,即可以为用户提供全套解决方案的应用,能够代替市面上大部分人工智能助手,也能节省大量的时间。
赛事基于百度深度学习平台PaddlePaddle进行。PaddlePaddle是大规模并行分布式深度学习框架,是目前全球开发热度(用 Github pull request 数量衡量)增速最高的开源深度学习平台。现已集成了CNN、RNN等多种神经网络及深度学习算法,同时支持CPU、GPU、FPGA等多款硬件,并与Kubernetes合作了PaddlePaddle EDL弹性深度学习,成为全球首个支持弹性作业调度的开源AI云解决方案。PaddlePaddle易学易用、高效灵活,支持海量图像识别分类、机器翻译和自动驾驶等多个领域的业务需求。
去年百度世界大会上,PaddlePaddle 发布了三项新功能,进一步加强了易用性,并降低了开发者的使用门槛:
1. PaddlePaddleFluid 提供高级语言中的 while 和 if 等控制流结构,提升使用者的开发效率,同时利用编译优化技术保证计算性能。
2. PaddlePaddleCloud 支持使用者在浏览器里开发 AI 应用,在云端调试运行,开发者不需要在个人电脑和机群之间切换,提升了工作效率。
3. PaddlePaddleEDL 是全球首个支持弹性作业调度的开源 AI 云解决方案,通过与 Kubernetes 合作实现弹性作业调度。
在线数据分析平台K-Lab为本次赛事提供全程支持。K-Lab不仅封装了包含PaddlePaddle等近百个AI开发常用工具,同时可直接调用百度云算力。
NLP智能问答大赛即日上线,对于阅读理解领域感兴趣的研究者及高校学生,我们欢迎和期盼你的参与,点击阅读原文报名,一起来挑战NLP-人工通用智能吧!
看到这里 不妨关注小科
期待更多挑战
科赛Kesci.com是聚合数据人才和行业问题的在线社区。科赛打造的K-Lab在线数据分析协作平台,为数据工作者的学习与工作带来全新的体验。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点TECH2IPO/创见
「 新生活 新科技 新零售」
解析搜索引擎的关键技术:NLP
搜索引擎要听懂用户的「人话」,用户的搜索请求直接用自然语言搜索已成为不少人的习惯,人们更倾向于搜索「广州到北京的航班信息」而不是「广州 北京 航班」,因此搜索引擎必须理解用户意图才可以帮助其去找到准确答案。
*本文作者罗超 文章略有修改 原标题为《什么是百度的技术基石?NLP》百度在一定程度可以说技术是其根基。中文搜索、知识图谱、大数据、自然语言处理、智能广告等细分技术已成为百度独有优势,所有这些技术的基石又是什么呢?答案或许是 NLP:自然语言处理。NLP 是搜索引擎的技术之本搜索引擎最基本的模式是自动化地聚合足够多的「内容」,对之进行解析、处理和组织,响应用户的搜索请求找到对应结果返回。每一个环节,都需要用到自然语言处理。爬取网页时要分析 HTML 页面以及处理爬取到的网页内容时,需要对起进行解析、分词、变换等,这十分依赖自然语言处理技术。搜索引擎要听懂用户的「人话」,用户的搜索请求又是千奇百怪的,关键词组合的方式越来越少,直接用自然语言搜索已成为不少人的习惯,人们更倾向于搜索「广州到北京的航班信息」而不是「广州 北京 航班」,因此搜索引擎必须理解用户意图才可以帮助其去找到准确答案。每一个环节自然语言处理都十分重要。这是 NLP 技术致力于解决的问题。自然语言处理(Natural Language Processing:NLP)是计算机科学、人工智能以及语言学的交叉学科,旨在解决计算机与人类语言之间的交互问题,这其中包括对自然语言的分析、理解、生成、检索、变换及翻译等方面。不只是搜索本身,搜索引擎衍生产品大都会应用到 NLP 技术。譬如百度、Google 均提供的翻译服务就是最经典的自然语言应用,它可以智能化地翻译大段文章,支持多种语言之间的互相翻译。还有百度知道,它可以智能化地识别相似的问题避免用户重复提问。再比如 Siri 掀起的语音助手浪潮最后反而被百度、Google 等搜索玩家抢得先机,就是因为搜索引擎更擅长于 NLP 技术,百度语音助手和 Google Now 在中文和英文语音领域表现都比 Siri 更为突出。总之,搜索引擎连接人与信息,它要能帮助人们更加高效地获取信息就必须学会像人类一样去读取信息,它要能够理解人们对信息的需求就需要去听懂「人话」,这都注定了 NLP 技术将成为搜索引擎的技术之本。无处不在的 NLP 让百度更智能百度从第一天处理用户的第一次搜索开始便开始应用 NLP 技术。十多年来,百度的用户数已经超过 5 亿,百度公司员工规模超过 3 万人,百度市值则逼近 1000 亿美金。伴随着百度的快速发展,百度 NLP 团队在同步地、甚至更快地发展壮大,NLP 技术本身也在发生着剧变,但总的来说,就是它帮助百度变得更加聪明。2010 年春,国际顶级自然语言处理专家王海峰博士加盟百度后,对百度 NLP 的工作进行了重新梳理与规划,除分词、专名识别、query 需求分析、query 改写等传统方向得到加强外,拓展了机器翻译、机器学习、语义搜索、语义理解、智能交互、深度问答、篇章理解等新的技术方向。现在 NLP 团队已经由当初仅 10 余人发展成为今天超过 200 人规模的团队,操盘手正是王海峰博士。因为理论造诣以及在百度的工程实践成就,王海峰成为自然语言处理领域世界上影响力最大的国际学术组织 ACL(Association for Computational Linguistics)50 多年历史上唯一华人主席。现在 NLP 团队的技术正应用在百度的方方面面。搜索引擎是 NLP 技术最大的用武之地。相比当年用户需要学习如何使用搜索引擎而言,今天的用户完全可以直接输入任何想到的需求或者问题,甚至直接通过话筒向百度语音助手提问。譬如用户可以搜「天气」、「日历」、「机票」、「汇率」这样的模糊需求,百度会直接在搜索结果呈现结果。再比如用户可以搜索「5000 港币是多少人民币」百度结果中会直接呈现一个计算器。用户还可以搜索「演过还珠格格的台湾演员」「张柏芝的儿子的爷爷是谁」这样的复杂问题,百度都可以准确地回答。基于知识图谱技术的「百度知心」同样处处用到 NLP 技术。知识图谱是让搜索引擎结果可以联想出更多相关结构化信息技术,百度结果页面右侧的结构化信息便是知识图谱结果集。举个例子,用户搜索「虎嗅网」搜索引擎右侧便会展示与之相似的其他科技媒体譬如「36kr」。用户搜索』青藏高原』和』小威』的时候,知心右侧都会推荐『李娜』,但前者推荐的是歌唱家李娜,后者推荐的是网球明星李娜,这便是基于 NLP 的实体消歧技术。深度问答技术则是机遇 NLP 技术和深度学习技术的问答产品。百度出品的智能问答机器人在江苏卫视《芝麻开门》节目中取得了卓越成就,答题准确率远超人类选手,正是得益于百度深厚的知识沉淀以及百度对用户问题的精准理解。不过这项技术并不只是用于比赛,在百度语音助手、百度知道以及百度搜索等产品之中,深度问答技术均被广泛应用,它可以精准理解用户的复杂问题,并且可以结合上下文、结合场景对问题做出不同理解。例如,当我们在百度中搜索「花生发芽了还能吃吗」,得到的答案已不再是互联网上五花八门的原始网页答案,而是让人一目了然的汇总式答案摘要。除了这样的「一问一答」,用户还可以与百度对话,问它一个又一个问题,NLP 最终可以让用户使用自然语言进行搜索,并且采用多轮交互的方式来逐步澄清和满足需求,从而完成深度决策型的搜索任务。百度 NLP 团队研发的「交互搜索技术」便可以做到多轮问答,而「多模(multi-modal)交互技术」则可以让用户通过文字、语音、图片、LBS 等多种输入形式进行更加人性化、更加简单易用的搜索,未来扩展到通过视频作为输入进行搜索也是有可能的。深度问答技术还可以应用到许多垂直领域。比如与教育结合的「百度考霸」就成为高中生填报高校志愿的得力助手,它今年一共服务毕业生 550 万次,帮助他们更加高效、简单和全面地了解高校和专业。再比如与医疗健康结合就可以实现寻医问药,我们可以搜索「头疼怎么办」百度便会给出结构化的疑似病症列表甚至用药建议。在「泛需求搜索」上百度可以很好地理解用户的模糊需求,在百度中搜索「家常菜」,搜索引擎将返回的 3 万多种家常菜按照「菜系」、「功效」和「口味」进行归类展现,层次分明、一目了然。不论是搜索引擎还是知识图谱还是深度问答,最关键的技术点就是 NLP。NLP 做好了还将形成壁垒,因为尽管对手可以做出类似的搜索频道或者子产品,但在智能化、准确性以及易用性上要赶上百度却并不容易。NLP 技术即需要数据积累,在算法的积累、团队的沉淀上都需要时间,后来者很难追平。NLP 未来对百度会愈发重要NLP(自然语言处理)技术对百度而言只会更加重要。搜索引擎的职责已经不单单是帮助用户找到答案,而是帮助用户找到所求,连接人与实体世界的服务,成为用户的智能化助理。无限接近人类的智慧是人类赋予机器的终极目标。对于百度而言,一是要从搜索引擎上升到服务连接平台,二是要大力发展人工智能、大数据、深度学习等面向未来的新兴技术,这些目标均离不开「理解用户需求、智能化地组织信息和服务」,这均十分依赖 NLP 技术。NLP 技术本身也在升级。从名称来看它是语言处理技术,能够理解文本似乎就够了。实际上现在它要理解的是语言所表征的人类的需求。除了文字之外,语音、图像也是人类需求表达的载体。同时,用户所处的环境(LBS)、用户的个人特征(用户画像)、用户发出请求的时间也会赋予同一个请求不同的目的。因此,NLP 技术在处理用户语言本身的时候,还需要结合上述因素去理解用户背后的需求。看上去 NLP 正在升级成为一项全新的「人类信息识别和需求理解技术」。技术是百度的基因,技术和数据积累形成的用户、产品和品牌优势是百度的护城河。NLP 则是百度技术的基石,它赋予了百度技术「智能化」的基因,在过去智能化的搜索让百度越来越好用为其在中文搜索市场奠定了王者地位;在未来智能化连接用户与服务成为百度与阿里腾讯等巨头最大的区隔时,NLP 技术只会更加重要。因此毫不夸张地说,NLP 就是百度的技术基石。*作者微博 @互联网阿超,微信 SuperSofter
请后参与评论现在位置 > >
所有关于NLP的文章
刚刚发售一个月的《New Love Plus》,因为诸多的BUG而被玩家骂声不断。由于3DS的性质不能推出补丁修正,而100多个BUG更是让各位玩家毫无办法。Konmai方面只是对此道歉,而没有对这些BUG提供回避方法。据闻这些卡带是因为交付国内,赶工压制而导致众多BUG。在发售后一个月的白色情人节,推特上的知情人士宣布《NLP》即将回收,而详细条件并没有说明,看来Konmai是逼到走头无路了。这也是3DS史上第一款召回的游戏,看来为此开了历史先河。
KONAMI的公开道歉信,没有提及BUG如何回避
大丈夫流血不流泪...
不知道各位玩《New Love Plus》的时候会不会遇到什么阻力呢,诸如无法接受和屏幕里的人谈恋爱的人之类的。如果你的父母这样为难你,这时候只需要说“其实《New Love Plus》也不过是《任天狗》的女孩子版而已”。当然把那些如此可爱的女孩子们比喻成狗是很失礼,但《New Love Plus》和《任天狗》的本质和平台是一样的,都是模拟育成游戏和3DS的,所以玩《New Love Plus》大可以没有感到什么羞耻。
通过《New Love Plus》来模拟未来的恋情,或者找回那份失去的感觉,是一件无可厚非的事情。所以请拿起你的3D...
所谓不求同年同月生,但求同年同月死。爱相随系列最新作《New Love Plus》一发售就成了各界的热点,除了本体和其他周边大卖外,众多的bug和雷人的成就称号也是成为话题。其中“2万天经过(约55年)”的成就可谓是吓死人,当然我们有穿越bug,来过300年也不是问题。看来内田岳父是要世界末日,也要各位继续抱着3DS…不过其实这2万日是大有来头,可不是随随便便来的,而且还得和任天堂扯上关系。
同一时间据外媒称,任天堂即使每年亏损200亿日元,凭借着8128亿日元的银行现金储备,至少能挨到2052年。再加上任...
本站微博和博客
如有以下相关事宜:
?投稿爆料 · ?小道消息 · ?商务合作 · ?加入团队
站长:天仓零
请联系:mio#jpbeta.net
2018年四月
2018年三月
2018年二月
2018年一月
2017年十二月
2017年十一月
2017年十月
2017年九月
2017年八月
2017年七月
2017年六月
2017年五月
2017年四月
2017年三月
2017年二月
2017年一月
2016年十二月
2016年十一月
2016年十月
2016年九月
2016年八月
2016年七月
2016年六月
2016年五月
2016年四月
2016年三月
2016年二月
2016年一月
2015年十二月
2015年十一月
2015年十月
2015年九月
2015年八月
2015年七月
2015年六月
2015年五月
2015年四月
2015年三月
2015年二月
2015年一月
2014年十二月
2014年十一月
2014年十月
2014年九月
2014年八月
2014年七月
2014年六月
2014年五月
2014年四月
2014年三月
2014年二月
2014年一月
2013年十二月
2013年十一月
2013年十月
2013年九月
2013年八月
2013年七月
2013年六月
2013年五月
2013年四月
2013年三月
2013年二月
2013年一月
2012年十二月
2012年十一月
2012年十月
2012年九月
2012年八月
2012年七月
2012年六月
2012年五月
2012年四月
2012年三月
2012年二月
2012年一月
2011年十二月
2011年十一月
2011年十月
2011年九月
2011年八月
2011年七月
2011年六月
2011年五月
2011年四月
2011年三月
本站作者阵
JPbeta作者GitHub 上有哪些有趣的关于 NLP 或者 DL 的项目? - 知乎<strong class="NumberBoard-itemValue" title="被浏览<strong class="NumberBoard-itemValue" title="6分享邀请回答0添加评论分享收藏感谢收起

我要回帖

更多关于 赛车比赛有哪些 的文章

 

随机推荐