李开复王小川张宏江对话:为什么拿出200万奖金打造中国版ImageNet?
2017-08-15 18:08 AI Challenger全球AI挑战赛 创新工场 今日头条 搜狗

李开复王小川张宏江对话:为什么拿出200万奖金打造中国版ImageNet?

ImageNet走了,AI Challenger来了。

ImageNet走了,AI Challenger来了。

8月14日,创新工场、搜狗和今日头条联合宣布,三方携手发起 “AI Challenger全球AI挑战赛”,并且,走在一起的三家确立的目标是:打造中国最大的科研数据集与世界级AI竞赛平台。

在人工智能领域,数据的质和量是科研与研发的核心。高质量训练数据对机器学习模型的建立和优化有关键性的作用。建立大规模、高水准的标注数据集,是推动AI科研和技术前进的驱动力。在国际上,前有ImageNet挑战赛,后有机器学习竞赛平台Kaggle,都吸引了全球将近百万数据科学家和研究者。但就在上月,在举办了八届后,ImageNet创始人之一李飞飞博士正式宣布其退出历史舞台。

现在,创新工场、搜狗和今日头条走到一起,“我们希望更多的中国人才参与进来,改变世界。”创新工场CEO李开复博士如是说。

200万奖金、规模最大的科研数据集

就在活动发布的8月14日当天,AI Challenger全球AI挑战赛的报名通道也宣布开通,并邀请全球AI科研人才参与。

对各界科研人员而言,这次竞赛中蕴藏着极大的吸引力。

首先就是数据。大赛第一年启动,将开放超过1000万条中英文翻译数据、70万个人体动作分析标注数据、30万张图片场景标注和语义描述数据,是国内迄今公开的规模最大的科研数据集。

11_副本

 

据发布会现场介绍,此次三方联合开放的AI Challenger数据集涵盖多个领域,包括最大规模的人体骨骼关键点数据集(用于无人驾驶、安防、体感游戏等场景)、最大规模的图像中文描述数据集(用于图像和视频内容理解、图像标题自动生成等各类应用)、最大规模的口语领域英中翻译数据集(用于同声传译等自然语言处理的各类应用)等。

在奖金方面,首届“AI Challenger 全球 AI 挑战赛”将于9月4日正式拉开帷幕,各路高手展开为期三个月的比拼,并于12月中旬进行总决赛巅峰对决,这次竞赛设置了共计200万元人民币的奖金池。

12

 

据悉,2017年竞赛将区分为五个竞赛任务,分别是:

英中机器童声传译

英中机器文本翻译

场景分类

人体骨骼关键点检测

图像中文描述

据赛事主办方透露,本次挑战赛有三大特点:

偏重为前沿科研,并将逐步涵盖计算机视觉、 自然语言处理、 自动驾驶、 智慧医疗、 智慧金融等核心AI领域。

超大规模的高质量数据。首度公开的人体⻣骼关键点检测、 图像描述和口语类机器翻译数据集, 均为国内迄今规模最大。

打造开放的世界级平台。

不难看出,这次竞赛,在科研之外,更大的侧重点是前沿科技,以及和未来商业、生活领域密切相关。而促使三方走到一起,打造这样一项赛事,细究缘起,无外乎两点,那就是推动国内科研创新能力,以及挖掘更多的AI人才。

创新与人才的竞争

“之前的数据集已经远远不够了。”李开复说。

李开复回忆,他之前去美国,在和很多美国顶尖的教授谈话中,他们都在感叹自己已经追不上美国互联网巨头了。“虽然这些教授能力绝对不比谷歌的工程师差,但是他们没有数据、没有大的计算力。”

同样,这也是国内人工智能领域,所面对的问题。在科研领域,研发人员缺乏数据、缺乏机器,同样也缺乏对前沿AI主流研究的课题。而对于拥有大量数据的商业公司而言,也更期待有更多的应用场景和研究成果可以挖掘。

在此之前,搜狗已经和清华大学共同做了9年的联合研究。双方在数据、人才、资金上进行不间断的交流和互相输送,在去年,更是联合成立了天工智能计算研究院。但王小川仍在思考,是否可以把数据公开给更多的国内高校,共同推进研发。而李开复的建议,让他感觉到,在这件事情上,其实可以做得更大。

“我们期待,高校和企业一样做出更好的研究成果。当高校等的研究人员应用数据时,他们可能会打破企业的固有的惯性思维和路径,做得更好、更深。”王小川说。

“我们是出于对数据的共识走在一起的。”张宏江说。“开放能够让更多的人加入进来,让算法研发进展更快。我们也将从中受益。而我们把数据开放出来以后,更多的创业公司也能够从中受益。它们可以应用数据更快地验证和产生新的创意、新的应用场景。”

人才培养的缺口和瓶颈,同样也在困扰着AI领域的创新创业公司。促使更多的人进入AI领域、为AI研发提供动力,同样也是这次大赛的目标之一。

“依赖高校基础上的人才供给,还是有缺口的。我有一段时间,非常担心从互联网时代走向AI时代时我们会掉队。”王小川说,“但今天,我还是看到了希望。中国公司跑得非常快,也在反哺高校,推动中小创业公司的进步。今天我们做这件事情的意义就是,让中国在AI领域里继续得到推动。”

一个月前,张宏江来到斯坦福大学和伯克利学院交流,最大的感受是,在AI人才方面,中美之间,仍然存在着差距。在研究的领先性和创造性上,在新问题的提出和把握上,国内仍然还有很大的改善空间。“这能培养更多的人才。我希望我们今天做这件事促进中国在这方面的发展。”

而“人才”也是张宏江加入今日头条后