专访猿辅导郭常圳:“AI+教育”没有想象的那么乐观
2018-07-20 10:18 猿辅导 AI+教育 教育 数据 火柴盒

专访猿辅导郭常圳:“AI+教育”没有想象的那么乐观

我认为现在处于技术高峰之后相对缓慢的一个阶段,2014年、2015年深度学习技术达到高峰,之后变得平缓。

作者|张乘辅

近日,中国在线K12教育机构猿辅导登顶SQuAD,排在其后的不乏谷歌、微软、百度等互联网科技巨头。SQuAD是斯坦福大学发起的机器阅读领域顶级赛事,主要测试机器对文本的理解能力,也就是机器阅读能力。今年互联网女皇的报告就是引用的SQuAD排名来分析AI行业的发展情况,可见该赛事在AI领域的影响力。

22

△2018年7月10日SQuAD排名

为了解目前AI在教育领域的落地,窥探未来AI对教育领域的影响,i黑马&火柴盒记者对猿辅导联合创始人、技术负责人郭常圳进行了专访。

1

“比媒体上看到的要悲观”

“如何看待AI+教育,AI将会颠覆教育?”i黑马&火柴盒问道。

郭常圳没有想象的那么激动,慢慢地回答,“我个人对这个的看法,还是比媒体上看到的那些要悲观。”

“我认为现在处于技术高峰之后相对缓慢的一个阶段,2014年、2015年深度学习技术达到高峰,之后变得平缓。机器学习是一个基础技术,深度学习是机器学习里面的一条路径。至于如今提得更多的AI概念,也就是机器学习换了个时髦的说法。”

2014年年中,猿辅导应用研究团队成立,该团队运用深度学习技术,打造出拍照搜题APP小猿搜题,开源了分布式机器学习系统ytk-learn和分布式通信系统ytk-mp4j。到了2016年,猿辅导内部便开始看高考机器人的方向。

郭常圳表示,“我们摸了一圈这个机器人,高考机器人参加高考的话,能够考个一本就不错了。”

郭常圳说的是实话。留意市场不难发现,众多高考机器人都从考清华北大改成考本科,从考全部科目改成考单个科目,这也从侧面反映了高考机器人挑战真人学生的难度。据介绍,在众多科目当中,数学是最简单的科目。拿语数英三大科排序的话,数学——英语——语文,难度逐渐上升。

“我们发现,英语学科的选词填空题目上,机器人显著高于人类平均水平。但整体上让机器人考到140分以上,还是很有难度的”,于是,猿辅导的一个项目团队开始参加SQuAD、MSMARCO等国际赛事。

郭常圳称,“我们试图去拓展一下技术推进教育的边界,我们去推一推。如果我们最终推动了,这也是一个面向未来的事情。”

前文提到,郭常圳对AI+教育持“悲观”的态度,并非是否定AI的作用。他表示,产生极其智慧的机器人,能够高考考满分,自主辅导学生学习,是悲观的、困难的,但用AI技术来辅助教育,这个是可以看到明显进步的。

郭常圳认为,AI+教育的技术大体可以分为两大类。

一类叫做外挂工具。比如说拍照搜题技术和基于人脸识别的学习情绪识别技术,本质上跟学习没关系,只是用来识别题目内容和学生状态。另一类就是学习本身,比如清晰地知道学生缺乏哪种具体的学习能力,进而提出解决方案。

具体落到学科,郭常圳认为,目前AI在教育上的应用,真正可以落地的就是英语。语言学习相对比较简单,机器能够衡量并训练用户的语言能力。

2

“鼠标加水泥”

1995年,中国电信开通了北京、上海两个接入Internet的节点。之后,信息高速公路架到中国。

“2000年左右,pc互联网的发展,成就了BAT和三大门户。2010年,移动互联网出现,TMD等新势力初露端倪。你会发现,只有外部环境发生剧烈变化的时候,才有大的机会。”郭常圳表示,感觉到大环境发生了变化,教育行业的市场又非常大,便加入李勇、帅科、李鑫团队在2012年创办了粉笔网(i黑马&火柴盒注:粉笔网是一个教育社区,这也是猿辅导的前身)。

作为猿辅导技术负责人,郭常圳在采访中不断提及“鼠标加水泥”的观点,这和他的性格一样,相对于虚无缥缈的概念,更注重实际的落地。“一方面是,要根据技术发展到哪一步。另一方面,要看家长和学生有什么需求。教育企业不能自己描述一个美好的未来,然后又没有路径去实现,甚至实现了也没用户接受。”

复盘猿辅导的产品路线,需求导向深深地烙在每一个产品上。

2013底,发现高三学生考试压力大,并且市场缺乏优质题库后,猿辅导推出了智能题库——猿题库。到了2014年,拍照识别技术较为成熟,结合学生解题答疑的需求,猿辅导推出了拍照搜题APP——小猿搜题。之后又在拍照答疑的基础上,上线了名师讲题的视频。通过两个“杀手级”产品,猿辅导获取到巨大的流量和数据,并于2015年6月正式上线猿辅导在线课程,进一步探索盈利变现。

除了三大主营业务产品,郭常圳介绍,猿辅导还根据不同的需求做出了众多产品工具。比如,发现家长批改孩子口算题比较费时间,就推出了小猿口算;去年9月,鉴于AI技术可用来解决学英语的难题,顺势推出了斑马英语。

目前,在线启蒙英语赛道尤其火热,除了猿辅导斑马英语,还有宝宝玩英语、叽哩呱啦、宝贝英语说、英语小神童、贝壳亲子英语、大塘小鱼(新东方)、酷学多纳(新东方在线)、VIPKID自由星球、DaDaBaby、粉笔kids等众多玩家。巨头、独角兽、初创企业均抢占0-6岁英语早教这一入口。

郭常圳向i黑马&火柴盒介绍了斑马英语的三个特点:

第一,斑马英语拥有多种形式的内容。比如,会提供配上音频的绘本故事,会做一系列的动画片,也会有外教录播视频,使得孩子可以听看和跟读。

第二,斑马英语还可以达到效果监测。AI系统会去监测孩子听了哪个句子,听了哪个单词,听了哪个音标,以及评估哪些音发的好和不好,然后智能地推送孩子不熟悉的内容。

第三,内容可编程,固定内容只占50%。如果发现孩子Apple的A的音发的不好,同时发现这个孩子的过去完成时掌握的不好,就会让孩子听练“我昨天吃了一个苹果”,而不是“我在吃一个香蕉”。并且,在斑马英语中,固定生产的内容只占50%,另外一半都是实时编程的。

3

“最核心的是得有数据”

教育界流传一句话,没有教研和数据的“AI+教育”企业都是耍流氓。

教、学、练、测、评等各个环节的数据,对于教育科技公司来说都尤为重要。郭常圳表示,猿辅导的数据主要体现在猿题库的练习数据。“2012年,我们把搜集到的试卷录入到题库系统,并且请专业老师来做解析,花了2年的时间才建立好初步版本”,郭常圳介绍称,“相较于小猿搜题等产品的数据,猿题库的数据具有非常高质量的结构化”。

“题库我们花了大量的工夫去做结构化,目前市面上其他所谓的自适应,我们都觉得不太灵,因为那个数据不够结构化。”

目前来看,题库的数据主要体现在文本数据和练习数据两个方面。进而,这些数据能够直接作用到教育的教、练、测等环节。

首先,数据能够优化教研系统和教学过程。比如,老师该讲哪道题、不讲哪道题,通过数据来挑选,是有很大价值的。

其次,数据能够提高练习环节的效率。比如,猿辅导直播课讲完一个知识点后,就可以精准地推送给学生随堂练习的习题。练完之后,根据题目的正确率再辅助老师判断重点讲哪道题目。

最后,测试环节也很关键。一方面,如同练习环节,数据可以提高测试的效率。另一方面,测试的数据可以反过来进一步优化算法。“我们今年举办了一场高三模拟考试,有60多万人报名,这些数据全是结构化数据,能够进一步优化算法。”

“算法并没有多复杂,最核心的是得有数据”,从猿题库智能题库到小猿搜题工具再到猿辅导在线课程,猿辅导形成商业闭环的同时,也构建了数据的闭环和仓库。

收集数据很关键,郭常圳举了一个例子:“当一位学生做选择题时,用了1分钟,这时手机屏幕可能会暗下去了,学生就得再点一下。我们会去探知这些行为,分析并计算答题的有效时间,然后进行记录。这些都是很有价值的东西,不能丢。”

1531799489107

火柴盒
文章评价
匿名用户
发布