
近日,中國線上K12教育機構猿輔導登頂SQuAD,排在其後的不乏谷歌、微軟、百度等網際網路科技巨頭。SQuAD是斯坦福大學發起的機器閱讀領域頂級賽事,主要測試機器對文本的了解能力,也就是機器閱讀能力。今年網際網路女皇的報告就是引用的SQuAD排名來分析AI行業的發展情況,可見該賽事在AI領域的影響力。
為了解目前AI在教育領域的落地,窺探未來AI對教育領域的影響,i黑馬&火柴盒記者對猿輔導聯合創始人、技術負責人郭常圳進行了專訪。
“如何看待AI+教育,AI将會颠覆教育?”i黑馬&火柴盒問道。
郭常圳沒有想象的那麼激動,慢慢地回答,“我個人對這個的看法,還是比媒體上看到的那些要悲觀。”
“我認為現在處于技術高峰之後相對緩慢的一個階段,2014年、2015年深度學習技術達到高峰,之後變得平緩。機器學習是一個基礎技術,深度學習是機器學習裡面的一條路徑。至于如今提得更多的AI概念,也就是機器學習換了個時髦的說法。”
2014年年中,猿輔導應用研究團隊成立,該團隊運用深度學習技術,打造出拍照搜題APP小猿搜題,開源了分布式機器學習系統ytk-learn和分布式通信系統ytk-mp4j。到了2016年,猿輔導内部便開始看聯考機器人的方向。
郭常圳表示,“我們摸了一圈這個機器人,聯考機器人參加聯考的話,能夠考個一本就不錯了。”
郭常圳說的是實話。留意市場不難發現,衆多聯考機器人都從考清華北大改成考大學,從考全部科目改成考單個科目,這也從側面反映了聯考機器人挑戰真人學生的難度。據介紹,在衆多科目當中,數學是最簡單的科目。拿語數英三大科排序的話,數學——英語——國文,難度逐漸上升。
“我們發現,英語學科的選詞填空題目上,機器人顯著高于人類平均水準。但整體上讓機器人考到140分以上,還是很有難度的”,于是,猿輔導的一個項目團隊開始參加SQuAD、MSMARCO等國際賽事。
郭常圳稱,“我們試圖去拓展一下技術推進教育的邊界,我們去推一推。如果我們最終推動了,這也是一個面向未來的事情。”
前文提到,郭常圳對AI+教育持“悲觀”的态度,并非是否定AI的作用。他表示,産生極其智慧的機器人,能夠聯考考滿分,自主輔導學生學習,是悲觀的、困難的,但用AI技術來輔助教育,這個是可以看到明顯進步的。
郭常圳認為,AI+教育的技術大體可以分為兩大類。
一類叫做外挂工具。比如說拍照搜題技術和基于人臉識别的學習情緒識别技術,本質上跟學習沒關系,隻是用來識别題目内容和學生狀态。另一類就是學習本身,比如清晰地知道學生缺乏哪種具體的學習能力,進而提出解決方案。
具體落到學科,郭常圳認為,目前AI在教育上的應用,真正可以落地的就是英語。語言學習相對比較簡單,機器能夠衡量并訓練使用者的語言能力。
1995年,中國電信開通了北京、上海兩個接入Internet的節點。之後,資訊高速公路架到中國。
“2000年左右,pc網際網路的發展,成就了BAT和三大門戶。2010年,移動網際網路出現,TMD等新勢力初露端倪。你會發現,隻有外部環境發生劇烈變化的時候,才有大的機會。”郭常圳表示,感覺到大環境發生了變化,教育行業的市場又非常大,便加入李勇、帥科、李鑫團隊在2012年創辦了粉筆網(i黑馬&火柴盒注:粉筆網是一個教育社群,這也是猿輔導的前身)。
作為猿輔導技術負責人,郭常圳在采訪中不斷提及“滑鼠加水泥”的觀點,這和他的性格一樣,相對于虛無缥缈的概念,更注重實際的落地。“一方面是,要根據技術發展到哪一步。另一方面,要看家長和學生有什麼需求。教育企業不能自己描述一個美好的未來,然後又沒有路徑去實作,甚至實作了也沒使用者接受。”
複盤猿輔導的産品路線,需求導向深深地烙在每一個産品上。
2013底,發現高三學生考試壓力大,并且市場缺乏優質題庫後,猿輔導推出了智能題庫——猿題庫。到了2014年,拍照識别技術較為成熟,結合學生解題答疑的需求,猿輔導推出了拍照搜題APP——小猿搜題。之後又在拍照答疑的基礎上,上線了名師講題的視訊。通過兩個“殺手級”産品,猿輔導擷取到巨大的流量和資料,并于2015年6月正式上線猿輔導線上課程,進一步探索盈利變現。
除了三大主營業務産品,郭常圳介紹,猿輔導還根據不同的需求做出了衆多産品工具。比如,發現家長批改孩子口算題比較費時間,就推出了小猿口算;去年9月,鑒于AI技術可用來解決學英語的難題,順勢推出了斑馬英語。
目前,線上啟蒙英語賽道尤其火熱,除了猿輔導斑馬英語,還有寶寶玩英語、叽哩呱啦、寶貝英語說、英語小神童、貝殼親子英語、大塘小魚(新東方)、酷學多納(新東方線上)、VIPKID自由星球、DaDaBaby、粉筆kids等衆多玩家。巨頭、獨角獸、初創企業均搶占0-6歲英語早教這一入口。
郭常圳向i黑馬&火柴盒介紹了斑馬英語的三個特點:
第一,斑馬英語擁有多種形式的内容。比如,會提供配上音頻的繪本故事,會做一系列的卡通片,也會有外教錄播視訊,使得孩子可以聽看和跟讀。
第二,斑馬英語還可以達到效果監測。AI系統會去監測孩子聽了哪個句子,聽了哪個單詞,聽了哪個音标,以及評估哪些音發的好和不好,然後智能地推送孩子不熟悉的内容。
第三,内容可程式設計,固定内容隻占50%。如果發現孩子Apple的A的音發的不好,同時發現這個孩子的過去完成時掌握的不好,就會讓孩子聽練“我昨天吃了一個蘋果”,而不是“我在吃一個香蕉”。并且,在斑馬英語中,固定生産的内容隻占50%,另外一半都是實時程式設計的。
教育界流傳一句話,沒有教研和資料的“AI+教育”企業都是耍流氓。
教、學、練、測、評等各個環節的資料,對于教育科技公司來說都尤為重要。郭常圳表示,猿輔導的資料主要展現在猿題庫的練習資料。“2012年,我們把搜集到的試卷錄入到題庫系統,并且請專業老師來做解析,花了2年的時間才建立好初步版本”,郭常圳介紹稱,“相較于小猿搜題等産品的資料,猿題庫的資料具有非常高品質的結構化”。
“題庫我們花了大量的工夫去做結構化,目前市面上其他所謂的自适應,我們都覺得不太靈,因為那個資料不夠結構化。”
目前來看,題庫的資料主要展現在文本資料和練習資料兩個方面。進而,這些資料能夠直接作用到教育的教、練、測等環節。
首先,資料能夠優化教研系統和教學過程。比如,老師該講哪道題、不講哪道題,通過資料來挑選,是有很大價值的。
其次,資料能夠提高練習環節的效率。比如,猿輔導直播課講完一個知識點後,就可以精準地推送給學生随堂練習的習題。練完之後,根據題目的正确率再輔助老師判斷重點講哪道題目。
最後,測試環節也很關鍵。一方面,如同練習環節,資料可以提高測試的效率。另一方面,測試的資料可以反過來進一步優化算法。“我們今年舉辦了一場高三模拟考試,有60多萬人報名,這些資料全是結構化資料,能夠進一步優化算法。”
“算法并沒有多複雜,最核心的是得有資料”,從猿題庫智能題庫到小猿搜題工具再到猿輔導線上課程,猿輔導形成商業閉環的同時,也建構了資料的閉環和倉庫。
收集資料很關鍵,郭常圳舉了一個例子:“當一位學生做選擇題時,用了1分鐘,這時手機螢幕可能會暗下去了,學生就得再點一下。我們會去探知這些行為,分析并計算答題的有效時間,然後進行記錄。這些都是很有價值的東西,不能丢。”
本文轉自微信公衆号“i黑馬”,作者張乘輔。文章為作者獨立觀點,不代表芥末堆立場。