芥末堆芥末堆

自適應(yīng)學(xué)習(xí)是「忽悠」還是「突破」?我們和專注其中的公司聊了聊

作者:極客公園 發(fā)布時間:

自適應(yīng)學(xué)習(xí)是「忽悠」還是「突破」?我們和專注其中的公司聊了聊

作者:極客公園 發(fā)布時間:

摘要:所謂簡單基于規(guī)則的自適應(yīng),對學(xué)習(xí)不但沒有用,很有可能還會有害。

rawpixel-659493-unsplash.jpg

圖片來源:unsplash

目前,人工智能在教育行業(yè)的應(yīng)用場景,無外乎幾種:智能測評、拍照搜題、智能排課、教育機(jī)器人、自適應(yīng)系統(tǒng)。

有的公司選擇選擇先發(fā)力「智能測評」,如中小學(xué)在線 1 對 1 輔導(dǎo)品牌掌門 1 對 1 就極其看重課前測評和學(xué)生與老師之間的匹配;有的公司選擇深挖「智能排課」,如面向 4-12 歲的在線少兒英語小班課產(chǎn)品「魔力耳朵」;還有的公司如「作業(yè)盒子」則致力于開發(fā)能教育機(jī)器人,實(shí)現(xiàn) AI 教師落地。

但在自適應(yīng)系統(tǒng)這個繞不開的話題上,國內(nèi)提及的人不少,專攻的卻寥寥無幾。因?yàn)槠浜诵乃惴ǖ牟煌该餍砸约肮タ说碾y度,自適應(yīng)系統(tǒng)相較于其他幾類人工智能在教育行業(yè)的落地場景更容易被貼上「忽悠」的標(biāo)簽。2016 年建立于上海和紐約的人工智能學(xué)習(xí)系統(tǒng)論答(learnta)就是為數(shù)不多專注于自適應(yīng)系統(tǒng)開發(fā)的一家。其 CEO 王楓認(rèn)為,中國是 AI+ 教育最合適的商業(yè)市場,因?yàn)閼?yīng)試教育是 AI+ 教育最能發(fā)揮價值的場景,而這一點(diǎn)的實(shí)現(xiàn)還得通過自適應(yīng)學(xué)習(xí)(Adaptive Learning)。

在國外,自適應(yīng)學(xué)習(xí)并不是個新鮮概念,相反,其是在上世紀(jì)七十年代隨著人工智能的概念逐漸為人熟知。難怪王楓說,教育里的人工智能就是自適應(yīng)學(xué)習(xí)。根據(jù)維基百科的解釋,自適應(yīng)學(xué)習(xí),也稱為自適應(yīng)教育,是一種教育方法,它使用計(jì)算機(jī)算法來協(xié)調(diào)與學(xué)習(xí)者的交互,并提供定制的資源和學(xué)習(xí)活動,以滿足每個學(xué)習(xí)者的個性化需求。(Adaptive learning, also known as adaptive teaching, is an educational method which uses computer algorithm to orchestrate the interaction with the learner and deliver customized resources and learning activities to address the unique needs of each learner.)

2008 年成立于美國紐約的 Knewton 是該行業(yè)的代表,在 2015 年也曾來到中國并引發(fā)了國內(nèi)對于自適應(yīng)教育的第一次集中關(guān)注,但最終結(jié)果卻顯得有些「水土不服」。極客公園和論答 CEO 王楓聊了聊他眼中的自適應(yīng)系統(tǒng),做到自適應(yīng)需要什么條件,以及 Knewton 失敗的原因等問題。

640.jpg

論答 CEO 王楓

真假

Geekpark:能講講自適應(yīng)學(xué)習(xí)到底指的是什么嗎?它與人工智能有什么區(qū)別?

王楓:自適應(yīng)學(xué)習(xí)不是什么新名詞,90 年代初卡耐基梅隆就已經(jīng)開發(fā)出了 Cognitive tutor(認(rèn)知向?qū)В瑫r加州大學(xué)和紐約大學(xué)開發(fā)出來的 Alex。其實(shí)這兩個產(chǎn)品已經(jīng)比較成熟了,不是什么新產(chǎn)品。當(dāng)然,產(chǎn)品的發(fā)展和許多人工智能領(lǐng)域的算法類似,受制于當(dāng)時計(jì)算機(jī)的運(yùn)算能力。現(xiàn)在這些年下來,自適應(yīng)學(xué)習(xí)已經(jīng)能夠成熟開始商業(yè)化應(yīng)用,Knewton 不是第一家做知識性學(xué)習(xí)的,但是第一家把它做到大規(guī)模商業(yè)化應(yīng)用的。對我們算法來說,自適應(yīng)學(xué)習(xí)是找到孩子學(xué)習(xí)問題,推薦下一步學(xué)什么,并在最短的時間內(nèi),幫助你攻克這個知識點(diǎn)。

其實(shí)自適應(yīng)學(xué)習(xí)本身就是 AI 在教育里的應(yīng)用,最早不說 AI,是因?yàn)槟菚r候算法非常初級。但是教育里面的 AI 就是自適應(yīng)學(xué)習(xí),當(dāng)然還有現(xiàn)在大家說的人臉情感識別,這些我就不說了。

Geekpark:現(xiàn)在國內(nèi)所講的自適應(yīng)和真正的自適應(yīng)有什么區(qū)別?

王楓:2015 年初我回國時,國內(nèi)一些同行零零星星的在講自適應(yīng)學(xué)習(xí),但當(dāng)時很多理解都非常不準(zhǔn)確。對教育來說,是根據(jù)學(xué)生實(shí)時的學(xué)習(xí)情況,來不斷調(diào)整下一步學(xué)生要學(xué)哪個知識點(diǎn),或者做什么試題,這叫 Adaptive。

但這里面水在什么地方?Adaptive 簡單說來有基于規(guī)則和基于算法兩種,比如說當(dāng)一個學(xué)生做錯了一元二次方程,系統(tǒng)根據(jù)提前埋好的點(diǎn)推薦幾個一元一次方程的題目,再推幾個因式分解題目,這就是基于規(guī)則。但不能說這是真正有用的自適應(yīng),因?yàn)?A 學(xué)生可能是一元二次方程不會,B 學(xué)生可能是一元一次方程不會,C 學(xué)生可能是因式分解不會,而 D 學(xué)生可能連小學(xué)的乘法快速運(yùn)算都不會。按照埋點(diǎn)的方式,無法預(yù)先知道學(xué)生到底是哪個知識點(diǎn)不會。如果按照設(shè)定規(guī)則的方式,74 個知識點(diǎn),就得需要設(shè)定 2 的 74 次方程的規(guī)則(每一道題都有會與不會兩種情況)。

換句話說,所謂簡單基于規(guī)則的自適應(yīng),對學(xué)習(xí)不但沒有用,很有可能還會有害,因?yàn)閷W(xué)生需要浪費(fèi)時間去重復(fù)學(xué)習(xí)他可能已經(jīng)掌握的知識。真正有用的自適應(yīng)一定是基于算法的,這就基于機(jī)器學(xué)習(xí),基于 AI 了。

Geekpark:論答現(xiàn)在能做到的自適應(yīng)是怎樣的?

王楓:前面說的 74 個知識點(diǎn),論答只需要用 8 道題就能檢測 74 個知識點(diǎn),有 66 個知識點(diǎn)是不用出題就可以判斷學(xué)生的掌握情況。但可能還不止,因?yàn)橐恍┲R點(diǎn)下面可能會有很多道題。

學(xué)生每做完一道題,下一道題在哪個知識點(diǎn)上給他出題,我們沒有任何人知道。論答的系統(tǒng)就像一個黑匣子,但本質(zhì)上就像一個名師一樣。一個名師來測試整個中考代數(shù),可能也只需要 5 至 8 道題。因?yàn)樗卸嗄甑慕逃?jīng)驗(yàn)來不停地判斷每道題之間的關(guān)聯(lián)性,他大腦中的判斷是個非常復(fù)雜的過程。對于機(jī)器而言,每做完一道題系統(tǒng)都在不斷更新,判斷你在每一個知識點(diǎn)上面掌握的可能性。

Geekpark:如何判定這個黑匣子中的算法就是有效的?

王楓:首先可以通過直觀感受,多做幾套測試來看看效果,看到底是不是靠譜,我們機(jī)器得出來的判斷和作為一個好老師的判斷,或者你對自己理解的判斷是否一致,這是第一點(diǎn)。比如在實(shí)數(shù)運(yùn)算這一節(jié),我全是亂點(diǎn)的答案,但蒙對了 3 個,可是系統(tǒng)對我的判定是掌握了 0 個知識點(diǎn)。有意思的是實(shí)數(shù)加法法則與運(yùn)算率這個知識點(diǎn),相關(guān)的兩道題我都猜對了,這種概率已經(jīng)是 25%×25% 了,不過通過相關(guān)的算法,機(jī)器最后還是認(rèn)定我沒有掌握這個知識點(diǎn)。

從嚴(yán)謹(jǐn)?shù)膶?shí)證研究來說,我們完成了中國有關(guān)自適應(yīng)學(xué)習(xí)第一個嚴(yán)謹(jǐn)?shù)膶?shí)證研究,研究結(jié)果發(fā)表在全球頂級的研究雜志《交互學(xué)習(xí)》研究雜志 2018 年第一期上面。在這個實(shí)驗(yàn)中,與一個主流學(xué)習(xí)系統(tǒng)相比,我們的學(xué)習(xí)效果顯然更好,我們的學(xué)習(xí)效率是在它的 3-28 倍之間。

Geekpark:為什么論答能做到通過 8 道題測評 74 個知識點(diǎn)?這背后的開發(fā)流程是怎樣的?

王楓:我從 2015 年初回國開始,就在開發(fā)這個系統(tǒng)。一直到今年 5 月份才覺得系統(tǒng)基本打磨成熟,開始輸出。算法的研發(fā)團(tuán)隊(duì)是紐約那邊做數(shù)據(jù)科學(xué)相關(guān)的高端人材。首席數(shù)據(jù)科學(xué)家馬鎮(zhèn)筠博士在那兒負(fù)責(zé),他是浙大數(shù)學(xué)系本科,弗吉尼亞大學(xué)統(tǒng)計(jì)學(xué)博士,他負(fù)責(zé)開發(fā)我們的核心算法。

這件事本質(zhì)上是一個龐大的系統(tǒng)工程,算法開發(fā)、知識圖譜設(shè)計(jì)、以及到最后相匹配的練習(xí)題、講義的生產(chǎn)等都是非常復(fù)雜的過程。拿 6-9 年級系統(tǒng)中的數(shù)學(xué)測試題來說,我們專業(yè)的題目研發(fā)團(tuán)隊(duì)通過對知識點(diǎn)的拆解原創(chuàng)開發(fā)了十幾萬道題。開發(fā)出題目后還需要用人工打標(biāo)簽,每一道題從開發(fā)到入庫,中間有幾十道工序,有很多個標(biāo)簽要打。只有這樣算法引擎才知道,每個知識點(diǎn)后面有哪些題,每個題后面的屬性、難度、區(qū)分度以及與學(xué)生做題之前的知識掌握程度等。入庫后算法會不斷根據(jù)學(xué)生的使用情況調(diào)整這些題目的屬性。

1.jpg

前景

Geekpark:自適應(yīng)系統(tǒng)能解決教育市場中的什么痛點(diǎn)?

王楓:像論答這樣的自適應(yīng)系統(tǒng),可以從根本上解決優(yōu)秀老師供給的問題。這也是整個教育產(chǎn)業(yè)最核心的價值。在中國,不管是培訓(xùn)機(jī)構(gòu)還是公立學(xué)校,最缺是優(yōu)秀老師。像新東方跟學(xué)而思這樣 200 億美金的大公司,加起來所占的市場份額也不到 12%。為什么?因?yàn)樗麄兏緵]有那么多優(yōu)秀的老師。論答現(xiàn)在可以做到讓一個沒有任何教學(xué)經(jīng)驗(yàn)的兼職大學(xué)生,只需要 3-6 小時在線微信群培訓(xùn),再加上我們?nèi)斯ぶ悄芟到y(tǒng),就能達(dá)到一個優(yōu)秀老師的教學(xué)水平。

Geekpark:論答為什么能解決優(yōu)秀老師的供給問題?

王楓:因?yàn)橐粋€名師的必殺技 70% 都能被我們的系統(tǒng)替代掉,我們已經(jīng)完全可以去做課堂。一個好老師其實(shí)有兩種職能是機(jī)器難替以代的,第一是看場子即是說保障課堂秩序,第二是精準(zhǔn)定位,即是說能夠一步一步的把一道題拆開,讓學(xué)生去思考到底是哪里不會?,F(xiàn)在論答已經(jīng)能夠賦予普通老師第二種功能,所以通過短暫的培訓(xùn)就能讓普通老師成為名師。

Geekpark:都知道 Knewton 是這個領(lǐng)域的領(lǐng)先者,為什么 Knewton 在中國沒先跑出來?

王楓:自適應(yīng)學(xué)習(xí)引擎是最核心的,但光有引擎是不夠的。Knewton 吃了虧,以前全部都做,后面只做引擎。但是光有引擎,沒有相匹配的內(nèi)容和系統(tǒng),最終的結(jié)果就沒法保證。除此以外,中國的學(xué)科體系和美國的也不一樣,所以在美國適用的那些經(jīng)驗(yàn),到中國就搞不定了。

對我們來說,除了引擎外還有一個龐大的學(xué)習(xí)系統(tǒng),包括教師、學(xué)生以及相應(yīng)的備課系統(tǒng),甚至包括相應(yīng)在線直播平臺,以及相匹配的課程內(nèi)容。這里面是一個完整的人工智能學(xué)習(xí)系統(tǒng),而且我們還是開放式平臺,任何老師可以在里面添加任何形式的教學(xué)內(nèi)容,任何機(jī)構(gòu)、任何學(xué)校都可以,是真正開放式平臺。

Geekpark:中國的教育場景有什么不同特點(diǎn)?

王楓:應(yīng)試教育是 AI+ 教育,最能發(fā)揮價值的場景。而全球最大的應(yīng)試教育市場在哪兒?就在中國。所以對于 AI+ 教育公司來說,中國是最合適的商業(yè)市場。

為什么 AI 最有用的應(yīng)用場景是應(yīng)試教育呢?簡單來說,AI 要能夠判斷,需要量化,必須有數(shù)據(jù)。像人臉識別、表情也不是說沒有用,但是對于機(jī)器而言,要能最大發(fā)揮價值,還是要能夠最大限度量化,而且必須要明確測量的目標(biāo)。從應(yīng)試教育來說,中國家長從初中開始,只有一個訴求——提分,考一個好的高中,然后考一個好的大學(xué),通過自適應(yīng)系統(tǒng)能夠很好的實(shí)現(xiàn)家長的這些訴求,在這方面機(jī)器的確能夠發(fā)揮巨大的價值。

Geekpark:現(xiàn)在的商業(yè)模式是怎樣的?

王楓:B2B2C 的模式。我們 5 月份開始向 B 端學(xué)校,還有培訓(xùn)機(jī)構(gòu)輸出,現(xiàn)在已經(jīng)有幾十所學(xué)校使用了。我認(rèn)為 3-5 年之內(nèi),論答的系統(tǒng)至少成為整個中國培訓(xùn)產(chǎn)業(yè)的標(biāo)配,而且對中國絕大部分中小學(xué)來說,他們會發(fā)現(xiàn)論答系統(tǒng),對他們學(xué)校的教學(xué)來說,也都是極其關(guān)鍵的。

本文轉(zhuǎn)自微信公眾號“極客公園”,作者哲銘,編輯臥蟲。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場。

1、本文是 芥末堆網(wǎng)轉(zhuǎn)載文章,原文:極客公園
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源:極客公園
芥末堆商務(wù)合作:王老師 18710003484
  • 自適應(yīng)學(xué)習(xí)是「忽悠」還是「突破」?我們和專注其中的公司聊了聊分享二維碼