圖片來(lái)源:unsplash
目前,人工智能在教育行業(yè)的應(yīng)用場(chǎng)景,無(wú)外乎幾種:智能測(cè)評(píng)、拍照搜題、智能排課、教育機(jī)器人、自適應(yīng)系統(tǒng)。
有的公司選擇選擇先發(fā)力「智能測(cè)評(píng)」,如中小學(xué)在線 1 對(duì) 1 輔導(dǎo)品牌掌門 1 對(duì) 1 就極其看重課前測(cè)評(píng)和學(xué)生與老師之間的匹配;有的公司選擇深挖「智能排課」,如面向 4-12 歲的在線少兒英語(yǔ)小班課產(chǎn)品「魔力耳朵」;還有的公司如「作業(yè)盒子」則致力于開發(fā)能教育機(jī)器人,實(shí)現(xiàn) AI 教師落地。
但在自適應(yīng)系統(tǒng)這個(gè)繞不開的話題上,國(guó)內(nèi)提及的人不少,專攻的卻寥寥無(wú)幾。因?yàn)槠浜诵乃惴ǖ牟煌该餍砸约肮タ说碾y度,自適應(yīng)系統(tǒng)相較于其他幾類人工智能在教育行業(yè)的落地場(chǎng)景更容易被貼上「忽悠」的標(biāo)簽。2016 年建立于上海和紐約的人工智能學(xué)習(xí)系統(tǒng)論答(learnta)就是為數(shù)不多專注于自適應(yīng)系統(tǒng)開發(fā)的一家。其 CEO 王楓認(rèn)為,中國(guó)是 AI+ 教育最合適的商業(yè)市場(chǎng),因?yàn)閼?yīng)試教育是 AI+ 教育最能發(fā)揮價(jià)值的場(chǎng)景,而這一點(diǎn)的實(shí)現(xiàn)還得通過(guò)自適應(yīng)學(xué)習(xí)(Adaptive Learning)。
在國(guó)外,自適應(yīng)學(xué)習(xí)并不是個(gè)新鮮概念,相反,其是在上世紀(jì)七十年代隨著人工智能的概念逐漸為人熟知。難怪王楓說(shuō),教育里的人工智能就是自適應(yīng)學(xué)習(xí)。根據(jù)維基百科的解釋,自適應(yīng)學(xué)習(xí),也稱為自適應(yīng)教育,是一種教育方法,它使用計(jì)算機(jī)算法來(lái)協(xié)調(diào)與學(xué)習(xí)者的交互,并提供定制的資源和學(xué)習(xí)活動(dòng),以滿足每個(gè)學(xué)習(xí)者的個(gè)性化需求。(Adaptive learning, also known as adaptive teaching, is an educational method which uses computer algorithm to orchestrate the interaction with the learner and deliver customized resources and learning activities to address the unique needs of each learner.)
2008 年成立于美國(guó)紐約的 Knewton 是該行業(yè)的代表,在 2015 年也曾來(lái)到中國(guó)并引發(fā)了國(guó)內(nèi)對(duì)于自適應(yīng)教育的第一次集中關(guān)注,但最終結(jié)果卻顯得有些「水土不服」。極客公園和論答 CEO 王楓聊了聊他眼中的自適應(yīng)系統(tǒng),做到自適應(yīng)需要什么條件,以及 Knewton 失敗的原因等問(wèn)題。
論答 CEO 王楓
真假
Geekpark:能講講自適應(yīng)學(xué)習(xí)到底指的是什么嗎?它與人工智能有什么區(qū)別?
王楓:自適應(yīng)學(xué)習(xí)不是什么新名詞,90 年代初卡耐基梅隆就已經(jīng)開發(fā)出了 Cognitive tutor(認(rèn)知向?qū)В瑫r(shí)加州大學(xué)和紐約大學(xué)開發(fā)出來(lái)的 Alex。其實(shí)這兩個(gè)產(chǎn)品已經(jīng)比較成熟了,不是什么新產(chǎn)品。當(dāng)然,產(chǎn)品的發(fā)展和許多人工智能領(lǐng)域的算法類似,受制于當(dāng)時(shí)計(jì)算機(jī)的運(yùn)算能力。現(xiàn)在這些年下來(lái),自適應(yīng)學(xué)習(xí)已經(jīng)能夠成熟開始商業(yè)化應(yīng)用,Knewton 不是第一家做知識(shí)性學(xué)習(xí)的,但是第一家把它做到大規(guī)模商業(yè)化應(yīng)用的。對(duì)我們算法來(lái)說(shuō),自適應(yīng)學(xué)習(xí)是找到孩子學(xué)習(xí)問(wèn)題,推薦下一步學(xué)什么,并在最短的時(shí)間內(nèi),幫助你攻克這個(gè)知識(shí)點(diǎn)。
其實(shí)自適應(yīng)學(xué)習(xí)本身就是 AI 在教育里的應(yīng)用,最早不說(shuō) AI,是因?yàn)槟菚r(shí)候算法非常初級(jí)。但是教育里面的 AI 就是自適應(yīng)學(xué)習(xí),當(dāng)然還有現(xiàn)在大家說(shuō)的人臉情感識(shí)別,這些我就不說(shuō)了。
Geekpark:現(xiàn)在國(guó)內(nèi)所講的自適應(yīng)和真正的自適應(yīng)有什么區(qū)別?
王楓:2015 年初我回國(guó)時(shí),國(guó)內(nèi)一些同行零零星星的在講自適應(yīng)學(xué)習(xí),但當(dāng)時(shí)很多理解都非常不準(zhǔn)確。對(duì)教育來(lái)說(shuō),是根據(jù)學(xué)生實(shí)時(shí)的學(xué)習(xí)情況,來(lái)不斷調(diào)整下一步學(xué)生要學(xué)哪個(gè)知識(shí)點(diǎn),或者做什么試題,這叫 Adaptive。
但這里面水在什么地方?Adaptive 簡(jiǎn)單說(shuō)來(lái)有基于規(guī)則和基于算法兩種,比如說(shuō)當(dāng)一個(gè)學(xué)生做錯(cuò)了一元二次方程,系統(tǒng)根據(jù)提前埋好的點(diǎn)推薦幾個(gè)一元一次方程的題目,再推幾個(gè)因式分解題目,這就是基于規(guī)則。但不能說(shuō)這是真正有用的自適應(yīng),因?yàn)?A 學(xué)生可能是一元二次方程不會(huì),B 學(xué)生可能是一元一次方程不會(huì),C 學(xué)生可能是因式分解不會(huì),而 D 學(xué)生可能連小學(xué)的乘法快速運(yùn)算都不會(huì)。按照埋點(diǎn)的方式,無(wú)法預(yù)先知道學(xué)生到底是哪個(gè)知識(shí)點(diǎn)不會(huì)。如果按照設(shè)定規(guī)則的方式,74 個(gè)知識(shí)點(diǎn),就得需要設(shè)定 2 的 74 次方程的規(guī)則(每一道題都有會(huì)與不會(huì)兩種情況)。
換句話說(shuō),所謂簡(jiǎn)單基于規(guī)則的自適應(yīng),對(duì)學(xué)習(xí)不但沒(méi)有用,很有可能還會(huì)有害,因?yàn)閷W(xué)生需要浪費(fèi)時(shí)間去重復(fù)學(xué)習(xí)他可能已經(jīng)掌握的知識(shí)。真正有用的自適應(yīng)一定是基于算法的,這就基于機(jī)器學(xué)習(xí),基于 AI 了。
Geekpark:論答現(xiàn)在能做到的自適應(yīng)是怎樣的?
王楓:前面說(shuō)的 74 個(gè)知識(shí)點(diǎn),論答只需要用 8 道題就能檢測(cè) 74 個(gè)知識(shí)點(diǎn),有 66 個(gè)知識(shí)點(diǎn)是不用出題就可以判斷學(xué)生的掌握情況。但可能還不止,因?yàn)橐恍┲R(shí)點(diǎn)下面可能會(huì)有很多道題。
學(xué)生每做完一道題,下一道題在哪個(gè)知識(shí)點(diǎn)上給他出題,我們沒(méi)有任何人知道。論答的系統(tǒng)就像一個(gè)黑匣子,但本質(zhì)上就像一個(gè)名師一樣。一個(gè)名師來(lái)測(cè)試整個(gè)中考代數(shù),可能也只需要 5 至 8 道題。因?yàn)樗卸嗄甑慕逃?jīng)驗(yàn)來(lái)不停地判斷每道題之間的關(guān)聯(lián)性,他大腦中的判斷是個(gè)非常復(fù)雜的過(guò)程。對(duì)于機(jī)器而言,每做完一道題系統(tǒng)都在不斷更新,判斷你在每一個(gè)知識(shí)點(diǎn)上面掌握的可能性。
Geekpark:如何判定這個(gè)黑匣子中的算法就是有效的?
王楓:首先可以通過(guò)直觀感受,多做幾套測(cè)試來(lái)看看效果,看到底是不是靠譜,我們機(jī)器得出來(lái)的判斷和作為一個(gè)好老師的判斷,或者你對(duì)自己理解的判斷是否一致,這是第一點(diǎn)。比如在實(shí)數(shù)運(yùn)算這一節(jié),我全是亂點(diǎn)的答案,但蒙對(duì)了 3 個(gè),可是系統(tǒng)對(duì)我的判定是掌握了 0 個(gè)知識(shí)點(diǎn)。有意思的是實(shí)數(shù)加法法則與運(yùn)算率這個(gè)知識(shí)點(diǎn),相關(guān)的兩道題我都猜對(duì)了,這種概率已經(jīng)是 25%×25% 了,不過(guò)通過(guò)相關(guān)的算法,機(jī)器最后還是認(rèn)定我沒(méi)有掌握這個(gè)知識(shí)點(diǎn)。
從嚴(yán)謹(jǐn)?shù)膶?shí)證研究來(lái)說(shuō),我們完成了中國(guó)有關(guān)自適應(yīng)學(xué)習(xí)第一個(gè)嚴(yán)謹(jǐn)?shù)膶?shí)證研究,研究結(jié)果發(fā)表在全球頂級(jí)的研究雜志《交互學(xué)習(xí)》研究雜志 2018 年第一期上面。在這個(gè)實(shí)驗(yàn)中,與一個(gè)主流學(xué)習(xí)系統(tǒng)相比,我們的學(xué)習(xí)效果顯然更好,我們的學(xué)習(xí)效率是在它的 3-28 倍之間。
Geekpark:為什么論答能做到通過(guò) 8 道題測(cè)評(píng) 74 個(gè)知識(shí)點(diǎn)?這背后的開發(fā)流程是怎樣的?
王楓:我從 2015 年初回國(guó)開始,就在開發(fā)這個(gè)系統(tǒng)。一直到今年 5 月份才覺(jué)得系統(tǒng)基本打磨成熟,開始輸出。算法的研發(fā)團(tuán)隊(duì)是紐約那邊做數(shù)據(jù)科學(xué)相關(guān)的高端人材。首席數(shù)據(jù)科學(xué)家馬鎮(zhèn)筠博士在那兒負(fù)責(zé),他是浙大數(shù)學(xué)系本科,弗吉尼亞大學(xué)統(tǒng)計(jì)學(xué)博士,他負(fù)責(zé)開發(fā)我們的核心算法。
這件事本質(zhì)上是一個(gè)龐大的系統(tǒng)工程,算法開發(fā)、知識(shí)圖譜設(shè)計(jì)、以及到最后相匹配的練習(xí)題、講義的生產(chǎn)等都是非常復(fù)雜的過(guò)程。拿 6-9 年級(jí)系統(tǒng)中的數(shù)學(xué)測(cè)試題來(lái)說(shuō),我們專業(yè)的題目研發(fā)團(tuán)隊(duì)通過(guò)對(duì)知識(shí)點(diǎn)的拆解原創(chuàng)開發(fā)了十幾萬(wàn)道題。開發(fā)出題目后還需要用人工打標(biāo)簽,每一道題從開發(fā)到入庫(kù),中間有幾十道工序,有很多個(gè)標(biāo)簽要打。只有這樣算法引擎才知道,每個(gè)知識(shí)點(diǎn)后面有哪些題,每個(gè)題后面的屬性、難度、區(qū)分度以及與學(xué)生做題之前的知識(shí)掌握程度等。入庫(kù)后算法會(huì)不斷根據(jù)學(xué)生的使用情況調(diào)整這些題目的屬性。
前景
Geekpark:自適應(yīng)系統(tǒng)能解決教育市場(chǎng)中的什么痛點(diǎn)?
王楓:像論答這樣的自適應(yīng)系統(tǒng),可以從根本上解決優(yōu)秀老師供給的問(wèn)題。這也是整個(gè)教育產(chǎn)業(yè)最核心的價(jià)值。在中國(guó),不管是培訓(xùn)機(jī)構(gòu)還是公立學(xué)校,最缺是優(yōu)秀老師。像新東方跟學(xué)而思這樣 200 億美金的大公司,加起來(lái)所占的市場(chǎng)份額也不到 12%。為什么?因?yàn)樗麄兏緵](méi)有那么多優(yōu)秀的老師。論答現(xiàn)在可以做到讓一個(gè)沒(méi)有任何教學(xué)經(jīng)驗(yàn)的兼職大學(xué)生,只需要 3-6 小時(shí)在線微信群培訓(xùn),再加上我們?nèi)斯ぶ悄芟到y(tǒng),就能達(dá)到一個(gè)優(yōu)秀老師的教學(xué)水平。
Geekpark:論答為什么能解決優(yōu)秀老師的供給問(wèn)題?
王楓:因?yàn)橐粋€(gè)名師的必殺技 70% 都能被我們的系統(tǒng)替代掉,我們已經(jīng)完全可以去做課堂。一個(gè)好老師其實(shí)有兩種職能是機(jī)器難替以代的,第一是看場(chǎng)子即是說(shuō)保障課堂秩序,第二是精準(zhǔn)定位,即是說(shuō)能夠一步一步的把一道題拆開,讓學(xué)生去思考到底是哪里不會(huì)?,F(xiàn)在論答已經(jīng)能夠賦予普通老師第二種功能,所以通過(guò)短暫的培訓(xùn)就能讓普通老師成為名師。
Geekpark:都知道 Knewton 是這個(gè)領(lǐng)域的領(lǐng)先者,為什么 Knewton 在中國(guó)沒(méi)先跑出來(lái)?
王楓:自適應(yīng)學(xué)習(xí)引擎是最核心的,但光有引擎是不夠的。Knewton 吃了虧,以前全部都做,后面只做引擎。但是光有引擎,沒(méi)有相匹配的內(nèi)容和系統(tǒng),最終的結(jié)果就沒(méi)法保證。除此以外,中國(guó)的學(xué)科體系和美國(guó)的也不一樣,所以在美國(guó)適用的那些經(jīng)驗(yàn),到中國(guó)就搞不定了。
對(duì)我們來(lái)說(shuō),除了引擎外還有一個(gè)龐大的學(xué)習(xí)系統(tǒng),包括教師、學(xué)生以及相應(yīng)的備課系統(tǒng),甚至包括相應(yīng)在線直播平臺(tái),以及相匹配的課程內(nèi)容。這里面是一個(gè)完整的人工智能學(xué)習(xí)系統(tǒng),而且我們還是開放式平臺(tái),任何老師可以在里面添加任何形式的教學(xué)內(nèi)容,任何機(jī)構(gòu)、任何學(xué)校都可以,是真正開放式平臺(tái)。
Geekpark:中國(guó)的教育場(chǎng)景有什么不同特點(diǎn)?
王楓:應(yīng)試教育是 AI+ 教育,最能發(fā)揮價(jià)值的場(chǎng)景。而全球最大的應(yīng)試教育市場(chǎng)在哪兒?就在中國(guó)。所以對(duì)于 AI+ 教育公司來(lái)說(shuō),中國(guó)是最合適的商業(yè)市場(chǎng)。
為什么 AI 最有用的應(yīng)用場(chǎng)景是應(yīng)試教育呢?簡(jiǎn)單來(lái)說(shuō),AI 要能夠判斷,需要量化,必須有數(shù)據(jù)。像人臉識(shí)別、表情也不是說(shuō)沒(méi)有用,但是對(duì)于機(jī)器而言,要能最大發(fā)揮價(jià)值,還是要能夠最大限度量化,而且必須要明確測(cè)量的目標(biāo)。從應(yīng)試教育來(lái)說(shuō),中國(guó)家長(zhǎng)從初中開始,只有一個(gè)訴求——提分,考一個(gè)好的高中,然后考一個(gè)好的大學(xué),通過(guò)自適應(yīng)系統(tǒng)能夠很好的實(shí)現(xiàn)家長(zhǎng)的這些訴求,在這方面機(jī)器的確能夠發(fā)揮巨大的價(jià)值。
Geekpark:現(xiàn)在的商業(yè)模式是怎樣的?
王楓:B2B2C 的模式。我們 5 月份開始向 B 端學(xué)校,還有培訓(xùn)機(jī)構(gòu)輸出,現(xiàn)在已經(jīng)有幾十所學(xué)校使用了。我認(rèn)為 3-5 年之內(nèi),論答的系統(tǒng)至少成為整個(gè)中國(guó)培訓(xùn)產(chǎn)業(yè)的標(biāo)配,而且對(duì)中國(guó)絕大部分中小學(xué)來(lái)說(shuō),他們會(huì)發(fā)現(xiàn)論答系統(tǒng),對(duì)他們學(xué)校的教學(xué)來(lái)說(shuō),也都是極其關(guān)鍵的。
本文轉(zhuǎn)自微信公眾號(hào)“極客公園”,作者哲銘,編輯臥蟲。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場(chǎng)。
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。