芥末堆芥末堆

學(xué)而思CTO田密:用大模型重構(gòu)教育,我們做對(duì)了什么?

作者:昆布 發(fā)布時(shí)間:

學(xué)而思CTO田密:用大模型重構(gòu)教育,我們做對(duì)了什么?

作者:昆布 發(fā)布時(shí)間:

摘要:AI技術(shù)的發(fā)展使“不可能三角”成為可能,而大模型技術(shù)的出現(xiàn)是一縷曙光。

8.png
7月4日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(簡(jiǎn)稱“WAIC 2024”)在上海啟幕。本屆大會(huì)備受關(guān)注的熱點(diǎn)領(lǐng)域之一是“人工智能+教育”,“教育與人才”被列為大會(huì)行業(yè)論壇的十大重點(diǎn)議題之一。

7月6日,在“AI 產(chǎn)業(yè)創(chuàng)新與投資發(fā)展主題會(huì)”上,學(xué)而思CTO田密以《教育大模型,構(gòu)建未來(lái)個(gè)性化學(xué)習(xí)藍(lán)圖》為題發(fā)表了主題演講,首次分享了九章大模型在產(chǎn)業(yè)化層面的未來(lái)愿景和規(guī)劃。

芥末堆:我們先從一個(gè)老話題開(kāi)始,“人工智能+教育”發(fā)展到今天,能在多大程度上替代老師?

田密:很多人認(rèn)為大模型的進(jìn)步會(huì)對(duì)教育行業(yè)產(chǎn)生顛覆性影響。Sora剛出來(lái)時(shí),很多人問(wèn)我,將來(lái)還需要輔導(dǎo)班老師嗎?今天的大模型發(fā)展非常迅速,但還沒(méi)有達(dá)到徹底替代老師的地步。

教育行業(yè)有一個(gè)“不可能三角理論”,即個(gè)性化、高質(zhì)量和大規(guī)模很難同時(shí)實(shí)現(xiàn)。以學(xué)而思為例,最早推出了學(xué)而思小班,可以做到高質(zhì)量和個(gè)性化,但是無(wú)法實(shí)現(xiàn)大規(guī)模;后來(lái)推出了學(xué)而思大班,實(shí)現(xiàn)了大規(guī)模和高質(zhì)量,但沒(méi)有做到個(gè)性化;再后來(lái)我們推出了各種AI課程,勉強(qiáng)實(shí)現(xiàn)了個(gè)性化和大規(guī)模,但其質(zhì)量和真人老師相比仍有很大差距。AI技術(shù)的發(fā)展使“不可能三角”成為可能,而大模型技術(shù)的出現(xiàn)是一縷曙光。

2.png

教育行業(yè)面臨的最大問(wèn)題是師資的匹配,優(yōu)質(zhì)資源不足,但事實(shí)上學(xué)習(xí)階段的孩子們隨時(shí)需要向老師提問(wèn)。AI老師就彌補(bǔ)了這樣的空白,能夠非常耐心地進(jìn)行陪伴式講解,孩子們不用擔(dān)心被說(shuō)笨或者擔(dān)心老師會(huì)不耐煩,就像醫(yī)生接診一樣,AI老師能夠回答很多學(xué)生的問(wèn)題。

芥末堆:能不能用最淺顯的語(yǔ)言,向我們眾多的教育創(chuàng)業(yè)者講清楚,人工智能對(duì)于教育而言,意味著什么?

田密:在大模型技術(shù)出現(xiàn)之前,AI技術(shù)已經(jīng)在教育的各個(gè)環(huán)節(jié)中發(fā)揮了作用,包括備課、教學(xué)、練習(xí)、評(píng)估和管理。例如,備課時(shí)可以用AI技術(shù)幫助老師自動(dòng)生成講義和試卷;授課環(huán)節(jié)中,AI可以充當(dāng)教學(xué)助手,提供智能答題器,幫助老師做智能提醒和個(gè)性化的TTS。在練習(xí)階段,AI可以實(shí)現(xiàn)自適應(yīng)練習(xí)、中文作業(yè)批改和整頁(yè)批改;在評(píng)估環(huán)節(jié),AI可以進(jìn)行口語(yǔ)評(píng)測(cè)等。

隨著大模型時(shí)代的到來(lái),所有的教育AI科技都可以通過(guò)大模型技術(shù)重新實(shí)現(xiàn)一遍。這意味著AI不僅可以優(yōu)化現(xiàn)有的教育環(huán)節(jié),還可以在個(gè)性化和規(guī)?;矫鎸?shí)現(xiàn)更大的突破,更好地滿足不同學(xué)生的需求。

芥末堆:大模型和傳統(tǒng)的深度學(xué)習(xí)技術(shù)有什么本質(zhì)差異呢?

田密:第一,大模型更加通用。過(guò)去需要上百個(gè)大大小小的模型來(lái)提供AI服務(wù),工作量非常大?,F(xiàn)在,一個(gè)大模型可以處理所有任務(wù),極大地降低了訓(xùn)練成本,提高了訓(xùn)練效率,并且通用性得到了保障。

第二,大模型有了通用大模型作為基座。過(guò)去,教育大模型只能學(xué)習(xí)教育相關(guān)的語(yǔ)料。如今,通過(guò)通用大模型,教育大模型可以融合更多的世界知識(shí)和教育知識(shí),從而變得更加聰明,情商更高。

第三,大模型支持多輪交互。這使得人機(jī)交互或師生交互更加容易、便捷和自然。大模型生成的多輪交互方式讓互動(dòng)變得更加流暢,提升了用戶體驗(yàn)。

芥末堆:教育大模型是怎么訓(xùn)練出來(lái)的?訓(xùn)練模型的方式和通用大模型有差別嗎?

田密:沒(méi)有本質(zhì)上的差別,通常會(huì)分成幾個(gè)階段。以九章大模型為例,你會(huì)發(fā)現(xiàn),大模型學(xué)習(xí)知識(shí)的方式、手段和人類很相似。我們把訓(xùn)練過(guò)程分為三個(gè)階段。

階段一,預(yù)訓(xùn)練。就像一個(gè)孩子要看大量的書去學(xué)習(xí),通過(guò)自學(xué)獲取基本知識(shí)和理論框架。

階段二,有監(jiān)督微調(diào)。相當(dāng)于請(qǐng)了一名老師給孩子講解標(biāo)準(zhǔn)的解題套路,孩子向老師學(xué)習(xí)解題步驟,比如一二三步驟分別怎么做。

階段三,強(qiáng)化學(xué)習(xí)。相當(dāng)于孩子不斷地進(jìn)行多輪練習(xí),每次練習(xí)后進(jìn)行批改和反饋,不斷進(jìn)階提升。

3.png

這個(gè)過(guò)程讓大模型像孩子一樣學(xué)習(xí)一門學(xué)科,比如數(shù)學(xué)。其中,最關(guān)鍵的是數(shù)據(jù)。訓(xùn)練什么樣的模型需要什么樣的數(shù)據(jù)。在不同的訓(xùn)練階段,比如預(yù)訓(xùn)練階段,需要海量的題庫(kù)、講義和教輔書;微調(diào)階段需要大量的步驟清晰的解決方案數(shù)據(jù);強(qiáng)化階段需要用獎(jiǎng)勵(lì)模型對(duì)結(jié)果進(jìn)行反饋。

在這一點(diǎn)上,學(xué)而思具備優(yōu)勢(shì)。我們一直在投入教育科技研發(fā),從2003年成立起就在積累題庫(kù)數(shù)據(jù),這些都是訓(xùn)練大模型寶貴的原材料。

芥末堆:此前有網(wǎng)友讓九章大模型和ChatGPT分別去答高考數(shù)學(xué)卷,引來(lái)熱議。在開(kāi)發(fā)團(tuán)隊(duì)內(nèi)部有沒(méi)有做過(guò)類似的對(duì)比實(shí)驗(yàn),結(jié)果如何?

田密:大模型和人類一樣,有文科生和理科生的區(qū)別。我們發(fā)現(xiàn),很難在一個(gè)大模型里同時(shí)學(xué)好數(shù)學(xué)、語(yǔ)文和英語(yǔ)。九章采用了多專家模型方式,有專門的數(shù)學(xué)專家模型、語(yǔ)文專家模型和英語(yǔ)專家模型,最終以MoE方式組合起來(lái)提供全科服務(wù)。

九章作為以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心的大模型,在高考數(shù)學(xué)題目上比GPT-4o得分更高?!包c(diǎn)睛”分析也是九章的特色,它在解題的同時(shí)拆解了題目的考點(diǎn),更適合學(xué)習(xí)者參考。

4.png

大模型應(yīng)用最大的阻礙在于“幻覺(jué)問(wèn)題”。通過(guò)搜索召回增強(qiáng)技術(shù),可以比較有效地緩解這一問(wèn)題。這個(gè)技術(shù)很簡(jiǎn)單,在大模型生成之前,先搜索并召回相關(guān)的內(nèi)容,拼裝到程序中作為提示詞工程的一部分,這樣輸出就會(huì)有約束,不會(huì)胡亂生成答案。例如,將學(xué)生的學(xué)習(xí)畫像放進(jìn)去,就可以生成個(gè)性化的回答,這是大模型落地應(yīng)用的關(guān)鍵點(diǎn)。

芥末堆:今天現(xiàn)場(chǎng)有一些觀眾嘗試用手機(jī)拍攝一道四年級(jí)數(shù)學(xué)題,大模型并沒(méi)有直接給出答案,而是分析了題目考察的知識(shí)點(diǎn)和形式,再引導(dǎo)用戶一步步思考。這和一些拍題軟件的講解方式區(qū)別很大,讓大家感受到了人工智能在個(gè)性化引導(dǎo)學(xué)習(xí)方面的潛力。

田密:我們認(rèn)為,所有教育場(chǎng)景都值得用大模型重新做一遍。到今天,學(xué)而思已經(jīng)在解題、對(duì)話、批改、講題和推薦這五大場(chǎng)景中重構(gòu)了教育科技。

解題很好理解,就是實(shí)時(shí)解答一個(gè)題目;對(duì)話是指具有常見(jiàn)的對(duì)話能力;批改方面,AI可以批改中文和英文作業(yè),甚至細(xì)致到數(shù)學(xué)題的步驟級(jí)別,識(shí)別出答案的對(duì)錯(cuò)和錯(cuò)誤的具體步驟;講題則是AI一對(duì)一地講解題目;推薦則是在大模型的基礎(chǔ)上做到步驟級(jí)的個(gè)性化推薦,使得標(biāo)簽更加精準(zhǔn),推薦效果更好。

5.png

具體來(lái)看,這些過(guò)程如下:

1.自動(dòng)解題:九章大模型在數(shù)學(xué)評(píng)測(cè)網(wǎng)站Matheval上排名第一。在我們官網(wǎng)上也有展示,一道高中的函數(shù)題,大模型會(huì)先分析題目,識(shí)別出考察的知識(shí)點(diǎn),然后進(jìn)行步驟詳解,最終完成解題并提供考點(diǎn)分析,這樣可以讓學(xué)生更清楚地了解題目的考察重點(diǎn)。

2.口語(yǔ)對(duì)話練習(xí):在我們的APP中,有口語(yǔ)評(píng)測(cè)功能,讓孩子通過(guò)游戲化的過(guò)程進(jìn)行學(xué)習(xí)。我們會(huì)對(duì)學(xué)生的口語(yǔ)回答進(jìn)行評(píng)測(cè),包括流利度和發(fā)音。

3.作業(yè)批改:中文作文批改涉及字詞判斷、錯(cuò)別字、段落批改、內(nèi)容建議和潤(rùn)色方法。英文作文批改分為三個(gè)步驟:批改、建議和潤(rùn)色。數(shù)學(xué)題的批改更為復(fù)雜,特別是主觀題,需要對(duì)步驟進(jìn)行批改,識(shí)別錯(cuò)誤步驟并提供個(gè)性化講解。

4.講題:我們推出了“九章隨時(shí)問(wèn)”小程序,它是一個(gè)數(shù)學(xué)AI老師,不是直接給出答案,而是一步步講解,任何不懂的地方可以隨時(shí)追問(wèn)。這個(gè)功能的目的是讓孩子學(xué)會(huì)主動(dòng)提問(wèn),培養(yǎng)批判性思維。

5.推薦:個(gè)性化學(xué)習(xí)的核心在于題目推薦。過(guò)去的診斷只能精確到題目級(jí)別,而現(xiàn)在可以拆解成多個(gè)步驟,每個(gè)步驟考察的知識(shí)點(diǎn)不同,對(duì)題目錯(cuò)因的判斷更加精準(zhǔn),從而推薦的效果也更好。

總的來(lái)說(shuō),AI時(shí)代的教育需要孩子主動(dòng)提問(wèn),因?yàn)锳I幾乎無(wú)所不知。提問(wèn)的能力在很多情況下不被鼓勵(lì),但AI讓這一過(guò)程變得自然,孩子們可以更加放松地提出問(wèn)題。AI老師會(huì)盡可能激發(fā)孩子的主動(dòng)提問(wèn),通過(guò)不斷的反問(wèn)和設(shè)問(wèn),引導(dǎo)孩子學(xué)會(huì)主動(dòng)學(xué)習(xí)。這是AI給教育帶來(lái)的一個(gè)變化。

芥末堆:有人擔(dān)心AI會(huì)讓教育變得更惰性,認(rèn)為是拍照抄答案。對(duì)此你怎么看?

田密:并不是這樣的。拍照講解之后會(huì)有追問(wèn),這才是真正的方向。我們的AI老師會(huì)盡可能去激發(fā)孩子主動(dòng)問(wèn)問(wèn)題。我們會(huì)把問(wèn)題拆成很多個(gè)小步驟,每一步都問(wèn)孩子“你怎么看這一步?”、“你覺(jué)得這么做是對(duì)的嗎?”或者“你認(rèn)為有什么重要的方法嗎?”通過(guò)不斷地反問(wèn)和設(shè)問(wèn),讓孩子自己學(xué)會(huì)主動(dòng)提問(wèn)。

這種方法不僅幫助孩子理解題目,更培養(yǎng)了他們的批判性思維和主動(dòng)學(xué)習(xí)的能力。AI在教育中的作用不僅是提供答案,更是引導(dǎo)學(xué)生思考,鼓勵(lì)他們獨(dú)立解決問(wèn)題。這樣,AI不僅不會(huì)讓教育變得更惰性,反而會(huì)推動(dòng)教育質(zhì)量的提升,使學(xué)習(xí)變得更加積極和主動(dòng)。

芥末堆:國(guó)內(nèi)外大模型在教育領(lǐng)域的應(yīng)用,目前還遇到什么樣的難題?解決方向會(huì)是在哪里?

田密:坦率地講,雖然目前大模型很熱,但從全球來(lái)看,真正落地用的產(chǎn)品并不多。大家看到比較成熟的應(yīng)用主要有兩個(gè),一個(gè)是搜索,另一個(gè)是聊天(chat)。

目前,大模型的應(yīng)用還處于早期階段,教育領(lǐng)域也是如此。簡(jiǎn)而言之,教育上的大模型未來(lái)要成為AI老師。AI老師需要具備多種能力,比如解題、講題、口語(yǔ)練習(xí)和批改答疑。然而,目前還沒(méi)有哪一個(gè)產(chǎn)品能夠?qū)⑦@些功能完美地結(jié)合在一起。

我們都希望有一個(gè)全能的AI老師,但實(shí)現(xiàn)這一目標(biāo)非常困難?,F(xiàn)在的實(shí)際做法是將這些能力分解并逐步落地。例如,我們的“隨時(shí)問(wèn)”專注于講解和答疑,口語(yǔ)練習(xí)則集成在一些應(yīng)用程序中。這些能力逐步落地,最終有一天可能會(huì)形成一個(gè)完整的產(chǎn)品。

目前,AI老師還遠(yuǎn)未成熟。這與自動(dòng)駕駛有些類似?,F(xiàn)在智能座駕很火,但真正意義上的全自動(dòng)駕駛(L4以上)尚未實(shí)現(xiàn)。然而,這并不妨礙一些具體功能的落地,比如自動(dòng)泊車、智能變道和高速巡航。AI老師也是如此,它會(huì)逐步替代老師的許多工作,最終成為一個(gè)比較全能的AI老師。

6.png
今天,整個(gè)AI大模型對(duì)教育行業(yè)的影響和賦能還處于非常早期的階段。學(xué)而思將把三項(xiàng)最重要的核心AI能力——解題、講題和批改,向全行業(yè)開(kāi)放。我們希望將核心能力開(kāi)放給行業(yè)中的所有參與者,包括各類硬件廠商,如AIPC、手機(jī)、iPad和汽車制造商,以及一些公立學(xué)校的2B2C應(yīng)用。我們希望通過(guò)大模型的應(yīng)用能力,真正推動(dòng)教育行業(yè)的發(fā)展,為整個(gè)教育的數(shù)字化轉(zhuǎn)型貢獻(xiàn)一份力量。

芥末堆:人們看到五月剛剛經(jīng)歷新一輪升級(jí)的“小思”也來(lái)到了今天的舞臺(tái)。“小思對(duì)話”上新了記憶式系統(tǒng),新增了情緒識(shí)別,可以根據(jù)提問(wèn)者的聲音、狀態(tài)識(shí)別他當(dāng)下的情緒,并以對(duì)應(yīng)語(yǔ)氣進(jìn)行回應(yīng)。還會(huì)通過(guò)對(duì)話記錄,在家長(zhǎng)端提供成長(zhǎng)報(bào)告和養(yǎng)育建議??瓷先ピ絹?lái)越像真人老師了。

田密:是的,“小思對(duì)話”的升級(jí)使其越來(lái)越像真人老師。然而,反過(guò)來(lái)說(shuō),有些人擔(dān)心AI大模型會(huì)不會(huì)顛覆教育行業(yè),讓AI老師完全代替真人老師。對(duì)此,我的答案是否定的。我們認(rèn)為大模型會(huì)給每名老師配備一個(gè)AI助教,每個(gè)孩子配備一個(gè)AI學(xué)伴。

老師有很多固定的工作,比如備課和作業(yè)批改,這些重復(fù)性的工作可以由AI大模型替代。這樣一來(lái),老師就可以把精力集中在對(duì)孩子的關(guān)愛(ài)、喚醒和激發(fā)上。對(duì)于孩子來(lái)說(shuō),AI學(xué)伴可以24小時(shí)在線陪伴他們學(xué)習(xí)和成長(zhǎng),孩子可以隨時(shí)向AI學(xué)伴提問(wèn),沒(méi)有任何壓力,不用擔(dān)心問(wèn)題是否愚蠢,也不用擔(dān)心需要重復(fù)講解幾遍才能聽(tīng)明白。

AI可以幫助孩子保持對(duì)學(xué)習(xí)的樂(lè)趣和自信,這才是教育行業(yè)大模型賦能的終極意義所在。通過(guò)這種方式,AI不會(huì)替代老師,而是增強(qiáng)老師的能力,讓教育變得更加人性化和個(gè)性化。

芥末堆:從整個(gè)教育產(chǎn)業(yè)結(jié)構(gòu)來(lái)看,大模型的融入將會(huì)引發(fā)怎樣的變化?未來(lái)三年內(nèi),教育產(chǎn)業(yè)在整合大模型時(shí)面臨的主要挑戰(zhàn)是什么?

田密:人們都看到大模型的潛力,也都在積極地?fù)肀н@個(gè)事情,但目前來(lái)看,無(wú)論是公立學(xué)校、培訓(xùn)機(jī)構(gòu)還是從業(yè)者,對(duì)于未來(lái)的變化尚不是特別清晰。大家都意識(shí)到變革將會(huì)發(fā)生,但具體的變化何時(shí)到來(lái),以及線上與線下的關(guān)系是否會(huì)被顛覆,人人都在探索。

大模型在教育產(chǎn)業(yè)的應(yīng)用不會(huì)是一蹴而就的,而是一個(gè)漸進(jìn)的過(guò)程。類似于自動(dòng)駕駛技術(shù)從L1到L5的逐步演進(jìn),大模型的應(yīng)用也需要逐步落地。因此,首先需要明確教育行業(yè)中可以應(yīng)用大模型的場(chǎng)景,并逐一實(shí)施落地,同時(shí)不斷提升模型的性能。數(shù)據(jù)的收集和積累是關(guān)鍵中的關(guān)鍵。只有通過(guò)收集大量真實(shí)用戶數(shù)據(jù),并建立完整的數(shù)據(jù)閉環(huán),才能實(shí)現(xiàn)全面的AI教師服務(wù)。

7.png

我們的孩子幾乎都是移動(dòng)互聯(lián)網(wǎng)的原住民,從小就在各種電子產(chǎn)品中成長(zhǎng)。未來(lái)的孩子將會(huì)成為AI的原住民,他們從出生起就接觸到帶有AI功能的產(chǎn)品。

教育是一個(gè)非常敏感的領(lǐng)域,人們對(duì)教育的容錯(cuò)率很低。就像自動(dòng)駕駛技術(shù)如果應(yīng)用不當(dāng)可能導(dǎo)致事故一樣,教育中如果傳授的知識(shí)有誤,家長(zhǎng)和社會(huì)都會(huì)產(chǎn)生極大的不滿。這就要求在大模型演進(jìn)過(guò)程中要極為謹(jǐn)慎,特別是在進(jìn)入公立學(xué)校領(lǐng)域時(shí),對(duì)教學(xué)內(nèi)容的準(zhǔn)確性要求更加嚴(yán)格。

因此,大模型在教育中的融合過(guò)程將是緩慢而長(zhǎng)期的。在此過(guò)程中,需要克服的主要挑戰(zhàn)包括技術(shù)性能的提升、數(shù)據(jù)隱私與安全的保護(hù)、教育內(nèi)容的準(zhǔn)確性保障以及社會(huì)接受度的提升。這些挑戰(zhàn)的解決將決定大模型在教育產(chǎn)業(yè)中的成敗。

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點(diǎn)擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。
來(lái)源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 學(xué)而思CTO田密:用大模型重構(gòu)教育,我們做對(duì)了什么?分享二維碼