芥末堆芥末堆

學(xué)而思CTO田密:用大模型重構(gòu)教育,我們做對了什么?

作者:昆布 發(fā)布時間:

學(xué)而思CTO田密:用大模型重構(gòu)教育,我們做對了什么?

作者:昆布 發(fā)布時間:

摘要:AI技術(shù)的發(fā)展使“不可能三角”成為可能,而大模型技術(shù)的出現(xiàn)是一縷曙光。

8.png
7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2024”)在上海啟幕。本屆大會備受關(guān)注的熱點領(lǐng)域之一是“人工智能+教育”,“教育與人才”被列為大會行業(yè)論壇的十大重點議題之一。

7月6日,在“AI 產(chǎn)業(yè)創(chuàng)新與投資發(fā)展主題會”上,學(xué)而思CTO田密以《教育大模型,構(gòu)建未來個性化學(xué)習(xí)藍(lán)圖》為題發(fā)表了主題演講,首次分享了九章大模型在產(chǎn)業(yè)化層面的未來愿景和規(guī)劃。

芥末堆:我們先從一個老話題開始,“人工智能+教育”發(fā)展到今天,能在多大程度上替代老師?

田密:很多人認(rèn)為大模型的進步會對教育行業(yè)產(chǎn)生顛覆性影響。Sora剛出來時,很多人問我,將來還需要輔導(dǎo)班老師嗎?今天的大模型發(fā)展非常迅速,但還沒有達(dá)到徹底替代老師的地步。

教育行業(yè)有一個“不可能三角理論”,即個性化、高質(zhì)量和大規(guī)模很難同時實現(xiàn)。以學(xué)而思為例,最早推出了學(xué)而思小班,可以做到高質(zhì)量和個性化,但是無法實現(xiàn)大規(guī)模;后來推出了學(xué)而思大班,實現(xiàn)了大規(guī)模和高質(zhì)量,但沒有做到個性化;再后來我們推出了各種AI課程,勉強實現(xiàn)了個性化和大規(guī)模,但其質(zhì)量和真人老師相比仍有很大差距。AI技術(shù)的發(fā)展使“不可能三角”成為可能,而大模型技術(shù)的出現(xiàn)是一縷曙光。

2.png

教育行業(yè)面臨的最大問題是師資的匹配,優(yōu)質(zhì)資源不足,但事實上學(xué)習(xí)階段的孩子們隨時需要向老師提問。AI老師就彌補了這樣的空白,能夠非常耐心地進行陪伴式講解,孩子們不用擔(dān)心被說笨或者擔(dān)心老師會不耐煩,就像醫(yī)生接診一樣,AI老師能夠回答很多學(xué)生的問題。

芥末堆:能不能用最淺顯的語言,向我們眾多的教育創(chuàng)業(yè)者講清楚,人工智能對于教育而言,意味著什么?

田密:在大模型技術(shù)出現(xiàn)之前,AI技術(shù)已經(jīng)在教育的各個環(huán)節(jié)中發(fā)揮了作用,包括備課、教學(xué)、練習(xí)、評估和管理。例如,備課時可以用AI技術(shù)幫助老師自動生成講義和試卷;授課環(huán)節(jié)中,AI可以充當(dāng)教學(xué)助手,提供智能答題器,幫助老師做智能提醒和個性化的TTS。在練習(xí)階段,AI可以實現(xiàn)自適應(yīng)練習(xí)、中文作業(yè)批改和整頁批改;在評估環(huán)節(jié),AI可以進行口語評測等。

隨著大模型時代的到來,所有的教育AI科技都可以通過大模型技術(shù)重新實現(xiàn)一遍。這意味著AI不僅可以優(yōu)化現(xiàn)有的教育環(huán)節(jié),還可以在個性化和規(guī)模化方面實現(xiàn)更大的突破,更好地滿足不同學(xué)生的需求。

芥末堆:大模型和傳統(tǒng)的深度學(xué)習(xí)技術(shù)有什么本質(zhì)差異呢?

田密:第一,大模型更加通用。過去需要上百個大大小小的模型來提供AI服務(wù),工作量非常大?,F(xiàn)在,一個大模型可以處理所有任務(wù),極大地降低了訓(xùn)練成本,提高了訓(xùn)練效率,并且通用性得到了保障。

第二,大模型有了通用大模型作為基座。過去,教育大模型只能學(xué)習(xí)教育相關(guān)的語料。如今,通過通用大模型,教育大模型可以融合更多的世界知識和教育知識,從而變得更加聰明,情商更高。

第三,大模型支持多輪交互。這使得人機交互或師生交互更加容易、便捷和自然。大模型生成的多輪交互方式讓互動變得更加流暢,提升了用戶體驗。

芥末堆:教育大模型是怎么訓(xùn)練出來的?訓(xùn)練模型的方式和通用大模型有差別嗎?

田密:沒有本質(zhì)上的差別,通常會分成幾個階段。以九章大模型為例,你會發(fā)現(xiàn),大模型學(xué)習(xí)知識的方式、手段和人類很相似。我們把訓(xùn)練過程分為三個階段。

階段一,預(yù)訓(xùn)練。就像一個孩子要看大量的書去學(xué)習(xí),通過自學(xué)獲取基本知識和理論框架。

階段二,有監(jiān)督微調(diào)。相當(dāng)于請了一名老師給孩子講解標(biāo)準(zhǔn)的解題套路,孩子向老師學(xué)習(xí)解題步驟,比如一二三步驟分別怎么做。

階段三,強化學(xué)習(xí)。相當(dāng)于孩子不斷地進行多輪練習(xí),每次練習(xí)后進行批改和反饋,不斷進階提升。

3.png

這個過程讓大模型像孩子一樣學(xué)習(xí)一門學(xué)科,比如數(shù)學(xué)。其中,最關(guān)鍵的是數(shù)據(jù)。訓(xùn)練什么樣的模型需要什么樣的數(shù)據(jù)。在不同的訓(xùn)練階段,比如預(yù)訓(xùn)練階段,需要海量的題庫、講義和教輔書;微調(diào)階段需要大量的步驟清晰的解決方案數(shù)據(jù);強化階段需要用獎勵模型對結(jié)果進行反饋。

在這一點上,學(xué)而思具備優(yōu)勢。我們一直在投入教育科技研發(fā),從2003年成立起就在積累題庫數(shù)據(jù),這些都是訓(xùn)練大模型寶貴的原材料。

芥末堆:此前有網(wǎng)友讓九章大模型和ChatGPT分別去答高考數(shù)學(xué)卷,引來熱議。在開發(fā)團隊內(nèi)部有沒有做過類似的對比實驗,結(jié)果如何?

田密:大模型和人類一樣,有文科生和理科生的區(qū)別。我們發(fā)現(xiàn),很難在一個大模型里同時學(xué)好數(shù)學(xué)、語文和英語。九章采用了多專家模型方式,有專門的數(shù)學(xué)專家模型、語文專家模型和英語專家模型,最終以MoE方式組合起來提供全科服務(wù)。

九章作為以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心的大模型,在高考數(shù)學(xué)題目上比GPT-4o得分更高?!包c睛”分析也是九章的特色,它在解題的同時拆解了題目的考點,更適合學(xué)習(xí)者參考。

4.png

大模型應(yīng)用最大的阻礙在于“幻覺問題”。通過搜索召回增強技術(shù),可以比較有效地緩解這一問題。這個技術(shù)很簡單,在大模型生成之前,先搜索并召回相關(guān)的內(nèi)容,拼裝到程序中作為提示詞工程的一部分,這樣輸出就會有約束,不會胡亂生成答案。例如,將學(xué)生的學(xué)習(xí)畫像放進去,就可以生成個性化的回答,這是大模型落地應(yīng)用的關(guān)鍵點。

芥末堆:今天現(xiàn)場有一些觀眾嘗試用手機拍攝一道四年級數(shù)學(xué)題,大模型并沒有直接給出答案,而是分析了題目考察的知識點和形式,再引導(dǎo)用戶一步步思考。這和一些拍題軟件的講解方式區(qū)別很大,讓大家感受到了人工智能在個性化引導(dǎo)學(xué)習(xí)方面的潛力。

田密:我們認(rèn)為,所有教育場景都值得用大模型重新做一遍。到今天,學(xué)而思已經(jīng)在解題、對話、批改、講題和推薦這五大場景中重構(gòu)了教育科技。

解題很好理解,就是實時解答一個題目;對話是指具有常見的對話能力;批改方面,AI可以批改中文和英文作業(yè),甚至細(xì)致到數(shù)學(xué)題的步驟級別,識別出答案的對錯和錯誤的具體步驟;講題則是AI一對一地講解題目;推薦則是在大模型的基礎(chǔ)上做到步驟級的個性化推薦,使得標(biāo)簽更加精準(zhǔn),推薦效果更好。

5.png

具體來看,這些過程如下:

1.自動解題:九章大模型在數(shù)學(xué)評測網(wǎng)站Matheval上排名第一。在我們官網(wǎng)上也有展示,一道高中的函數(shù)題,大模型會先分析題目,識別出考察的知識點,然后進行步驟詳解,最終完成解題并提供考點分析,這樣可以讓學(xué)生更清楚地了解題目的考察重點。

2.口語對話練習(xí):在我們的APP中,有口語評測功能,讓孩子通過游戲化的過程進行學(xué)習(xí)。我們會對學(xué)生的口語回答進行評測,包括流利度和發(fā)音。

3.作業(yè)批改:中文作文批改涉及字詞判斷、錯別字、段落批改、內(nèi)容建議和潤色方法。英文作文批改分為三個步驟:批改、建議和潤色。數(shù)學(xué)題的批改更為復(fù)雜,特別是主觀題,需要對步驟進行批改,識別錯誤步驟并提供個性化講解。

4.講題:我們推出了“九章隨時問”小程序,它是一個數(shù)學(xué)AI老師,不是直接給出答案,而是一步步講解,任何不懂的地方可以隨時追問。這個功能的目的是讓孩子學(xué)會主動提問,培養(yǎng)批判性思維。

5.推薦:個性化學(xué)習(xí)的核心在于題目推薦。過去的診斷只能精確到題目級別,而現(xiàn)在可以拆解成多個步驟,每個步驟考察的知識點不同,對題目錯因的判斷更加精準(zhǔn),從而推薦的效果也更好。

總的來說,AI時代的教育需要孩子主動提問,因為AI幾乎無所不知。提問的能力在很多情況下不被鼓勵,但AI讓這一過程變得自然,孩子們可以更加放松地提出問題。AI老師會盡可能激發(fā)孩子的主動提問,通過不斷的反問和設(shè)問,引導(dǎo)孩子學(xué)會主動學(xué)習(xí)。這是AI給教育帶來的一個變化。

芥末堆:有人擔(dān)心AI會讓教育變得更惰性,認(rèn)為是拍照抄答案。對此你怎么看?

田密:并不是這樣的。拍照講解之后會有追問,這才是真正的方向。我們的AI老師會盡可能去激發(fā)孩子主動問問題。我們會把問題拆成很多個小步驟,每一步都問孩子“你怎么看這一步?”、“你覺得這么做是對的嗎?”或者“你認(rèn)為有什么重要的方法嗎?”通過不斷地反問和設(shè)問,讓孩子自己學(xué)會主動提問。

這種方法不僅幫助孩子理解題目,更培養(yǎng)了他們的批判性思維和主動學(xué)習(xí)的能力。AI在教育中的作用不僅是提供答案,更是引導(dǎo)學(xué)生思考,鼓勵他們獨立解決問題。這樣,AI不僅不會讓教育變得更惰性,反而會推動教育質(zhì)量的提升,使學(xué)習(xí)變得更加積極和主動。

芥末堆:國內(nèi)外大模型在教育領(lǐng)域的應(yīng)用,目前還遇到什么樣的難題?解決方向會是在哪里?

田密:坦率地講,雖然目前大模型很熱,但從全球來看,真正落地用的產(chǎn)品并不多。大家看到比較成熟的應(yīng)用主要有兩個,一個是搜索,另一個是聊天(chat)。

目前,大模型的應(yīng)用還處于早期階段,教育領(lǐng)域也是如此。簡而言之,教育上的大模型未來要成為AI老師。AI老師需要具備多種能力,比如解題、講題、口語練習(xí)和批改答疑。然而,目前還沒有哪一個產(chǎn)品能夠?qū)⑦@些功能完美地結(jié)合在一起。

我們都希望有一個全能的AI老師,但實現(xiàn)這一目標(biāo)非常困難?,F(xiàn)在的實際做法是將這些能力分解并逐步落地。例如,我們的“隨時問”專注于講解和答疑,口語練習(xí)則集成在一些應(yīng)用程序中。這些能力逐步落地,最終有一天可能會形成一個完整的產(chǎn)品。

目前,AI老師還遠(yuǎn)未成熟。這與自動駕駛有些類似?,F(xiàn)在智能座駕很火,但真正意義上的全自動駕駛(L4以上)尚未實現(xiàn)。然而,這并不妨礙一些具體功能的落地,比如自動泊車、智能變道和高速巡航。AI老師也是如此,它會逐步替代老師的許多工作,最終成為一個比較全能的AI老師。

6.png
今天,整個AI大模型對教育行業(yè)的影響和賦能還處于非常早期的階段。學(xué)而思將把三項最重要的核心AI能力——解題、講題和批改,向全行業(yè)開放。我們希望將核心能力開放給行業(yè)中的所有參與者,包括各類硬件廠商,如AIPC、手機、iPad和汽車制造商,以及一些公立學(xué)校的2B2C應(yīng)用。我們希望通過大模型的應(yīng)用能力,真正推動教育行業(yè)的發(fā)展,為整個教育的數(shù)字化轉(zhuǎn)型貢獻一份力量。

芥末堆:人們看到五月剛剛經(jīng)歷新一輪升級的“小思”也來到了今天的舞臺?!靶∷紝υ挕鄙闲铝擞洃浭较到y(tǒng),新增了情緒識別,可以根據(jù)提問者的聲音、狀態(tài)識別他當(dāng)下的情緒,并以對應(yīng)語氣進行回應(yīng)。還會通過對話記錄,在家長端提供成長報告和養(yǎng)育建議??瓷先ピ絹碓较裾嫒死蠋熈?。

田密:是的,“小思對話”的升級使其越來越像真人老師。然而,反過來說,有些人擔(dān)心AI大模型會不會顛覆教育行業(yè),讓AI老師完全代替真人老師。對此,我的答案是否定的。我們認(rèn)為大模型會給每名老師配備一個AI助教,每個孩子配備一個AI學(xué)伴。

老師有很多固定的工作,比如備課和作業(yè)批改,這些重復(fù)性的工作可以由AI大模型替代。這樣一來,老師就可以把精力集中在對孩子的關(guān)愛、喚醒和激發(fā)上。對于孩子來說,AI學(xué)伴可以24小時在線陪伴他們學(xué)習(xí)和成長,孩子可以隨時向AI學(xué)伴提問,沒有任何壓力,不用擔(dān)心問題是否愚蠢,也不用擔(dān)心需要重復(fù)講解幾遍才能聽明白。

AI可以幫助孩子保持對學(xué)習(xí)的樂趣和自信,這才是教育行業(yè)大模型賦能的終極意義所在。通過這種方式,AI不會替代老師,而是增強老師的能力,讓教育變得更加人性化和個性化。

芥末堆:從整個教育產(chǎn)業(yè)結(jié)構(gòu)來看,大模型的融入將會引發(fā)怎樣的變化?未來三年內(nèi),教育產(chǎn)業(yè)在整合大模型時面臨的主要挑戰(zhàn)是什么?

田密:人們都看到大模型的潛力,也都在積極地?fù)肀н@個事情,但目前來看,無論是公立學(xué)校、培訓(xùn)機構(gòu)還是從業(yè)者,對于未來的變化尚不是特別清晰。大家都意識到變革將會發(fā)生,但具體的變化何時到來,以及線上與線下的關(guān)系是否會被顛覆,人人都在探索。

大模型在教育產(chǎn)業(yè)的應(yīng)用不會是一蹴而就的,而是一個漸進的過程。類似于自動駕駛技術(shù)從L1到L5的逐步演進,大模型的應(yīng)用也需要逐步落地。因此,首先需要明確教育行業(yè)中可以應(yīng)用大模型的場景,并逐一實施落地,同時不斷提升模型的性能。數(shù)據(jù)的收集和積累是關(guān)鍵中的關(guān)鍵。只有通過收集大量真實用戶數(shù)據(jù),并建立完整的數(shù)據(jù)閉環(huán),才能實現(xiàn)全面的AI教師服務(wù)。

7.png

我們的孩子幾乎都是移動互聯(lián)網(wǎng)的原住民,從小就在各種電子產(chǎn)品中成長。未來的孩子將會成為AI的原住民,他們從出生起就接觸到帶有AI功能的產(chǎn)品。

教育是一個非常敏感的領(lǐng)域,人們對教育的容錯率很低。就像自動駕駛技術(shù)如果應(yīng)用不當(dāng)可能導(dǎo)致事故一樣,教育中如果傳授的知識有誤,家長和社會都會產(chǎn)生極大的不滿。這就要求在大模型演進過程中要極為謹(jǐn)慎,特別是在進入公立學(xué)校領(lǐng)域時,對教學(xué)內(nèi)容的準(zhǔn)確性要求更加嚴(yán)格。

因此,大模型在教育中的融合過程將是緩慢而長期的。在此過程中,需要克服的主要挑戰(zhàn)包括技術(shù)性能的提升、數(shù)據(jù)隱私與安全的保護、教育內(nèi)容的準(zhǔn)確性保障以及社會接受度的提升。這些挑戰(zhàn)的解決將決定大模型在教育產(chǎn)業(yè)中的成敗。

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 學(xué)而思CTO田密:用大模型重構(gòu)教育,我們做對了什么?分享二維碼