芥末堆芥末堆

從Level 0到Level 5,自適應(yīng)學(xué)習(xí)可分為哪些等級(jí)?

作者:胡天碩 發(fā)布時(shí)間:

從Level 0到Level 5,自適應(yīng)學(xué)習(xí)可分為哪些等級(jí)?

作者:胡天碩 發(fā)布時(shí)間:

摘要:較低等級(jí)的自適應(yīng)學(xué)習(xí)幾乎與AI無(wú)關(guān),而最高等級(jí)的自適應(yīng)學(xué)習(xí)沒(méi)有一家公司能夠完全做出來(lái)。

500182789.jpg

圖片來(lái)源:攝圖網(wǎng)

本文是胡天碩《揭秘自適應(yīng)學(xué)習(xí)的背后原理》系列文章第二篇,第一篇為《一套自適應(yīng)學(xué)習(xí)系統(tǒng)更應(yīng)該包括那些環(huán)節(jié)?》。

當(dāng)大家聊起AI與汽車(chē)的時(shí)候,第一個(gè)想到的是無(wú)人駕駛技術(shù)。當(dāng)大家聊起AI與教育的時(shí)候,第一個(gè)往往想到的則是自適應(yīng)學(xué)習(xí)。然而自適應(yīng)學(xué)習(xí)就像無(wú)人駕駛一樣,是分為不同的等級(jí)。較低等級(jí)的自適應(yīng)學(xué)習(xí)幾乎與AI無(wú)關(guān),而最高等級(jí)的自適應(yīng)學(xué)習(xí)沒(méi)有一家公司能夠完全做出來(lái),是AI領(lǐng)域非常困難的問(wèn)題。

今天我?guī)е蠹覐淖畹退降淖赃m應(yīng)學(xué)習(xí),一直講述自適應(yīng)學(xué)習(xí)的最高等級(jí)。

Level 0:基于純?nèi)斯さ淖赃m應(yīng)學(xué)習(xí)

如果要做一款自適應(yīng)學(xué)習(xí)的產(chǎn)品,我們先假設(shè)電腦是完全沒(méi)有能力判斷出學(xué)生的能力水平,而由老師來(lái)做判斷,判斷之后,由電腦來(lái)推送相應(yīng)的課程。

0.png

1、英語(yǔ)作文批改

用戶在網(wǎng)站上錄入了自己的托福作文,提交后,作文被送到一個(gè)隊(duì)列里等待人工的批注。老師收到了新的作文后,對(duì)學(xué)生作文的各個(gè)部分進(jìn)行標(biāo)注,哪些單詞拼錯(cuò)了,用錯(cuò)了,哪些固定搭配錯(cuò)了,哪些語(yǔ)法有問(wèn)題,文章結(jié)構(gòu)有什么問(wèn)題。批改完畢后,學(xué)生會(huì)收到老師的評(píng)價(jià),和系統(tǒng)自動(dòng)推送出的單詞,語(yǔ)法,和結(jié)構(gòu)課。從算法上來(lái)講,邏輯很簡(jiǎn)單,總共會(huì)有不同的幾種錯(cuò)誤類(lèi)型,和對(duì)應(yīng)的課程,只要學(xué)生在作文里出現(xiàn)某種錯(cuò)誤,就自動(dòng)推這類(lèi)課程。

2、一對(duì)一幾何課

老師在一對(duì)一地個(gè)性化輔導(dǎo)一個(gè)同學(xué),這時(shí)候給出一道幾何題目讓學(xué)生完成,學(xué)生通過(guò)手寫(xiě)的方式錄入自己的答案,但是中間有幾個(gè)過(guò)程問(wèn)題。老師用手寫(xiě)批改后,在直播過(guò)程中的后臺(tái),記錄了學(xué)生的知識(shí)漏洞,課后生成的學(xué)習(xí)報(bào)告里,會(huì)包括學(xué)生的知識(shí)點(diǎn)掌握情況,出現(xiàn)的錯(cuò)題,推薦做的同類(lèi)題目。甚至,完全可以在直播的過(guò)程中,老師出什么題目,完全并不由老師決定,而是由系統(tǒng)自動(dòng)出,老師每次只是給出評(píng)價(jià)學(xué)生到底出現(xiàn)哪些知識(shí)漏洞,是否要出一個(gè)更難的挑戰(zhàn)?從算法上來(lái)講,邏輯也非常簡(jiǎn)單,一道幾何題出現(xiàn)的錯(cuò)誤類(lèi)型有限,可以為每道題目找難度更低和更高的幾種題目,然后由老師決定是加大難度,減少難度,還是到下一個(gè)學(xué)習(xí)環(huán)節(jié)。

接下來(lái)我們讓電腦來(lái)判斷學(xué)生的對(duì)錯(cuò)。

Level 1:基于簡(jiǎn)單規(guī)則的自適應(yīng)學(xué)習(xí)

我們要在Level 0的基礎(chǔ)上加入簡(jiǎn)單的條件判斷,就可以實(shí)現(xiàn)最簡(jiǎn)單的自適應(yīng)學(xué)習(xí)算法?;谝?guī)則的自適應(yīng)學(xué)習(xí),其實(shí)本質(zhì)是決策樹(shù),適用場(chǎng)景是那些不去判斷學(xué)生是否掌握某種知識(shí),而是直接去判斷學(xué)生的某種行為是否是不對(duì)的。

0.png

1、汽車(chē)模擬駕駛

學(xué)生闖紅燈了,扣分,然后告訴學(xué)生,你要注意紅綠燈。學(xué)生左轉(zhuǎn)忘打轉(zhuǎn)向燈了,扣分,然后告訴學(xué)生,你要記得打轉(zhuǎn)向燈。學(xué)生超速了,扣分,然后告訴學(xué)生,你要注意自己行駛的速度。由于是電腦模擬駕駛,判斷語(yǔ)句設(shè)計(jì)起來(lái)都并不復(fù)雜。這種情況,不僅適用于開(kāi)車(chē),也適用于開(kāi)飛機(jī),開(kāi)挖掘機(jī),等各種計(jì)算機(jī)可以模擬的情景。

2、智能健身矯正

640.jpg

通過(guò)可穿戴式或者是視頻式的動(dòng)作捕捉設(shè)備,能夠獲得學(xué)生在做深蹲,硬拉,平板支撐等一系列動(dòng)作時(shí)各個(gè)關(guān)節(jié)的角度。當(dāng)學(xué)生完成動(dòng)作的過(guò)程中有角度超出規(guī)定值的時(shí)候,就提醒學(xué)生,你硬拉時(shí)背部不夠收緊,臀部不夠翹起。動(dòng)作捕捉的技術(shù)和硬件雖然當(dāng)前還未普及,但是實(shí)際上,判斷姿態(tài)是否正確的算法并不是那么困難。這種情況,不僅適用于健身,還有各種球類(lèi),舞蹈,甚至器樂(lè)的基本功學(xué)習(xí)。

實(shí)際上學(xué)生的掌握程度,未必是那么黑白分明,對(duì)就是對(duì),錯(cuò)就是錯(cuò),接下來(lái),我們需要在簡(jiǎn)單的決策樹(shù)規(guī)則之上建立更好的自適應(yīng)學(xué)習(xí)算法。

Level 2:基于難度等級(jí)的自適應(yīng)學(xué)習(xí)

剛才我們?cè)贚evel 1級(jí)的自適應(yīng)學(xué)習(xí)里,通過(guò)學(xué)生的行為直接指出學(xué)生的問(wèn)題。而拿開(kāi)車(chē)的例子,同樣兩個(gè)人既不闖紅燈,也不超速,但依然可能開(kāi)除的體驗(yàn)非常不同——所謂有新手司機(jī)和老司機(jī)的區(qū)別。

如果我們不去規(guī)定,學(xué)生什么具體行為錯(cuò)了就推送什么相應(yīng)課程,而是設(shè)計(jì)一套難度遞增的課程,當(dāng)學(xué)生完成得好的時(shí)候就加大挑戰(zhàn)難度,當(dāng)學(xué)生完成的有問(wèn)題時(shí),就相應(yīng)減少難度。這就是基于難度等級(jí)的自適應(yīng)學(xué)習(xí)。

640.jpg

1、英語(yǔ)分級(jí)閱讀


0.jpg

一個(gè)學(xué)生是否能看懂一篇文章,背后的原因是非常多的。一個(gè)很難的單詞,靠上下文,反而可能能猜測(cè)出來(lái);幾個(gè)簡(jiǎn)單的單詞,組合成短語(yǔ)和搭配,可能完全意思就變了;甚至如果是因?yàn)閷?zhuān)業(yè)問(wèn)題,可能單詞,短語(yǔ),語(yǔ)法都完全看得懂,但依然不明白的現(xiàn)象也會(huì)發(fā)生。

所以國(guó)外提出了所謂的readability(可讀性)的概念,兒童出版社將書(shū)籍按照大概的年齡段劃分。教學(xué)的時(shí)候,雖然每一個(gè)孩子有他的真實(shí)年齡,但是可以通過(guò)閱讀測(cè)試找到最合適他讀的年齡段。一開(kāi)始當(dāng)書(shū)比較少的時(shí)候,可以由教育專(zhuān)家和老師來(lái)評(píng)定書(shū)籍的可讀性,但隨著要標(biāo)注的書(shū)籍的增加,這件事情就必須由算法來(lái)完成。

國(guó)外readability的算法在wikipedia有講述,以常見(jiàn)的Flesch-Kincaid等級(jí)為例,單詞的平均音節(jié)數(shù)越多,段落里句子的長(zhǎng)度越長(zhǎng),就認(rèn)為文章越難讀懂。例如高考聽(tīng)力的難度最難也就在10年級(jí),高考閱讀在12年級(jí)左右,托福雅思的閱讀題可能會(huì)有18-19年級(jí)的壓軸題。注意像Flesch-Kincaid這類(lèi)把句子長(zhǎng)度考慮進(jìn)去的readability算法,對(duì)于缺乏標(biāo)點(diǎn)符號(hào)的歌詞或詩(shī)歌,還有標(biāo)點(diǎn)符號(hào)過(guò)于頻繁的對(duì)話型文章,都會(huì)有較大偏差,需要進(jìn)行修正。

2、王者榮耀的天梯系統(tǒng)

0.jpg

在這里我們舉一個(gè)非常有意思的學(xué)習(xí)例子,那就是手機(jī)游戲。像王者榮耀這類(lèi)MOBA手機(jī)游戲,并不是自己去設(shè)計(jì)不同難度的關(guān)卡讓用戶進(jìn)階學(xué)習(xí)而是采用了天梯的方式,讓水平近似的人在相同的段位PK,變相地提供了一個(gè)進(jìn)階的臺(tái)階。在排位賽的個(gè)天梯系統(tǒng)里,贏得多了就會(huì)遇到更強(qiáng)的對(duì)手,輸?shù)枚嗔?,就?huì)遇到更弱的對(duì)手。雖然最終比賽的輸贏不僅和個(gè)人的操作、意識(shí)和配合有關(guān),還跟自己的隊(duì)友,選擇的英雄組合相比較對(duì)手是壓制和被壓制,還有運(yùn)氣有關(guān)。但是整體來(lái)講,差一個(gè)大的段位(例如鉆石和鉑金),水平上一定會(huì)有明顯的差距。

elo算法在圍棋,國(guó)際象棋,是國(guó)際上評(píng)估水平高低的重要算法。與天梯系統(tǒng)不同,輸贏的得分并不是固定的,而和你和競(jìng)爭(zhēng)對(duì)手的差異有關(guān)的,如果你贏了水平比你強(qiáng)的人,你提的分?jǐn)?shù)多,而他掉的分?jǐn)?shù)多,如果你輸了水平比你強(qiáng)的人,你掉的分?jǐn)?shù)少,而他提的分?jǐn)?shù)也少。感興趣的可以參考這里。

基于難度的自適應(yīng)學(xué)習(xí)算法的最大缺點(diǎn)是認(rèn)為學(xué)生的學(xué)科掌握度是一個(gè)值——有點(diǎn)像把學(xué)生分為重點(diǎn)班,普通版的感覺(jué)——而實(shí)際上,更多時(shí)候,大家關(guān)注的是學(xué)科中細(xì)粒度的知識(shí)點(diǎn)的掌握情況。

Level 3:基于知識(shí)點(diǎn)網(wǎng)絡(luò)和概率模型的自適應(yīng)學(xué)習(xí)

Level 2 只有難度等級(jí)的概念,現(xiàn)在我們要引入知識(shí)圖譜的概念了。我們實(shí)際上是沒(méi)有直接辦法去測(cè)量學(xué)生的知識(shí)點(diǎn)掌握程度,我們只能倒過(guò)來(lái)從學(xué)生的做題情況,推斷知識(shí)點(diǎn)的掌握程度。后面可能會(huì)涉及到一些數(shù)學(xué)公式,不會(huì)的同學(xué)可以選擇性跳過(guò)。Level 3的內(nèi)容比較多,我們分為多個(gè)部分來(lái)講。

0.jpg

1、相同難度,單一知識(shí)點(diǎn)的題目

我們先解釋一下,為什么學(xué)生的知識(shí)點(diǎn)要用概率模型來(lái)算。學(xué)生做對(duì)做錯(cuò)的最簡(jiǎn)單模型就是翻一枚不均衡的硬幣,看正面朝上的分布。假如學(xué)生知識(shí)點(diǎn)的掌握度為p,p是0~1之間的一個(gè)數(shù),意味著每做1道題,有p的概率做對(duì)。那么學(xué)生做了n道題,得零分的概率為(1-p)的n次方,得滿分的概率是p的n次方,他最有可能做對(duì)的題目數(shù)是n*p。

問(wèn)題是,沒(méi)有人知道p為多少,我們倒過(guò)來(lái)只知道n道題里,有m道做對(duì)了。當(dāng)n趨近于無(wú)窮的時(shí)候,我們幾乎可以肯定p=m/n,但現(xiàn)實(shí)中,別說(shuō)無(wú)窮道題,同一個(gè)知識(shí)點(diǎn)的題目讓學(xué)生做20遍,學(xué)生就會(huì)受不了了。所以為了追求實(shí)用,我們必須犧牲一部分精度,我們可以認(rèn)為n=0的時(shí)候,也就是我們對(duì)學(xué)生一無(wú)所知的時(shí)候,p應(yīng)該是一個(gè)0~1的均勻分布,但是隨著n的增加,p的分布應(yīng)該如何改變呢?

實(shí)際上數(shù)學(xué)家們?cè)缫呀?jīng)告訴我們了,扔不均勻硬幣的二項(xiàng)式分布的共軛先驗(yàn)密度函數(shù)(conjugate prior probability distribution)是beta分布(其多維版本叫做Dirichlet分布)。具體的公式和推導(dǎo)參見(jiàn)維基百科。

這里背后核心的思想是,同樣是100%的正確率,同樣難度的題,張三做了三道,李四做了20道,由于樣本容量的不同,會(huì)導(dǎo)致知識(shí)點(diǎn)掌握度的置信因子不同。

2、不同難度,相同知識(shí)點(diǎn)的題目

接下來(lái)我們要考慮到,真實(shí)的題型,并不是都難度一樣的,甚至說(shuō)難度一個(gè)衡量指標(biāo),是遠(yuǎn)遠(yuǎn)不夠的。舉一個(gè)例子,題目一是1234*56789等于多少,填空題,題目二一個(gè)天體為水的密度,重量為1億億噸,請(qǐng)問(wèn)這個(gè)天體是否是一個(gè)黑洞。前者其實(shí)難度是比后者小的,但是,由于前面是填空題,后面是判斷題,其實(shí)后面的題目有50%的蒙對(duì)概率。為了能夠?qū)︻}目更好地建模,我們引入IRT(Item-response-theory)模型。

0.png

以上圖是三個(gè)參數(shù)版本的IRT,其中a為區(qū)分度,b為難度,c為猜測(cè)可能性。橫縱標(biāo)里,值越高代表學(xué)生能力越強(qiáng)。c=0.25,意味著哪怕最差的學(xué)生都有25%的可能性做對(duì),所以這道題目最有可能是一道4選1的單選題。b=0.0代表,這道題目的難度正好適中,如果b比較大,代表能夠把特別優(yōu)秀的學(xué)生和普通學(xué)生區(qū)分開(kāi),如果b比較小,代表這是一道送分題,如果這還做不對(duì),大概是平時(shí)沒(méi)有認(rèn)真學(xué)習(xí)。區(qū)分度a,可以認(rèn)為當(dāng)區(qū)分度特別大時(shí),這道題目是要么肯定就會(huì),要么就是徹底不會(huì),不存在中間地帶。

IRT模型的初始化可以用老師來(lái)標(biāo)注,但是后期只有有足夠多的真實(shí)做題數(shù)據(jù)才反映真實(shí)的題目難度。通常來(lái)講,一道題目被1000個(gè)不同的學(xué)生做后,參數(shù)就可以基本確定,當(dāng)這道題被10000個(gè)學(xué)生做過(guò)后,會(huì)基本收斂,再來(lái)新的學(xué)生,參數(shù)變化會(huì)非常小。

在IRT的基礎(chǔ)上,又出現(xiàn)了利用貝葉斯+HMM的BKT,還有基于深度學(xué)習(xí)的DKT等一系列算法,不管算法怎么演進(jìn),其核心目的在于通過(guò)做題情況估算學(xué)生真是的知識(shí)點(diǎn)掌握度。然而,剛才有一個(gè)重要的點(diǎn)被我們略過(guò)了,那就是,實(shí)際的題目,并不是只有單一知識(shí)點(diǎn)的,而往往可能同時(shí)對(duì)應(yīng)多個(gè)知識(shí)點(diǎn)。這時(shí)候我們就要引入題目知識(shí)映射矩陣(q matrix)的概念。

3、一題多個(gè)知識(shí)點(diǎn)對(duì)應(yīng)的情況

0.jpg

q matrix就是一個(gè)題目與知識(shí)點(diǎn)對(duì)應(yīng)的矩陣,其中的值既可以是離散的0或1,也可以是連續(xù)的0~1之間的概率。Level 3級(jí)自適應(yīng)學(xué)習(xí)的最大工作量之一就在于q矩陣的搭建,尤其是當(dāng)知識(shí)點(diǎn)的粒度比較細(xì)的時(shí)候,所需要投入的人工成本非常大,就光初中數(shù)學(xué)一個(gè)學(xué)科,為百萬(wàn)道題目打標(biāo)簽,沒(méi)有大幾百萬(wàn)的經(jīng)費(fèi)是幾乎不可能完成的。而哪怕在收到足夠多的數(shù)據(jù)后,可以對(duì)q矩陣進(jìn)行演化,做知識(shí)點(diǎn)的拆分和合并,但是在沒(méi)有任何初始化的q矩陣,光有數(shù)據(jù)幾乎是不可能空手套白狼變出一個(gè)知識(shí)圖譜的。

到底應(yīng)該怎樣給題目打標(biāo)簽?zāi)兀窟@個(gè)過(guò)程一定要拋開(kāi)狹義的課本上的知識(shí)點(diǎn),而采用廣義知識(shí)點(diǎn)(Knowledge Component)。廣義知識(shí)點(diǎn),除了章節(jié)以外,還應(yīng)該包括策略,考察點(diǎn),技巧,知識(shí)誤區(qū),甚至還有學(xué)生是否馬虎大意,應(yīng)用題的閱讀理解能力如何。好的系統(tǒng),可能會(huì)給選擇題的不同選項(xiàng)都會(huì)對(duì)應(yīng)不同的知識(shí)點(diǎn),而填空題的情況還會(huì)更加復(fù)雜。

4、知識(shí)點(diǎn)相互關(guān)聯(lián)形成知識(shí)圖譜

知識(shí)點(diǎn)之間并不是孤立的。當(dāng)學(xué)生做題之后,除了要更新題目所對(duì)應(yīng)的知識(shí)點(diǎn),還要以降低置信度+傳播到相關(guān)知識(shí)點(diǎn)。這部分的算法并不復(fù)雜,真正難的是建立知識(shí)圖譜。

知識(shí)點(diǎn)的關(guān)系,遠(yuǎn)比課本或教參中呈現(xiàn)的章節(jié)樹(shù)復(fù)雜的多。章節(jié)樹(shù)的結(jié)構(gòu),僅僅是做了包含關(guān)系,而且由于教材版本的不同,實(shí)際上會(huì)出現(xiàn)一個(gè)知識(shí)圖譜與不同版本教材章節(jié)的映射網(wǎng)絡(luò)。高中學(xué)習(xí)階段,有的知識(shí)點(diǎn)會(huì)一次次地出現(xiàn),然而每次地出現(xiàn)都是把過(guò)去的定義,特性推倒重來(lái),可是到了高三總復(fù)習(xí)的時(shí)候,又要融會(huì)貫通,這些同類(lèi)知識(shí)點(diǎn),需要關(guān)聯(lián)起來(lái)。很多團(tuán)隊(duì)做了知識(shí)的先后依存關(guān)系,但是忽略了,實(shí)際上有的時(shí)候多學(xué)的知識(shí),不僅沒(méi)有強(qiáng)化過(guò)去的知識(shí),反而有可能會(huì)導(dǎo)致困惑,讓過(guò)去的知識(shí)的掌握程度降低(例如英語(yǔ)里學(xué)完compose之后又學(xué)了comprise)。

5、考慮到時(shí)間的影響

一個(gè)學(xué)生做了100道知識(shí)點(diǎn)一樣的題目,最終對(duì)了50道,這真的代表學(xué)生水平是0.5嗎?實(shí)際上很有可能,前20道題,由于學(xué)生什么都不會(huì),只對(duì)了2-3道,而后20道題,學(xué)生已經(jīng)基本掌握了,可能一道都沒(méi)錯(cuò)。我們要以變化的眼光去看待學(xué)生的發(fā)展,這就意味著,我們需要“遺忘”那些時(shí)間久遠(yuǎn)的事情。也就是我們需要一個(gè)滑動(dòng)的窗口(sliding window),越遙遠(yuǎn)的行為數(shù)據(jù)權(quán)重越低。

還有一個(gè)時(shí)間的影響就是記性,隨著時(shí)間的推移,學(xué)生遺忘的比例會(huì)越來(lái)越高。而最佳的復(fù)習(xí)時(shí)間,就是學(xué)生恰好要遺忘,卻沒(méi)有忘記的時(shí)候。自適應(yīng)的復(fù)習(xí)算法,開(kāi)源軟件anki采用了supermemo的早期spaced repeatition算法,已經(jīng)能夠滿足絕大多數(shù)的需求,也是多數(shù)背單詞軟件所采納的算法。

終于講完了,下面可以舉例了。

6、數(shù)學(xué)的填空題,0.0035的科學(xué)計(jì)數(shù)法

比如學(xué)生回答:-0.35*10的3次方。那么最簡(jiǎn)單的辦法是,系統(tǒng)評(píng)估這道題是一道簡(jiǎn)單題,說(shuō)學(xué)生你的科學(xué)計(jì)數(shù)法基本功不行。但實(shí)際上如果是一名優(yōu)秀的數(shù)學(xué)老師,他會(huì)發(fā)現(xiàn),學(xué)生搞錯(cuò)了多個(gè)事情。一、科學(xué)計(jì)數(shù)法首位應(yīng)該非零的數(shù)字。二、負(fù)號(hào)的位置學(xué)生搞錯(cuò)了。三、學(xué)生估計(jì)記得老師說(shuō)過(guò),從小數(shù)點(diǎn)往后數(shù)幾位,指數(shù)應(yīng)該放多少,而沒(méi)有真正理解指數(shù)上的坐標(biāo)的意思。

7、英語(yǔ)開(kāi)放作文的發(fā)音和語(yǔ)法

發(fā)音的知識(shí)圖譜比較簡(jiǎn)單,bit和bite混淆發(fā)音,那么lit和light混淆的可能性也非常大。甚至bed和bead都有可能因?yàn)樵糸L(zhǎng)短因分不清楚而錯(cuò)誤。這個(gè)在學(xué)生邊讀的過(guò)程中,就可以逐漸收集問(wèn)題,并且推送相應(yīng)課程。

語(yǔ)法的知識(shí)圖譜就比較復(fù)雜了,同樣是動(dòng)詞的過(guò)去式,規(guī)則動(dòng)詞就包括多種情況,不規(guī)則動(dòng)詞幾乎每一個(gè)都構(gòu)成自己一個(gè)知識(shí)點(diǎn),過(guò)去式與過(guò)去分詞搞混了又是另外一種情況。同樣是冠詞,a后面是元音是一種情況,但a user是一種特例,an hour是另一種特例,如果后面接的是地理位置,則更加混亂(the USA, 但不是the China)。英語(yǔ)的教研工作量一點(diǎn)都不比數(shù)學(xué)簡(jiǎn)單。

自適應(yīng)做到這個(gè)地步,依然存在兩大問(wèn)題,一個(gè)問(wèn)題是人工教研工作量耗大,做得越細(xì)越好,越困難。另一個(gè)問(wèn)題是,只能解決客觀題,對(duì)于證明題,簡(jiǎn)答題,完全沒(méi)有辦法做。而只有能夠在解題步驟里做自適應(yīng),才是真正的終極解決辦法。

Level 4:基于NLP和推理引擎的自適應(yīng)學(xué)習(xí)

真正的AI級(jí)別的自適應(yīng)學(xué)習(xí),說(shuō)的就是Level 4。如果拿自動(dòng)駕駛技術(shù)來(lái)對(duì)比,這就是你可以撒手,不摸方向盤(pán),不看路面,不聽(tīng)導(dǎo)航,在汽車(chē)?yán)锼X(jué),汽車(chē)就會(huì)安全送你到你的指定位置。達(dá)到這個(gè)水平的自適應(yīng)學(xué)習(xí)系統(tǒng),可以做到拿到任何一道學(xué)科題目,就可以用多種策略得到正確答案(也就是最近高考機(jī)器人在比拼的事情),并且看到別人的答案時(shí),判斷答案是否正確。

0.jpg

一個(gè)簡(jiǎn)單粗暴的想法是略過(guò)推理引擎,直接拿著幾百萬(wàn)道題目做char-rnn,但很顯然這個(gè)是不work的??梢哉J(rèn)為答案就是如同程序代碼一樣的,是其內(nèi)在邏輯的,然而目前char-rnn是根本沒(méi)有能力生成任何有真實(shí)意義的代碼,最多只能生成一些格式上看起來(lái)正確,但是沒(méi)有任何含義的代碼。

這件事情如果要做成,必須死磕推理邏輯。畢竟一道題目里,學(xué)生可能會(huì)出現(xiàn)的錯(cuò)誤類(lèi)型實(shí)在是太多了。例如:

  1. 推導(dǎo)錯(cuò)誤

  2. 計(jì)算錯(cuò)誤

  3. 關(guān)鍵步驟順序不對(duì)

  4. 推導(dǎo)正確但原因不對(duì)

  5. 多次計(jì)算錯(cuò)誤,但最終答案湊巧對(duì)了

  6. 用結(jié)論來(lái)“反證”結(jié)論

  7. 引入原本不存在的條件

  8. 冗余步驟

這個(gè)其實(shí)會(huì)像alphago一樣,除了一個(gè)深度學(xué)習(xí)的價(jià)值和策略網(wǎng)絡(luò)以外,也需要一個(gè)通曉邏輯的mcts,在數(shù)學(xué)運(yùn)算這種場(chǎng)景下,一樣也是需要“閱讀理解”和“推理邏輯”兩個(gè)部分。

所以,整個(gè)過(guò)程應(yīng)該是:

  1. 【識(shí)別】將題目的題干和相關(guān)圖片抽取成機(jī)器能讀懂的條件

  2. 【邏輯】判斷題目沒(méi)有邏輯錯(cuò)誤,確實(shí)有解(小紅有三個(gè)蘋(píng)果,小明有四個(gè),請(qǐng)問(wèn)小紅多大了)

  3. 【邏輯】得出標(biāo)準(zhǔn)答案

  4. 【識(shí)別】如果學(xué)生是手寫(xiě)的答案,先做圖像識(shí)別

  5. 【邏輯】如果是選擇,填空,直接對(duì)比學(xué)生的答案

  6. 【邏輯】如果是大題,驗(yàn)證學(xué)生的推理過(guò)程是否完備,正確

  7. 【表達(dá)】判斷學(xué)生出錯(cuò)的環(huán)節(jié),不告訴完整答案,而只是給學(xué)生一個(gè)點(diǎn)撥性的提示

  8. 【表達(dá)】AI與人之間可以以一種對(duì)話式的界面

對(duì)比當(dāng)下的掃題軟件,學(xué)生哪里不會(huì),去哪里抄答案。而這一的自適應(yīng)學(xué)習(xí)系統(tǒng),則更是,哪里卡住了,算錯(cuò)了,哪里小小地提醒一下。這種教學(xué)方法才是真正幫助學(xué)生成長(zhǎng)和前進(jìn),當(dāng)然這里也要防止部分學(xué)生利用提醒的機(jī)制不斷刷最終答案。

1、英語(yǔ)作文AI批改

回到了Level 0的例子了,只不過(guò)再也不需要老師的參與,AI直接對(duì)詞匯,短語(yǔ),句式,語(yǔ)法,文章的邏輯性,結(jié)構(gòu),和文筆優(yōu)美度給出了打分和修改建議。目前的AI對(duì)于前面幾點(diǎn)(尤其國(guó)外的Grammarly公司)做得還可以,但是對(duì)于結(jié)構(gòu),邏輯,文筆,則是完全做不到。

2、一對(duì)一幾何課

還是Level 0的例子,老師這回是真的面臨失業(yè)了,全中國(guó)的每一個(gè)學(xué)生都配備了一個(gè)最厲害的AI老師,他能夠針對(duì)性地解決你的學(xué)習(xí)問(wèn)題,你做題并不需要在電腦上做,依然是筆和紙,但是他隨時(shí)會(huì)提醒提示你,學(xué)習(xí)的過(guò)程由過(guò)去的很長(zhǎng)時(shí)間才有反饋,變成了像游戲一樣,很快就有反饋和進(jìn)步。

結(jié)論,一旦出現(xiàn)了Level 4級(jí)別的自適應(yīng)學(xué)習(xí),從Level 0到Level 3級(jí)別的都會(huì)收到巨大的顛覆,畢竟都能自動(dòng)駕駛了,自然就不需要單獨(dú)的自動(dòng)泊車(chē)技術(shù)。然而Level 4級(jí)別的難度非常高,無(wú)論是國(guó)內(nèi)還是國(guó)際上都是在探索階段。說(shuō)實(shí)在,我這里沒(méi)有展開(kāi)說(shuō)算法,因?yàn)檫B我也不知道具體算法該怎么做。至于在Level 4之后,未來(lái)幾年會(huì)不會(huì)有沒(méi)有像移植記憶等黑科技,目前我們就不得而知了。

本文轉(zhuǎn)自微信公眾號(hào)“EduMax教育資本論”,作者胡天碩,原標(biāo)題為《寄在線教育創(chuàng)業(yè)者:揭秘自適應(yīng)學(xué)習(xí)的背后原理(中)》。

1、本文是 芥末堆網(wǎng)轉(zhuǎn)載文章,原文:EduMax教育資本論;
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車(chē)馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫(xiě)信息告訴我們。
來(lái)源:EduMax教育資本論
芥末堆商務(wù)合作:王老師 18710003484
  • 從Level 0到Level 5,自適應(yīng)學(xué)習(xí)可分為哪些等級(jí)?分享二維碼