松鼠Ai創(chuàng)始人栗浩洋在GET2024分享
11月11日至12日,芥末堆在北京舉辦以“新質學習力,通向更美好的教育未來”為主題的GET2024教育科技大會。在12日的領袖論壇上,松鼠Ai創(chuàng)始人栗浩洋就《AI自習室沒有大模型能走下去嗎?》進行了主題分享。
以下為演講實錄,經編輯:
栗浩洋:大家好,能出現(xiàn)在最后一天這個時候都是教育科技行業(yè)的鐵粉,非常感謝大家的守候,希望能夠給大家?guī)硪恍└韶?。AI自習室很火,大模型也很火,我和大家分享這兩者結合在一起能夠有什么價值。
大語言模型是用大模型做了漢字或者英文單詞的排序。而我們知道SORA,生成視頻跟大語言模型沒有任何關系,它是用大模型做了一個像素的排序。如果一款產品只是跟學生說幾句話,那只是用了大語言模型API,并不是自己做出了大模型。
松鼠Ai的大模型也不是大語言模型,而是學生的學習順序排序——這個學生應該學什么、不應該學什么、先學什么、后學什么,這看起來很簡單,但等一下大家會知道玄妙在哪里。
過去十年我們一直都在做這個事情,而且是在松鼠Ai的統(tǒng)一系統(tǒng)里面,我們有了2400萬學生100億學習行為數(shù)據(jù),才可以訓練這樣大模型,這是我們不同的Agent。
大模型是什么?就是參數(shù)量大,大家聽說過1000億參數(shù)、100億參數(shù),參數(shù)是什么呢?我舉個例子,大家吃過魚香肉絲,但你每次吃味道都不一樣,原因是什么呢?就是參數(shù)在變化。有時候你吃的魚香肉絲幾乎沒有肉,說明肉的數(shù)量就是一個參數(shù),蔬菜數(shù)量也是一個參數(shù),炒的火候又是一個參數(shù),當所有參數(shù)都對的時候,你就吃到了你一生中最愛的魚香肉絲。
對于大模型來說,我們簡單的講,大參數(shù)就是給了你無限的可能性,來找到最優(yōu)解、最好的方案。
我們可以回憶一下Alpha Go的表現(xiàn),當年還是深度學習、強化學習的時代。而我們現(xiàn)在已經進入到大模型時代,AI可以思考100億步、1000億步,它一定能找到最好最優(yōu)解。AI在設計層面的像素也可以找的比人類準,盡管會出錯,但AI能把1000億種可能性畫出來,最后再用概率排序找出最優(yōu)解,一定比你畫得好。未來任何一個畫家也趕不上AI,就是因為參數(shù)量可能還會更大,這就是參數(shù)量大的意義。
參數(shù)量變大之后能解決什么問題呢?解決暗邏輯,人類不理解的邏輯。
柯潔當年哭就是因為人類幾千年來的認知被沖擊了,AI竟然想出了和人類直覺完全相反的路徑。我們松鼠Ai也是,我們的教學路徑跟常規(guī)的認知,跟特級教師的認知有一半多是完全相反、逆他們的方向和思維做的,這就是暗邏輯。
回到自習室,這些大模型的大參數(shù),暗邏輯,對人工智能自習室有什么關系呢?自習室最難的是什么?不像一對一輔導,現(xiàn)在成績不好的學生來了自習室是厭學的,他90%的時間是走神的,他不能控制自己的思維。
我們看一個松鼠Ai的案例,一個被認為厭學、精神專注力有問題,每周要看醫(yī)生的孩子。他學了100分鐘,我們就得出了一個診斷報告,18個知識點測出來12個漏洞,成績方面這個孩子是極差生。
這個孩子精神有沒有問題?我們看進步幅度的標簽,學習報告里有大量的知識點進步幅度在40%、60%,說明這個孩子在100分鐘里非常認真用心專注學習,在大量知識點上有了成長和進步,而我們最怕的是進步只有10-20%孩子,等于什么都沒有學會。
但是通過另外一個數(shù)據(jù)報告可以發(fā)現(xiàn),他可能存在一些問題。每一道題的做題時間,我們用藍色曲線標注出來,再和橘色的全國平均時間曲線比較,我們可以看到這個孩子大概率是有容易走神的問題,也可能是個不算聰明的孩子,但是他至少是用心的。
比如,平均用時47秒的題他用了五分鐘,但是他做對了,而且這是一道系統(tǒng)標注為難度系數(shù)76級的題,已經超過了這個同學當時的能力范圍,但他花了五倍時間用心做出來了。
如果你習慣去分析大數(shù)據(jù),你會發(fā)現(xiàn)這個圖里還有一些問題。我們可以看到,這個孩子19題做錯了之后放棄了,沒有作答,連續(xù)20到23題全部放棄了,說明做錯題之后心態(tài)崩了。而且從題目難度系數(shù)的角度來說,這道26級難度的題完全可以做出來。那么,剛才他只差一步,所以系統(tǒng)又把難度降到17級,按道理這時候應該百分之百可以做對,但他又沒有做,我們系統(tǒng)最后降到1級難度,他才慢慢從20多級難度升到70多級水平。
這里的關鍵在于這個孩子心態(tài)崩潰連續(xù)放棄答題之后為什么又接上了,為什么不再厭學,不放棄了。因為系統(tǒng)一直給他1級難度的題目,幾乎是類似1+1=2的題,讓他又找回自信了,然后系統(tǒng)再不斷給他難題,再重新慢慢拉高難度,所以在這100分鐘時間里大部分知識點都有了提升。
所以我想表達的是,學習路徑是多么重要,在大模型的幫助下,每一道題的難度系數(shù)變化都可以看出對孩子的心情、心態(tài)產生什么影響。像這樣一個基礎較差的孩子,他平時在學校里面大部分80多級難度題,偶爾能做對幾個,但根本沒多少20多級難度的題來持續(xù)給他信心,他為什么厭學的原因就在于此。
如果你的AI自習室給學苗、學霸都上一樣的課,這樣自習室不崩才怪,你沒有AI,沒有算法,沒有一個能理解孩子、給他安慰的方法,這中間家長根本不知道怎么回事。而這就是AI的價值,這不是任何人類老師可以做到的,這樣AI自習室不再僅僅是自習室,而是在讓學生跟著AI超級智能老師學習,沒有一個特級老師能夠與之相比。
再來聊聊AI自習室怎么征服學霸。學霸他在家也可以自習,為什么要來你的自習室?
我們有一個名校北師大附中的孩子,七年級平時最多扣三四分,但從來沒有得過滿分。他剛用我們系統(tǒng),上來就把他降到四年級水平去學習了,四年級學了一個月又降到三年級學習了。他父母是雙博士,母親更是一個家庭教育集團四千家連鎖店的老板。他母親當時在群里面就跳出來說,你們松鼠Ai什么人工智能?人工智障吧,我家孩子不是哪里不會學哪里,97分只學3分不會就行了,你為什么讓他學四年級、三年級的呢?
很簡單,我們看數(shù)據(jù)。你在三年級幾百個知識點里有12個漏洞,你在四年級知識點有19個漏洞,雖然你的漏洞只有10%、5%,但這些漏洞到了高年級的時候遇到混合出題,五個知識點、八個知識點混合出題,有的時候你沒有卡在同步知識點,卡在前置知識點里面。
我說你們家孩子考試之后是不是經常一拍大腿說這題怎么能錯呢,他說你怎么知道,我說很簡單,我們算法找到了問題。你不需要通過七年時間學過去七年的內容,這個孩子在松鼠Ai只用了56個小時,就把過去的知識漏洞補完了,然后就考了五年沒有考過的100分,很開心。
但是有一天,他的同步課突然只有75%正確率,他說太痛苦了,今天怎么只有75分,而我看了數(shù)據(jù)以后,我說你不是75分,你是99.5分。因為系統(tǒng)給他推的題是多少級別,99級,這是什么意思呢?中考的最后一道題才是99級難度,我們把全中國所有中考的最后一題都匯集過來,才能夠在幾百個知識點找到這么多的99級題目,給到這個學霸來訓練。這孩子說AI太智能了。
所以,有了大模型的加持,AI自習室不會浪費學霸一分鐘時間,因人而異給到不同的人完全不同的學習路徑。
那么AI自習室和名師相比,又是什么水平?
一個AI教育公司沒有做過人機大戰(zhàn),基本上說明你技術完全不成熟,我們2017年在亞太地區(qū)第一個做人機大戰(zhàn),至今已經做了七次,全部獲得成功。幫一些個別孩子提升分數(shù)非常簡單,但你能不能讓整個班,甚至百人、萬人超過同時提升?
在國家教育部期刊上面的論文,有我們松鼠Ai人機大戰(zhàn)的數(shù)據(jù),結果是比實驗班的教師高出31.2分。我們是第一個有智慧的大模型,我們的大模型不是跟孩子對話,我們最核心的應用,在于能夠識別孩子的錯因。這道題孩子有草稿紙,我們看出來以為時鐘敲11下是11個間隔,實際上是10個間隔,他可以深度理解這個孩子錯因,然后給對癥下藥。
一道題目,全國的孩子最多能有977種錯法。這997種錯因,你能一樣對待嗎,不能。人類老師很難一一應對,只能是AI,只有大模型可以。大模型已經可以理解孩子是自律有耐心的還是草率的,是喜歡挑戰(zhàn)的還是畏難的,是有小聰明還是堅韌不拔的,我們整個模型對于孩子性格描述可以通過兩個小時就非常精準地給出畫像,然后我們再對他進行對癥下藥,千姿百態(tài)的大模型算法對應的是千姿百態(tài)的學生,即“千人千面”。
我父親是一名特級教師,市教研室主任,他幫助了無數(shù)學生提升。但他能夠幫助七、八十分孩子提升,不可能幫助不及格學生提高上來。而我們已經可以幫助30分水平的孩子考到130分,七年級需要一年半的時間,八年級需要兩年的時間,大概需要600-700小時。
你想要的分數(shù),在大模型眼里就是你的學習速度和你的學習時間。一般來說,開頭差生會非常慢,一二三年級要求反復學習好幾次,但之后被我們的算法推起來后,這些孩子的學習速度會越來越快。大家常說的笨孩子、差生并不是如你想象的那樣,人的大腦智能幾乎是相當?shù)?,只不過有的孩子就是慢一點,只是他需要你兩倍的時間,就可以解決。
我們的大模型能夠解決這么多問題,背后就是我們強大的技術實力。松鼠Ai所獲得的國家發(fā)明專利,并且拿到授權的有110多個發(fā)明專利。北交所專精特新需要2項發(fā)明專利,我們有112項。此前在為期五天的UNESCO人工智能全球大會的第一天最高級別的全球教育部長論壇,我是唯一一個非部長參與這個論壇討論并演講的嘉賓。
在43萬科學家組成的IEEE協(xié)會,BAT有兩個標準委員會委員,而華裔主席華為有一個,我是第二個。我是IEEE人工智能教育大模型標準組主席,也算是給中國教育科技爭口氣。全球40多個國家的83位科學家都在我做主席的標準委里面申請成為我的委員。
最后我想說,大部分人對新生事物往往會從“看不到”到“看不起”到“來不及”,我們無論對抖音還是拼多多等等都是,我相信很多人對人工智能也曾是這樣的感覺。
十年前做人工智能更不用說了,那個時候共享經濟非常火,我的下屬都拿了兩、三億融資,我2000萬都拿不到。我在2014年拿不到錢,因為大家不知道人工智能是什么。所以我們今天不是趕上風口,我們是蹲了十年,一直蹲到了這個風口。
我們也希望一些有識之士,愿意跟我們一起合作,把人工智能教育真正推廣普及出來。我認為人工智能教育大模型是對整個行業(yè)的一場顛覆,而做AI自習室,你要想讓孩子來自習,你就得擁有世界最強的大模型技術,謝謝大家。
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。