芥末堆 11月16日 冬妮 報道
11月14日,在以“碰撞·演變”為主題的GET2018教育科技大會“教育技術(shù)如何不被濫用”分論壇上,學(xué)堂在線技術(shù)副總裁管健發(fā)表了《規(guī)?;膫€性化教育》的主題演講。他認(rèn)為純IT技術(shù)不能夠輕易解決的教育問題,引入交叉學(xué)科可能會是關(guān)鍵。
以下是管健的演講精選實錄:
大家好!我是學(xué)堂在線管健,今天要講的話是在線教育里面由于技術(shù)帶來的一些機遇以及我們在應(yīng)用技術(shù)的過程中遇到的一些挑戰(zhàn)。
互聯(lián)網(wǎng)技術(shù)與人工智能技術(shù)給教育帶來顛覆性改變
隨著高等教育的發(fā)展,中國已經(jīng)有很多大學(xué)能排在全球前列,但因為我們的人口基數(shù)大,我們?nèi)司鶕碛械膬?yōu)質(zhì)高等教育資源非常少,我們比別人可能低一到兩個數(shù)量級以上。然而這個數(shù)據(jù)不僅僅是在大學(xué)這個層面,中學(xué)、小學(xué)一樣有這個問題,全國畢竟只有一個人大附中。
我認(rèn)為怎么能夠讓優(yōu)質(zhì)的教育資源能夠惠及到更多的人,一直以來都是我們要解決的問題,技術(shù)其實帶來了一定的機會。
我們做在線教育,把這個詞拆開叫做“在線”跟“教育”兩個事情,在線實際上體現(xiàn)了技術(shù)范疇。
我們看到在線帶來了兩件事情,第一它通過連接我們有了互聯(lián)網(wǎng)。通過國家三通兩平臺(寬帶網(wǎng)絡(luò)校校通、優(yōu)質(zhì)資源班班通、網(wǎng)絡(luò)學(xué)習(xí)空間人人通),通過電信運營商的建設(shè),基本上能夠把網(wǎng)絡(luò)連接到每一個村鎮(zhèn),能夠讓優(yōu)質(zhì)教育資源覆蓋到更多人。那么這樣帶來的結(jié)果是什么?是教育效率的提升。以前一個老師可能只能教一個小班40人,開一個大課兩百人。那么現(xiàn)在我們通過互聯(lián)網(wǎng)技術(shù),應(yīng)用直播可以實現(xiàn)十萬人、百萬人的量級同時在線去看他講一堂課。這就是是互聯(lián)網(wǎng)技術(shù)帶來的一個顛覆性的變化。
當(dāng)互聯(lián)網(wǎng)使得優(yōu)質(zhì)教育資源覆蓋面擴大的時候,另外一個要解決的問題是如何提升教學(xué)效果。我們看到人工智能技術(shù)的進展給我們看到了一點曙光,這是在線做的第二件事。
通過引入互聯(lián)網(wǎng)技術(shù)和人工智能技術(shù),能夠在一定條件下實現(xiàn)規(guī)?;蛡€性化教育。這是我今天整個這個分享的重要主題。
大數(shù)據(jù)不是萬能的
學(xué)堂在線在做一個業(yè)務(wù)叫做慕課,我們給它的一個定義叫做“多快好省”。它是基于人工智能和大數(shù)據(jù)技術(shù)來構(gòu)建的一個開放的、在線交互學(xué)習(xí)平臺。我們要解決的問題實際上也是教育幾千年以來的一個實踐和理念,就是希望能夠做到有教無類和因材施教。那么這兩個詞映射到為規(guī)模化和個性化實際上是一樣的道理,有教無類意味著誰都可以來學(xué),有適合各種學(xué)生的資源,因材施教使得每一個學(xué)生能夠得到針對他的個性,適合他特點的一個學(xué)習(xí)。
學(xué)堂在線是清華大學(xué)發(fā)起成立的在線教育公司,我們在2013年10月10日上線,剛上線的時候有五門由清華大學(xué)拍攝和提供的慕課,到現(xiàn)在課程總數(shù)量超過一千八百多門,注冊用戶接近一千五百萬人,人均的選課量超過兩門多。并且,我們的每一門課自成體系,符合大學(xué)教學(xué)水準(zhǔn),比方說微積分,比方說財務(wù)分析,比方說數(shù)據(jù)結(jié)構(gòu)都是大學(xué)里學(xué)分課的水準(zhǔn),所以大家可以想到一千八百門課加在一起是個怎樣的量級。
上線以來,學(xué)堂在線除了積累教學(xué)資源之外,還積累了大量的學(xué)生行為數(shù)據(jù),數(shù)據(jù)是學(xué)堂在線的整個業(yè)務(wù)核心。我們從平臺上收集學(xué)生的學(xué)習(xí)行為,比如學(xué)生跟視頻的交互,老師和同學(xué)的交互以及做的各種習(xí)題、考試、討論,日常的日志量能夠達到一億條左右。
那么大數(shù)據(jù)真的是一個我們不可或缺的技術(shù)嗎?可能我的結(jié)論有一點偏負(fù)面,我認(rèn)為他未必是一個必需品,但它能帶來一種新的邏輯和機會。
我舉一個例子,這是我們擁有的數(shù)據(jù)類型,一個在線教育平臺最多的數(shù)據(jù)無非就是這些,你選什么課、在視頻上怎么看、怎么跳轉(zhuǎn)頁面,做題做的怎么樣。然后把后臺用戶注冊的信息數(shù)據(jù)進行分析,希望得到一個關(guān)于課程的用戶畫像,然而實際上結(jié)果并沒有那么準(zhǔn)確。性別大概猜對了59%,比拋硬幣稍微好一點。猜年齡更差,只猜到55%,猜教育程度基本上跟拋硬幣差不多。這就是我們拿大數(shù)據(jù)來做用戶畫像得到的結(jié)果,其實這種用戶畫像很多互聯(lián)網(wǎng)公司都在做,不管是旅游行業(yè)、電商行業(yè),可能都經(jīng)常做這個事。但在教育行業(yè)的結(jié)果確實很不盡如人意,回過頭去看這些數(shù)據(jù),一個人選什么課跟他的性別有特別強的關(guān)聯(lián)性嗎?其實未必。一個人看視頻是喜歡跳來跳去看,還是喜歡從頭看到尾,跟他的年齡有多大關(guān)系嗎?可能也未必。
這個例子是說大數(shù)據(jù)技術(shù)它不是沒有用,但不要去神化它,什么東西上來大數(shù)據(jù)跑一遍,算法跑一遍都能跑出結(jié)果來這是神話,當(dāng)然它也不是沒有用。我們拿它來做另一件事,改個題目,用同樣的數(shù)據(jù),同樣的算法,去分析另一個問題。其實在慕課學(xué)習(xí)里面一門課可能有16個學(xué)時,32個學(xué)時這么長,其實很多學(xué)生可能看了一兩個小時以后他往后就不看了,這就是學(xué)生的流失問題。一個學(xué)生這周學(xué)了他下周還來不來?這個學(xué)生來了三五周以后他能不能堅持到最后?我們用大數(shù)據(jù)分析這個問題,同樣的數(shù)據(jù)同樣的算法我們就做到了72%的一個效果,而且我們在持續(xù)改進如何研究流失預(yù)測。所以技術(shù)要怎么用,拿來解決什么問題?是一個需要設(shè)計的事,這是我舉的第一個例子。
前面說了大數(shù)據(jù)不是萬能的,要學(xué)會合理的運用大數(shù)據(jù),那么接下來就講講具體能用大數(shù)據(jù)做什么。
通用技術(shù)——數(shù)據(jù)可視化
很多時候大家認(rèn)為教育是個特殊行業(yè),我們要結(jié)合行業(yè)的特點要做一些有特色的,結(jié)合應(yīng)用領(lǐng)域的東西,其實也未必。我們也拿它來做很多常見的事情,比方說數(shù)據(jù)可視化,其實就是數(shù)據(jù)統(tǒng)計,有多少人選課,什么時候來選,這些數(shù)據(jù)能夠給老師和學(xué)習(xí)者提供很好的決策支持。另外,還可以運用現(xiàn)在已經(jīng)很成熟的通用技術(shù)例如圖像處理技術(shù)、人臉識別技術(shù)、環(huán)境識別技術(shù),去解決教育行業(yè)一些特定的問題,比如說在線監(jiān)考。考試的時候把房間周邊的這個環(huán)境拍下來,程序能夠識別可疑的不應(yīng)該出現(xiàn)的動作和場景,我們就能在一定程度上實現(xiàn)除高考外一定程度的在線監(jiān)考。
這是通用技術(shù)在教育領(lǐng)域的應(yīng)用,有利于規(guī)?;逃膶崿F(xiàn),但對于個性化教育我們能做什么呢?以下是我的一些思考。
首先我們要做的是基于知識圖譜的資源和用戶組織
有大量的不管是視頻、習(xí)題或討論,其實它最終的知識點力度很粗,交互也不夠,我們需要按照更細(xì)力度的知識點把它組織起來,形成底層的知識圖譜,并且把用戶以及用戶跟資源的交互,通過底層的知識圖譜連接起來。這樣我們能做到什么?我們能給每一個資源做畫像。比方說我今天可能講二十分鐘的視頻,這里面我講了十個、二十個知識點,它能夠自動的去給它切分出來去計算知識點的覆蓋。
其次就是基于“資源畫像+知識結(jié)構(gòu)畫像”的學(xué)習(xí)路徑
一個學(xué)生他在哪一個知識點上強,哪一個知識點上弱,我們能夠把它細(xì)化到知識點力度上去,給它做一個畫像。那么基于這兩者資源的畫像和知識結(jié)構(gòu)的畫像使得我們能夠去給它設(shè)計更個性化的學(xué)習(xí)路徑。
比如,我們能發(fā)現(xiàn)某一門課里面哪個知識點比較難,老師可能講得不夠細(xì)或者這個東西本身就特別難,我們就能給它做智能推薦。這個可能大家在電商里面看的比較多,經(jīng)常瀏覽哪些商品頁面就會推薦哪些商品。我們給它做的是人工對比的效果,把每一個知識點的講解做成一個個小視頻,根據(jù)一個人的知識結(jié)構(gòu)我們?nèi)ソo它推薦適合他學(xué)習(xí)的這些資源,那么他的效果比人工運營的效果要好一點,點擊率能夠提高11%,然后最終它點進這個課以后最終選了這門課的概率會提升5%,同時學(xué)習(xí)者的學(xué)習(xí)效果也會得到很大提升。
剛才講到的都是純IT技術(shù),不管是人工智能還是大數(shù)據(jù),它離跟應(yīng)用結(jié)合真正去解決問題,可能還有比較大的差距。不是純粹的利用IT技術(shù)去解決所有問題,這只是我們的基本思路,我再舉兩個例子。
第一個是我們引用心理學(xué)的因素做這件事。之前提到,我們用人工智能做個性化的推薦能夠帶來更高的點擊率和選課率,跟心理學(xué)結(jié)合怎么做呢?我們可以把推薦背后的邏輯可視化出來。比如剛才電商的例子,我今天買雙鞋,如果明天再給我推薦一堆鞋,用戶就會很煩。而我們推薦的邏輯是這樣的,你今天選了一門英語聽說課,我給你推一個跟它相似的課,比方說英語的讀寫;或者我給你推一個跟它相關(guān)的課,比方說英國文學(xué)的文化;或者我根據(jù)你的社交網(wǎng)絡(luò)去分析你的同班同學(xué)或者你關(guān)注的某一個學(xué)霸選了另外一門機械原理。這個背后的邏輯如果我用純智能算法去做,無論如何不會因為你學(xué)了英語去給你推機械原理的。
這個例子是想說,也許我們可以不用特別看著很先進的技術(shù),但是通過其他交叉學(xué)科的引入,我們也能更好的去解決問題。
第二個例子是關(guān)于測評的。一個老師一個班帶40個人,可以給每個學(xué)生寫評語或者推薦信,等到畢業(yè)的時候找工作。但現(xiàn)在就已經(jīng)很難了,學(xué)生多,老師的精力有限,而且老師也需要長時間的跟你接觸下來,才能寫出有針對性的評語或推薦信。
那么機器怎么去評價一個人?其實這是個很大的問題。你如果沒有一個合適的模型你說你評價什么?于是我們結(jié)合教育學(xué)的專家做了一個多維度的評估模型,把成績之外的數(shù)據(jù)引進進來去給一個人做評價。比如時間、投入、交流、序列、節(jié)奏等學(xué)習(xí)偏好;學(xué)習(xí)成績也不僅僅是結(jié)果性成績,還包括測試行為和作業(yè)行為;以及學(xué)習(xí)速度和效率等其他參考……這份測評就更傾向于給人一個全面的描畫。
今天要跟大家分享的內(nèi)容就是這么多,總結(jié)起來可能一句話:純的IT技術(shù)可能不能夠那么容易的解決教育的問題,也許我們的路線可能要在交叉學(xué)科。謝謝大家!
點擊這里查看所有嘉賓精彩分享。
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。