Alpha Go 以 4:1 完勝李世石,人工智能成為熱議的話題,從1997年人工智能在國(guó)際象棋上戰(zhàn)勝人類,到2016年人工智能又在圍棋上勝出,AI在各個(gè)細(xì)分領(lǐng)域都獲得了更多關(guān)注,包括教育這個(gè)十分注重師生互動(dòng)的領(lǐng)域,學(xué)吧課堂的創(chuàng)始人李行武對(duì)人工智能在教育領(lǐng)域的應(yīng)用十分有信心:
“未來一定是虛擬(智能)老師代替大部分不合格的老師,三五年內(nèi)就能看到成效,其實(shí)我們已經(jīng)做出了能夠替代部分老師的系統(tǒng)”。
教育領(lǐng)域的Alpha Go可行嗎?
一個(gè)有豐富教學(xué)經(jīng)驗(yàn)的老師,通過兩三道題就能判斷出學(xué)生所處的水平,機(jī)器能不能模擬這個(gè)過程?這是李行武從2013年開始琢磨的一件事。
抱著科技是第一生產(chǎn)力的信念,從跨界進(jìn)入教育行業(yè)開始,李行武的理想就沒有變過——做出一款智能教師產(chǎn)品,讓每個(gè)學(xué)生都能接受優(yōu)質(zhì)教育。為了設(shè)計(jì)出貼合教學(xué)的產(chǎn)品,程序員出身的他特地做了一年中學(xué)老師,拋去“碼農(nóng)”做教育的慣性思維,試圖從教學(xué)的角度去理解老師與不同的學(xué)生之間所產(chǎn)生的化學(xué)反應(yīng),讓機(jī)器模擬老師的“大腦”,向虛擬老師進(jìn)化。
自此,學(xué)吧課堂就從2013年夏天的線下培訓(xùn)班起步了,在與學(xué)生的一次次互動(dòng)中,學(xué)吧課堂的產(chǎn)品雛形也出來了。
李行武所提到“能夠代替部分老師的系統(tǒng)”正是學(xué)吧課堂推出的第一版產(chǎn)品,“短視頻+練習(xí)”的形式,每個(gè)視頻由十幾段幾十秒的視頻切片拼接而成,在知識(shí)點(diǎn)之間插入測(cè)試和練習(xí),通過人與機(jī)器的一次次互動(dòng)采集學(xué)生的學(xué)習(xí)數(shù)據(jù),給予個(gè)性化的反饋,為每個(gè)學(xué)生生成不同的學(xué)習(xí)路徑。
本質(zhì)上來說,學(xué)吧課堂是要解決學(xué)生“學(xué)什么”和“怎么學(xué)”的問題,第一步通過前置測(cè)試來判斷學(xué)生的水平,推薦適合的學(xué)習(xí)材料。而學(xué)習(xí)同一段視頻的學(xué)生,學(xué)習(xí)路徑也不完全相同,根據(jù)學(xué)生的反饋和歷史學(xué)習(xí)數(shù)據(jù)來決定下一步學(xué)什么,隨時(shí)從素材庫中調(diào)取視頻片段。這也是做視頻切片的原因,只有顆粒度夠細(xì),才能做到個(gè)性化推薦。經(jīng)過一年的努力,學(xué)吧課堂高二數(shù)學(xué)的課程搭建完成,其產(chǎn)品在公立學(xué)校的試點(diǎn)實(shí)驗(yàn)中得到了校方和學(xué)校的認(rèn)可。
不過,視頻制作成本太高,采集的數(shù)據(jù)量不夠,是學(xué)吧課堂當(dāng)時(shí)面臨的兩大問題。制作一個(gè)小時(shí)的視頻,團(tuán)隊(duì)要耗費(fèi)大約100個(gè)人時(shí)。對(duì)于學(xué)吧課堂十來個(gè)人的小團(tuán)隊(duì)來說,根本支撐不起來制作如此龐大的素材庫。李行武開始重新思考產(chǎn)品的發(fā)展路徑,不久后,前巨人教育副總裁齊明鑫加入任CEO,團(tuán)隊(duì)做出決策:暫停視頻制作,先從更輕的練習(xí)切入。
采集有效數(shù)據(jù)是自適應(yīng)學(xué)習(xí)的關(guān)鍵
2015年11月,重新改版后的學(xué)吧課堂上線,4個(gè)多月以來,積累了30萬用戶,日活達(dá)5萬人次,活躍用戶日均做題量超過100萬道 ,上線以來總做題量超過5000萬條。齊明鑫一再強(qiáng)調(diào)這都是真實(shí)數(shù)據(jù),并向我展示了友盟的后臺(tái)統(tǒng)計(jì)數(shù)據(jù)。
目前學(xué)吧課堂的主要功能是“診斷+推薦”,通過十道前置的測(cè)試題,判斷學(xué)生的學(xué)習(xí)水平,形成學(xué)生在知識(shí)結(jié)構(gòu)上的“用戶畫像”,雖然做不到像老師一樣迅速診斷學(xué)生水平,“目前市面上還沒有能做到這一點(diǎn)的,無法真實(shí)判斷學(xué)生的水平”,當(dāng)我追問原因,他們一致歸結(jié)為這一點(diǎn):在技術(shù)和教研之間搭建“橋梁”的能力,懂技術(shù)又懂教學(xué),不是人人都能做到。
在學(xué)吧課堂的辦公地點(diǎn),此前為錄制視頻而改造的兩間錄課室還保留著,“視頻我們并沒有放棄,目前內(nèi)測(cè)版本里面仍然有短視頻,只是我們的重點(diǎn)放在練習(xí)這塊?!崩钚形洳⒉辉敢獍堰@次變化稱為轉(zhuǎn)型,退回到練習(xí),學(xué)吧課堂的發(fā)展路徑變了,不過智能教師這一點(diǎn)并沒有變,以練習(xí)這種更輕的方式切入,獲取數(shù)據(jù)的速度會(huì)加快。
“做到自適應(yīng)學(xué)習(xí),關(guān)鍵的因素之一是數(shù)據(jù),而且必須是必須是有效的”,李行武強(qiáng)調(diào)。援引機(jī)器學(xué)習(xí)大師 Andrew Ng(吳恩達(dá))的話,"It's not who has the best algorithm that wins,It's who has the most data”。
所謂有效數(shù)據(jù),有兩個(gè)維度:
一是數(shù)據(jù)的密度,在單個(gè)學(xué)生身上搜集到的數(shù)據(jù)是否足夠,在以練習(xí)為主的題庫產(chǎn)品中,主要取決于學(xué)生單位時(shí)間的做題量,學(xué)吧課堂的每個(gè)用戶每周的做題量超過50題。
另外是數(shù)據(jù)的質(zhì)量,表現(xiàn)在學(xué)生刷題的正確率,如果正確率過低,導(dǎo)致產(chǎn)生的無效數(shù)據(jù)過多,會(huì)影響機(jī)器的判斷。而在同類題庫產(chǎn)品中,學(xué)生答題的正確率在35%-40%,學(xué)吧課堂的這個(gè)數(shù)字為60%,“這說明學(xué)生都在努力把題做對(duì),而不是隨便蒙的”,齊明鑫向我解釋其中的差別。學(xué)吧課堂為學(xué)生設(shè)置的學(xué)習(xí)目標(biāo)是自適應(yīng)的,學(xué)渣也會(huì)更有學(xué)習(xí)動(dòng)力。
這些數(shù)據(jù)讓兩位創(chuàng)始人特別興奮,這次新的嘗試收到了用戶的正面反饋,小范圍內(nèi)驗(yàn)證了這種模式。
關(guān)于未來的發(fā)展,拓展學(xué)科是必然的。學(xué)吧課堂接下來計(jì)劃是成為老師的助教,幫助老師布置、批改作業(yè)。更長(zhǎng)遠(yuǎn)的目標(biāo)是成為“教育領(lǐng)域的小冰”。“你們預(yù)期需要多久?”我問道,李行武的回答是:“很快了,三、五年內(nèi)就能看到了?!?/p>
智能教師離我們并不遠(yuǎn)
優(yōu)質(zhì)教師不足,是教育行業(yè)從業(yè)者的共識(shí),如何解決這個(gè)問題,O2O找老師、在線直播、錄播等,目的之一都是讓更多學(xué)生能接觸到優(yōu)質(zhì)的教育資源。而李行武不看好基于人的授課產(chǎn)品,本質(zhì)上來講都是售賣人的時(shí)間,做過十幾年教師的齊明鑫深有體會(huì),“如果我去教課的話,一個(gè)小時(shí)課時(shí)費(fèi)可以收2000,但這本質(zhì)上還是體力勞動(dòng)”。如果有“智能教師”替代老師的部分工作,人可以去做更有價(jià)值的事情。
同樣從自適應(yīng)學(xué)習(xí)出發(fā),Knewton的路徑是做自適應(yīng)學(xué)習(xí)引擎,把API接口開放給學(xué)?;蛘呓逃龣C(jī)構(gòu)這類B端用戶。而學(xué)吧課堂走了另外一條路。
從商業(yè)價(jià)值上來說,與其他技術(shù)驅(qū)動(dòng)的互聯(lián)網(wǎng)產(chǎn)品一樣,機(jī)器教學(xué)從總體上來說可以無限降低成本,只是在初期投入較大,而當(dāng)技術(shù)和產(chǎn)品逐步成熟,就可以大規(guī)模復(fù)制,也許未來人人都有一個(gè)虛擬老師,可能像電影《Her》所呈現(xiàn)的場(chǎng)景,只需要帶上耳機(jī),“薩曼沙”老師就在你身邊,告訴你這一題怎么做,接下來應(yīng)該學(xué)什么。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。