芥末堆 田園 11月22日
11月16日,GET2017教育科技大會(huì)“人工智能論壇”上,先聲教育聯(lián)合創(chuàng)始人兼CTO秦龍以“教育為本·智能驅(qū)動(dòng)”為題進(jìn)行了主題演講。
秦龍首先由自身經(jīng)歷介紹了創(chuàng)辦先聲教育的初衷,即為中國的教育企業(yè)提供最好的人工智能技術(shù),從而使教育企業(yè)可以更好地服務(wù)中國學(xué)生。隨后,他為大家講解了語言學(xué)習(xí)中的人工智能技術(shù),包括口語測評(píng)、寫作批改和私人語言陪練。此外,他還講到人工智能技術(shù)并不是無敵的,未來人工智能技術(shù)仍然面臨很多挑戰(zhàn)。最后,他呼吁做人工智能、做教育的企業(yè)齊心協(xié)力,一起為中國所有家庭、學(xué)生提供最好的教育貢獻(xiàn)力量。
以下是秦龍演講實(shí)錄:
大家好,今天在這里簡單地跟大家分享一下人工智能和教育的結(jié)合。因?yàn)橄嚷暯逃且患曳浅D贻p的初創(chuàng)企業(yè),所以請?jiān)试S我花幾分鐘時(shí)間簡單介紹一下我們的背景。
先聲教育:人工智能技術(shù)服務(wù)商,幫助教育企業(yè)更好地服務(wù)中國學(xué)生
我是在大學(xué)三年級(jí)時(shí)加入了中國科學(xué)技術(shù)大學(xué)人機(jī)通訊語音實(shí)驗(yàn)室,了解科大訊飛的朋友們可能知道,科大訊飛正是從我們的實(shí)驗(yàn)室走出去的。十幾年前,科大訊飛第一次在國際語音合成大賽上獲得第一名,我也是當(dāng)時(shí)語音合成團(tuán)隊(duì)的主要成員之一。
離開科大訊飛后,我來到卡耐基梅隆大學(xué)攻讀計(jì)算機(jī)博士學(xué)位,在這樣一個(gè)李開復(fù)老師曾經(jīng)學(xué)習(xí)和工作的地方,我花了六年的時(shí)間,做語音識(shí)別方面的研究。
后來我加入了Duolingo,這張照片是我第一次工作的照片。我手里拿的牌子上面是西班牙語,是我們在Duolingo西班牙語課程中教的一句話,它翻譯成中文的意思是“你的熊喝啤酒”。在Duolingo里,我們有非常多的無厘頭句子,但是我們的客戶反映這些無厘頭的句子,反而讓他們特別容易記住外語中的單詞和語法。
我們也發(fā)現(xiàn)這是一個(gè)非常有意思的現(xiàn)象,我剛加入Duolingo時(shí),只10幾個(gè)工程師。我離開時(shí),Duolingo在全球已經(jīng)擁有超過2億的語言學(xué)習(xí)用戶,提供超過60門語言學(xué)習(xí)課程,而且所有的課程都是免費(fèi)的。
Duolingo免費(fèi)學(xué)習(xí)的理念對我的影響非常大,于是我從做技術(shù)和產(chǎn)品的角度思考,我們能不能為中國的家庭、學(xué)生做些什么。所以,就有了先聲教育。先聲教育是一家人工智能技術(shù)服務(wù)商,我們做的是賦能的一家公司。我們希望為中國的教育企業(yè)提供最好的人工智能技術(shù),從而使教育企業(yè)可以更好地服務(wù)中國學(xué)生。
AI離教育應(yīng)用還有多遠(yuǎn):未來已來
下面,我們開始今天的主題——AI人工智能。自從去年AlphaGo擊敗前圍棋世界冠軍李世石后,人工智能越來越多的出現(xiàn)在我們的生活中。而且人工智能對我們的生活產(chǎn)生了非常大的改變,比如,最新的蘋果手機(jī)可以通過“刷臉”來解鎖,這在很多年前是完全不能想象的。
人工智能如此發(fā)達(dá),教育界的人自然會(huì)問一個(gè)問題,AI離教育應(yīng)用還有多遠(yuǎn)?我覺得今天的這個(gè)主題特別好,在這里我想借用,我非常喜歡的科幻小說作家說的一句話來表達(dá)我的觀點(diǎn):未來已經(jīng)在這里了,只不過它還沒有完全普及。
語言學(xué)習(xí)里的人工智能技術(shù):口語測評(píng)、寫作批改、私人語言陪練
剛剛流利說、科大訊飛和微軟都介紹了人工智能技術(shù)和教育非常好的結(jié)合點(diǎn)。可以說,如今在中國每天都有幾千萬的中小學(xué)生通過人工智能技術(shù)進(jìn)行學(xué)習(xí),包括口語評(píng)測、寫作批改、精確評(píng)分等等。作為一個(gè)有做技術(shù)、產(chǎn)品背景的人,下面我想給大家介紹一下語言學(xué)習(xí)里常見的人工智能技術(shù)。
首先是我們剛剛提到的口語測評(píng),就是通過計(jì)算機(jī)、人工智能自動(dòng)化來評(píng)判學(xué)生的口語能力。這里主要用到語音識(shí)別算法和深度學(xué)習(xí)模型來估計(jì)打分。為了服務(wù)更多的學(xué)生,我們的語音測評(píng)技術(shù)不僅需要讓大家可以在蘋果手機(jī)、安卓手機(jī)上使用,還需要讓大家可以在微信公眾號(hào)、微信小程序里使用。
此外,無論是網(wǎng)快、網(wǎng)慢、有網(wǎng)和沒網(wǎng)哪一種網(wǎng)絡(luò)環(huán)境,我們都可以做語音測評(píng)。同時(shí),為了滿足中國中小學(xué)生的需求,語音測評(píng)技術(shù)也支持中高考所有考試的提醒。
像這樣一個(gè)語音測評(píng)技術(shù),每一天我們語音服務(wù)的平臺(tái)會(huì)接受數(shù)千萬的語音評(píng)測請求,每一天我們要處理數(shù)百小時(shí)的語音數(shù)據(jù)??梢哉f,正是因?yàn)檫@些非常大量的語音請求和語音數(shù)據(jù),我們也觀察到一些非常有意思的現(xiàn)象。我有兩幅圖,是我們語音平臺(tái)得到的平時(shí)和周末的語音評(píng)測請求分布。
我們可以看到,這兩幅圖有非常大的區(qū)別,也有非常類似的情況。用一句話來說,我覺得中國的學(xué)生為了學(xué)習(xí)口語、練習(xí)口語真的是很拼,也特別的辛苦。從早上6點(diǎn)開始,一直到晚上11點(diǎn)、12點(diǎn),有很多學(xué)生一直在練習(xí)口語。
下面我介紹的技術(shù)是寫作批改。寫作批改和口語測評(píng)非常類似。它要解決的問題是讓計(jì)算機(jī)自動(dòng)去判別一個(gè)學(xué)生寫的作文好不好,好在哪里,或者說有哪些問題。
我們會(huì)給出一個(gè)總分,也會(huì)給出一些非常精確的評(píng)判,包括詞匯的使用能力、語法的掌握程度,以及是不是切題。同時(shí),我們給出的反饋也會(huì)告訴學(xué)生,你這篇作文中哪些地方是拼寫錯(cuò)誤,哪些地方是語法錯(cuò)誤,甚至是用詞不當(dāng)、詞不達(dá)意等等。我們希望通過這些最實(shí)時(shí)的反饋,讓學(xué)生立刻知道哪些地方犯了錯(cuò)誤,從而有改進(jìn)的機(jī)會(huì)。
其實(shí)很多人都知道,學(xué)習(xí)語言最好的方法就是使用這門語言。不過這些事情在中國是比較困難的,對于中國孩子來說,沒有一個(gè)合適的環(huán)境和場景來讓他們練習(xí)這門語言。
20年之前,我們用的都是復(fù)讀機(jī),播的是磁帶。磁帶是一種非常簡單的形式,它播一句英語,然后你暫停,你重復(fù)這句英語,這種學(xué)習(xí)效果并不好。
20年后的今天,我們有了非常好的語言學(xué)習(xí)方式。比如,一對一在線外教直播課程,我認(rèn)為這是非常好的方式,可以讓孩子直接學(xué)習(xí)最地道的英語。但這樣的語言學(xué)習(xí)形式仍然有很大問題,目前來看它的成本比較高。也就是說,它不能服務(wù)中國絕大多數(shù)的家庭,絕大多數(shù)的學(xué)生。
所以,我們想說能不能通過人工智能技術(shù)做一點(diǎn)什么,于是我想到了通過人工智能技術(shù)為每個(gè)人打造私人語言陪練。在去年,Duolingo上線了一個(gè)產(chǎn)品,它就是為每一個(gè)學(xué)習(xí)語言者打造私人的語言陪練。
圖中就是這個(gè)產(chǎn)品的大致樣子,它是通過英語學(xué)習(xí)西班牙的課程。我有一個(gè)動(dòng)物園的場景,我的人工智能的陪練就是我在動(dòng)物園里的一個(gè)導(dǎo)游。我們會(huì)通過文字、語音、圖片來引導(dǎo)學(xué)生、引導(dǎo)用戶,把對話進(jìn)行下去。
與傳統(tǒng)的對話相比,比如siri,它們有著非常大的區(qū)別。我們的對話主要由人工智能引導(dǎo),這樣可以解決學(xué)生在學(xué)習(xí)語言初期對語言掌握不好的問題,使用戶更容易把對話進(jìn)行下去。這種形式、技術(shù)和設(shè)計(jì)在客戶中得到了非常好的反饋。
人工智能看似強(qiáng)大,實(shí)則面臨很多挑戰(zhàn)
既然人工智能應(yīng)用這么廣泛,是不是人工智能就無敵了呢?就已經(jīng)完美了呢?我想從自己做人工智能的經(jīng)驗(yàn)跟大家分享一下。目前我們所有解決人工智能的案例中,基本上都是Big Data、Small Task這一類。
我們先說什么叫做Big Data??梢杂靡痪湓拋砜偨Y(jié),有多少人工就有多少智能。剛剛微軟的同事也提到了,我們每一個(gè)人工智能的模型,都需要大量的大數(shù)據(jù)來進(jìn)行訓(xùn)練。比如,語音測評(píng)模型和語音識(shí)別模型需要幾千小時(shí),甚至上萬小時(shí)人工標(biāo)準(zhǔn)的語音錄音,才能訓(xùn)練出一個(gè)模型。所以,標(biāo)準(zhǔn)問題是所有人工智能從業(yè)者都非常頭疼的問題,是一個(gè)非常耗費(fèi)人力、物力、財(cái)力的過程。
所以,這也是為什么在谷歌發(fā)表《AlphaGo Zero》這篇論文以后,大家眼前一亮。因?yàn)锳lphaGo Zero在完全沒有使用任何有監(jiān)督的數(shù)據(jù)情況下,訓(xùn)練了一個(gè)可以用于人工智能下圍棋的產(chǎn)品,它比之前有訓(xùn)練數(shù)據(jù)的產(chǎn)品更厲害。
什么叫做Small Task呢?我用一句話來總結(jié),就是單一模型只能解決單一問題。在2002年,谷歌通過使用1萬6千多塊CPU、3天時(shí)間、超過1000萬張圖片數(shù)據(jù)訓(xùn)練了一個(gè)非常強(qiáng)大、非常復(fù)雜的人工神經(jīng)網(wǎng)絡(luò)。但它只能干一件事,就是識(shí)別圖片中有沒有貓臉。如果我想讓它識(shí)別有沒有狗臉,或者人臉,它就做不了。應(yīng)該說,目前人工智能看似強(qiáng)大,但其實(shí)它每一個(gè)訓(xùn)練出來的結(jié)果,就只能做一個(gè)非常小的事情。
那么,未來人工智能技術(shù)面臨哪些挑戰(zhàn)呢?從人工智能技術(shù)的角度出發(fā),包括如何無監(jiān)督的學(xué)習(xí)、如何打通多維數(shù)據(jù)、音頻、視頻和頭像、如何融合多種算法等等,這都是未來人工智能技術(shù)面臨的挑戰(zhàn)。
共建,讓更好的教育來的更快
接下來,我們再講講教育。其實(shí),目前的教育系統(tǒng)非常老舊,它起始于第一次工業(yè)革命。當(dāng)時(shí)創(chuàng)立學(xué)校、創(chuàng)辦教育的目的是為了培訓(xùn)在流水線上工作的工人。同樣地,教育的形式也像流水線一樣,每個(gè)學(xué)生用同樣的速度學(xué)習(xí)同樣的內(nèi)容。
我們現(xiàn)在的生活和兩三百年前有著翻天覆地的變化,我們可以用人臉去解鎖手機(jī)、可以做視頻通訊、可以把人類送向太空,我們火車的速度已經(jīng)比兩三百年前至少快了100倍。但是我們的教育形式、教育內(nèi)容并沒有發(fā)生太大的變化,應(yīng)該說教育的變革非常緩慢。
在今天的論壇里,我想跟大家探討一下,是不是有了人工智能技術(shù)這無所不能的利器,就可以解決教育里的所有問題呢?我認(rèn)為不是的。那有沒有什么更好的方法,可以幫助我們解決這樣的問題呢?我覺得今年GET大會(huì)的主題已經(jīng)給了我們很好的答案,那就是共建。
今天,在中國有非常多、非常優(yōu)秀的教育企業(yè),每一個(gè)教育企業(yè)都有自己非常大的優(yōu)勢。比如說,有的企業(yè)可能有大量的學(xué)生用戶,有大量學(xué)生學(xué)習(xí)使用的數(shù)據(jù)。有的公司有非常好的教研,非常好的教研內(nèi)容。像我們這些初創(chuàng)企業(yè),或者已經(jīng)比較成功的初創(chuàng)企業(yè),有很好的人工智能技術(shù)。那么,我們這些企業(yè)之間能不能以一個(gè)非常開放的心態(tài),把彼此最好的地方、最好的優(yōu)勢都拿出來。我們一起合作,一起讓教育的發(fā)展來得更快。
最后,我想說,我們已經(jīng)在人工智能和教育相結(jié)合這條路上走下去了,但是這條路還很長、很慢、很遙遠(yuǎn),距離我們最終的目標(biāo)不是一天兩天能夠?qū)崿F(xiàn)的。我希望所有做人工智能、做教育的企業(yè),大家齊心協(xié)力,為早日實(shí)現(xiàn)我們通過技術(shù),為中國所有家庭、所有學(xué)生提供最好的教育,貢獻(xiàn)一份力量。
謝謝大家。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請您 填寫信息告訴我們。