科大訊飛教育事業(yè)群副總裁王卓
芥末堆 紅印兒 11月17日
11月16日,在“GET2017教育科技大會(huì)”第三日的人工智能論壇上,科大訊飛教育事業(yè)群副總裁王卓發(fā)表了以“人工智能助力教與學(xué)”為主題的演講。他介紹了科大訊飛人工智能技術(shù)的發(fā)展情況,并分享了科大訊飛將人工智能技術(shù)應(yīng)用到教和學(xué)之中的經(jīng)驗(yàn)。
“如果不能回應(yīng)中國(guó)社會(huì)的重大問(wèn)題,科大訊飛的價(jià)值會(huì)大打折扣?!蓖踝空f(shuō)。科大訊飛在教育行業(yè)中發(fā)現(xiàn)了很多亟待解決的問(wèn)題,比如,如何讓學(xué)生個(gè)性化地學(xué)習(xí)、如何減少老師的重復(fù)性工作。通過(guò)利用人工智能技術(shù)收集和分析教學(xué)數(shù)據(jù),科大訊飛逐漸建立起一個(gè)網(wǎng)絡(luò)化、數(shù)字化的教學(xué)平臺(tái),為后續(xù)實(shí)現(xiàn)個(gè)性化學(xué)習(xí)打下數(shù)據(jù)基礎(chǔ)。
以下是王卓的演講實(shí)錄(芥末堆有刪減):
今天我想在這里做兩件事。一是向大家全面地介紹科大訊飛AI技術(shù)發(fā)展到什么樣的程度、在教育行業(yè)是怎樣應(yīng)用的。二是介紹科大訊飛在教育行業(yè)中將技術(shù)、用戶流量、內(nèi)容整合、渠道建設(shè)都做到什么樣的程度,看看這些資源怎么與在座的創(chuàng)業(yè)團(tuán)隊(duì)對(duì)接、形成生態(tài),共同推動(dòng)中國(guó)教育產(chǎn)業(yè)的發(fā)展。
技術(shù)發(fā)展的價(jià)值在于它能解決怎樣的社會(huì)問(wèn)題
首先,介紹一下人工智能現(xiàn)在的發(fā)展情況。人工智能已經(jīng)上升到了國(guó)家戰(zhàn)略的層面。在2016年,人工智能被美國(guó)和歐盟列入整體發(fā)展戰(zhàn)略。我們國(guó)家今年出臺(tái)了相關(guān)文件,公布了新一代人工智能發(fā)展規(guī)劃。未來(lái),人工智能對(duì)國(guó)家的經(jīng)濟(jì)發(fā)展將起到至關(guān)重要的作用。在人工智能的發(fā)展方面,中美兩國(guó)處于同一個(gè)賽道上。我們?cè)谌斯ぶ悄苡绕涫歉兄悄艿陌l(fā)展賽道上處于全球最領(lǐng)先的水平。
今年2月,我國(guó)人工智能發(fā)展的進(jìn)展受到美國(guó)的關(guān)注,《紐約時(shí)報(bào)》專(zhuān)門(mén)對(duì)此進(jìn)行了報(bào)道。在發(fā)展人工智能的過(guò)程中,科大訊飛認(rèn)識(shí)到這不是一家企業(yè)的事,也不是幾個(gè)團(tuán)隊(duì)的事情,而是需要舉全國(guó)之力來(lái)做。凡是有志于從事這個(gè)領(lǐng)域的團(tuán)隊(duì)、公司、研究機(jī)構(gòu),應(yīng)該聯(lián)合起來(lái),一起推動(dòng)中國(guó)人工智能產(chǎn)業(yè)的發(fā)展。2016年,我們聯(lián)合相關(guān)合作單位發(fā)表了《人工智能深圳宣言》,就是要在國(guó)內(nèi)團(tuán)結(jié)一切可以團(tuán)結(jié)的力量,共同推動(dòng)中國(guó)人工智能產(chǎn)業(yè)的發(fā)展。
在這個(gè)背景下,我們?cè)賮?lái)談教育??拼笥嶏w為什么要進(jìn)入教育行業(yè)?科大訊飛發(fā)展到目前的狀態(tài),如果想在未來(lái)追求更大的發(fā)展,我們的價(jià)值取決于我們能解決什么樣的重大社會(huì)問(wèn)題。如果不能回應(yīng)中國(guó)社會(huì)的重大問(wèn)題,科大訊飛的價(jià)值會(huì)大打折扣。
放眼中國(guó)各個(gè)行業(yè),教育行業(yè)存在的問(wèn)題最多。教育行業(yè)未來(lái)的變革中存在巨大的商業(yè)價(jià)值,這是科大訊飛把人工智能技術(shù)應(yīng)用在教育行業(yè)的根本出發(fā)點(diǎn)。由于教育行業(yè)的特性,這件事也不是一家企業(yè)能做的。我們懷著去年發(fā)表《深圳宣言》時(shí)的那種心態(tài),希望團(tuán)結(jié)國(guó)內(nèi)有志于從事教育行業(yè)的企業(yè)和創(chuàng)業(yè)團(tuán)隊(duì),一起實(shí)踐人工智能在教育行業(yè)的應(yīng)用。
我們把人工智能分為三個(gè)層次,即計(jì)算智能、感知智能和認(rèn)知智能。計(jì)算智能是說(shuō)機(jī)器就像AlphaGo機(jī)器人一樣,計(jì)算能力和存儲(chǔ)能力超強(qiáng)??拼笥嶏w的自身定位是在感知智能和認(rèn)知智能方面。感知智能就是讓計(jì)算機(jī)能聽(tīng)會(huì)說(shuō)、能看會(huì)認(rèn),像人一樣跟你交流。認(rèn)知智能是說(shuō)讓計(jì)算機(jī)能理解、會(huì)思考。科大訊飛從1999年創(chuàng)業(yè)之始就在感知智能的賽道上,到今年,我們的位置已經(jīng)從感知智能在向認(rèn)知智能靠近。
在感知智能上,我們已經(jīng)做到了全球領(lǐng)先的水平。從2006年參加全球的PK大賽到今天,科大訊飛代表中國(guó)在感知智能方面一直獲得全球第一。不管是語(yǔ)音合成、語(yǔ)音識(shí)別,還是高噪音環(huán)境下的語(yǔ)音識(shí)別,在所有的PK評(píng)測(cè)中科大訊飛都代表中國(guó)拿到了第一名。我們的感知智能技術(shù)在全球絕對(duì)是領(lǐng)先的?,F(xiàn)在,感知智能技術(shù)也用在了語(yǔ)文、英語(yǔ)、音樂(lè)等一些學(xué)科中,用來(lái)給學(xué)生構(gòu)建標(biāo)準(zhǔn)化的學(xué)習(xí)環(huán)境。
關(guān)于認(rèn)知智能,全球基本上都是圍繞考試機(jī)器人在做。美國(guó)華盛頓大學(xué)的圖靈中心已經(jīng)把考試機(jī)器人作為人工智能的一個(gè)重要抓手,通過(guò)美國(guó)高中生物考試來(lái)檢驗(yàn)人工智能的效果。日本國(guó)立情報(bào)研究所也把機(jī)器人是否能考上東京大學(xué)作為人工智能的抓手。
中國(guó)科技部建成了類(lèi)人答題機(jī)器人,聯(lián)合了國(guó)內(nèi)9家最領(lǐng)先的研究單位,想在2020年讓機(jī)器人能在全學(xué)科考試上達(dá)到前20%考生的水平。現(xiàn)在認(rèn)知智能的重點(diǎn)都投向了考試機(jī)器人的研究。為什么?因?yàn)榭荚嚈C(jī)器人回答的題目是你以前在社會(huì)上見(jiàn)不到的,解析題目并分析整個(gè)知識(shí)體系對(duì)技術(shù)的要求非常高。我們國(guó)家也把類(lèi)人答題考試機(jī)器人作為中國(guó)人工智能的總抓手。
這對(duì)科大訊飛來(lái)說(shuō)是一個(gè)機(jī)遇。科大訊飛牽頭承擔(dān)了首個(gè)人工智能重大項(xiàng)目“類(lèi)人答題機(jī)器人”。我們跟其他另外8家單位一起致力于這方面的攻關(guān)。在高考機(jī)器人的攻關(guān)方面,我們以語(yǔ)音和語(yǔ)言為入口推動(dòng)認(rèn)知革命的整體變革。
在國(guó)家考試中心出題的評(píng)測(cè)下,150分的數(shù)學(xué)試卷,機(jī)器人基本能達(dá)到110分的水平。在醫(yī)療方面,360分就能通過(guò)全國(guó)醫(yī)師資格考試,而機(jī)器人考了457分。醫(yī)師資格考試的考題不是基于題庫(kù)而是重新定制的,因此它的考試難度也相當(dāng)高。
技術(shù)開(kāi)始驅(qū)動(dòng)教育的變革
科大訊飛如何把現(xiàn)有的技術(shù)成果應(yīng)用在教育行業(yè)的變革中?我們總說(shuō)技術(shù)是為教育服務(wù)的。教育是核心,技術(shù)位于從屬的地位。但到目前這個(gè)階段,技術(shù)發(fā)展的成果已遠(yuǎn)遠(yuǎn)超越了教學(xué)理論和方法論的水平。教育技術(shù)的發(fā)展已經(jīng)對(duì)教育的方法論產(chǎn)生了具有變革性的影響。我們慢慢在形成一個(gè)共識(shí),那就是技術(shù)在驅(qū)動(dòng)教育,技術(shù)的重要性得到大大提升。
目前,中國(guó)的教育已經(jīng)進(jìn)入教育大數(shù)據(jù)時(shí)代。 這個(gè)“大”字怎么理解?我們理解它有兩層含義,一是指數(shù)量大,二是指價(jià)值大。擁有最大量的數(shù)據(jù)并不一定就獲得最大的價(jià)值。在大數(shù)據(jù)的背景下,教育未來(lái)的發(fā)展方向一定是在個(gè)性化學(xué)習(xí)上??拼笥嶏w也在從教育大數(shù)據(jù)、個(gè)性化學(xué)習(xí)的角度來(lái)推動(dòng)人工智能和教育的融合。
人工智能技術(shù)應(yīng)該給教育帶來(lái)怎樣的價(jià)值?第一,人工智能技術(shù)要對(duì)數(shù)據(jù)采集的手段進(jìn)行變革。 大量的教和學(xué)的過(guò)程化數(shù)據(jù)都是以視頻、音頻、圖片的方式存在的,但這只是數(shù)字化。想要形成數(shù)據(jù)化,就需要人工智能技術(shù)。人工智能技術(shù)要能把音頻都轉(zhuǎn)成文字,把以前寫(xiě)在紙上的作文識(shí)別出來(lái),把以前在紙上寫(xiě)的學(xué)科試題答卷智能解析出來(lái)。用人工智能技術(shù)對(duì)課堂教學(xué)場(chǎng)景進(jìn)行分析,是人工智能技術(shù)在數(shù)據(jù)采集和分析方面的重要價(jià)值。
第二,為教師減負(fù)增效。很多老師都在做重復(fù)性的工作,比如批改作業(yè)、重復(fù)備課。人工智能可以大幅提高老師的效率,讓計(jì)算機(jī)來(lái)承擔(dān)那些簡(jiǎn)單重復(fù)的工作。
第三,幫助學(xué)生實(shí)現(xiàn)個(gè)性化的學(xué)習(xí),提高學(xué)習(xí)效率。一個(gè)初三的學(xué)生可能會(huì)花3個(gè)小時(shí)來(lái)練習(xí)一套題,第二天他做這套題可以得100分。通過(guò)后臺(tái)數(shù)據(jù)的分析,我們可以在半小時(shí)里教給學(xué)生他想學(xué)的、欠缺的、需要提升的東西,剩下兩個(gè)半小時(shí)的時(shí)間,學(xué)生可以做別的事情。
第四,為管理決策提供大數(shù)據(jù),為科學(xué)治理提供支撐。國(guó)家對(duì)教育的年度投資已經(jīng)達(dá)到了GDP的4%。想要知道投下去的資源是否產(chǎn)生了相應(yīng)的效果,可以用人工智能技術(shù)分析教育大數(shù)據(jù),給國(guó)家相關(guān)部門(mén)提供科學(xué)的決策依據(jù)。
用伴隨式的數(shù)據(jù)收集與分析為個(gè)性化學(xué)習(xí)做鋪墊
想要全面地推進(jìn)人工智能,要做到三點(diǎn):
1、深入一線,覆蓋教、學(xué)、考、管
一定要深入到一線,不能就技術(shù)論技術(shù)。
人工智能技術(shù)聽(tīng)著很高大上,但也有短板,并沒(méi)有達(dá)到完全成熟的地步。技術(shù)人員、產(chǎn)品人員必須要到一線去深入了解教、考、評(píng)、管各個(gè)環(huán)節(jié),才能讓技術(shù)與教育的應(yīng)用場(chǎng)景結(jié)合起來(lái)。
2、互聯(lián)聯(lián)通,常態(tài)應(yīng)用中收集真實(shí)教育大數(shù)據(jù)
常態(tài)化收集不是說(shuō)收集一次、兩次的數(shù)據(jù)。它是對(duì)課堂教學(xué)、課堂學(xué)習(xí)、家庭作業(yè)等環(huán)節(jié)進(jìn)行日常性的數(shù)據(jù)采集,每天都會(huì)采集學(xué)生真實(shí)的生活數(shù)據(jù)、體質(zhì)數(shù)據(jù)。常態(tài)化采集對(duì)供應(yīng)商的服務(wù)能力、資金能力都提出非常大的要求。
3、應(yīng)用大數(shù)據(jù),實(shí)現(xiàn)個(gè)性化教、針對(duì)性學(xué)與科學(xué)決策
如果不圍繞以上三點(diǎn)深入研究的話,人工智能就是一個(gè)高大上的東西,無(wú)法落地。科大訊飛對(duì)教學(xué)過(guò)程性數(shù)據(jù)的采集有一個(gè)完整的鏈條。從課堂互動(dòng)、作業(yè)到考試,我們都會(huì)收集對(duì)應(yīng)的數(shù)據(jù)。不同數(shù)據(jù)的采集方法有所不同。比如我們用智慧課堂設(shè)備采集課堂教學(xué)互動(dòng)和授課數(shù)據(jù),用手機(jī)采集日常學(xué)生作業(yè)和練習(xí)的數(shù)據(jù),用校級(jí)云閱卷系統(tǒng)采集校內(nèi)考試數(shù)據(jù),用區(qū)域數(shù)據(jù)中心采集中考、會(huì)考等區(qū)域統(tǒng)考數(shù)據(jù)。
學(xué)校是數(shù)據(jù)采集的主戰(zhàn)場(chǎng)。我們把科大訊飛的系統(tǒng)安裝到學(xué)校里,目前主要針對(duì)中學(xué)。有1萬(wàn)多所學(xué)校部署了我們的系統(tǒng),并形成了常態(tài)化的使用。采集數(shù)據(jù)的服務(wù)成本和資金成本是巨大的。每個(gè)學(xué)校都要配備相關(guān)的硬件、軟件和到校服務(wù)團(tuán)隊(duì)?;旧厦?00個(gè)學(xué)校就要配12名地面服務(wù)人員。前期的硬件和軟件投入都需要有資本實(shí)力,用免費(fèi)部署系統(tǒng)的方式來(lái)培育市場(chǎng)、引領(lǐng)市場(chǎng)。
另外,建設(shè)自身品牌也很重要。當(dāng)學(xué)校得知它的數(shù)據(jù)要匯聚到我們的平臺(tái)上,一開(kāi)始是會(huì)抵制的。我們通過(guò)一年、兩年、三年用心用情的服務(wù),樹(shù)立起自己在教育信息化方面的品牌,獲得了學(xué)校的認(rèn)可,才能做出這樣的匯集數(shù)據(jù)的平臺(tái)。
目前,科大訊飛已經(jīng)建立起一個(gè)網(wǎng)絡(luò)化、數(shù)字化的教學(xué)平臺(tái),采用伴隨式的教學(xué)數(shù)據(jù)收集方式,為個(gè)性化學(xué)習(xí)打下堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
通過(guò)搭建平臺(tái)、數(shù)據(jù)分析和資源建設(shè)讓人工智能技術(shù)融入教育
在推廣應(yīng)用中有幾個(gè)亮點(diǎn)。一是口語(yǔ)學(xué)習(xí)??谡Z(yǔ)學(xué)習(xí)面向中考、高考等各類(lèi)考試。以前的口語(yǔ)考試要么缺乏客觀評(píng)價(jià)學(xué)生口語(yǔ)水平的方法,要么所需投入的人力物力很大。一旦評(píng)審老師的疲勞了或者評(píng)分標(biāo)準(zhǔn)不統(tǒng)一,就不能保證公平。人工智能技術(shù)已經(jīng)進(jìn)入中高考的智能評(píng)閱中。我們的口語(yǔ)評(píng)測(cè)技術(shù)在廣東、江蘇、上海、北京、天津等十多個(gè)省市的中高考里已經(jīng)得到全面的應(yīng)用。
二是全學(xué)科的閱卷。批改主觀題和作文會(huì)占用老師大量的時(shí)間。我們可以用人工智能技術(shù)把老師從重復(fù)的工作中釋放出來(lái)。一些省市中高考的作文批改已經(jīng)在使用我們的技術(shù)。
收集好數(shù)據(jù)后,最難的是對(duì)教和學(xué)的數(shù)據(jù)進(jìn)行精準(zhǔn)的分析評(píng)價(jià)。為了進(jìn)行評(píng)價(jià),要建立龐大的知識(shí)庫(kù),覆蓋全學(xué)科、全學(xué)段。市面上能采集到的題庫(kù)數(shù)據(jù)很多都是冗余的,都不能作為種子試題。當(dāng)每個(gè)學(xué)科都選出四、五萬(wàn)道種子試題之后,就要開(kāi)始搭建學(xué)科知識(shí)體系。體系怎么分層、板塊怎么劃分,全國(guó)都眾說(shuō)紛紜,很難找到一致的標(biāo)準(zhǔn)??茖W(xué)的分層是靠采集到的數(shù)據(jù)來(lái)驅(qū)動(dòng)的,是非常難的事,所需投入也很大。科大訊飛初步建立起一套分析評(píng)價(jià)體系,針對(duì)主管部門(mén)、校長(zhǎng)、老師、家長(zhǎng)和學(xué)生,都能提供他們相應(yīng)感興趣的評(píng)價(jià)服務(wù)。
我們幫助老師實(shí)現(xiàn)了精準(zhǔn)的講評(píng)。在上課前,老師就可以通過(guò)后臺(tái)數(shù)據(jù)知道學(xué)生在作業(yè)中都有哪些問(wèn)題。在課堂上,老師就可以采用更有針對(duì)性的教學(xué)策略,精準(zhǔn)地去講解相應(yīng)的知識(shí)點(diǎn)。我們還初步實(shí)現(xiàn)了針對(duì)學(xué)生的個(gè)性化題庫(kù)推薦。我們?yōu)槟骋粋€(gè)學(xué)科構(gòu)建了898個(gè)知識(shí)點(diǎn),還梳理了2489個(gè)題型,建立了5萬(wàn)多道種子用戶題和60多萬(wàn)道拓展題目。在這樣的知識(shí)體系下,當(dāng)學(xué)生的學(xué)習(xí)數(shù)據(jù)被回收上來(lái)之后,就可以給學(xué)生更加精準(zhǔn)地推送題目,提高學(xué)習(xí)效率。
我們的后臺(tái)數(shù)據(jù)也支持老師的教研。以前的教研是經(jīng)驗(yàn)性的,現(xiàn)在是大數(shù)據(jù)指導(dǎo)下的精準(zhǔn)教研。很多學(xué)校已經(jīng)建立了精準(zhǔn)教研中心。根據(jù)學(xué)生的數(shù)據(jù)和分析,我們會(huì)告訴老師教學(xué)中存在什么問(wèn)題,他們的教研應(yīng)該如何更有針對(duì)性。
除了平臺(tái)、數(shù)據(jù)分析和評(píng)價(jià)之外,人工智能發(fā)展還有一個(gè)很核心的問(wèn)題,那就是資源的匯集。不光是計(jì)算機(jī)學(xué)習(xí)海量知識(shí)需要海量的數(shù)據(jù),學(xué)生的學(xué)習(xí)、老師的教學(xué)也需要海量數(shù)據(jù)資源的支持。
我們的資源建設(shè)分為三個(gè)層次:
第一,國(guó)家資源平臺(tái)。十二五期間,國(guó)家積累了大量的數(shù)據(jù),包括名師資源、一師一優(yōu)課的資源。我們把這些資源匯集起來(lái),篩選出高質(zhì)量的內(nèi)容,為老師的課堂教學(xué)和學(xué)生個(gè)性化學(xué)習(xí)提供服務(wù)。
第二,各大出版社的資源。我們提供的數(shù)據(jù)服務(wù)覆蓋學(xué)生學(xué)習(xí)的整個(gè)過(guò)程。如果要開(kāi)發(fā)同步學(xué)習(xí)的產(chǎn)品,必須要拿到各個(gè)出版社的授權(quán),去整合各個(gè)出版社的優(yōu)質(zhì)資源??拼笥嶏w每年會(huì)在這方面投入幾千萬(wàn)的資金。
第三,教師日常教學(xué)的資源。我們用智慧課堂采集課堂上的全程數(shù)據(jù)。在后臺(tái),我們有一個(gè)3000多人的加工團(tuán)隊(duì)。
在未來(lái),人工智能技術(shù)與教育的融合會(huì)向哪幾個(gè)方面發(fā)展?現(xiàn)階段,我們主要采集學(xué)生知識(shí)性學(xué)習(xí)的數(shù)據(jù)。今后,我們也會(huì)關(guān)注學(xué)生的成長(zhǎng)數(shù)據(jù)、心理健康數(shù)據(jù)、體質(zhì)數(shù)據(jù)、創(chuàng)造數(shù)據(jù)、核心素養(yǎng)數(shù)據(jù)等等。我們還會(huì)關(guān)注智能硬件、VR、AR技術(shù)的發(fā)展。最終,我們希望搭建一個(gè)覆蓋全教育場(chǎng)景的教育數(shù)據(jù)中心,實(shí)現(xiàn)個(gè)性化學(xué)習(xí)、針對(duì)性教學(xué)以及科學(xué)管理。
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車(chē)馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫(xiě)信息告訴我們。