芥末堆芥末堆

【GET2020】作業(yè)幫羅亮:基礎(chǔ)音視頻服務(wù)和AI視覺(jué)語(yǔ)音是直播課技術(shù)兩大核心

作者:李海顏 發(fā)布時(shí)間:

【GET2020】作業(yè)幫羅亮:基礎(chǔ)音視頻服務(wù)和AI視覺(jué)語(yǔ)音是直播課技術(shù)兩大核心

作者:李海顏 發(fā)布時(shí)間:

摘要:教育科技就是把優(yōu)質(zhì)的教育資源放大、遷移、匹配的便捷管道。

WechatIMG332.jpg

作業(yè)幫副總裁羅亮在做“后疫情時(shí)代作業(yè)幫對(duì)教育科技的探索”的主題分享

芥末堆 11月26日 李海顏 報(bào)道

11月24日,在“或躍在淵:教育的信心與發(fā)展”芥末堆GET2020教育科技大會(huì)上,作業(yè)幫副總裁羅亮帶來(lái)了“后疫情時(shí)代作業(yè)幫對(duì)教育科技的探索”的主題分享。

他表示,在線教育的最大價(jià)值是在于用科技的力量,把知識(shí)分發(fā)到每一個(gè)有需要的學(xué)生身邊,而教育科技就是把優(yōu)質(zhì)的教育資源放大、遷移、匹配的便捷管道。就直播技術(shù)而言有兩大核心,一是基本的音視頻傳輸能力和互動(dòng)能力,二是利用AI技術(shù)提升學(xué)生課堂中的互動(dòng)效果。    

以下為羅亮的演講實(shí)錄:

尊敬的各位嘉賓大家好!我是來(lái)自作業(yè)幫的羅亮,今天分享主題是《后疫情時(shí)代作業(yè)幫在教育科技的探索》。我是在教育行業(yè)里面做技術(shù)的,其實(shí)可以看得出來(lái),在線教育的最大價(jià)值就是用科技的力量把知識(shí)分發(fā)到每一個(gè)有需求的學(xué)生身邊。

互聯(lián)網(wǎng)是什么?互聯(lián)網(wǎng)本質(zhì)是連接,它能打破時(shí)間、空間、地域、階層的限制,讓整個(gè)社會(huì)、整個(gè)信息得以連接。教育又是最不均衡的社會(huì)資源,通過(guò)技術(shù)我們可以把教育資源均衡地分發(fā)下去,所以技術(shù)的價(jià)值就是搭建起了把優(yōu)質(zhì)的教育資源放大、遷移、匹配的便捷管道。

為什么我們能做一個(gè)管道呢?在我看來(lái),作業(yè)幫在累計(jì)8億智能設(shè)備上被激活,每月連接用戶數(shù)超過(guò)1.7億,這樣的積累幫助我們?cè)诩夹g(shù)上持續(xù)提升。我們用科技來(lái)賦能教育,為教育普惠貢獻(xiàn)自己的一份力量,我們有60%的直播課的學(xué)員是來(lái)自三線及三線以下的城市與鄉(xiāng)村。

屏幕快照 2020-11-26 下午4.26.57.png疫情以來(lái),各地紛紛轉(zhuǎn)戰(zhàn)線上,在線教育被推到了風(fēng)口浪尖。作業(yè)幫也積極響應(yīng)政府號(hào)召,助力各地中小學(xué)生在線學(xué)習(xí)。疫情期間,我們開(kāi)設(shè)了春季免費(fèi)直播課,僅五周的時(shí)間就有3300萬(wàn)人次的學(xué)員參與了春季免費(fèi)直播課。同時(shí),我們還開(kāi)設(shè)了名師講堂公益課和針對(duì)高考的高考真題解析直播課。

屏幕快照 2020-11-26 下午4.27.07.png疫情來(lái)臨時(shí),大量的學(xué)生突然涌入在線教育。過(guò)往我們?cè)诰€直播課學(xué)員數(shù)量是百萬(wàn)級(jí)別,但今年已超過(guò)了3000萬(wàn),整個(gè)數(shù)量級(jí)乘了10倍,這其實(shí)對(duì)于做技術(shù)的人而言是一個(gè)非常大的挑戰(zhàn)。

這個(gè)時(shí)候怎么辦?坦白的說(shuō)就一個(gè)辦法,多加點(diǎn)服務(wù)器、多加點(diǎn)帶寬,但是加服務(wù)器和帶寬并不是那么容易。首先,需要基礎(chǔ)架構(gòu)能夠支撐增加服務(wù)器和帶寬;其次,需要在短時(shí)間內(nèi)找到供應(yīng)商,并讓其提供服務(wù)。這兩點(diǎn)都不是短時(shí)間內(nèi)可以做到的。

作業(yè)幫早在一年前就已經(jīng)從單一的云服務(wù)商變成了五家云服務(wù)商同時(shí)提供服務(wù),才能在短時(shí)間內(nèi)增加服務(wù)器和帶寬,才能比較從容地承接用戶的爆發(fā)。此外,直播技術(shù)也是我們的核心技術(shù)之一。我們用了將近一年半的時(shí)間搭建了一套自己的直播體系,在今年的免費(fèi)直播課中也發(fā)揮了應(yīng)有的作用。

直播課的兩大核心:基礎(chǔ)音視頻服務(wù)和AI視覺(jué)語(yǔ)音技術(shù)

后疫情時(shí)代對(duì)教育科技提出了更多要求和挑戰(zhàn)。比如,如何滿足更多形式的授課方式、如何更好地提升整個(gè)課程的互動(dòng)效果、如何真正有效地提升學(xué)習(xí)的效果。經(jīng)過(guò)疫情的大考我們開(kāi)始進(jìn)行自己的思考和探索,我們認(rèn)為技術(shù)是能做非常多的事情。

屏幕快照 2020-11-26 下午4.35.49.png整個(gè)直播課我認(rèn)為有兩個(gè)核心要點(diǎn),第一是直播技術(shù)本身,基于Web RTC的行業(yè)協(xié)議我們自研了一套直播架構(gòu)體系,讓分布在全國(guó)各地的師生通過(guò)直播網(wǎng)絡(luò)穩(wěn)定的連接在一起。我們的直播課類型是多樣的,包括1對(duì)多的大班直播課、1對(duì)1的輔導(dǎo)課以及6人的小班課等等。6人小班課其實(shí)本質(zhì)上是一個(gè)大班,但是每一個(gè)學(xué)生的感受是在一個(gè)6人小班當(dāng)中上課。

我們的用戶覆蓋全國(guó)整個(gè)學(xué)生群體,這樣多形式的直播課,如何通過(guò)直播網(wǎng)絡(luò)將分布在全國(guó)各地的師生都穩(wěn)定的連接在一起呢?我們用了一年時(shí)間和云服務(wù)供應(yīng)商一起共建了遍布全國(guó)的節(jié)點(diǎn)網(wǎng)絡(luò),為老師和學(xué)生提供足夠清晰、足夠流暢、實(shí)時(shí)互動(dòng)的直播音視頻服務(wù)。

基礎(chǔ)的音視頻服務(wù)之外,在未來(lái)直播課中我們認(rèn)為會(huì)大放異彩的是AI技術(shù)。我們用AI做什么呢?就目前的行業(yè)技術(shù)而言,我們?cè)诮虒W(xué)領(lǐng)域應(yīng)用最多的是視覺(jué)技術(shù)和語(yǔ)音技術(shù)。

屏幕快照 2020-11-26 下午4.27.16.png以視覺(jué)技術(shù)為例,我們可以利用視覺(jué)技術(shù)對(duì)學(xué)生在課堂上的學(xué)習(xí)情況、表現(xiàn)情況進(jìn)行感知。通過(guò)視覺(jué)技術(shù)能夠幫助主講老師收集學(xué)生在課堂上的表現(xiàn)情況,包括注意力是否集中、是否有家人陪同、坐姿是否端正等。這些行為的識(shí)別、分析和匯總,能夠幫助主講老師及時(shí)了解所有學(xué)生的上課狀態(tài),比如內(nèi)容是否難度偏大,學(xué)生整體的接受度如何,是否需要著重講解或者是轉(zhuǎn)換講課方式。同時(shí)也能夠幫助輔導(dǎo)老師關(guān)注學(xué)生的學(xué)習(xí)行為。如學(xué)生狀態(tài)有異常,老師直接收通知,會(huì)提醒學(xué)生更好地投入到學(xué)習(xí)中去。學(xué)生在上課過(guò)程中,如果離屏幕太近,我們也會(huì)對(duì)他進(jìn)行提醒。

每節(jié)課結(jié)束后,我們會(huì)綜合匯總學(xué)生當(dāng)節(jié)課各種行為、注意力集中狀態(tài)、答疑情況等,智能分析的學(xué)生行為數(shù)據(jù),匯總后呈現(xiàn)給老師,老師基于這個(gè)完整的報(bào)告來(lái)評(píng)估自己教學(xué)情況,不斷提高自己的教學(xué)水平。

屏幕快照 2020-11-26 下午4.27.40.png另外一種形式是語(yǔ)音技術(shù),我們自研的AI語(yǔ)音技術(shù)提供了語(yǔ)音發(fā)彈幕的能力和服務(wù)。在小低年級(jí),孩子最自然的交互形式是說(shuō)話,學(xué)生們可以用語(yǔ)音發(fā)送自己的彈幕,這樣極大提升了學(xué)生在課堂當(dāng)中的參與感和積極性。而且在一些英語(yǔ)學(xué)科當(dāng)中,口語(yǔ)的讀寫、聽(tīng)寫能力都是非常重要的,我們也能通過(guò)AI技術(shù)對(duì)用戶的讀音的效果進(jìn)行評(píng)分,匯總到老師那里,可以讓老師和學(xué)生進(jìn)行反饋互動(dòng),你答得好不好、你答得怎么樣,這樣的技術(shù)在當(dāng)今的直播課里面、AI課里面大量使用。    

同時(shí),通過(guò)語(yǔ)音技術(shù)還能提升交互能力。我們有一種教學(xué)類型叫集體發(fā)言,六個(gè)學(xué)生針對(duì)老師提出的問(wèn)題一起來(lái)發(fā)言,這個(gè)時(shí)候我們會(huì)發(fā)現(xiàn)一個(gè)問(wèn)題,每個(gè)學(xué)生既要聽(tīng)得見(jiàn)同學(xué)們的聲音,還要不被發(fā)出來(lái)的聲音回聲所干擾,這需要大量噪音消除、回聲消除的技術(shù),讓同組學(xué)生,也讓老師能聽(tīng)到學(xué)生們的清晰發(fā)言。

所以其實(shí)我們可以看到直播課技術(shù)的兩大核心,一是基本的音視頻傳輸能力和互動(dòng)能力,二是利用AI技術(shù)提升學(xué)生課堂中的互動(dòng)效果。    

 AI技術(shù)是算法、模型和數(shù)據(jù)的結(jié)合體

其實(shí)AI是什么呢?AI是算法、模型和數(shù)據(jù)的結(jié)合體,我們?cè)谶@上面的成果,源于作業(yè)幫長(zhǎng)期的技術(shù)和數(shù)據(jù)積累,尤其是在作業(yè)幫拍照搜題這個(gè)場(chǎng)景下的不斷探索。

作業(yè)幫APP是中國(guó)全網(wǎng)流量里面APP活躍度TOP30的教育類APP,我們的月活過(guò)億。在這5年的過(guò)程里面,我們累積了20000TB的學(xué)習(xí)數(shù)據(jù),同時(shí)也積累了超過(guò)2.5億的行業(yè)題庫(kù)。

疫情期間,對(duì)拍照搜題業(yè)務(wù)也提出了新的挑戰(zhàn)。過(guò)去對(duì)著書(shū)本或者手寫的文字,疫情期間出現(xiàn)了很多對(duì)著屏幕拍照的需求,增加了對(duì)識(shí)別技術(shù)的要求。比如電腦屏幕有閃爍,有摩爾紋,有反光,這些新情況,需要不斷的去迭代和優(yōu)化,盡可能的去提升用戶搜索的準(zhǔn)確率和召回率。

拍照搜題是作業(yè)幫積累最久的一個(gè)技術(shù),經(jīng)過(guò)5年多不斷的迭代和創(chuàng)新以及積累,目前已經(jīng)是一個(gè)結(jié)合神經(jīng)網(wǎng)絡(luò),集群化的識(shí)別引擎。我們?cè)?年前拍一道題得到它的答案大概可能要七八秒鐘的時(shí)間,但是到了今天通過(guò)不斷提升的神經(jīng)網(wǎng)絡(luò),我們能做到在200ms內(nèi)完成識(shí)別解析,然后從包含2.5億個(gè)題目的搜索引擎里匹配到最佳的結(jié)果。 

其實(shí)在這個(gè)過(guò)程中我們經(jīng)歷了非常多的挑戰(zhàn),從最開(kāi)始的準(zhǔn)確率低到令人發(fā)指,到今天我們能應(yīng)對(duì)模糊、傾斜、干擾各種低像素的相機(jī),很多用戶的設(shè)備是拿著家長(zhǎng)淘汰下來(lái)的舊手機(jī)、老手機(jī),像素低、內(nèi)存小,拍出來(lái)的質(zhì)量參差不齊。

長(zhǎng)期面對(duì)這種低像素、模糊、傾斜、干擾等等的輸入,倒逼我們?nèi)ゲ粩嗟奶嵘R(shí)別的效果,也幫助我們積累了大量的寶貴數(shù)據(jù),提升了模型的能力,形成一個(gè)正向循環(huán)。通過(guò)不斷的積累在AI方面的技術(shù)能力,我們也把這些能力應(yīng)用到了更多的場(chǎng)景中去,提供更好的產(chǎn)品,比如整頁(yè)拍搜、自動(dòng)批改,自動(dòng)答題等功能。

我們?cè)谶@個(gè)過(guò)程中能看到技術(shù)對(duì)在線教育起非常大的促進(jìn)作用,在疫情的沖擊下,各行各業(yè)都起了很多的變化。在線教育在后疫情時(shí)代被推上了歷史的舞臺(tái),中央也在“十四五”的規(guī)劃里面提出要建設(shè)高質(zhì)量的教育體系。在線教育不僅可以促進(jìn)教育普惠,推動(dòng)教育均衡發(fā)展,還可以激發(fā)優(yōu)質(zhì)教育新供給,推動(dòng)中國(guó)教育邁向數(shù)字化、智能化、個(gè)性化的新臺(tái)階。

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點(diǎn)擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。
來(lái)源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 【GET2020】作業(yè)幫羅亮:基礎(chǔ)音視頻服務(wù)和AI視覺(jué)語(yǔ)音是直播課技術(shù)兩大核心分享二維碼