芥末堆芥末堆

【GET2020】作業(yè)幫羅亮:基礎音視頻服務和AI視覺語音是直播課技術兩大核心

作者:李海顏 發(fā)布時間:

【GET2020】作業(yè)幫羅亮:基礎音視頻服務和AI視覺語音是直播課技術兩大核心

作者:李海顏 發(fā)布時間:

摘要:教育科技就是把優(yōu)質(zhì)的教育資源放大、遷移、匹配的便捷管道。

WechatIMG332.jpg

作業(yè)幫副總裁羅亮在做“后疫情時代作業(yè)幫對教育科技的探索”的主題分享

芥末堆 11月26日 李海顏 報道

11月24日,在“或躍在淵:教育的信心與發(fā)展”芥末堆GET2020教育科技大會上,作業(yè)幫副總裁羅亮帶來了“后疫情時代作業(yè)幫對教育科技的探索”的主題分享。

他表示,在線教育的最大價值是在于用科技的力量,把知識分發(fā)到每一個有需要的學生身邊,而教育科技就是把優(yōu)質(zhì)的教育資源放大、遷移、匹配的便捷管道。就直播技術而言有兩大核心,一是基本的音視頻傳輸能力和互動能力,二是利用AI技術提升學生課堂中的互動效果。    

以下為羅亮的演講實錄:

尊敬的各位嘉賓大家好!我是來自作業(yè)幫的羅亮,今天分享主題是《后疫情時代作業(yè)幫在教育科技的探索》。我是在教育行業(yè)里面做技術的,其實可以看得出來,在線教育的最大價值就是用科技的力量把知識分發(fā)到每一個有需求的學生身邊。

互聯(lián)網(wǎng)是什么?互聯(lián)網(wǎng)本質(zhì)是連接,它能打破時間、空間、地域、階層的限制,讓整個社會、整個信息得以連接。教育又是最不均衡的社會資源,通過技術我們可以把教育資源均衡地分發(fā)下去,所以技術的價值就是搭建起了把優(yōu)質(zhì)的教育資源放大、遷移、匹配的便捷管道。

為什么我們能做一個管道呢?在我看來,作業(yè)幫在累計8億智能設備上被激活,每月連接用戶數(shù)超過1.7億,這樣的積累幫助我們在技術上持續(xù)提升。我們用科技來賦能教育,為教育普惠貢獻自己的一份力量,我們有60%的直播課的學員是來自三線及三線以下的城市與鄉(xiāng)村。

屏幕快照 2020-11-26 下午4.26.57.png疫情以來,各地紛紛轉(zhuǎn)戰(zhàn)線上,在線教育被推到了風口浪尖。作業(yè)幫也積極響應政府號召,助力各地中小學生在線學習。疫情期間,我們開設了春季免費直播課,僅五周的時間就有3300萬人次的學員參與了春季免費直播課。同時,我們還開設了名師講堂公益課和針對高考的高考真題解析直播課。

屏幕快照 2020-11-26 下午4.27.07.png疫情來臨時,大量的學生突然涌入在線教育。過往我們在線直播課學員數(shù)量是百萬級別,但今年已超過了3000萬,整個數(shù)量級乘了10倍,這其實對于做技術的人而言是一個非常大的挑戰(zhàn)。

這個時候怎么辦?坦白的說就一個辦法,多加點服務器、多加點帶寬,但是加服務器和帶寬并不是那么容易。首先,需要基礎架構能夠支撐增加服務器和帶寬;其次,需要在短時間內(nèi)找到供應商,并讓其提供服務。這兩點都不是短時間內(nèi)可以做到的。

作業(yè)幫早在一年前就已經(jīng)從單一的云服務商變成了五家云服務商同時提供服務,才能在短時間內(nèi)增加服務器和帶寬,才能比較從容地承接用戶的爆發(fā)。此外,直播技術也是我們的核心技術之一。我們用了將近一年半的時間搭建了一套自己的直播體系,在今年的免費直播課中也發(fā)揮了應有的作用。

直播課的兩大核心:基礎音視頻服務和AI視覺語音技術

后疫情時代對教育科技提出了更多要求和挑戰(zhàn)。比如,如何滿足更多形式的授課方式、如何更好地提升整個課程的互動效果、如何真正有效地提升學習的效果。經(jīng)過疫情的大考我們開始進行自己的思考和探索,我們認為技術是能做非常多的事情。

屏幕快照 2020-11-26 下午4.35.49.png整個直播課我認為有兩個核心要點,第一是直播技術本身,基于Web RTC的行業(yè)協(xié)議我們自研了一套直播架構體系,讓分布在全國各地的師生通過直播網(wǎng)絡穩(wěn)定的連接在一起。我們的直播課類型是多樣的,包括1對多的大班直播課、1對1的輔導課以及6人的小班課等等。6人小班課其實本質(zhì)上是一個大班,但是每一個學生的感受是在一個6人小班當中上課。

我們的用戶覆蓋全國整個學生群體,這樣多形式的直播課,如何通過直播網(wǎng)絡將分布在全國各地的師生都穩(wěn)定的連接在一起呢?我們用了一年時間和云服務供應商一起共建了遍布全國的節(jié)點網(wǎng)絡,為老師和學生提供足夠清晰、足夠流暢、實時互動的直播音視頻服務。

基礎的音視頻服務之外,在未來直播課中我們認為會大放異彩的是AI技術。我們用AI做什么呢?就目前的行業(yè)技術而言,我們在教學領域應用最多的是視覺技術和語音技術。

屏幕快照 2020-11-26 下午4.27.16.png以視覺技術為例,我們可以利用視覺技術對學生在課堂上的學習情況、表現(xiàn)情況進行感知。通過視覺技術能夠幫助主講老師收集學生在課堂上的表現(xiàn)情況,包括注意力是否集中、是否有家人陪同、坐姿是否端正等。這些行為的識別、分析和匯總,能夠幫助主講老師及時了解所有學生的上課狀態(tài),比如內(nèi)容是否難度偏大,學生整體的接受度如何,是否需要著重講解或者是轉(zhuǎn)換講課方式。同時也能夠幫助輔導老師關注學生的學習行為。如學生狀態(tài)有異常,老師直接收通知,會提醒學生更好地投入到學習中去。學生在上課過程中,如果離屏幕太近,我們也會對他進行提醒。

每節(jié)課結(jié)束后,我們會綜合匯總學生當節(jié)課各種行為、注意力集中狀態(tài)、答疑情況等,智能分析的學生行為數(shù)據(jù),匯總后呈現(xiàn)給老師,老師基于這個完整的報告來評估自己教學情況,不斷提高自己的教學水平。

屏幕快照 2020-11-26 下午4.27.40.png另外一種形式是語音技術,我們自研的AI語音技術提供了語音發(fā)彈幕的能力和服務。在小低年級,孩子最自然的交互形式是說話,學生們可以用語音發(fā)送自己的彈幕,這樣極大提升了學生在課堂當中的參與感和積極性。而且在一些英語學科當中,口語的讀寫、聽寫能力都是非常重要的,我們也能通過AI技術對用戶的讀音的效果進行評分,匯總到老師那里,可以讓老師和學生進行反饋互動,你答得好不好、你答得怎么樣,這樣的技術在當今的直播課里面、AI課里面大量使用。    

同時,通過語音技術還能提升交互能力。我們有一種教學類型叫集體發(fā)言,六個學生針對老師提出的問題一起來發(fā)言,這個時候我們會發(fā)現(xiàn)一個問題,每個學生既要聽得見同學們的聲音,還要不被發(fā)出來的聲音回聲所干擾,這需要大量噪音消除、回聲消除的技術,讓同組學生,也讓老師能聽到學生們的清晰發(fā)言。

所以其實我們可以看到直播課技術的兩大核心,一是基本的音視頻傳輸能力和互動能力,二是利用AI技術提升學生課堂中的互動效果。    

 AI技術是算法、模型和數(shù)據(jù)的結(jié)合體

其實AI是什么呢?AI是算法、模型和數(shù)據(jù)的結(jié)合體,我們在這上面的成果,源于作業(yè)幫長期的技術和數(shù)據(jù)積累,尤其是在作業(yè)幫拍照搜題這個場景下的不斷探索。

作業(yè)幫APP是中國全網(wǎng)流量里面APP活躍度TOP30的教育類APP,我們的月活過億。在這5年的過程里面,我們累積了20000TB的學習數(shù)據(jù),同時也積累了超過2.5億的行業(yè)題庫。

疫情期間,對拍照搜題業(yè)務也提出了新的挑戰(zhàn)。過去對著書本或者手寫的文字,疫情期間出現(xiàn)了很多對著屏幕拍照的需求,增加了對識別技術的要求。比如電腦屏幕有閃爍,有摩爾紋,有反光,這些新情況,需要不斷的去迭代和優(yōu)化,盡可能的去提升用戶搜索的準確率和召回率。

拍照搜題是作業(yè)幫積累最久的一個技術,經(jīng)過5年多不斷的迭代和創(chuàng)新以及積累,目前已經(jīng)是一個結(jié)合神經(jīng)網(wǎng)絡,集群化的識別引擎。我們在5年前拍一道題得到它的答案大概可能要七八秒鐘的時間,但是到了今天通過不斷提升的神經(jīng)網(wǎng)絡,我們能做到在200ms內(nèi)完成識別解析,然后從包含2.5億個題目的搜索引擎里匹配到最佳的結(jié)果。 

其實在這個過程中我們經(jīng)歷了非常多的挑戰(zhàn),從最開始的準確率低到令人發(fā)指,到今天我們能應對模糊、傾斜、干擾各種低像素的相機,很多用戶的設備是拿著家長淘汰下來的舊手機、老手機,像素低、內(nèi)存小,拍出來的質(zhì)量參差不齊。

長期面對這種低像素、模糊、傾斜、干擾等等的輸入,倒逼我們?nèi)ゲ粩嗟奶嵘R別的效果,也幫助我們積累了大量的寶貴數(shù)據(jù),提升了模型的能力,形成一個正向循環(huán)。通過不斷的積累在AI方面的技術能力,我們也把這些能力應用到了更多的場景中去,提供更好的產(chǎn)品,比如整頁拍搜、自動批改,自動答題等功能。

我們在這個過程中能看到技術對在線教育起非常大的促進作用,在疫情的沖擊下,各行各業(yè)都起了很多的變化。在線教育在后疫情時代被推上了歷史的舞臺,中央也在“十四五”的規(guī)劃里面提出要建設高質(zhì)量的教育體系。在線教育不僅可以促進教育普惠,推動教育均衡發(fā)展,還可以激發(fā)優(yōu)質(zhì)教育新供給,推動中國教育邁向數(shù)字化、智能化、個性化的新臺階。

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源: 芥末堆
芥末堆商務合作:王老師 18710003484
  • 【GET2020】作業(yè)幫羅亮:基礎音視頻服務和AI視覺語音是直播課技術兩大核心分享二維碼