芥末堆芥末堆

DL研討會(huì):深度學(xué)習(xí)和在線教育有什么關(guān)系?

作者:芥末堆 發(fā)布時(shí)間:

DL研討會(huì):深度學(xué)習(xí)和在線教育有什么關(guān)系?

作者:芥末堆 發(fā)布時(shí)間:

摘要: 如果你關(guān)注在線教育,可能多少都會(huì)聽(tīng)到些與“Deep Learning(深度學(xué)習(xí))”相關(guān)的東西……但即便是看到學(xué)習(xí)二字,也請(qǐng)務(wù)必先冷靜下來(lái)!

如果你關(guān)注在線教育,可能多少都會(huì)聽(tīng)到些與“Deep Learning(深度學(xué)習(xí))”相關(guān)的東西……但即便是看到學(xué)習(xí)二字,也請(qǐng)務(wù)必先冷靜下來(lái)!深度學(xué)習(xí)概念源于人工神經(jīng)網(wǎng)絡(luò)的研究,是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù),例如圖像,聲音和文本。

追溯深度學(xué)習(xí)如何成為教育圈的熱門(mén)詞匯,要回到2014年5月:Coursera的聯(lián)合創(chuàng)始人吳恩達(dá)(Andrew Ng)加入百度擔(dān)任首席科學(xué)家,并負(fù)責(zé)百度研究院的領(lǐng)導(dǎo)工作。由于Ng本人擁有“機(jī)器學(xué)習(xí)和人工智能領(lǐng)域國(guó)際最權(quán)威學(xué)者之一”的神秘光環(huán),“深度學(xué)習(xí)”又作為這個(gè)領(lǐng)域的重點(diǎn)研究之一,配以Coursera的標(biāo)簽,教育圈迅速迎來(lái)了一股不明覺(jué)厲的科技風(fēng)。芥末堆也曾有作者與大家分享有關(guān)機(jī)器學(xué)習(xí)的硬干貨,只是在當(dāng)時(shí)與之討論的寥寥無(wú)幾。

因?yàn)樵S多人都還在困惑:深度學(xué)習(xí)和我們傳統(tǒng)意義上的教育培訓(xùn)有什么關(guān)系?

于是在2014年底,好未來(lái)-未來(lái)之星發(fā)起了一場(chǎng)“深度學(xué)習(xí)研討會(huì)”,邀請(qǐng)到百度深度學(xué)習(xí)研究院院長(zhǎng)的余凱、神馬搜索架構(gòu)師張棟、云知聲創(chuàng)始人兼CTO梁家恩三位老師到場(chǎng)分享。

以下為精華摘要:

余凱:深度學(xué)習(xí)為什么重要?

今天是一個(gè)智能時(shí)代,我們可以看到各式各樣的產(chǎn)品,像智能手機(jī)、手表、手環(huán)、冰箱等產(chǎn)品。但是否真的智能?或者它只是一個(gè)商業(yè)模式?我們需要去判斷。但是我們發(fā)現(xiàn)絕大部分的東西跟過(guò)去的老式收音機(jī)差不多,都是事先編好指令,它便可以自己完成工作。但是這個(gè)過(guò)程并沒(méi)有它自己的思考。唯一不同的是,之前的程序不是用電腦程序代碼來(lái)寫(xiě)的,可能用機(jī)械或者是電路做的。

人工智能就像我們?nèi)艘粯佑醒劬τ形骞?,可以感知周?chē)沫h(huán)境,可以對(duì)環(huán)境進(jìn)行理解和思考,最后達(dá)到目的。這個(gè)思考的結(jié)果,就是決策控制,是人工智能的最重要的核心。那么深度學(xué)習(xí)能為什么重要?

第一,它模擬了仿真的大腦的結(jié)構(gòu)和行為。在連接人和服務(wù)的通路上扮演非常好的角色。

第二,Deep Learning特別的適合大數(shù)據(jù)。由于模型和計(jì)算的原因,它的數(shù)據(jù)規(guī)模不斷的增加,效果不斷的變好,所以它要是一個(gè)很寬的管道,數(shù)據(jù)才可以進(jìn)來(lái)更多信息可以出來(lái)更多。

第三,Deep Learning它提供了一個(gè)非常靈活的建模語(yǔ)言。很多人認(rèn)為Deep Learning是一個(gè)黑箱系統(tǒng),但是它實(shí)際上是提供了一個(gè)框架,就像一個(gè)語(yǔ)言。機(jī)器學(xué)習(xí)也是這樣的,不只是懂?dāng)?shù)學(xué)就好,要學(xué)會(huì)運(yùn)用這個(gè)工具。并且它帶來(lái)的語(yǔ)言框架在不同的模型里面都可以針對(duì)性的解決問(wèn)題。

第四,圖象和語(yǔ)言的聯(lián)合的處理。因?yàn)槲覀內(nèi)嗣繒r(shí)每刻都是語(yǔ)音和圖象同時(shí)處理的。比如我們看到一個(gè)圖象,不僅要描述有什么物體,還要描述發(fā)生的故事。但是現(xiàn)在,用Deep Learning的程序就會(huì)自動(dòng)生成,它可以像人一樣生成自然語(yǔ)言,而且可以描述圖象發(fā)生的故事。比如用一個(gè)基于CNN的深度神經(jīng)網(wǎng)絡(luò),中間會(huì)有一個(gè)中間層,上面的是基于語(yǔ)言的深層模型,那么它便可以從當(dāng)前的Word,生成下一個(gè)Word。

總的來(lái)說(shuō),Deep Learning在很多領(lǐng)域里面都可以取得很大的進(jìn)展,最主要三個(gè)方面:1、大數(shù)據(jù)。2、計(jì)算能力。3、算法的提升。

梁家恩:深度學(xué)習(xí)與在線教育有什么關(guān)系?

深度學(xué)習(xí)現(xiàn)在可以看到在整個(gè)感知智能上應(yīng)用是非常成功的。在座有CEO也有CTO我是一個(gè)當(dāng)過(guò)CEO的CTO,作為CEO我們關(guān)注是這個(gè)東西有什么用,大概是什么概念?云知聲作為一個(gè)創(chuàng)業(yè)不到三年時(shí)間的公司,我們?cè)谶@方面也做了一些深度學(xué)習(xí)的一些技術(shù),同時(shí)也取得比較好的效果。我們也是國(guó)內(nèi)比較早一批把深度學(xué)習(xí)網(wǎng)絡(luò)學(xué)習(xí)運(yùn)用在工藝應(yīng)用的東西。當(dāng)時(shí)他們還很懷疑我們這么小的公司可以做這個(gè)事情。我們回過(guò)頭來(lái)看這個(gè)是人性嘛,這個(gè)詞可以表達(dá)這個(gè)意思。

在線教育里面有很多,包括K12的體系,還有社會(huì)化的體系,在我們所有的學(xué)習(xí)里面跟語(yǔ)音識(shí)別技術(shù)關(guān)聯(lián)最強(qiáng)的是我們?cè)趺从梦覀兊募夹g(shù)幫助學(xué)生學(xué)習(xí)英語(yǔ)學(xué)習(xí),培養(yǎng)漢語(yǔ)普通話以及幫老外學(xué)習(xí)語(yǔ)言,這是我們做的嘗試。大家也可以看到,這是比較經(jīng)典的一種流程,比如說(shuō)有了一些這種語(yǔ)音過(guò)來(lái)以后,我們就把這個(gè)語(yǔ)音跟它所說(shuō)的內(nèi)容給它對(duì)齊起來(lái),對(duì)齊之后在發(fā)音在流利方面的一些特征。比如說(shuō)它在讀一個(gè)句子我們是清楚的,但是要把它說(shuō)話的內(nèi)容把這個(gè)聲音對(duì)齊起來(lái),我們才知道這個(gè)學(xué)生它的發(fā)音跟我們有沒(méi)有偏差,或者是說(shuō)它有沒(méi)有足夠流利,這個(gè)就可以分辨口音口語(yǔ)的質(zhì)量。

大家做在線教育,我雖然做過(guò)幾年,現(xiàn)在基本上從教育角度來(lái)說(shuō)我還是門(mén)外漢還是被教育的對(duì)象。在90年代的時(shí)候出現(xiàn)一些網(wǎng)校做遠(yuǎn)程教育,這個(gè)也不是特別的紅火,2000年的時(shí)候很多的培訓(xùn)轉(zhuǎn)到網(wǎng)上來(lái)了。到2011年的時(shí)候很多互聯(lián)網(wǎng)的巨頭都在發(fā)力的一塊。很多PC以前會(huì)用電腦的人不多,現(xiàn)在基本上人手一部手機(jī),又有計(jì)算能力又可以上網(wǎng),所以中國(guó)有六個(gè)多億的網(wǎng)民,移動(dòng)網(wǎng)民超過(guò)五個(gè)億,有非常多的用戶在上面,在線教育就成為非常火熱的點(diǎn),我們?cè)谕顿Y圈也有非常多的風(fēng)投,巨頭阿里巴巴也在投這一塊,不管他們是直接做,還是投資去做,這個(gè)未來(lái)是非常大的增長(zhǎng)點(diǎn),這個(gè)是我們今天開(kāi)這個(gè)會(huì)的時(shí)候,這里面有很多老師琢磨這個(gè)事情,確實(shí)這個(gè)也是在一個(gè)風(fēng)口上面。

關(guān)于深度學(xué)習(xí)和在線教育里面其他應(yīng)用的探討,學(xué)霸君的老師他們是做這一塊的拍照方面擅長(zhǎng)的事情,圖片收集是他們擅長(zhǎng)的業(yè)務(wù)之一。在題海里面能有一個(gè)題海的神器,拍照可以把答案找到。還有題庫(kù)的標(biāo)注,特別是內(nèi)容里面的谷歌的標(biāo)注,因?yàn)榭赡艽蠹曳e累的歷史的數(shù)據(jù)比較多了,以前是紙質(zhì)的,掃描以后還要把這個(gè)題庫(kù)建立起來(lái),還有機(jī)器人聊天。如果做開(kāi)放式的聊天的話,它完全不可能。在英語(yǔ)的話,在特定的場(chǎng)景下,買(mǎi)東西,問(wèn)一個(gè)天氣啊,這個(gè)學(xué)生學(xué)習(xí)的時(shí)間有限的話,通過(guò)對(duì)話把這個(gè)互動(dòng)建立起來(lái),這個(gè)可能會(huì)做的好玩一點(diǎn)。

不過(guò)最后一點(diǎn)是比較科幻了,可能是十年之后的事情。

張棟:深度學(xué)習(xí)的延伸在哪里?

首先是一個(gè)小故事,就是林彪打仗的時(shí)候總是勝利是因?yàn)樗P(guān)注數(shù)據(jù)。比如說(shuō)每一次戰(zhàn)役他會(huì)讓大家統(tǒng)計(jì)繳獲的長(zhǎng)槍的比例,通過(guò)三個(gè)問(wèn)題就可以判斷敵軍。大家有一點(diǎn)統(tǒng)計(jì)學(xué)的概念就知道這三個(gè)問(wèn)題是機(jī)器學(xué)習(xí)的三個(gè)特征:要有一些數(shù)據(jù),通過(guò)數(shù)據(jù)做特征,通過(guò)特征做判斷。這三個(gè)是通過(guò)特征做一個(gè)判斷,這個(gè)判斷是一個(gè)分類(lèi)器。為什么是大數(shù)據(jù)時(shí)代呢?現(xiàn)在的數(shù)據(jù)量每人每天獲得的數(shù)據(jù)量是當(dāng)年亞歷山大圖書(shū)館的數(shù)據(jù)量?;ヂ?lián)網(wǎng)本質(zhì)上是什么?互聯(lián)網(wǎng)本質(zhì)上在我來(lái)看實(shí)際上把各式各樣的線下的數(shù)據(jù)搬到線上。新浪就是把新聞數(shù)據(jù)從線下搬到線上。再往后就是電商,電商是把產(chǎn)品搬到線上。O2O是把服務(wù)線下搬到線上。所以這個(gè)數(shù)據(jù)是導(dǎo)致是爆炸的增長(zhǎng),互聯(lián)網(wǎng)一天產(chǎn)生的數(shù)據(jù)一天可以刻1.68億郵件,所以是很大的數(shù)據(jù)。

大家認(rèn)為大數(shù)據(jù)就成為了一個(gè)類(lèi)似于石油礦山類(lèi)的資源,那怎么去挖掘這個(gè)資源?2013年被稱(chēng)為大數(shù)據(jù)元年,甚至上升為政府的高度,美國(guó)政府把這六個(gè)部門(mén)聚集起來(lái),制定了一個(gè)大數(shù)據(jù)研究發(fā)展倡議書(shū)。這個(gè)圖是給了大家一個(gè)整體的一個(gè)大數(shù)據(jù)的這么一個(gè)應(yīng)用的藍(lán)圖,左邊一些是所有各式各樣你能夠采集的數(shù)據(jù)(而且我認(rèn)為萬(wàn)物皆數(shù),即萬(wàn)世萬(wàn)物都可以用數(shù)據(jù)表征的。這個(gè)話不是我說(shuō)的,最早是這個(gè)學(xué)派說(shuō)的這句話)。然后右邊就是這個(gè)各個(gè)行業(yè)應(yīng)用,大家可以看到這個(gè)大數(shù)據(jù)在電子商務(wù)、醫(yī)療、軍事、創(chuàng)意、廣告。一邊是數(shù)據(jù)源,一邊是應(yīng)用。

但在各種應(yīng)用當(dāng)中,它回到機(jī)器學(xué)習(xí)的算法是哪類(lèi)算法?我對(duì)大數(shù)據(jù)有一點(diǎn)思考,這個(gè)是我以前寫(xiě)的一個(gè)微博其實(shí)本質(zhì)上互聯(lián)網(wǎng)所有的公司都是大數(shù)據(jù)公司。你想想BAT百度是網(wǎng)頁(yè)和用戶搜索數(shù)據(jù),阿里巴巴是最大的電商數(shù)據(jù),騰訊是人的最大的交互交流溝通數(shù)據(jù),這個(gè)做大的公司都是大數(shù)據(jù)公司。因?yàn)樗麄冏钪匾馁Y產(chǎn)都是數(shù)據(jù)資產(chǎn)。這些公司有一個(gè)共同點(diǎn)在初期商業(yè)模式都有一個(gè)摸索過(guò)程。為什么早期的時(shí)候沒(méi)有商業(yè)模式,因?yàn)樗?guī)模沒(méi)有到達(dá)一定的點(diǎn),所以就沒(méi)有商業(yè)模式。百度之所以上百億網(wǎng)頁(yè)的時(shí)候就沒(méi)有商業(yè)模式,但是作為一個(gè)小公司就沒(méi)有一個(gè)商業(yè)模式。當(dāng)你的用戶數(shù)和你的數(shù)據(jù)到達(dá)一定的規(guī)模的時(shí)候,這個(gè)商業(yè)模式自然而然就出來(lái)了。如果你想做大數(shù)據(jù)相關(guān)的應(yīng)用要在大公司,因?yàn)榇蠊疽呀?jīng)有這樣的平臺(tái)和數(shù)據(jù)了。

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點(diǎn)擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車(chē)馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫(xiě)信息告訴我們。
來(lái)源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • DL研討會(huì):深度學(xué)習(xí)和在線教育有什么關(guān)系?分享二維碼