(圖片來源:pixabay)
本文經(jīng)機器之心(微信公眾號:almosthuman2014)授權(quán)轉(zhuǎn)載,禁止二次轉(zhuǎn)載。文章選自高盛報告,由機器之心編譯。
不久之前,高盛推出了一份講解人工智能生態(tài)的重磅報告(共 99 頁)。報告從最基本的人工智能概念開始,主要內(nèi)容包括人工智能所能變革的行業(yè)、人工智能生態(tài)、使用案例、背后的主要驅(qū)動者(谷歌、亞馬遜、英偉達、百度等)等,并附有高盛調(diào)查得到的 150 多家人工智能與機器學習公司列表。機器之心編譯了報告的主要部分。
人工智能(AI)是信息時代的尖端技術(shù)。在最新的「創(chuàng)新簡介」(Profiles in Innovation)系列文章中,我們將對機器學習和深度學習的進展進行研究考察。
在和更強大的計算資源以及不斷擴增的數(shù)據(jù)結(jié)合以后,一些非相關(guān)行業(yè)的公司也能夠接觸到人工智能了。AI-as-a-service 的發(fā)展有可能開辟一塊新的市場并打破云計算的市場。我們相信,在接下來幾年,一個公司利用人工智能技術(shù)的能力將成為體現(xiàn)公司競爭力的一個屬性,同時這種能力也將帶來生產(chǎn)率的復蘇。
人工智能是信息時代的尖端技術(shù)。從人類建立起需要指導控制才能運行的計算機,到計算機擁有可以自己去學習的能力,這一飛躍對各行各業(yè)都產(chǎn)生了巨大的影響。雖然此時此刻可能是下一個 AI 冬季(圖8)到來之前的「給予承諾又讓人失望」的周期,但這些投資和新技術(shù)至少會給我們帶來有形的機器學習生產(chǎn)力的經(jīng)濟利益。
與此同時,人工智能、機器人和無人駕駛汽車已經(jīng)成為了流行文化甚至是政治話語的前沿。而且我們在過去一年的研究使我們相信這不是一個錯誤的開始,而是一個拐點。正如我們將在本報告中探討的那樣,這個變化的原因有顯而易見的(更快更強的計算資源和爆炸式增長的數(shù)據(jù)庫),也有細致入微(深度學習,專有硬件和開源的崛起)的。
這個 AI 拐點(AI inflection)中更令人興奮的一個方面是「現(xiàn)實世界」的使用案例比比皆是。雖然深度學習使計算機視覺和自然語言處理等技術(shù)有了顯著的提高,比如蘋果公司的 Siri,亞馬遜的 Alexa 和 Google 的圖像識別,但是 AI 不僅僅是「科技技術(shù)」(tech for tech),也就是大數(shù)據(jù)集與足夠強大的技術(shù)相結(jié)合的情況下,價值正在被慢慢創(chuàng)建,競爭優(yōu)勢也變得越來越明顯。
例如,在醫(yī)療保健中,圖像識別技術(shù)可以提高癌癥診斷的準確性。在農(nóng)業(yè)中,農(nóng)民和種子生產(chǎn)商可以利用深度學習技術(shù)來提高作物產(chǎn)量。在制藥業(yè)中,深度學習可以用于改善藥物的研發(fā)。在能源方面,勘探效率正在提高,設(shè)備可用性正在不斷增強。在金融服務(wù)方面,通過開辟新的數(shù)據(jù)集,實現(xiàn)更快的分析,從而降低成本,提高回報。AI 現(xiàn)在還處于發(fā)現(xiàn)其可被利用場景的早期階段,這些必要的技術(shù)會通過基于云的服務(wù)實現(xiàn)大眾化、平等化,我們相信隨之而來的創(chuàng)新浪潮將在每個行業(yè)中創(chuàng)造新的贏家和輸家。
AI 的廣泛應(yīng)用讓我們得出了一個結(jié)論:它是一種可以變革全球經(jīng)濟的技術(shù),是提高生產(chǎn)力并結(jié)束美國生產(chǎn)率停滯增長的驅(qū)動力。結(jié)合 GS 首席經(jīng)濟學家 Jan Hatzius 的研究,我們明確了資本深化目前的停滯及其對美國生產(chǎn)率的相關(guān)影響。我們相信,AI 技術(shù)將會驅(qū)動生產(chǎn)力的提高,就像 20 世紀 90 年代那樣,驅(qū)動企業(yè)投資更多的資本和勞動密集型項目,加快發(fā)展的腳步,提高盈利能力以及提高股票的估值。
啟示
雖然我們看到了人工智能可以及時地影響到每個公司、行業(yè)和一部分經(jīng)濟,但對投資者而言,我們認為這其中有四個影響最為顯著。
生產(chǎn)率。AI 和機器學習具有激發(fā)生產(chǎn)率增長周期的潛力,這會有利于經(jīng)濟的增長,提升企業(yè)的盈利能力,資本回報率和資產(chǎn)估值。根據(jù) GS 首席經(jīng)濟學家 Jan Hatzius 所說:「大體上而言,AI 看起來似乎比上一次創(chuàng)新浪潮更有可能在統(tǒng)計數(shù)據(jù)中捕捉到更有價值的東西,人工智能可以降低成本,減少對高附加值生產(chǎn)類型的勞動投入。舉個例子,這些在商業(yè)部門成本節(jié)約上的創(chuàng)新可能比在 iPhone 中增加應(yīng)用程序的可用性和多用性更利于統(tǒng)計學家去捕獲有價值的東西??紤]人工智能對商業(yè)部門的成本結(jié)構(gòu)的廣泛影響,我有理由相信它會被統(tǒng)計學家接受,并且會出現(xiàn)在整體生產(chǎn)力數(shù)據(jù)中。」
尖端技術(shù)。AI 和機器學習在速度上的價值有利于構(gòu)建一種在建設(shè)數(shù)據(jù)中心和網(wǎng)絡(luò)服務(wù)時讓硬件更便宜的趨勢。我們認為這可能推動硬件,軟件和服務(wù)支出的市場份額的大幅度改變。例如,在「標準」數(shù)據(jù)中心計算資源上運行的 AWS 工作負載的成本低至 $ 0.0065 /小時,而在使用 AI 優(yōu)化過的 GPU 上運行的成本為 0.900 美元一小時。
競爭優(yōu)勢。我們看到了 AI 和機器學習具有重新調(diào)整每個行業(yè)的競爭秩序的潛力。未能投資和利用這些技術(shù)的管理團隊在和受益于戰(zhàn)略智能的企業(yè)競爭時,有很大可能會被淘汰掉,因為這些技術(shù)可以讓企業(yè)的生產(chǎn)力提高,并為它們創(chuàng)造資本效益。在第 41 頁開始的短文中,我們將研究這些競爭優(yōu)勢是如何在醫(yī)療保健、能源、零售、金融和農(nóng)業(yè)等領(lǐng)域發(fā)展起來的。
創(chuàng)辦新公司。我們發(fā)現(xiàn)了 150 多家在過去十年中創(chuàng)建的人工智能和機器學習公司(附錄 69-75)。雖然我們相信人工智能的大部分價值都掌握在具有資源、數(shù)據(jù)和投資能力的大公司手中,但我們也期望風險投資家、企業(yè)家和技術(shù)專家可以繼續(xù)推動新公司的創(chuàng)立,從而促進實質(zhì)性的創(chuàng)新和價值創(chuàng)造,即使最后創(chuàng)業(yè)公司會被收購。當然我們也不能忽視人工智能巨頭(人工智能領(lǐng)域的谷歌或 Facebook)的出現(xiàn)。
在接下來的篇幅中,我們將深入探討 AI 的技術(shù),歷史,機器學習的生態(tài)系統(tǒng)以及這些技術(shù)在行業(yè)和領(lǐng)頭公司中的應(yīng)用。
什么是人工智能?
人工智能是做出能夠以人類智能的方式學習并解決問題的智能機器和計算機程序的理工科。傳統(tǒng)而言,該領(lǐng)域包括自然語言處理與翻譯、視覺感知與模式識別,以及決策制定。但該領(lǐng)域以及應(yīng)用的復雜度都在急劇擴展。
在此報告中,我們的大部分分析集中在機器學習(人工智能的一個分支)與深度學習(機器學習的分支)上。我們強調(diào)兩點:
簡言之,機器學習是從樣本和經(jīng)驗(即數(shù)據(jù)集)中進行學習的算法,而不是依靠硬編碼和預先定義的規(guī)則。換言之,也就是開發(fā)者不再告訴程序如何區(qū)分蘋果和橘子,而是向算法輸入數(shù)據(jù)(訓練),然后自己學習如何區(qū)分蘋果和橘子。
深度學習的重大發(fā)展是人工智能拐點背后的主要驅(qū)動。深度學習是機器學習的一個子集。在大部分傳統(tǒng)的機器學習方法中,特征(即有預測性的輸入或?qū)傩裕┯扇藖碓O(shè)計。特征工程是一大瓶頸,需要大量的專業(yè)知識。在無監(jiān)督學習中,重要特征并非由人預定義,而是由算法學習并創(chuàng)造。
為了更加明了,我們不注重真人工智能、強人工智能或通用人工智能這樣的概念,它們意味著復制人類智能,也經(jīng)常出現(xiàn)在流行文化中。雖然已經(jīng)有了一些有潛力的突破,比如谷歌 DeepMind 的 AlphaGo 系統(tǒng),我們還是更注重立即有實在經(jīng)濟的人工智能發(fā)展。
為何人工智能發(fā)展加速?
深度學習能力的極大發(fā)展是如今人工智能拐點背后的催化劑之一。深度學習的底層技術(shù)框架——神經(jīng)網(wǎng)絡(luò),已經(jīng)存在了數(shù)十年,但過去 5 到 10 年的 3 種東西改變了深度學習:
1. 數(shù)據(jù)。隨著全球設(shè)備、機器和系統(tǒng)的連接,大量的無結(jié)構(gòu)數(shù)據(jù)被創(chuàng)造出來。神經(jīng)網(wǎng)絡(luò)有了更多的數(shù)據(jù),就變得更為有效,也就是說隨著數(shù)據(jù)量增加,機器學習能夠解決的問題也增加。手機、IoT 、低成本數(shù)據(jù)存儲和處理(云)技術(shù)的成熟使得可用數(shù)據(jù)集的大小、結(jié)構(gòu)都有了極大增長。例如,特斯拉收集了 780mn 英里的駕駛數(shù)據(jù),而且通過他們的互連汽車,每 10 小時就能增加 100 萬英里的數(shù)據(jù)。此外,Jasper 有一個平臺,能讓多家汽車制造商和電信公司進行機器間的交流,這家公司于今年 2 月份被 Cisco 收購。Verizon 在 8 月份做了類似的投資,宣布收購 Fleetmatics,F(xiàn)leetmatics 做的是將汽車上的遠程傳感器通過無線網(wǎng)絡(luò)連接到云軟件。未來,5G 網(wǎng)絡(luò)的上線將會加速數(shù)據(jù)生成與傳輸?shù)乃俾?。?jù) IDC 的 Digital Universe Report 顯示,年度數(shù)據(jù)生成預期到 2020 年達到 44zettabytes,表明我們正在見證應(yīng)用這些技術(shù)的使用案例。
圖 1:年度數(shù)據(jù)生成預期到 2020 年達到 44zettabytes
2. 更快的硬件。GPU 的再次使用、低成本計算能力的普遍化,特別是通過云服務(wù),以及建立新的神經(jīng)網(wǎng)絡(luò)模型,已經(jīng)極大的增加了神經(jīng)網(wǎng)絡(luò)產(chǎn)生結(jié)果的速度與準確率。GPU 和并行架構(gòu)要比傳統(tǒng)的基于數(shù)據(jù)中心架構(gòu)的 CPU 能更快的訓練機器學習系統(tǒng)。通過使用圖像芯片,網(wǎng)絡(luò)能更快的迭代,能在短期內(nèi)進行更準確的訓練。同時,特制硅的發(fā)展,比如微軟和百度使用的 FPGA,能夠用訓練出的深度學習系統(tǒng)做更快的推斷。另外,從 1993 年開始超級計算機的原計算能力有了極大發(fā)展(圖 2)。在 2016 年,單張英偉達游戲顯卡就有了類似于 2002 年之前最強大的超級計算機擁有的計算能力。
圖 2:全球超級計算機的原計算性能,以 GFLOPs 測試
成本也有了極大的降低。英偉達 GPU(GTX 1080)有 9 TFLOPS 的性能,只要 700 美元,意味著每 GFLOPS 只要 8 美分。在 1961 年,串夠 IBM 1620s 每提供 1 GFLOPS 需要的錢超過 9 萬億。
圖 3:每單位計算的價格有了極大下降
3. 更好、更普遍可用的算法。更好的輸入(計算和數(shù)據(jù))使得更多的研發(fā)是面向算法,從而支持深度學習的使用。例如伯克利的 Caffe、谷歌的 TensorFlow 和 Torch 這樣的開源框架。比如,剛開源一周年的 TensorFlow,成為了 GitHub 上有最多 forked repositories 的框架。雖然不是所有的人工智能發(fā)生于普遍可用的開源框架中,但開源確實在加速發(fā)展,而且也有更多先進的工具正在開源。
方向
雖然本報告的重點是人工智能的發(fā)展方向以及公司如何把握這個方向,但是了解人工智能對我們生活的影響程度也是很重要的。
在線搜索。就在一年多以前,谷歌透露,它們已經(jīng)開始將大量的搜索工作移植到了 RankBrain(一個人工智能系統(tǒng)),使其和鏈接(links)以及內(nèi)容(content)成為了谷歌搜索算法的三個最重要的標志。
推薦引擎。Netflix,亞馬遜 和 Pandora 都在使用人工智能來確定推薦什么樣的電影和歌曲,突出哪些產(chǎn)品。5 月,亞馬遜開源了它們的深度可擴展稀疏傳感網(wǎng)絡(luò)引擎(the Deep Scalable Sparse Tensor Network Engine(DSSTNE),簡稱「Destiny」),它被用于產(chǎn)品推薦,同時可以被擴展以實現(xiàn)超越語言和語言理解以及異議識別的目的。
人臉識別。Google(FaceNet)和 Facebook(DeepFace)都投入了大量的技術(shù)來確定您的照片中的人臉和真實的人臉是不是幾乎完全吻合。1 月,蘋果采取了進一步措施,購買了 Emotient(一個致力于通過讀取人的面部表情來確定其情緒狀態(tài)的 AI 創(chuàng)業(yè)公司)顯然,這些技術(shù)遠遠不止于對照片進行標記。
雖然個人助理應(yīng)用產(chǎn)品有無數(shù)的用戶,比如蘋果的 Siri,信用貸,保險風險評估,甚至天氣預測。在接下來的篇幅中,我們探討企業(yè)該如何使用這些技術(shù)來加速增長,降低成本和控制風險。從這些技術(shù)及其使用這些技術(shù)的應(yīng)用的發(fā)展速度來看,它們充其量不過可以為公司和投資者提供一些方向,以保持他們的競爭力。
加強未來的生產(chǎn)率
美國的勞動生產(chǎn)率在 90 年代中期的快速增長和過去十年的緩慢增長和之后,近年來已經(jīng)停止增長了。我們認為,就像 20 世紀 90 年代互聯(lián)網(wǎng)技術(shù)被廣泛采用那樣,消費類機器學習和人工智能的擴散有可能大幅度地改變?nèi)虍a(chǎn)業(yè)的生產(chǎn)范式。
在整個行業(yè)中,我們發(fā)現(xiàn)在自動化的促使下,勞動時間減少了約 0.5%-1.5%,同時,由于 AI / ML 技術(shù)帶來的效率增益,到 2025 年,這些技術(shù)將對生產(chǎn)力增長產(chǎn)生高達 51-1154 個基點(bps)的影響。雖然我們期望 AI / ML 可以隨著時間同時提高生產(chǎn)率的分母和分子,不過我們認為最重要的是,早期的影響將是低工資任務(wù)的自動化,即以更少的勞動時間推動類似的產(chǎn)出增長水平。我們的基本案例 AI / ML 驅(qū)動提高了 97 個基點,這意味著 2025 年的增長生產(chǎn)率中的 1.61% 將由 IT 貢獻,比 1995 - 2004 年高出 11 個基點(圖 9,10)。
圖 9:生產(chǎn)力分析;單位百萬美元,假設(shè) 2019 年之后 GDP 線性增長
生態(tài)系統(tǒng):云服務(wù),開源在未來的 AI 投資周期中的關(guān)鍵受益人
我們相信,在未來的幾年中,一個公司利用人工智能技術(shù)的能力將成為體現(xiàn)公司在所有主要行業(yè)競爭力的一個屬性。雖然戰(zhàn)略會因公司規(guī)模和行業(yè)而有所不同,但如果管理團隊不會把重心放在領(lǐng)導人工智能和在此基礎(chǔ)上的利益上,那么未來產(chǎn)品創(chuàng)新、勞動效率和資本杠桿都會存在落后的風險。因此,我們認為公司需要投資這些新技術(shù)以保持競爭力,同時這將導致對人工智能所以依賴的人才、服務(wù)和硬件的空前的需求。
作為比較,20 世紀 90 年代技術(shù)驅(qū)動的生產(chǎn)力繁榮推動了相應(yīng)的激增。增加對技術(shù)的資本支出導致了新的企業(yè)和業(yè)務(wù)的增加來捕獲這些資本支出。在不可避免的行業(yè)整合發(fā)生之前,成立軟件、硬件和網(wǎng)絡(luò)公司開始發(fā)生轉(zhuǎn)變。下圖 13 突出了軟件行業(yè)內(nèi)的這種模式。在 1995 - 1999 年期間,在通貨膨脹調(diào)整后,市值在 20 億美元到 50 億美元之間的公共軟件公司的數(shù)量幾乎增加了兩倍,在 2000 年代中期才得到鞏固。
圖 13:伴隨 20 世紀 90 年代生產(chǎn)力激增的驅(qū)動者生態(tài)系統(tǒng)(enabler ecosystem)
圖 14:這十年來,投資人工智能的風險資本出現(xiàn)了暴增
我們看到了由 AI 驅(qū)動的生產(chǎn)率具有產(chǎn)生下一個相似的繁榮周期的潛力,可以通過利用這些潛力,把軟件、硬件、數(shù)據(jù)和服務(wù)提供商作為商業(yè)投資來創(chuàng)造價值。如上圖 14 所反映的那樣,與 AI 相關(guān)的初創(chuàng)企業(yè)的風險投資在這十年中急劇增加。AI 企業(yè)投資的繁榮現(xiàn)象的巨大潛力也開始推動整合。尤其是云平臺對 AI 相關(guān)人才進行了大量投入,自 2014 年以來,谷歌、亞馬遜、微軟和 Salesforce 共進行了 17 項與 AI 相關(guān)的收購(下圖)。
在上下文中對 AI 和 ML 技術(shù)的發(fā)展和歷史技術(shù)周期的比較中,我們看到了前者的一些益處。與過去 50 年的其他主要技術(shù)的周期一樣,計算(和摩爾定律)一直是進步的抑制劑和推動者。例如,在系統(tǒng)架構(gòu)方面,我們目睹了從大型機系統(tǒng)轉(zhuǎn)變?yōu)榭蛻舳?服務(wù)器模型的整個過程,并且近年來已經(jīng)開始被云/移動模式所取代。這種進化的驅(qū)動因素是計算能力、存儲容量和帶寬的改進。每個轉(zhuǎn)換都伴隨著應(yīng)用開發(fā)的轉(zhuǎn)變,包括各種新編程語言的出現(xiàn)和演變(見圖表 15)和各種可能的應(yīng)用程序各種的類型。如上下文中所提及的一樣,AI 這個概念已經(jīng)存在幾十年了,其中神經(jīng)網(wǎng)絡(luò)的概念出現(xiàn)在 20 世紀 60 年代,雖然直到最近幾年,計算能力才開始讓神經(jīng)網(wǎng)絡(luò)能在實際環(huán)境中使用。我們相信我們正處于 AI 平臺的早期階段,就如同 20 世紀 50 年代大型機才開始商業(yè)化到 21 世紀的智能手機和云的商業(yè)化。隨著平臺曲線的變化(我們認為它正在發(fā)生),應(yīng)用程序、工具和服務(wù)驅(qū)動者(enabler)會爆炸式增長,我們將在下面更詳細地討論。
圖 15:人工智能的發(fā)展可以與歷史上的系統(tǒng)架構(gòu)和編程語言的采用的技術(shù)革命相比,盡管我們認為我們目前仍然處在人工智能發(fā)展和應(yīng)用的早期階段
stack 的演變過程以及和 AI 之間的對應(yīng)關(guān)系
藍色 =專有供應(yīng)商,橙色 =開源,綠色 =云服務(wù)(注意:一些供應(yīng)商,如 IBM 和 Microsoft 都是專有服務(wù)和云服務(wù))
圖 17:生產(chǎn)中的機器學習:如何在機器學習管道中利用各種開源和云技術(shù)
圖 18:機器學習管道中的關(guān)鍵開源項目??捎玫捻椖縗支持公司和風險投資
圖表 20:人工智能即服務(wù)(AI-as-a-Service(AI-aaS))概覽:機器學習 API 正在被開發(fā)以解決水平和垂直使用案例
圖表 21:水平 AI-aaS 產(chǎn)品和定價:來自云平臺的 AI-aaS 產(chǎn)品示例
中國人工智能現(xiàn)狀
iResearch 預測,2020 年,中國人工智能市場將從 2015 年的 12 億人民幣增長至 91 億人民幣。2015 年,約 14 億資本(年增長率 76%)流入了中國的人工智能市場。
在政府政策方面,中國的國家發(fā)展改革委員會(發(fā)改委)和其他相關(guān)政府機構(gòu)于 2016 年 5 月 18 日發(fā)布了《「互聯(lián)網(wǎng)+」人工智能三年行動實施方案》?!斗桨浮分赋隽巳斯ぶ悄茴I(lǐng)域發(fā)展的六大保障措施,包括資金支持、標準體系、知識產(chǎn)權(quán)保護、人才培養(yǎng)、國際合作和組織實施。《方案》提出,到 2018 年,中國的人工智能基礎(chǔ)資源與創(chuàng)新平臺、產(chǎn)業(yè)體系、創(chuàng)新服務(wù)體系、標準化體系應(yīng)基本建立。發(fā)改委期望中國人工智能產(chǎn)業(yè)整體與國際同步,系統(tǒng)級別(system-level)的人工智能技術(shù)和應(yīng)用要位于市場領(lǐng)先位置。
中國已經(jīng)做出一些重大舉措,而且根據(jù)提及「深度學習」和「深度神經(jīng)網(wǎng)絡(luò)」的被引用期刊論文數(shù)量,2014 年,中國已經(jīng)超越美國(Exhibit 23)。中國擁有世界領(lǐng)先的語音和視覺識別技術(shù),其人工智能研究能力也令人印象深刻(Exhibit 24)。百度于 2015 年 11 月發(fā)布的 Deep Speech 2 已經(jīng)能夠達到 97% 的正確率,并被《麻省科技評論》評為 2016 年十大突破科技之一。另外,早在 2014 年香港中文大學開發(fā)的 DeepID 系統(tǒng)就在 LFW 數(shù)據(jù)庫中達到了 99.15% 的面目識別正確率。
Exhibit 23:提到「深度學習」或者「深度神經(jīng)網(wǎng)絡(luò)」的期刊文章
Exhibit 24:至少被引用一次的、并提到「深度學習」或者「深度神經(jīng)網(wǎng)絡(luò)」的期刊文章
中國的互聯(lián)網(wǎng)巨頭百度、阿里巴巴和騰訊(BAT)正在領(lǐng)導中國的人工智能市場,同時數(shù)以百計的初創(chuàng)公司也正滲透到這一產(chǎn)業(yè)中,并在各種人工智能細分市場及應(yīng)用領(lǐng)域建立服務(wù)模型。目前,中國的人工智能領(lǐng)域包括:
基本服務(wù),如數(shù)據(jù)資源和計算平臺;
硬件產(chǎn)品,如工業(yè)機器人和服務(wù)機器人;
智能服務(wù),如智能客戶服務(wù)和商業(yè)智能;以及
技術(shù)能力,如視覺識別和機器學習。
根據(jù) iResearch,目前,語音和視覺識別技術(shù)分別占中國人工智能市場的 60% 和 12.5%。在中國,所有和人工智能相關(guān)的公司中,71% 專注于開發(fā)應(yīng)用。其余的公司專注算法,其中,55% 的公司研究計算機視覺,13% 研究自然語言處理,9% 致力于基礎(chǔ)機器學習。
我們認為,人工智能前沿的重要參與者可能會繼續(xù)來自美國和中國。
百度:
2015 年 9 月,百度「度秘」:聲控人工智能個人助理(整合進百度移動搜索應(yīng)用)
2015 年 11 月,百度 DeepSpeech 2:包含一個大型神經(jīng)網(wǎng)絡(luò)的語音技術(shù),通過樣本學會將聲音與語詞聯(lián)系起來
2015 年 12 月,百度無人車:百度無人車在北京道路上完成測試,并在硅谷設(shè)立自動駕駛部門(ADU)
2016 年 8 月,百度「DuSee」:為移動設(shè)備打造的 AR 平臺(整合進百度搜索和地圖移動應(yīng)用),在搜索廣告方面有著廣泛應(yīng)用
2016 年 9 月,百度大腦:官方介紹,百度的人工智能平臺
2016 年 9 月,Paddle Paddle:百度近期開源的深度學習工具包
2016 年 10 月,百度移動應(yīng)用 8.0:新升級的移動搜索應(yīng)用,內(nèi)含一個整合了智能搜索和個性化新聞推薦的系統(tǒng),其背后采用了人工智能、自然語言處理和深度學習技術(shù)
阿里巴巴:
2015 年 7 月,阿里小蜜「阿里小秘書」:虛擬人工智能客服,據(jù)公司 2016 年 10 月報告,問題解決率已達到 80%
2015 年 8 月,DT PAI:基于阿里云的服務(wù),用來處理機器學習過程,被該公司稱為是中國的第一個人工智能平臺
2016 年 6 月,阿里媽媽光學字符識別:該技術(shù)獲得文檔分析與識別國際會議(ICDAR)Robust Reading 比賽第一名
2016 年 8 月,阿里云 ET:一套綜合的人工智能解決方案套件,包括視頻、圖像和語音識別技術(shù)
騰訊:
2015 年 6 月,優(yōu)圖:騰訊為開發(fā)者開放了其面部識別技術(shù),以及優(yōu)圖科技的其他核心技術(shù)
2015 年 8 月,騰訊 TICS 實驗室:2015 年騰訊設(shè)立的智能計算和搜索實驗室,專注于四個方面:搜索、自然語言處理、數(shù)據(jù)挖掘和人工智能
2015 年 9 月,Dreamwriter:騰訊上線中國第一個新聞報道機器人
2015 年 11 月,WHAT 實驗室:微信-香港科技大學人工智能聯(lián)合實驗室,于 2015 年 11 月 26 日成立
人工智能生態(tài):關(guān)鍵參與者
人工智能生態(tài):使用案例與潛在機會
創(chuàng)新人工智能的驅(qū)動者:谷歌、亞馬遜
谷歌在做些什么?
谷歌的搜索算法在過去二十年里進展迅速。從 1998 年的 PageRank 到 2015 年的 RankBrain,基于鏈接的網(wǎng)絡(luò)排名已經(jīng)進化成人工智能驅(qū)動下的查詢匹配系統(tǒng),后者能夠不斷適應(yīng)那些獨特的搜索(占谷歌所有搜索的 15%)。在云技術(shù)方面,公司五月份公布了針對平臺的定制化硬件加速器方面取得的進展,一種定制化的 ASIC,亦即 TPU,這一進展對 2015 年開源的機器學習軟件庫 TensorFlow 進行了補充。過去三年中,在與人工智能相關(guān)的收購戰(zhàn)中,公司也當仁不讓。被收購的公司中,最知名的當屬 DeepMind,它提升了 Alphabet 的神經(jīng)網(wǎng)絡(luò)功能并已經(jīng)將其應(yīng)用于各種人工智能驅(qū)動的項目中。
為何重要?
在搜索中使用算法,谷歌可謂先行者。將自然語言處理應(yīng)用到配備用戶搜索意圖和可欲結(jié)果方面,公司一直處于領(lǐng)先地位,這也不斷加強了公司在該領(lǐng)域的競爭優(yōu)勢。在進一步推進人工智能領(lǐng)域的融合。在促進人工智能一體化(AI integration)方面,公司的開源應(yīng)用 TensorFlow 已經(jīng)為其他云平臺以及研究社區(qū)利用公司資源提供了先例。同時,谷歌正通過自身優(yōu)勢,比如 TPU,充分利用開源世界為公司提供競爭優(yōu)勢,盡管其機器學習庫是開源的。因為 DeepMind, 公司提升了端到端的強化能力;2015 年末擊敗職業(yè)圍棋選手的 AlphaGo。將人工智能帶到更為廣泛的研究社區(qū),同時也通過軟硬件方面的自身優(yōu)勢進行創(chuàng)新,谷歌是最好例子。
亞馬遜在做什么?
亞馬遜正在公司內(nèi)部和云端使用機器學習技術(shù)。2015 年 4 月,公司發(fā)布 Amazon ML,這款機器學習服務(wù)能夠為對云數(shù)據(jù)的使用提供機器學習功能(無需之前的客戶經(jīng)驗)。公司緊隨谷歌的開源步伐,今年 5 月開源了 DSSTNE,一個針對推薦深度學習模型的的庫。通過改善搜索、定制化產(chǎn)品推薦以及語音識別、增加有質(zhì)量的產(chǎn)品評價,公司內(nèi)部也在使用機器學習改善端到端的用戶體驗。
為什么重要?
借助 AWS,亞馬遜成為全球最大的云服務(wù)商,可能也是最成熟的人工智能平臺。借助 Amazon ML,公司成為作為服務(wù)的人工智能(AI-as-a-service)生態(tài)系統(tǒng)的領(lǐng)先者,將復雜的推理能力帶到之前幾乎沒有機器學習經(jīng)驗的公司辦公室當中。無需基于定制的復雜應(yīng)用,AWS 用戶就能使用機器學習訓練模型,評估以及優(yōu)化潛力。亞馬遜推薦引擎使用了機器學習,在匹配用戶意圖以及可欲結(jié)果方面,具有競爭優(yōu)勢,也為公司創(chuàng)造了商機。公司正更加高效地利用收集到的數(shù)據(jù)合理化用戶購物體驗,也讓電子商務(wù)體驗更具互動性。隨著 DSSTNE 的開源,亞馬遜也與其他科技巨頭一起,推動科技社區(qū)的人工智能進步。
蘋果在做什么?
去年,蘋果已經(jīng)成為最活躍的人工智能公司收購商,比如 Vocal IQ, Perceptio, Emotient, Turi, 以及 Tuplejump。幾乎同時收購了 Vocal IQ 和 Perceptio,公司請來了 Johnathan Cohen,當時還是英偉達 CUDA 庫以及 GPU 加速軟件項目的負責人。近期,據(jù)報道,公司請來 Ruslan Salakhutdinov 擔任人工智能研究總監(jiān),這也標志著公司人工智能戰(zhàn)略的轉(zhuǎn)型。在此之前,公司最初人工智能成果之一是 Siri , 第一款嵌入移動技術(shù)的虛擬助手,2014 年,其語音識別技術(shù)被移入神經(jīng)網(wǎng)絡(luò)系統(tǒng)。
為什么重要?
直到去年,蘋果已經(jīng)取得相對專有的機器學習成就;2015 年 10 月,Bloomberg Businessweek 報道,在大眾消費方面,蘋果研究人員還沒發(fā)過一篇與人工智能有關(guān)的論文。不過,這一策略轉(zhuǎn)型多少與新的、與人工智能相關(guān)的雇傭與收購有關(guān),科技記者 Steven Levy 在 Backchannel 的一篇報道強調(diào)公司已經(jīng)在人工智能領(lǐng)域活躍一段時間了。特別是,公司收購 Turi 突出了公司要按規(guī)模推進非結(jié)構(gòu)數(shù)據(jù)和推論,以及開放給更為廣泛的人工智能研究社區(qū)。這次收購,配以基于收購公司技術(shù)的較小應(yīng)用,反映出蘋果致力于用這些新技術(shù)創(chuàng)新公司產(chǎn)品。
微軟在做什么?
CEO Satya Nadella 表示,微軟正在大眾化人工智能(democratizing AI)。公司的人工智能和研究團隊(總?cè)藬?shù)大約 5 千多),關(guān)注改變?nèi)祟愺w驗和與機器的互動。微軟已經(jīng)積極地將新的、融合人工智能的功能嵌入公司核心服務(wù)中,并在對話計算(比如 Cortana)、自然語言處理(SwfitKey)等方面取得進展。公司正進一步打造基于 GPU 和 FPGA 的云(Azure),在公司所謂的更高水平的人工智能服務(wù),比如語音識別、圖片識別以及自然語言處理當中,為機器學習提供動力和速度。
為什么重要?
兩個單詞:人工智能大眾化(democratizing AI)。由于這個行業(yè)中的公司將研究計劃甚至庫開放給人工智能研究社區(qū),微軟發(fā)明了這一表述,用來解釋許多領(lǐng)先的人工智能創(chuàng)新者的舉動。去年,微軟在人工智能領(lǐng)域頗為活躍,正式發(fā)布了產(chǎn)品以及研究計劃,并宣布了一個新的人工智能和研究小組(2016 年 9 月下旬)。微軟的 FPGA 表現(xiàn)突出了人工智能可以為普通商業(yè)或個人帶來什么;不到十分之一秒,它就翻譯完了整個維基百科(30 億個單詞和 500 萬條條款)。而且伴隨著虛擬助理 Cortana, Siri, Alexa 以及其他助理之間的競爭,進一步將人工智能研發(fā)融入廣泛使用的產(chǎn)品中去,通過產(chǎn)品進步吸引客戶似乎是必須的。
Facebook 在做什么?
Facebook 人工智能研究部門(FAIR,2013 年)的策略是在更廣泛的研究社區(qū)背景下研發(fā)技術(shù)。這個團隊以推進無監(jiān)督表征學習(比如,觀察世界、而不是借助人類算法干預,借助對抗網(wǎng)絡(luò)進行學習)的進步而為眾人所知。應(yīng)用機器學習部門(AML)在 FAIR 之后成立,聚焦將研究應(yīng)用到公司產(chǎn)品中,時間限制為月或季度(而不是年)。公司正將機器學習功能應(yīng)用到各種垂直領(lǐng)域中,比如面部識別,機器翻譯以及深度文本(DeepText)語言或文本學習。
為什么重要?
公司已經(jīng)發(fā)布了多個無監(jiān)督學習方面的研究成果,隨著機器學習超越從「正確答案」中學習,開始聚焦獨立的模式識別,無監(jiān)督學習已經(jīng)成為一個重要的焦點領(lǐng)域。無監(jiān)督學習有望去除更多的、與大數(shù)據(jù)有關(guān)的人類成分,公司在 Yann Lecun 的帶領(lǐng)下,正引領(lǐng)該領(lǐng)域的研究。今年五月,公司發(fā)布的 FBLearner FLow 合理化了端到端 UI(從研究到工作流程、實驗管理以及視覺化和比較輸出)。公司的人工智能項目和工作流程應(yīng)用不限于 AML 成員,公司各部門領(lǐng)域都可以使用借鑒。這樣一來,公司就可以利用研究部門之外所取得的人工智能進步。
Salesforce 在做什么?
在 2014 年和 2015 年,Salesforce 開始解釋自己的 Apex 開發(fā)平臺如何可被用在 Salesforce1 云上完成機器學習任務(wù)。從此,該公司開始在人工智能上投入更多的資源,收購了多家人工智能公司,包括 Minhash、PredictionIO 和 MetaMind。在 9 月份,Salesforce 推出了 Einstein——一個面向多平臺的基于人工智能的云計劃。該計劃專注于將人工智能融入銷售云、市場云、服務(wù)云、社區(qū)云、IoT 云和 app 云。
為什么重要?
Salesforce Einstein 有潛力促進商業(yè)使用數(shù)據(jù)的方式。在銷售云中,該公司希望讓各個組織通過預測銷售線索得分、洞見機會以及自動捕捉活動來優(yōu)化銷售機遇。市場和服務(wù)云將提供預測參與度得分,來分析消費者使用情況。還能提供預測客戶,從而幫助定位市場,并基于趨勢和用戶歷史通過自動案例分類更快解決消費者服務(wù)事件。Salesforce 用微妙的使用案例將機器學習帶到云中,強調(diào)它對公司核心競爭力的影響。
英偉達在做什么?
英偉達已經(jīng)從之前電子游戲 GPU 生產(chǎn)商轉(zhuǎn)型為機器學習應(yīng)用硬件廠商。2015 年年底,公司表示,較之使用傳統(tǒng) CPU,使用了 GPU 神經(jīng)網(wǎng)絡(luò)的訓練速度提升了 10 到 20 倍。盡管英特爾重金投入的 FPGA(作為 GPU 的替代產(chǎn)品)加入硬件市場角逐,但是,GPU 的機器學習應(yīng)用能實現(xiàn)更加密集的訓練。相對而言,F(xiàn)PGA 可以提供更快、計算密集程度更低的推理和任務(wù);這說明市場會根據(jù)實際應(yīng)用案例區(qū)分對待。過去五年,到 2016 年 6 月為止,英偉達所占 GPU 市場份額已經(jīng)從二分之一上升到近四分之三。
為什么重要?
在人工智能創(chuàng)新公司和學術(shù)機構(gòu)中,GPU 加速的深度學習一直是許多項目的前沿。英偉達所占據(jù)的市場份額意味著,隨著人工智能越來越成為未來幾年中大型商務(wù)的中心議題,公司可以從中獲益。使用公司產(chǎn)品的一個例子,俄羅斯的 NTechLab,使用 GPU 加速的深度學習框架來訓練面部識別模型,識別密集集會中的個人,并在 AWS 中利用這些 GPU 進行推理。
作為一種選擇,許多大學也使用英偉達 Tesla 加速器來模擬可能的抗體突變,這種變異可能會擊敗進化中的伊波拉病毒,將來研究會進一步關(guān)注流感病毒。
英特爾在做什么?
英特爾的戰(zhàn)略比較獨特,其使用的案例多種多樣。2016 年年中,公司發(fā)布了第二代 Xeon Phi 產(chǎn)品系列,以其高性能計算(HPC)能力著稱,它可以讓人工智能擴展到更加大型的服務(wù)器網(wǎng)絡(luò)和云端。在硬件不斷進步的同時,公司也下重金投資 FPGA,這主要歸功于其推理速度和靈活的可編程性。英特爾令人矚目的收購包括 Nervana(深度學習),以及 Altera——該公司將 FPGA 的創(chuàng)新帶入了英特爾。
為什么重要?
英特爾關(guān)注 FPGA 創(chuàng)新補足了英偉達對 GPU 的關(guān)注。當處理大型數(shù)據(jù)庫(微軟等許多大公司用來測試大數(shù)據(jù)分析的邊界),F(xiàn)PGA 能夠提供更加快速的推理速度。在物聯(lián)網(wǎng)的應(yīng)用環(huán)境中,公司也宣布了一個計劃,旨在將學習技術(shù)融入可穿戴微芯片中(顯然是通過 Xeon Quark)。物聯(lián)網(wǎng)和人工智能的銜接有助于為公司和個人日常使用案例的數(shù)據(jù)搜集機制提供機器學習解決方案。
Uber 在做什么?
Uber 正在使用機器學習優(yōu)化 UberX ETA 以及接送地點的準確性。為了實現(xiàn)這一點,需要數(shù)百萬之前搭乘記錄的數(shù)據(jù)點來探測常規(guī)交通模式,從而可以相應(yīng)調(diào)整 ETA/接送地點。今年 9 月,Uber 展開了一個自動駕駛試點項目,地點位于匹茲堡,由來自 CMU 的研究人員(受雇于 Uber)負責該項目,很多大型汽車制造商業(yè)參與了進來。該公司還和沃爾沃達成了一項合作(金額 300 萬美元),研發(fā)協(xié)作也為這個試點項目提供了機遇。不過,公司并不止步于小轎車。公司收購了一家自動卡車創(chuàng)業(yè)公司 Otto,今年十月在科羅拉多,公司試點快遞了 5 萬瓶啤酒。
為什么重要?
Uber 的機器學習負責人 Danny Lange 在接受 GeekWire 的收集中提及,他們的團隊正在將這種技術(shù)無縫供給公司的其他團隊,這些團隊無需具備機器學習背景就可以使用 APIs。這也能讓公司不同部門能高效利用機器學習基礎(chǔ)架構(gòu),例如,UberX、UberPool、UberEats 以及自動駕駛工具都使用到了公司的人工智能技術(shù)。
IBM 在做什么?
IBM 在全球有 3000 多名研究人員。過去十年,IBM 在認知計算上超過有 1400 項專利,下一代云上有 1200 項,在硅/納米科學上有 7200 項專利。IBM Watson 利用自然語言處理機器學習技術(shù)識別模式,并提供在非結(jié)構(gòu)數(shù)據(jù)上的洞見,據(jù)該公司表示這代表如今所有數(shù)據(jù)的 80%。其他 Watson 產(chǎn)品包括 Virtual Agent,一個響應(yīng)分析的自動消費者服務(wù)體驗;Explorer,這是一個分析并連接大量不同數(shù)據(jù)集的工具。
為什么重要?
IBM 一直是該領(lǐng)域的先驅(qū),有著極大的成就,包括上世紀 90 年代的 DeepBlue 和 2011 年的 Watson。Watson 的應(yīng)用包括醫(yī)療中的病人治療分析,基于 twitter 數(shù)據(jù)的股票推薦,零售中消費者的行為分析,以及對抗網(wǎng)絡(luò)安全威脅。據(jù)財富報道,GM 將 Watson 加入到了汽車中,在 OnStar 系統(tǒng)上結(jié)合了 Watson 的能力。
百度在做什么?
百度的人工智能研究由百度大腦所推進。它包含 3 個元素:1)一個模擬人類神經(jīng)網(wǎng)絡(luò)的人工智能算法,有著在百十億的樣本上訓練的大量參數(shù);2)能在數(shù)十萬臺服務(wù)器與大量 GPU 集群上進行高性能計算(HPC)的運算能力。HPC 能容納更多可擴展的深度學習算法。百度是首家宣布這種架構(gòu)的公司,并正與 UCLA 合作;3)標記數(shù)據(jù),借此技術(shù),百度收集到了數(shù)以億計的網(wǎng)頁,包括百億的視頻/音頻/圖像內(nèi)容碎片,還有數(shù)十億的搜索請求和百億的定位要求。為特定模型訓練一臺機器可能需要很高的(exaFLOPS 級)計算能力以及 4T 的數(shù)據(jù)。
為什么重要?
人工智能正在改進百度全線產(chǎn)品的用戶體驗和提升用戶粘性,也在推動針對每一用戶的定制化高質(zhì)量內(nèi)容。建立一個內(nèi)部平臺來運行從網(wǎng)頁搜索到廣告投放的帶有標簽數(shù)據(jù)的深度學習實驗,能夠預測點擊率(CTR),這會直接影響百度的廣告投放,因此也是它們目前的主要收益。此外,基于人工智能的技術(shù)也能帶來更高的 CTR,而且每點擊成本的降低也能促進變現(xiàn)。
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。