說起AI,很多人都知道AlphaGo戰(zhàn)勝過人類頂尖圍棋手李世石、柯潔。其實,游戲AI也是人工智能的熱門研究領(lǐng)域。DeepMind正專攻《星際爭霸2》,OpenAI的人工智能也曾在Dota2上用人工智能打敗了職業(yè)玩家。騰訊也向外界透露正利用《王者榮耀》進(jìn)行AI研究。
今年年初,騰訊AI Lab科學(xué)家劉霽被《麻省理工科技評論》評為“中國區(qū)35歲以下創(chuàng)新35人”之一,獲獎理由是前者的研究讓機(jī)器學(xué)習(xí)算法更加準(zhǔn)確高效,對游戲AI領(lǐng)域的研發(fā)也將進(jìn)一步拓寬人類對AI能力的認(rèn)知。
在本期《騰云》雜志新設(shè)立的“騰訊科學(xué)家”專欄中,劉霽分享了他對人工智能和機(jī)器學(xué)習(xí)前沿等問題的看法,帶我們以全新的視角認(rèn)識游戲AI。
自 1999 年起,《麻省理工科技評論》每年都會推出“35歲以下創(chuàng)新35人”(Innovators Under 35)榜單,旨在于全球范圍內(nèi)評選出被認(rèn)為最有才華、最具創(chuàng)新精神,以及最有可能改變世界的35位年輕技術(shù)創(chuàng)新者或企業(yè)家。2018年年初,該全球權(quán)威榜單正式推出中國區(qū)評選結(jié)果,34歲的騰訊AI Lab科學(xué)家劉霽入選,他正在和他的團(tuán)隊攻克多人即時戰(zhàn)略游戲的AI設(shè)計問題。他獲獎的理由是:讓機(jī)器學(xué)習(xí)算法更準(zhǔn)確更高效,探索人工智能潛力的邊界,游戲AI的研發(fā)將會進(jìn)一步拓寬人類對于AI能力的認(rèn)知。
▲騰訊AI Lab科學(xué)家劉霽
日前,《騰云》在AI Lab美國西雅圖辦公室收集了劉霽。位于美國西海岸的西雅圖,是規(guī)模僅次于硅谷的高科技中心,這里云集了微軟和亞馬遜等一眾高科技企業(yè)。騰訊的辦公室位于西雅圖貝爾維尤(Bellevue)市中心。同一棟辦公樓里,還有百度、華為等中國企業(yè)的辦公室,阿里的辦公室也在附近。這恰恰是中國高科技公司紛紛積極布局AI領(lǐng)域的寫照。
“中國公司在西雅圖設(shè)辦公室,也是為了方便吸引更多優(yōu)秀的人才?!?nbsp;劉霽說。和硅谷比起來,西雅圖所在的華盛頓州沒有州稅,房價也相對較低,微軟和亞馬遜的總部都在這里,Google和Facebook在這里也設(shè)有分部。這些都成為西雅圖吸引人才的優(yōu)勢。
騰訊AI Lab副主任俞棟,之前曾在微軟研究院就職。而劉霽的另一個身份是,紐約羅切斯特大學(xué)(University of Rochester)助理教授。在騰訊AI Lab,像他這樣從學(xué)界轉(zhuǎn)身于企業(yè)的科學(xué)家并不少見,AI Lab主任張潼在回國之前,就是新澤西羅格斯大學(xué)(Rutgers University)的教授。
說起來,張潼還是劉霽的學(xué)術(shù)引路人。
▲騰訊 AI Lab 主任 張潼博士
劉霽本科畢業(yè)于中國科技大學(xué),專業(yè)是控制。2008年到美國亞利桑那大學(xué)攻讀碩士時他轉(zhuǎn)向了計算機(jī)領(lǐng)域。當(dāng)時有兩個方向可供選擇,一個是計算機(jī)圖形,另一個是機(jī)器學(xué)習(xí)。計算機(jī)圖形涉及更多的編程技能,從找工作的角度,是比機(jī)器學(xué)習(xí)更熱門的專業(yè)。劉霽當(dāng)時覺得機(jī)器學(xué)習(xí)既有意思也很具挑戰(zhàn),研究的大多是實際中提煉出的具有共性的問題,對理解知識和掌握技能都很有幫助。當(dāng)時機(jī)器學(xué)習(xí)方向的導(dǎo)師葉杰平(后回國就任滴滴研究院副院長)對他坦陳,機(jī)器學(xué)習(xí)方向不容易找工作,可以先從讀一兩篇論文開始。而論文的作者就是張潼。劉霽說,“機(jī)器學(xué)習(xí)領(lǐng)域的很多人都是讀張老師的論文成長起來的。”
劉霽用了一個多月啃完了這篇“特別長,全是公式和證明”的論文。這也堅定了他對機(jī)器學(xué)習(xí)研究的信心?!拔矣X得自己還可以??赡苣菚r候也比較年輕氣盛?!?劉霽笑著說。后來,讓他倍感幸運的是,博士就讀的威斯康星大學(xué)聚集了機(jī)器學(xué)習(xí)領(lǐng)域的大牛和科研新星,從與這些學(xué)術(shù)導(dǎo)師共同開展的工作中他受益匪淺。
2014年博士畢業(yè)找工作時,他經(jīng)歷了與三、四百人競爭一個教職的慘烈競爭。而他當(dāng)時完全沒有料想到以2015年AlphaGo首次戰(zhàn)勝人類棋手為轉(zhuǎn)折點,人工智能迎來今日如此蓬勃的大發(fā)展期。
“我的工作是把實際問題抽象成數(shù)學(xué)問題,在數(shù)學(xué)層面解決這個general(一般性)的問題,再應(yīng)用到特殊的問題?!睓C(jī)器學(xué)習(xí)領(lǐng)域的多年研究,讓劉霽一直游走于計算機(jī)和數(shù)學(xué)之間,是數(shù)學(xué)家眼中的計算機(jī)人才,又是計算機(jī)人才中的數(shù)學(xué)家。
在接受《騰云》訪問時,劉霽還分享了他對人工智能和機(jī)器學(xué)習(xí)前沿、為何加入騰訊、以及中美AI競爭的看法。
以下為經(jīng)過編輯的收集實錄。
1異步并行算法,使機(jī)器計算效率明顯提升
騰云:你在異步并行算法創(chuàng)新等領(lǐng)域取得了不少成績,也因此獲獎。能否談一下異步并行算法,對于機(jī)器學(xué)習(xí)或是人工智能領(lǐng)域的發(fā)展有何意義?
劉霽:人工智能解決的是實際的問題。我覺得主要過程有兩步,第一步是把一個實際問題,比如說人臉識別,或者智能家居,還有各種各樣的應(yīng)用場景,轉(zhuǎn)化成一個數(shù)學(xué)問題,建立數(shù)學(xué)模型。第二步就是針對這個數(shù)學(xué)模型利用收集的數(shù)據(jù)對其求解,怎么讓計算變得更快。我的工作在這兩方面都有涉及。
計算機(jī)的計算能力呈指數(shù)級的增長,現(xiàn)在一臺PC的計算能力,在10-20年前,相當(dāng)于一個很大集群的計算能力。計算能力的快速增長促成了AI最近的一些突破,包括AlphaGo的出現(xiàn)。這導(dǎo)致我們可以解決以前無法解決的問題。就像以前AI只能下國際象棋,下不了圍棋,因為圍棋的變化更多。而現(xiàn)在計算能力上去了,解決問題變得有可能。從而人們對人工智能有了更多的期待和想像,對并行計算效率提出了前所未有的要求。
有幾種不同的方向去提高計算效率。首先是算法設(shè)計,用盡可能少的計算量求解目標(biāo)問題。這部分研究相對已經(jīng)比較成熟。第二部分的重點就是把計算并行化,以前大家擁有的計算資源相對很少,那時候并不存在并行的問題?,F(xiàn)在有很多機(jī)器,需要把資源全部協(xié)調(diào)起來,把它們管理好,做一個大的項目。其實就跟管理公司一樣,一個創(chuàng)業(yè)公司只有一二十人,對于CEO的管理能力要求沒有那么高,但是如果一個公司發(fā)展到像騰訊這樣的規(guī)模之后,你肯定得想如何把它管理好。我在并行計算方面的研究,通俗講就是當(dāng)你要去解決一個機(jī)器學(xué)習(xí)的計算問題的時候,幫助你如何把下面的計算資源分配好,整合好,設(shè)計更好的算法提高并行效率。我們提出了各種各樣的新的方法、方式,打破一些傳統(tǒng)桎梏,讓計算并行的效率得到明顯提升,而且在工業(yè)界有了很好的應(yīng)用,比如我們研究的異步并行的算法框架在當(dāng)今主流的機(jī)器學(xué)習(xí)平臺(像Tensorflow、CNTK、MXnet)都有廣泛應(yīng)用。
異步并行指的是,本地機(jī)器各自進(jìn)行自己的訓(xùn)練工作,一段時間以后將模型更新到參數(shù)服務(wù)器上,然后并不等待其他機(jī)器就進(jìn)行下一輪的本地訓(xùn)練。這個過程的好處就是快,因為各個機(jī)器之間不需要互相等待,因此異步并行被大量使用。劉霽提出的一系列異步并行算法,則解決了傳統(tǒng)同步并行算法的瓶頸問題——快機(jī)等待慢機(jī)。同時,他的相關(guān)理論研究還解決了異步并行的深度學(xué)習(xí)算法中的一個開放性問題——關(guān)于異步 SGD 算法正確性和效率保證,該異步 SGD 并行算法已經(jīng)廣泛運用于各種主流的機(jī)器學(xué)習(xí)計算軟件和平臺,例如Google 開發(fā)的 Tensorflow、微軟開發(fā)的 CNTK以及亞馬遜開發(fā)的 MXNet 等?!堵槭±砉ぜ夹g(shù)評論》
2人工智能研究,要解決好一般性問題
騰云:人工智能領(lǐng)域還有什么你覺得比較重要的研究方向嗎?
劉霽:人工智能的內(nèi)涵和外延太廣,定義也相對模糊,我恐怕講不好??赡軓臋C(jī)器學(xué)習(xí)的角度來講,對我來說可能更合適一些。機(jī)器學(xué)習(xí)傳統(tǒng)上主要集中解決的問題從決策的角度來看都是靜態(tài)的,比如AI幫助我判斷圖片里是不是有一只貓,這是一個靜態(tài)的決策?,F(xiàn)在很多復(fù)雜的AI問題以及現(xiàn)實的問題中的決策需要是動態(tài)的,比如說要做股票投資,目標(biāo)并非是在某個時刻收益最大化,你還要考慮風(fēng)險等各方面的因素,實現(xiàn)在一段長時間內(nèi)總收益最大化。再比如下圍棋,每一步可能重要,單步的得失并不是你的最終目的,最終目的是要贏整盤棋。
▲AlphaGo大戰(zhàn)李世石
這類問題的難點在于每個決策前后的相關(guān)性,你下一刻的決定,其實取決于之前的一系列決定。從技術(shù)上講,研究如何解決這種動態(tài)最優(yōu)化策略的問題會成為將來最有挑戰(zhàn)的問題。為了解決這類問題,傳統(tǒng)AI有很多基于搜索的方法。強(qiáng)化學(xué)習(xí)也是一類方法。我也做了一些關(guān)于強(qiáng)化學(xué)習(xí)的工作,拿到過Facebook的最佳學(xué)生論文。盡管有AlphaGo的成功,但是總的來說都還不令人滿意,距離系統(tǒng)化地解決這類問題,還有很多工作要做。
騰云:這是屬于人工智能現(xiàn)在比較核心也是比較基礎(chǔ)的研究。
劉霽:沒錯,我們其實要解決的是一般化的問題,一般化的問題是現(xiàn)實中各種問題的抽象,比如人臉識別,安防的檢測,甚至可能是完全不相關(guān)的問題,可是如果你把它抽象成一個數(shù)學(xué)問題,其實它是同一個數(shù)學(xué)問題,我們的目的是要把這個數(shù)學(xué)問題解決好。為下一個問題的解決提供重要的方法和思路。
騰云:為什么在學(xué)術(shù)休假期間選擇加入騰訊?
劉霽:騰訊AI Lab在張(潼)老師和俞(棟)老師的帶領(lǐng)下有著非常好的基礎(chǔ)研究氛圍,同時還能接觸到實際的業(yè)務(wù)問題。過去我只能在紙上推導(dǎo)的東西現(xiàn)在有機(jī)會實現(xiàn)。不論是從個人影響,還是說個人體驗,都更有意義。因為要做成一件事情,不光是要解決一般性的理論問題,還要把資源整合好,要考慮很多細(xì)枝末節(jié)的東西。這都是更大的挑戰(zhàn)。好比一個管理學(xué)家可以做很多年的管理研究,做得很成功,但是你讓他去管一個公司,卻未必非常成功。
AlphaGo很厲害,是厲害在算法嗎?我覺得不完全是,雖然對外宣傳是強(qiáng)調(diào)算法的突破。它絕對不是在技術(shù)某一個點上獲得突破,而是能夠把整個系統(tǒng)工程管理好,能夠激發(fā)每個人的潛能,一步步地突破,解決好問題。學(xué)術(shù)研究本身可能就是鉆研一個小問題,但那不足以支撐一個大的項目。工業(yè)界的工作是會讓人接觸一個龐大的項目,把事情做成功,這是完全不一樣的體驗。
3游戲是現(xiàn)實問題的投影
騰云:DeepMind團(tuán)隊在研究游戲AI如何在《星際爭霸》(StarCraft)這款游戲中戰(zhàn)勝人類。騰訊研究游戲AI的目的是什么?
劉霽:我理解最重要的目的并不一定是要打敗人類,而是看中它的現(xiàn)實意義。游戲里有很多小的場景,都是我們真實生活當(dāng)中一些重要問題的投影。比如說,游戲里的多人即時戰(zhàn)斗,反映了現(xiàn)實生活中的足球、籃球等各種球類運動,我們怎么把它做好。
再舉一個例子,比如《星際爭霸》里你的工兵需要采礦,采哪種礦,如何調(diào)配資源,才會達(dá)到累計收益最大化。在現(xiàn)實中這就是投資的問題,你買哪支股票,賺了錢你是用來買房,還是買更多股票,這其實是投資組合的問題。游戲是對現(xiàn)實問題的抽象,所以說解決好游戲的問題,對很多現(xiàn)實問題都有幫助和借鑒,這是游戲的現(xiàn)實意義,也是它有意思的地方。
▲游戲AI更多是輔助人類,提升用戶體驗
騰云:回到游戲本身,如果說游戲AI把人打敗了,是否會降低人們玩游戲的滿足感。通過游戲AI是否能夠幫助提升游戲的體驗,或者它的復(fù)雜程度?
劉霽:首先,人打不過機(jī)器其實也正常。人是會做加減法,但肯定做不過電腦。隨著電腦計算能力提高,計算速度加快,AI用數(shù)學(xué)的方式把游戲也變成一個數(shù)據(jù)的問題,這時人算不過電腦就很正常。
我理解游戲AI更多是輔助人類,提升用戶體驗。比如《王者榮耀》是5V5的游戲,可以用AI替換掉掉線的玩家,讓游戲更加公平地得以繼續(xù);再比如圍棋AI對選手在線定段,輔助提高。
騰云:你平時生活中是游戲玩家嗎?
劉霽:是的,我玩游戲,我從中學(xué)就開始玩《星際爭霸》,玩了有20年了。做游戲AI,必須要懂游戲。就像AlphaGo也要找很多職業(yè)棋手去給他們指導(dǎo)。我們跟國內(nèi)同事開會的時候會說,大家都要把游戲玩到一定水平才能真正進(jìn)入這個角色。
騰云:現(xiàn)在中國家長普遍還是覺得打游戲是不太好的一件事。你從中學(xué)時開始打游戲,還是學(xué)霸,看來也沒有影響學(xué)習(xí)。
劉霽:小孩都愛玩游戲,我自制力還可以,說不玩就不玩了。中國家長將游戲妖魔化,老是怪游戲怎么怎么樣,我個人認(rèn)為游戲本身并沒有好壞之分,在于你使用它的方式 。有人總抱怨小孩子打游戲,一看父母天天在打麻將,在外面玩,你能怪孩子嗎? 父母沒法以身作則,給孩子做榜樣。孩子就算不沉迷于游戲,也會沉迷于其他的東西。相反如果能夠利用好游戲,正確引導(dǎo)對孩子成長、IQ和EQ的提升都大有裨益。
4提升游戲競技性,會對孩子產(chǎn)生更多的正面意義
騰云:游戲?qū)δ愕恼鎯r值在哪里?
劉霽:我高中的班級里,成績好的玩游戲都還可以,如果玩游戲水平特別差,成績卻特別好的,很少看到。游戲小孩都愛玩,大人其實也愛玩,關(guān)鍵在引導(dǎo)。玩游戲不僅是出于娛樂的目的,我的建議是提高它的競技性,削弱娛樂性。其實這對于小孩的成長有很大幫助,對我個人就是非常大的幫助。
簡單來說,娛樂性游戲就是勝負(fù)更多取決于在上面耗費的時間和隨機(jī)性。競技性游戲需要你積極地思考參與,憑借你的能力和水平,才能取得優(yōu)勢或者勝利。
▲《王者榮耀》中的射手英雄
增強(qiáng)游戲的競技性對于游戲健康地發(fā)展很有幫助,對于小孩的鍛煉也非常大。像孩子參加奧數(shù)和其它體育比賽,這些也都是競技性的。孩子也可以在玩的過程中,想辦法解決問題,提升自己,這是提高他個人能力的一種手段。同時對人的心態(tài)也非常有幫助。競技性的游戲,輸了你沒法去怪別人,也不能說自己運氣不好。輸了就是因為你實力問題。我觀察到現(xiàn)實中教育子女經(jīng)常出現(xiàn)的一個問題是,小孩事情沒做成,首先不是想自己或者孩子哪里做得不好,而往往是責(zé)怪老師。競技性游戲提供了一個非常好的公平場景,如果你輸了,就是能力沒有對手強(qiáng),沒有什么好怪的。
游戲的競技性和勝負(fù)感加強(qiáng)的時候,會幫助你提升注意力,輸了你需要學(xué)會控制心態(tài),繼續(xù)下半場比賽。很多人在日常生活中可能很少有機(jī)會接受這種面對大起大落的心態(tài)的培養(yǎng)。對我影響最深的就是在激烈的對抗當(dāng)中,職業(yè)選手的心態(tài)非常平靜,一場比賽結(jié)束后,給兩邊選手每人一個鏡頭,你看不出誰贏誰輸,都是一樣的表情,這就是修為。
我自己也深有體會,輸了我會很急躁,每個人一開始都這樣。我覺得我從游戲中學(xué)到的,首先是想自己哪里玩得不好。第二我會去看回放錄像,看哪里我還可以提高。復(fù)盤是讓一個人不斷反思自己、讓自己提高的很好的途徑。第三心態(tài)要好,你這一場輸了,下一場你的心態(tài)要調(diào)整得更好,所謂兵敗如山倒,其實是因為你的心態(tài)崩了。人很容易碰到挫折就一蹶不振,破罐破摔。
所以在這些方面,游戲其實是能夠幫助人的,如果家長有足夠的智慧去引導(dǎo),玩游戲就會對孩子有正面的意義。如果游戲只強(qiáng)調(diào)娛樂性,輸贏都靠運氣、靠花時間多,負(fù)面效應(yīng)會比較大,而當(dāng)游戲成為競技性的時候,很多小孩可能就選擇放棄了。真正的職業(yè)選手要經(jīng)過非常辛苦的訓(xùn)練,付出很多心血的。我相信頂級的職業(yè)選手,就算不從事競技游戲這個行業(yè)了,他們也有能力在其他領(lǐng)域生存下去。
騰云:怎么看中美AI競爭各自的優(yōu)勢和劣勢。
劉霽:美國起步比較早,相對來說美國人更沉得住氣一些,研究更厚實一些,這是美國的優(yōu)勢。中國的社會更加浮躁,一定要立竿見影才有興趣繼續(xù)弄下去。但是我覺得中國的優(yōu)勢更明顯,第一物理環(huán)境上,中國的人口更多、數(shù)據(jù)量更大,現(xiàn)在的AI落地的場景,其實主要還是數(shù)據(jù)驅(qū)動的。中國的醫(yī)療數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù),都超越美國幾個量級。美國找不到幾個企業(yè),有騰訊這么多用戶,這是天然的優(yōu)勢。從人才來說,中國現(xiàn)在也有大批的人才,包括海外的學(xué)者的加入,從技術(shù)和研究水平,中國趕超得很快。在一些個別的問題上,比如在人臉識別、安防等方面,中國甚至有領(lǐng)先優(yōu)勢。而且中國人相對來說比美國人更能吃苦。所以總體來講我個人更看好中國AI的未來。
本文轉(zhuǎn)自微信公眾號“騰云”,作者徐可(系《騰云》高級編輯)。文章為作者獨立觀點,不代表芥末堆立場。
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。