芥末堆芥末堆

人機(jī)世紀(jì)大戰(zhàn),AlphaGo贏了,幸好機(jī)器沒有故意輸

作者:阿博 發(fā)布時(shí)間:

人機(jī)世紀(jì)大戰(zhàn),AlphaGo贏了,幸好機(jī)器沒有故意輸

作者:阿博 發(fā)布時(shí)間:

摘要:一個(gè)時(shí)代的終結(jié)。

69531310978718211.jpg

芥末堆文,3月9日中午12時(shí),來(lái)自于Google的人工智能機(jī)器人AlphaGo同韓國(guó)棋手李世石展開具有“跨時(shí)代意義”的第一場(chǎng)人機(jī)大戰(zhàn)。比賽持續(xù)了近4小時(shí),AlphaGo以人工智能的身份,最終贏得了這場(chǎng)比賽。

李世石,1983年3月2日生于韓國(guó)全羅南道,曾于2006、2007、2008均獲得韓國(guó)圍棋大獎(jiǎng)—最優(yōu)秀棋手大獎(jiǎng)(MVP),是職業(yè)九段選手的世界圍棋冠軍,此次代表人類出戰(zhàn)。本次圍棋挑戰(zhàn)賽共分為5場(chǎng),在韓國(guó)首爾舉行,獲勝者將得到一百萬(wàn)美元獎(jiǎng)金。

而AlphaGo(阿爾法圍棋)是一款由英國(guó)谷歌旗下的DeepMind團(tuán)隊(duì)開發(fā)而成,主要工作原理是“深度學(xué)習(xí)”,即通過模擬人腦神經(jīng)網(wǎng)絡(luò)和對(duì)職業(yè)棋手棋譜的學(xué)習(xí),進(jìn)行自我博弈,再通過兩個(gè)不同神經(jīng)網(wǎng)絡(luò)“大腦”來(lái)決定棋路,曾于去年10月以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾。這場(chǎng)人類同智能機(jī)器人的“世紀(jì)之戰(zhàn)”,瞬間吸引了眾多關(guān)注。

177135250641532652.jpg

從圍棋學(xué)習(xí)談起,圍棋為什么是“人類最后的智力驕傲”?

相對(duì)于國(guó)際象棋,為什么說圍棋是“人類最后的智力驕傲”呢?因?yàn)閲遄鳛橐婚T競(jìng)技體育項(xiàng)目,更成體系,邏輯性也更強(qiáng),更難學(xué)習(xí)和提升。國(guó)際象棋每一步有24種可能性,而圍棋以變化反復(fù)聞名,按照棋盤上每個(gè)交叉點(diǎn)上黑、白、空三種可能性算,棋盤的變化總數(shù)可達(dá)3的361次方次可能性,而目前的計(jì)算機(jī)無(wú)法對(duì)所有走法進(jìn)行統(tǒng)計(jì)和窮舉,因此人工智能依然無(wú)法玩轉(zhuǎn)圍棋界。此次AlphaGo贏得了這場(chǎng)比賽,刷新了圍棋界的新紀(jì)錄,代表人工智能第一次在圍棋界,超越了最高水平的專業(yè)選手。

圍棋作為變化多端的一種競(jìng)技類項(xiàng)目,一般認(rèn)為可以開發(fā)智力,拓展思維,具有很強(qiáng)的教育意義和鍛煉意義。據(jù)悉,中國(guó)學(xué)習(xí)圍棋的兒童目前已超1000萬(wàn)人。

機(jī)器學(xué)習(xí)模仿人腦神經(jīng)模式,所以能“步步為贏“?

在去年10月樊麾同AlphaGo的對(duì)弈中,樊麾曾表示,“如果沒有人告訴我,我一定不知道它是電腦,它太像人了。它一定是在思考?!贝送?,樊麾還提到在對(duì)弈過程中,AlphaGo不同于人類,完全沒有心態(tài)的波動(dòng)變化,且有很強(qiáng)的學(xué)習(xí)能力。AlphaGo會(huì)進(jìn)行自我學(xué)習(xí),采取自我博弈的方式,一旦輸了,就會(huì)記錄下來(lái),下次避免這種下棋方式。通過數(shù)據(jù)統(tǒng)計(jì)和積累,研究出最好的下棋和落子方式。

從1997年美國(guó)IBM公司研發(fā)的超級(jí)計(jì)算機(jī)“深藍(lán)”戰(zhàn)勝了當(dāng)時(shí)世界排名第一的國(guó)際象棋大師卡斯帕羅夫后,機(jī)器學(xué)習(xí)的概念再次走進(jìn)大眾視野。不同于人類的學(xué)習(xí)模型,機(jī)器學(xué)習(xí)是對(duì)能通過經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能。除卻“深藍(lán)”,2006年,超級(jí)計(jì)算機(jī)“浪潮天梭”也在人機(jī)大戰(zhàn)中大敗5位中國(guó)象棋特級(jí)大師。

AlphaGo采取的主要工作原理是“深度學(xué)習(xí)”模式,即擁有多層的人工神經(jīng)網(wǎng)絡(luò)及訓(xùn)練它的方法。AlphaGo擁有“策略網(wǎng)絡(luò)”和“價(jià)值網(wǎng)絡(luò)”兩個(gè)“大腦”,通過策略網(wǎng)絡(luò)觀察棋盤,決定下一步下棋步驟,而“價(jià)值網(wǎng)絡(luò)”則是在判斷對(duì)手贏棋可能性的情況下進(jìn)行落子決定。

wxid_h8mx6n2bsh4x12_1457506992918_5.png                                                         (圖片來(lái)源:澎湃新聞)

本次AlphaGo的勝利,被認(rèn)為是深藍(lán)在1997年成功挑戰(zhàn)國(guó)際象棋的20年后,人工智能取得的又一巨大勝利。自此,人工智能在圍棋界,攻破了人類最后的“智力壁壘”,走入了新時(shí)代。

在之前的報(bào)道中,谷歌董事會(huì)執(zhí)行主席施密特曾表示,“無(wú)論哪方笑到最后,終究都是人類的勝利,因?yàn)檎侨祟惖呐?,才讓機(jī)器學(xué)習(xí)有了現(xiàn)在的進(jìn)展和突破?!?br/>
1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點(diǎn)擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。
來(lái)源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 人機(jī)世紀(jì)大戰(zhàn),AlphaGo贏了,幸好機(jī)器沒有故意輸分享二維碼