芥末堆芥末堆

人機(jī)世紀(jì)大戰(zhàn),AlphaGo贏了,幸好機(jī)器沒有故意輸

作者:阿博 發(fā)布時間:

人機(jī)世紀(jì)大戰(zhàn),AlphaGo贏了,幸好機(jī)器沒有故意輸

作者:阿博 發(fā)布時間:

摘要:一個時代的終結(jié)。

69531310978718211.jpg

芥末堆文,3月9日中午12時,來自于Google的人工智能機(jī)器人AlphaGo同韓國棋手李世石展開具有“跨時代意義”的第一場人機(jī)大戰(zhàn)。比賽持續(xù)了近4小時,AlphaGo以人工智能的身份,最終贏得了這場比賽。

李世石,1983年3月2日生于韓國全羅南道,曾于2006、2007、2008均獲得韓國圍棋大獎—最優(yōu)秀棋手大獎(MVP),是職業(yè)九段選手的世界圍棋冠軍,此次代表人類出戰(zhàn)。本次圍棋挑戰(zhàn)賽共分為5場,在韓國首爾舉行,獲勝者將得到一百萬美元獎金。

而AlphaGo(阿爾法圍棋)是一款由英國谷歌旗下的DeepMind團(tuán)隊(duì)開發(fā)而成,主要工作原理是“深度學(xué)習(xí)”,即通過模擬人腦神經(jīng)網(wǎng)絡(luò)和對職業(yè)棋手棋譜的學(xué)習(xí),進(jìn)行自我博弈,再通過兩個不同神經(jīng)網(wǎng)絡(luò)“大腦”來決定棋路,曾于去年10月以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾。這場人類同智能機(jī)器人的“世紀(jì)之戰(zhàn)”,瞬間吸引了眾多關(guān)注。

177135250641532652.jpg

從圍棋學(xué)習(xí)談起,圍棋為什么是“人類最后的智力驕傲”?

相對于國際象棋,為什么說圍棋是“人類最后的智力驕傲”呢?因?yàn)閲遄鳛橐婚T競技體育項(xiàng)目,更成體系,邏輯性也更強(qiáng),更難學(xué)習(xí)和提升。國際象棋每一步有24種可能性,而圍棋以變化反復(fù)聞名,按照棋盤上每個交叉點(diǎn)上黑、白、空三種可能性算,棋盤的變化總數(shù)可達(dá)3的361次方次可能性,而目前的計(jì)算機(jī)無法對所有走法進(jìn)行統(tǒng)計(jì)和窮舉,因此人工智能依然無法玩轉(zhuǎn)圍棋界。此次AlphaGo贏得了這場比賽,刷新了圍棋界的新紀(jì)錄,代表人工智能第一次在圍棋界,超越了最高水平的專業(yè)選手。

圍棋作為變化多端的一種競技類項(xiàng)目,一般認(rèn)為可以開發(fā)智力,拓展思維,具有很強(qiáng)的教育意義和鍛煉意義。據(jù)悉,中國學(xué)習(xí)圍棋的兒童目前已超1000萬人。

機(jī)器學(xué)習(xí)模仿人腦神經(jīng)模式,所以能“步步為贏“?

在去年10月樊麾同AlphaGo的對弈中,樊麾曾表示,“如果沒有人告訴我,我一定不知道它是電腦,它太像人了。它一定是在思考。”此外,樊麾還提到在對弈過程中,AlphaGo不同于人類,完全沒有心態(tài)的波動變化,且有很強(qiáng)的學(xué)習(xí)能力。AlphaGo會進(jìn)行自我學(xué)習(xí),采取自我博弈的方式,一旦輸了,就會記錄下來,下次避免這種下棋方式。通過數(shù)據(jù)統(tǒng)計(jì)和積累,研究出最好的下棋和落子方式。

從1997年美國IBM公司研發(fā)的超級計(jì)算機(jī)“深藍(lán)”戰(zhàn)勝了當(dāng)時世界排名第一的國際象棋大師卡斯帕羅夫后,機(jī)器學(xué)習(xí)的概念再次走進(jìn)大眾視野。不同于人類的學(xué)習(xí)模型,機(jī)器學(xué)習(xí)是對能通過經(jīng)驗(yàn)自動改進(jìn)的計(jì)算機(jī)算法的研究,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能。除卻“深藍(lán)”,2006年,超級計(jì)算機(jī)“浪潮天梭”也在人機(jī)大戰(zhàn)中大敗5位中國象棋特級大師。

AlphaGo采取的主要工作原理是“深度學(xué)習(xí)”模式,即擁有多層的人工神經(jīng)網(wǎng)絡(luò)及訓(xùn)練它的方法。AlphaGo擁有“策略網(wǎng)絡(luò)”和“價值網(wǎng)絡(luò)”兩個“大腦”,通過策略網(wǎng)絡(luò)觀察棋盤,決定下一步下棋步驟,而“價值網(wǎng)絡(luò)”則是在判斷對手贏棋可能性的情況下進(jìn)行落子決定。

wxid_h8mx6n2bsh4x12_1457506992918_5.png                                                         (圖片來源:澎湃新聞)

本次AlphaGo的勝利,被認(rèn)為是深藍(lán)在1997年成功挑戰(zhàn)國際象棋的20年后,人工智能取得的又一巨大勝利。自此,人工智能在圍棋界,攻破了人類最后的“智力壁壘”,走入了新時代。

在之前的報道中,谷歌董事會執(zhí)行主席施密特曾表示,“無論哪方笑到最后,終究都是人類的勝利,因?yàn)檎侨祟惖呐?,才讓機(jī)器學(xué)習(xí)有了現(xiàn)在的進(jìn)展和突破?!?br/>
1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點(diǎn)擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 人機(jī)世紀(jì)大戰(zhàn),AlphaGo贏了,幸好機(jī)器沒有故意輸分享二維碼