-
陳經(jīng):人類智能堡壘圍棋突然被谷歌智能攻破了,靠的是策略判斷和暴力搜索兩手都硬
關(guān)鍵字: 谷歌人工智能職業(yè)二段圍棋圍棋AI人工智能AlphaGoAlphaGo電腦圍棋樊麾2016年1月28日一早,圍棋圈和人工智能圈被一個消息給炸了:
谷歌人工智能分先5:0擊敗歐洲職業(yè)圍棋冠軍樊麾,2016年3月將分先挑戰(zhàn)李世石,獎金100萬美元。
Nature網(wǎng)站出了新聞:
谷歌的人工智能算法精通了古老的游戲圍棋(Google AI algorithm masters ancient game of Go)
1月28日出版的Nature封面文章介紹了這個人工智能領(lǐng)域的重大突破。
文章第一作者David Silver
圍棋迷以前的感覺是,電腦圍棋確實(shí)進(jìn)步挺大的,但要說能挑戰(zhàn)職業(yè)棋手,似乎還有很長時間,十年或者更長。
僅僅兩個月前,2015年11月,北京舉辦了一次“美林谷杯”電腦圍棋競賽,冠軍是韓國人工智能程序“石子旋風(fēng)”(DolBaram),被讓四子、五子、六子與中國職業(yè)高手連笑七段(剛獲得名人和倡棋杯兩個頭銜)對弈。在第一局中,電腦顯得無比愚蠢,執(zhí)著地與連笑打一個注定無法勝利的連環(huán)劫,消耗了大量劫材不斷虧損,對弈中連笑都笑開花了。直到讓六子,電腦才勝了一局。
連笑七段和DolBaram作者林宰范
早期的電腦圍棋代表程序是我國陳志行教授(量子化學(xué)家,跟風(fēng)云學(xué)會會長袁嵐峰是同行,2008年去世)開發(fā)的“手談”,上世紀(jì)90年代多次獲得電腦圍棋世界冠軍。那時的電腦圍棋棋力不到業(yè)余一段,業(yè)余棋迷們以讓多少子戰(zhàn)勝“手談”為談資,讓七八子都很正常。
1997年IBM的國際象棋程序“更深的藍(lán)”戰(zhàn)勝了人類最高水平的卡斯帕羅夫,當(dāng)時興起了一股人工智能熱潮。但是圍棋迷很淡定:電腦圍棋,還差太遠(yuǎn),離一般業(yè)余棋手都有不小的差距。按某種估計(jì),圍棋的復(fù)雜度是10的170次方,比國際象棋的10的47次方多100多個0,電腦還差得遠(yuǎn)。這個時期的圍棋程序有的搜索,有的不搜索,但基本還是與國際象棋的人工智能算法相似,被圍棋的復(fù)雜度輕易擊敗,下起來一看就很愚蠢,根本不象人。
和國際象棋類似,中國象棋也被人工智能程序攻破了。業(yè)余象棋比賽多次傳出選手使用軟件作弊的丑聞,職業(yè)圈子中王天一、孫勇征等大師也為之爭吵。之后圍棋逐漸成為人工智能領(lǐng)域的核心難題。Google、Facebook和微軟都開了圍棋研究小組。
圍棋人工智能的上一次顯著突破,是2010年左右,開發(fā)者們引入了“蒙特卡洛”算法。這種算法的特點(diǎn)是模擬棋局一直到下完算子判斷勝負(fù),模擬多次后看哪個選點(diǎn)的“獲勝概率”最高。模擬時會利用“棋形”等經(jīng)驗(yàn)減少選點(diǎn),一直模擬下去直至終局。時間不夠或者電腦計(jì)算能力不足,模擬的“局面數(shù)”就少,棋力就低。這是一個基于概率的暴力搜索算法,確實(shí)取得了突破。代表程序有日本的Zen,法國的CrazyStone,以及前面提到的DolBaram(在北京擊敗了Zen與CrazyStone)。中國電腦圍棋開發(fā)者這時落后了,沒有開發(fā)出水平相當(dāng)?shù)某绦?。這些基于蒙特卡洛算法的圍棋人工智能,已經(jīng)可以輕松戰(zhàn)勝一般業(yè)余棋手了,但是對職業(yè)棋手還是差距很大。對局時,電腦招法一般看著還可以,但有時會出現(xiàn)一些莫明其妙的招數(shù),如落后時就開始瞎下。這是因?yàn)殡娔X根據(jù)概率評估,瞎下人應(yīng)錯了它有機(jī)會勝。
研究者以及棋迷們都認(rèn)為,蒙特卡洛概率暴力搜索雖然取得了棋力的巨大突破,但不是圍棋人工智能技術(shù)繼續(xù)發(fā)展的方向。即使再增加算力,增多模擬局面,棋力也不會有本質(zhì)提升,戰(zhàn)勝職業(yè)棋手是不可能的。業(yè)余棋迷們會驚嘆于人工智能圍棋的發(fā)展,在KGS圍棋網(wǎng)上,排著隊(duì)和Zen等人工智能程序?qū)趾苡袠啡?。但職業(yè)棋手們?nèi)匀缓艿?,認(rèn)為圍棋人工智能挑戰(zhàn)職業(yè)選手還是很遠(yuǎn)的事。
就在前面連笑與DolBaram對弈之后,對于電腦圍棋較為了解的中國圍棋隊(duì)總教練俞斌九段評論說:
“國際象棋的電腦程序是圍繞著殺死王這一要點(diǎn)設(shè)計(jì)的,比較有效。而圍棋的棋子沒有大小之分,電腦無法判斷哪條大龍更大,從而無法準(zhǔn)確做出取舍。圍棋到后盤收官變化無窮,越下到后面,盤面形勢就越復(fù)雜,這讓計(jì)算機(jī)程序難以做出正確選擇?,F(xiàn)在設(shè)計(jì)圍棋電腦軟件的都是業(yè)余棋手,而軟件的水平很難超過設(shè)計(jì)者,光靠電腦會記能算,想戰(zhàn)勝職業(yè)高手是不容易的。業(yè)余棋手思考問題的方法與職業(yè)棋手不同,如果今年由圍棋和電腦軟件高手聯(lián)手編寫軟件,那么,電腦圍棋的水平會有質(zhì)的變化。”
國家隊(duì)總教練俞斌九段
這次Google的DeepMind小組開發(fā)的AlphaGo取得的突破,可以說打破了俞斌九段的預(yù)期。AlphaGo與中國職業(yè)二段樊麾分先下成了5:0,新浪圍棋有這五局的棋譜。看這五局棋的感覺,AlphaGo下得非常象人,一點(diǎn)看不出是機(jī)器下的,和以前的各種程序有顯著區(qū)別。戰(zhàn)績上也是壓倒性的。第一局樊麾和電腦平穩(wěn)收官,輸了3目半。后面四局進(jìn)行戰(zhàn)斗,多次被電腦殺死大龍,全部慘敗。
樊麾雖然只是歐洲冠軍,但畢竟有中國職業(yè)段位,就算多年在低水平環(huán)境中棋力下降,業(yè)余頂尖水平總是有的。AlphaGo也和之前最高水平的程序Zen、CrazyStone下過,分先495盤只輸了1盤。它甚至能讓4子對陣Crazy Stone和Zen,勝率分別是77%和86%。這個水平突破絕對是革命性的。
-
本文僅代表作者個人觀點(diǎn)。
- 請支持獨(dú)立網(wǎng)站,轉(zhuǎn)發(fā)請注明本文鏈接:
- 責(zé)任編輯:李楚悅
-
圍島集結(jié)、多向抵近!現(xiàn)場視頻來了 評論 165美國學(xué)者開始“流亡” 評論 126“中國走在這場國際救援最前線,美國呢?” 評論 133“再不打錢,歐洲在這個領(lǐng)域也會輸給中國” 評論 141最新聞 Hot
-
“斯塔默這么努力地討好特朗普,但沒回報”
-
特朗普最新對朝表態(tài)
-
美媒竟來碰瓷:解放軍這次演訓(xùn),“是在考驗(yàn)美國決心”
-
“一些政府打電話來問:中國已深耕十年,我們咋追?”
-
圍島集結(jié)、多向抵近!現(xiàn)場視頻來了
-
龍應(yīng)臺:賴清德錯了,留給臺灣的時間不多了
-
她又來:美歐相爭,中國得利
-
“說好的補(bǔ)貼不作數(shù)了,美商務(wù)部長還讓學(xué)學(xué)臺積電…”
-
美國學(xué)者開始“流亡”
-
美媒質(zhì)疑:這事真怪得著中國么?
-
“中國走在這場國際救援最前線,美國呢?”
-
“‘AI末日論’是美國的誤導(dǎo),我們的命運(yùn)要自己把握”
-
特朗普:4月2日將是“解放日”
-
馬斯克5月底離任?特朗普:我會挽留他
-
“馮德萊恩罵我半小時,說我是白癡,就因?yàn)椤?/a>
-
“再不打錢,歐洲在這個領(lǐng)域也會輸給中國”
-