本報赴烏鎮(zhèn)特派記者 黎巧毅 本報特約記者 魏云峰 本報記者 趙覺珵 張旺

“僅差了1/4目!”在23日舉行的人機(jī)圍棋大賽中,排名世界第一的中國棋手柯潔九段首局惜敗給圍棋人工智能AlphaGo(阿爾法狗)。盡管僅以圍棋規(guī)則中最小的差距落敗,但柯潔自己在賽后也承認(rèn)“阿爾法狗越來越像圍棋上帝”。各路棋手和人工智能專家普遍認(rèn)為,以阿爾法狗為代表的人工智能程序戰(zhàn)勝人類棋手已經(jīng)是不可避免的,未來更需要關(guān)注的是,如何將人工智能的這種能力應(yīng)用在更多社會領(lǐng)域。
一直沒有太好的贏棋機(jī)會
柯潔在比賽中執(zhí)黑先行,但很快陷入苦戰(zhàn)。一名現(xiàn)場觀戰(zhàn)的圍棋界人士告訴《環(huán)球時報》記者,柯潔整體上發(fā)揮還是不錯的,但能看出來這盤棋他下得很艱難。柯潔下得比較緊張,有不少類似撓頭、搖頭的小動作,表情也很豐富,不時露出不知道是微笑還是苦笑的笑容。
該人士表示,觀戰(zhàn)的棋手絕大部分都認(rèn)為這次比賽沒有懸念,柯潔確實很難贏下升級后的阿爾法狗。在距離這局比賽結(jié)束前半個小時的時候,圍棋界大部分人就基本已經(jīng)斷定柯潔沒有翻盤希望。“相比柯潔與阿爾法狗對弈,我更關(guān)心阿爾法狗和人類進(jìn)行配對賽會是什么局面。人工智能和人一起協(xié)同合作,能否在圍棋上取得什么進(jìn)步。”此前,國手古力九段就曾預(yù)測,柯潔能贏一盤的概率只有10%。棋圣聶衛(wèi)平也表示,阿爾法狗布局構(gòu)思遠(yuǎn)勝于人類,柯潔不知不覺中就中招了。“阿爾法狗有幾步棋完全出乎職業(yè)棋手意料,當(dāng)時看著奇怪,但之后仔細(xì)一看確實下得好”。
2.0版阿爾法狗進(jìn)步在何處?
柯潔在賽后的發(fā)布會上也承認(rèn),阿爾法狗確實下得精彩,改變我們對圍棋的看法,沒有什么棋是不可以下的。“感覺阿爾法狗和去年判若兩人,當(dāng)時覺得它的棋很接近人,現(xiàn)在感覺越來越像圍棋上帝”。
中科院計算所研究員、國家超算濟(jì)南中心主任張云泉23日接受《環(huán)球時報》記者采訪時表示,此次阿爾法狗的升級主要在于其使用了專門為機(jī)器學(xué)習(xí)設(shè)計的新型TPU,而此前使用的是GPU。在賽后的新聞發(fā)布會上,阿爾法狗創(chuàng)始人哈薩比斯表示,“阿爾法狗采用了10顆TPU在谷歌云端運(yùn)行。和李世石對戰(zhàn)的版本相比,此次對弈的新版阿爾法狗計算量減到1/10,自我對弈能力更強(qiáng),運(yùn)行起來更簡單,功耗也更小。”
張云泉介紹說,阿爾法狗2.0版本已經(jīng)不像此前一樣需要人類棋譜,而是通過自我對抗進(jìn)行學(xué)習(xí)。張云泉認(rèn)為,這可以理解成是一種“排錯法”,通過自我對弈,將不同情況下的錯誤選擇排除掉,讓別人找不到自己的弱點。不過目前阿爾法狗還處于監(jiān)督學(xué)習(xí)階段,達(dá)不到無監(jiān)督學(xué)習(xí)的程度。它依然還需要人類告訴它如何學(xué)習(xí)。
張云泉表示,人工智能下棋的思路和棋手不完全一樣。圍棋界有句話叫“金角銀邊草肚皮”,一般情況下,人類棋手為了減少計算量,會選擇走邊或走角,而人工智能不怕復(fù)雜計算,可能會選擇在“草肚皮”落子,把戰(zhàn)局拉到棋盤中央以發(fā)揮算力優(yōu)勢。這正是讓柯潔等棋手感嘆“沒有什么棋是不可以下”的原因。
在對弈過程中,《環(huán)球時報》記者還注意到一個細(xì)節(jié)。在收官階段,阿爾法狗落子的速度反而從最初的十幾秒一手逐漸變慢了。張云泉告訴《環(huán)球時報》記者,圍棋的棋子越下越多,阿爾法狗的計算復(fù)雜度也越來越大,這是人工智能區(qū)別于人類棋手的特點。
阿爾法狗的未來之路
按照比賽設(shè)置,未來幾天內(nèi)還將有數(shù)場人機(jī)對決。“即使柯潔贏下其中一局比賽,但柯潔的提升空間有限,而阿爾法狗卻有提升計算能力的巨大空間。”賽迪電子信息產(chǎn)業(yè)研究中心行業(yè)研究專家向陽接受《環(huán)球時報》記者采訪時表示,“大趨勢是人工智能的計算能力已超過人類,尤其是在圍棋領(lǐng)域。”
如果徹底在圍棋領(lǐng)域打敗人類,阿爾法狗下一步會干什么?此前有報道稱,它可能繼續(xù)修改后會去挑戰(zhàn)難度更高的電腦游戲《星際爭霸2》。張云泉介紹說,阿爾法狗依賴的技術(shù)都是通用技術(shù),除了這類挑戰(zhàn)比賽外,它也可以用在算法適用的其他領(lǐng)域。尤其是深度學(xué)習(xí)算法,對圖像的理解能力做得比較快,需要認(rèn)知的能力方面有很大的提升。以后在對這類技術(shù)需求比較高的領(lǐng)域,比如說交通規(guī)劃、決策領(lǐng)域,用來局勢的預(yù)測,都大有用武之地。▲
環(huán)球時報2017-05-24