揚州職業(yè)大學(xué) 林 革
提起“人機大戰(zhàn)”,想必許多人都記憶猶新、耳熟能詳。那是指兩位圍棋世界冠軍(韓國圍棋九段棋手李世石、中國圍棋九段棋手柯潔)分別與谷歌出品的人工智能圍棋程序“阿爾法狗”(AlphaGo)之間的巔峰對弈。第一場為2016 年3 月9 日至15 日在韓國首爾進行的五番棋比賽,“阿爾法狗”以總比分4 比1 戰(zhàn)勝李世石;第二場為2017 年5 月23 日至27 日在中國嘉興烏鎮(zhèn)進行的三番棋比賽,“阿爾法狗”以總比分3 比0 戰(zhàn)勝世界排名第一的柯潔,一時間在全球引起巨大反響和震動。人們紛紛提出同樣的問題:究竟是人腦強于電腦,還是電腦將會超越人腦?
事實上,在圍棋人機大戰(zhàn)之前,電腦程序與人類棋手的對抗在其他棋類游戲中就一直在上演。比如,共有24 枚棋子的西洋跳棋一直是數(shù)世紀以來西方人消遣的首選,這個可追溯到古埃及時期的游戲,玩法比較簡單,但要贏得勝利也并非輕而易舉。加拿大計算機科學(xué)家在經(jīng)過18 年的深入研究后,已經(jīng)證明:如果兩個勢均力敵的游戲者比賽,游戲結(jié)果必定是平局。
就總體而言,西洋跳棋是一種策略游戲,完全無法靠運氣取勝。因此,計算機科學(xué)家選中這個游戲,來測試依靠自身能力直觀掌握情況和做出決策的人腦,是否優(yōu)于在數(shù)十億種可能解答中尋找制勝策略的計算機。
1989 年,加拿大阿爾伯塔大學(xué)計算機科學(xué)家喬納森·謝弗(Jonathan Schaeffer),研制出名為“奇努克”(Chinook)的計算機程序,并邀請當時的頂尖棋手與之展開較量。在第一場西洋跳棋人機大戰(zhàn)中,身為數(shù)學(xué)家的西洋跳棋世界冠軍馬里恩·廷斯利(Marion Tinsley),以微弱優(yōu)勢險勝“奇努克”。但兩年之后,結(jié)果發(fā)生了變化。一生只輸過7 場比賽的廷斯利教授,和“奇努克”連續(xù)打成7 場平局,絞盡腦汁、身心俱疲的數(shù)學(xué)家不得不選擇退出比賽。這完全可以理解,因為他的機器對手可不知道什么叫疲勞。自此之后,關(guān)于在西洋跳棋比賽中,電腦是否優(yōu)于人腦的爭論,一直不絕于耳。
于是,謝弗繼續(xù)完善他的程序,這是令人咋舌的艱難任務(wù)。因為游戲過程中會出現(xiàn)5×1020種可能的情況。數(shù)據(jù)量是如此巨大,以至于計算機的“暴力法”(也叫窮舉算法——依賴于計算機的計算能力來窮盡每一種可能的游戲情況,從中篩選出最佳走法的策略)也難以奏效,這就要求人腦思考出更聰明的算法。
謝弗和他的團隊建立相應(yīng)數(shù)據(jù)庫,用于分析棋盤上剩10 子或更少棋子時的殘局。把需要分析的可能情況數(shù)量減少到只有390 億種,然后根據(jù)黑棋贏、白棋贏和平局這三種不同的結(jié)果,對這些殘局進行分類。一直到1996 年,他們花了7 年時間將8 子或更少棋子的殘局進行了分類。然后團隊暫停了工作,等待處理能力更強、速度更快的計算機問世。當更為高級的計算機出現(xiàn)之后,研究團隊又開始分析9 子和10子的殘局情況,為此常常需要多達200 臺的臺式計算機同時工作。
除此之外,研究團隊還分析了開局后走3 步會出現(xiàn)的各種情況。一個專門研發(fā)的程序給出了參賽雙方都有獲勝機會的最佳走法。也就是說,如果兩位選手以此進行布局和比賽,最終一定會以平局收場。
截至目前,除了西洋跳棋接受了計算機程序的挑戰(zhàn)外,對局數(shù)高達1040、局勢更為復(fù)雜的國際象棋也和電腦對弈過。最著名的國際象棋人機大戰(zhàn),當數(shù)1996 年和1997 年國際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov)對陣IBM 的計算機程序“深藍”(Deep Blue)的兩場比賽。在各賽6盤的比賽中,棋王卡斯帕羅夫以4 比2 的總比分贏得1996 年的人機大戰(zhàn),但“深藍”亦首次對陣頂尖棋手獲得勝局;而在1997 年的人機大戰(zhàn)中,經(jīng)過改進的“深藍”首次以總比分3.5 比2.5 獲勝。后來,國際象棋大師們不斷挑戰(zhàn)國際象棋的頂級人工智能,但最多只能獲得平局或個別勝局,在總比分上再也不能取勝。
接下來,電腦程序開始向人類智力游戲僅存的高地——圍棋發(fā)起沖擊。這個過程可謂舉步維艱,因為圍棋需要計算的變化數(shù)量實在太大,遠遠超過已經(jīng)觀測到的宇宙中原子的數(shù)量,采用計算機進行暴力破解完全不可行。但人類可以憑借某種難以復(fù)制的算法或直覺,一眼看到棋盤走勢的本質(zhì),這就不難理解起步的圍棋程序甚至不能打敗業(yè)余棋手。而當“深度學(xué)習(xí)”漸漸進入人工智能研究領(lǐng)域,電腦程序的圍棋技藝獲得空前的極速提升,“阿爾法狗”正是基于深度學(xué)習(xí)技術(shù)開發(fā)的產(chǎn)品,不斷完善后終于贏得萬眾矚目的圍棋人機大戰(zhàn)。
棋類游戲一直被視為頂級人類智力及人工智能的試金石。盡管人工智能程序已經(jīng)在各種棋類游戲中全面占據(jù)優(yōu)勢,但就此斷言,人類智力將臣服于人工智能,似乎還為時尚早。唯一可以肯定的是,兩者的發(fā)展和博弈仍將在相當長的時間內(nèi)繼續(xù),讓我們拭目以待吧!