王彥彬

舉世矚目的圍棋人機世紀大戰——谷歌人工智能系統“阿爾法圍棋”(AlphaGo)對決韓國高手李世石(五番賽第一回合),于北京時間3月9日12時在韓國首爾準時拉開帷幕。
繼2015年10月份AlphaGo在沒有任何讓子的情況下以5∶0完勝歐洲冠軍職業圍棋二段樊麾之后,AlphaGo向李世石發起了挑戰。
面對擁有眾多國際冠軍頭銜的九段高手李世石,AlphaGo已經連下兩城,取得2∶0的領先。
三萬個“深藍”
其實人工智能征服人類的智力驕傲是個漫長的征程。
1997年,IBM的“深藍”戰勝了國際象棋世界冠軍卡斯帕羅夫。歐美傳統里的頂級人類智力試金石,在電腦面前終于一敗涂地。這讓重達1270公斤、擁有32個微處理器、每秒可以計算2億步、計算能力達到11.38GFLOPS的“深藍”聲名顯赫,轟動世界。
但在長期以來圍棋AI一度舉步維艱,頂級AI甚至不能打敗稍強的業余選手。但是現在一臺筆記本的計算能力就已經遠遠超越了“深藍”,成功戰勝了圍棋世界冠軍李世石。
人工智能正在指數級快速增長。據了解,AlphaGo計算能力是當年IBM計算機“深藍”的3萬倍。
揭秘AlphaGo
谷歌于2014年收購了英國人工智能公司DeepMind。今年早些時候,DeepMind的團隊發表論文,介紹了AlphaGo擊敗職業棋手、歐洲圍棋冠軍樊麾的情況。
AlphaGo的核心是兩種不同的深度神經網絡。“策略網絡”(policy network)和 “值網絡”(value network)。它們的任務在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在計算機可以完成的范圍里,本質上和人類棋手所做的一樣。
其中,“值網絡”負責減少搜索的深度——AI會一邊推算一邊判斷局面,局面明顯劣勢的時候,就直接拋棄某些路線,不用一條道算到“黑”;而“策略網絡”負責減少搜索的寬度——面對眼前的一盤棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。將這些信息放入一個概率函數,AI就不用給每一步以同樣的重視程度,而可以重點分析那些有戲的棋著。
AlphaGo利用這兩個工具來分析局面,判斷每種下子策略的優劣,就像人類棋手會判斷當前局面以及推斷未來的局面一樣。這樣AlphaGo在分析了比如未來20步的情況下,就能判斷在哪里下子贏的概率會高。
人類在下棋時有一個劣勢,在長時間比賽后,他們會犯錯,但機器不會。而且人類或許一年能玩1000局,但機器一天就能玩100萬局。所以AlphaGo只要經過了足夠的訓練,就能擊敗所有的人類選手。
不必過于驚慌
AlphaGo戰勝李世石,人工智能研究者面對這樣的成就當然欣喜。深度學習和強化學習等技術完全可以用于更廣泛的領域。比如最近很火的精準治療,我們可以訓練它們判斷哪些治療方案對某個特定的人有效。
就像十多年前的“深藍”戰勝國際象棋世界冠軍一樣,今天,AlphaGo戰勝李世石也必將引發超出圍棋自身領域之外的討論。人工智能還將在其他層面上繼續碾壓人類嗎?傳統認為人工智能不可能完成的任務是否也都將被逐一打破?人類最后是會進入人工智能的烏托邦還是被人工智能淘汰呢?
沒人知道答案。但有一點毫無疑問:面對人工智能不用過度驚慌。人工智能一定會進入我們的生活,并且將極大地改善我們的生活,我們不可能躲開。