Paradox
最開始的時候本來想著做一個科普的內容,但是在耐心研究過之后才發現,Google的世界已經不是我這樣沒進行過專業訓練的電競記者能夠用明確清晰的描述清楚的了。但是,對于人工智能我們還是看到了非常多的誤解和偏見,所以有一些基本的不錯的提法,還是希望能夠有更多的人能夠了解。
上一次關于人工智能的熱點來自于“Alpha Go”的橫空出世,之前的雜志上也做過專門的內容,對于那個階段的人工智能而言,我們可以清晰的歸納出一些限制條件。這其中最重要的一點是來自于規則,任何棋類運動都擁有非常清晰而且簡明的規則,在規則的基礎之上,谷歌的DeepMind無論實現怎樣的學習,在我的認識里,都還是沿著過去幾十年里一般性的計算機算法在前進。換句話說,在Alpha Go的階段,利用原來的線性邏輯,谷歌實現了讓電腦的去學習。Alpha Go的偉大之處也正在于此。
但當我們把規則放到星際爭霸中的時候,谷歌雖然只是提供了一些思路,在我看來既然他們敢開啟這個項目,那他們對于“混沌”的處理已經到了我們想象之外的程度,在信息不對稱和實時交互的環境下,實現對于部分混沌規則的信息提取與分析,聽起來確實是一個非常讓人興奮的事情。如果還像很多水友把DeepMind和悍馬2000擺在一起的話,我只能說這是對于人工智能的侮辱。
說了這么多,更重要的是谷歌的工程師為電子競技的選手和數據分析師,提供了一個非常重要的思路,通過這個思路也許我們能夠獲得完全不同的電競解決方案,也是電子競技不同于傳統體育的要點所在。
部分混沌的規則
聽起來很玄妙的理論,我們可以用非常字面的方式理解混沌,因為部分混沌到底是怎么界定的不是重點,重點在于我們在所有的電競項目的游戲規則中,我們要直面復雜設計規則帶來的不可知。
在傳統的思維方式中,我們希望能夠有一些模型有效的量化眼前的世界,所以在數據分析的過程中,我們更習慣歸納和總結。但在一定的條件之下,歸納和總結會讓我們浪費大量的時間,而游戲本身版本迭代速度驚人,同時很多平衡性調整是牽一發動全身,所以很難實現規律的總結,而DeepMind的思路,通過大量的統計和不斷的試錯,來是發現相對優的解法。其實這樣的方法在電子競技的訓練中是完全可取。以職業選手的訓練量和訓練水平,我們只需要大量提取數據,很多問題我們完全可以通過經驗規律來解決,最重要的是,我們要相信這些規律。
不對稱性信息的提取
在一般的傳統體育中,場面的博弈中幾乎不會存在直觀信息的不對稱,但是在電子競技中,不對稱的信息是一個非常基礎的玩法。但是在數據分析的過程中,我們更喜歡從結果出發,然后提出一些可以支撐的戰術分析邏輯。比較好的戰術分析師和教練會嘗試不斷的開關全圖,開讓選手理解他們的邏輯。但是對于本身不對稱的信息到底應該通過什么樣的方法來提取,可能我們還做的遠遠不夠。
這不是說我們應該在什么時間把在什么位置插眼或者探路的問題,是從既有的信息中,怎么提取有效信息的問題。我想在這個維度上,不久的將來DeepMind會給電子競技帶來非常多全新的思路,畢竟谷歌是在走在人類最前沿的,如何能夠更好的向DeepMind平臺學習提取信息的方法,非常值得選手和戰術分析師的關注。
實時交互環境的分析
這是人類要強于人工智能非常重要的部分,在我們大腦中,科學家還沒法解釋清楚神經元對于信息匯總之后的分析是如何精密實現的。DeepMind在星際爭霸中遭遇的最大障礙可能也來自于此,但從專業人士口中得到的信息是,在自主學習的過程中,人工智能是把信息的提取和分析剝離。
在這一點上,也是對于一般性思維方式的挑戰,我們習慣把很多信息混在一起講,實際上這樣的講法往往不能切中要害,而追求單純的控制變量又做不到,所以電競的數據分析一直都處于一個低水平發展的階段,而DeepMind告訴我們,越是實時交互環境下的事件,我們越應該把信息的提取和分析分開來處理。
原因很簡單,只有朝著這個思路前進,我們才能提高訓練的效率。而可能最初的訓練體驗會很差,但長此以往,我們對于信息處理的能力是可以得到充分訓練的,以此因為大量的實時信息的涌入而造成分析困難。簡單的說,在星際爭霸中,面對三線空投,除了拉農民這樣的規避動作之外,在三線空投都已經定位的時候再選擇主力的分兵防守,可能比第一時間拉上大量部隊回防在最終的結果上要好,可能用一礦的農民為代價保住了最關鍵的牛塔,然后才能有下一波反擊的機會。
結語
對于是不是我們將來要依靠人工智能做為陪練和分析師,是不是要看到谷歌的強大AI與世界最頂尖職業選手的對抗,這些在好的方法論面前都變得不那么重要。過去十幾年里,硅谷的很多企業都一直潛心人工智能,這不僅代表著智械危機的將來,也代表著人類應該不斷進步的現在。