人類在沙盤上推演戰爭的歷史,或許比文字承載的文明更加古老。殷商甲骨上的卜辭尚在灼痕中顫動時,周王朝的將領已用陶俑與河圖演繹“牧野之戰”;羅馬軍團的百夫長用蠟塊在石板上勾畫高盧地形時,漢尼拔的象群正踏過阿爾卑斯山的積雪。而現代兵棋的雛形,則在19世紀普魯士軍事改革的鐵砧上淬煉成形,若現實戰爭是混沌的迷霧,兵棋便是第一盞穿透虛妄的提燈。
兵棋的終極目的,從來不是復刻戰爭,而是淬煉人類在混沌中捕捉秩序的本能。人類與AI的決策鴻溝,本質是兩種思維范式的對決。AI是絕對理性者,它需要清晰的規則邊界與充足的數據訓練;而人類是直覺獵手,擅長在規則崩壞處尋找機遇。兵棋推演的核心價值,正在于將指揮官拋入這種“確定性與不確定性”的撕扯中——用規則框架構建理性基底,又用戰爭迷霧保留直覺騰躍的空間。而兵棋推演,正是通過千萬次虛擬的“不完美抉擇”,將這種能力鍛造成肌肉記憶。
本文的核心議題聚焦于兵棋推演的模擬效能評估機制與方法探析。首先需要明確指出的是,在可預見的未來,人類尚無法構建具有完全精確性的兵棋推演模型體系。倘若真能實現這種絕對精確的模型建構,那么人類軍事決策體系將不可避免地需要全面遵循人工智能的運算結果,甚至應當將其作為軍事決策的范式標準。在這種情況下,針對兵棋推演的模擬效能評估,現階段仍以定性分析為主導范式,即采用“模擬性不合格”與“模擬性合格”二元分類體系。基于筆者十余年的兵棋推演經驗來看,絕大多數的商業兵棋都可以歸為“模擬性不合格”,少數“模擬性合格”的作品,暫時來說難以用明確的定量手段分出模擬性的高下,更多是一種直觀感受。

進行定性分析的最重要的方法就是反證法。首先要說明“優勢策略”的含義,優勢策略指在一個兵棋中玩家為取得推演的勝利,應采取的勝率較高的策略。與之相對應的反義詞是“劣勢策略”。一個兵棋假如具備一定的模擬性,那么該兵棋中的優勢策略應該與現實中的戰術原則相符合,假使不符合的話,那么可以反推出該兵棋欠缺最基本的模擬性。在戰術作戰中,最基本的戰術原則是“火力與機動”,即當任一機動單元開始機動時,應有相應的火力單元為其提供掩護,二者的動作應是基本同步進行的,或是機動單元稍稍在前,火力單元在敵軍開火時迅速響應。而在上世紀誕生的諸多戰術兵棋,例如高級步兵班長ASL、火力戰Firefight、MBT中,火力與機動并不是他們的優勢策略,“全走全打”才是他們的優勢策略。例如,筆者曾經有大量的ASL推演經驗,從這些推演經驗中,會錯誤地以為真實戰場上,如果我方的兵力占優勢并且需要進攻,最佳的策略就是同時向守軍躍進(至少是用絕大部分人躍進),從而使得守軍無法防御射擊所有進攻者。真實的基層軍事指揮官可能很輕易就能洞察這里面存在的邏輯問題,遺憾的是如此簡單的事情時至今日依然沒有獲得廣泛的認可和共識。正是兵棋設計中“一半科學、一半藝術”的特性造就了這一點,很多兵棋設計師并非專業的軍事人員,在設計的過程中難免脫離了一些基礎的軍事行動邏輯;而專業的軍事人員往往也只能講出直觀感受上的“合理”與“不合理”,難以直接指出具體的問題所在以及形成原因。
反證法同樣可以用于大戰術兵棋以及戰役兵棋中。以著名的戰役兵棋戰役作戰系列OCS為例,OCS的補給系統看上去非常不錯,因為它給出了具象化的補給物資,稱為SP,1SP約等于1500噸補給物資。玩家在執行特定行動的時候,如裝甲師移動、戰斗、建設、炮兵轟炸會消耗SP。一切看上去都井井有條非常美好。但是隨著玩家對于OCS策略的解構,已經把OCS的推演方式推向了一個極端。使得OCS完全成為了一個少數人的戰爭。比如在OCS系列中的著名作品古德里安閃擊戰Ⅱ,表現的是德軍中央集團軍在1941年底進攻莫斯科的臺風行動。在熟練的德軍玩家手里,德軍90%以上的SP都被20個左右裝甲師、摩步師在進攻中消耗掉了,而剩下40余個步兵師僅僅花費了5%左右的SP,而且他們幾乎永遠都在承擔防守任務,從不發起主動進攻,這是完全不符合現實情況的。

所以,OCS里的優勢策略和現實中的軍事策略并不符合。如果完全以OCS的經驗套用現實,會得出裝甲師的編制應該越大越好的荒謬結論,以及步兵師在德軍的進攻行動中完全是“醬油角色”的錯誤認知。OCS的設計師Dean Essig在設計營級作戰系列BCS時,有在設計筆記中詳細闡述為什么OCS的設計最終失敗了,以及BCS是如何避免走上同一條老路的。BCS的設計筆記同樣也說明了為什么傳統的攻—防—移戰役棋從一開始就難以還原真實的軍事行動邏輯。在絕大多數傳統的戰役棋中,單個算子的數據往往以攻—防—移的面目出現,單個格子的堆疊上限比較低,并且不會限制玩家的進攻方式。那么幾乎可以肯定,在這樣的兵棋設計下,優勢策略一定是多格打一格,但是正如Dean Essig指出的,現實中并不存在類似的進攻邏輯。舉個例子,假使防守方的兵力足夠填滿戰線,按照二戰標準就是一個步兵師負責10千米左右的防線,那么在傳統兵棋中,進攻方肯定會用3格進攻1格或者2格進攻1格的方式來達成所謂的3:1左右的進攻,但這在現實中是完全不可能做到的。受限于兵力密度和協調難度,能夠投入第一線的進攻部隊永遠是有限的,進攻方如果擁有更多的兵力,他的優勢往往是體現在可以在更寬廣的正面上施加壓力,以及當第一線進攻取得成功的時候,可以迅速投入預備隊發展戰果,而并非體現在初始交戰時。

我們還可以用一個現實的例子去理解,在諾曼底戰役中,從1944年7月初開始,盟軍就已為歐洲大陸輸送了超過一百萬士兵,并且還在不斷增援。德軍則是約有四十萬人在諾曼底地區作戰。盟軍從此時開始就至少擁有2.5:1的兵力優勢,但雙方依然拉鋸了超過一個月,戰線在8月初之前變化很小。其核心原因就在于盡管盟軍登陸過程大體順利,但是相比于常規陸戰而言,德軍的戰線非常短(至6月底戰線正面約120千米,對比此時東線戰線長度超過1800千米),德軍增援來的師基本可以填滿戰線,那么在雙方戰斗力差距不大的情況下,自然很難短時間內快速突破德軍防線。所以,假設防守方的完整防線由A、B、C三個在不同格子的單位組成,進攻方擁有更多兵力并不意味著它可以用“更強大的”方式去進攻A,而是說它可以同時向ABC施加壓力,以及一旦進攻成功,可以釋放更多的預備隊去嘗試擴張戰果。但是以傳統的戰役級兵棋設計方式,很容易出現的情景是進攻玩家在ABC中選擇一個完美的目標,然后集中全力去進攻這個目標。
在完成基礎層面的探討后,我們需要轉向更具挑戰性的核心問題討論。首先必須要引入一個兵棋推演中的獨特概念,稱為“Gamey”,筆者至今都無法找到一個合適的中文詞與之對應,所以依然保持原始的英文叫法。Gamey的意思是指在兵棋推演中存在的某些策略,這些策略在兵棋的框架下屬于優勢策略,但是很明顯不屬于現實中存在的軍事策略。舉個例子,在某戰術兵棋中,坦克如果在友方的炮火轟炸區內對敵軍進行戰車碾壓,相比于直接發起戰車碾壓,會獲得一些優勢。但這明顯是不符合現實的戰術原則的,現實的坦克指揮官絕對不會輕易把己方戰車送入炮火轟炸區內進行作戰。這種類型的Gamey是可以通過調整規則來避免的,比如說應該對坦克在炮擊區或煙霧內執行戰車碾壓進行懲罰,而目前該兵棋尚未存在這樣的規則,這是導致這一Gamey的原因。
并非所有的Gamey都能通過更新規則的方式來解決,讀者可能對此會有一些疑惑。通常來說,在兵棋設計中的絕大多數部分,我們可以通過規則上的設置,鼓勵玩家做出符合現實軍事邏輯的決策。但是在某些情況下,想做到這一點是非常困難的。例如指揮與控制。
這里我們同樣以Dean Essig設計的戰術作戰系列TCS為例,來進行說明。在TCS中,為了體現現實中的指揮與控制過程,Dean Essig設置了一套行動計劃規則,在這部分規則中,玩家在指揮任何單位進行任何軍事行動之前,都需要事先把自己的行動計劃用圖表的方式寫下來。玩家需要在微縮地圖上畫出本次行動所涉及的區域,所選的路線,各單位的行動分界線、火力分界線等,并且輔以文字說明,使得任何人看到這份行動計劃,都能輕松地理解其意思。每份行動計劃在真正執行前,隨著時間推移以及部隊情況積攢準備度,每回合根據準備度進行判定,準備度越高越容易通過,只有判定通過,行動計劃才能開始。

這部分規則的本意是為了體現現實軍事作戰中指揮與控制上的難度。例如現實中當軍事進攻行動受阻時,除非一開始就留有預案,否則一般只能先行放棄進攻,撤退到重整點后,再另行準備新的進攻計劃。TCS的行動計劃規則可以完美地反映這一點。在進攻行動中,進攻單位的前進路線都是事先畫好的,如果不幸路線規劃有誤,正好撞上了敵軍重兵固守的區域,也是無法更改的,只能先宣布當前的計劃失敗,退回去重新準備一份計劃。看上去非常好,但是聰明的玩家立刻就能想到,行動計劃規則并沒有規定我應該把進攻計劃寫的多細致,那我干脆一開始就寫一個非常寬大的進攻軸,這樣能夠給自己留下足夠大的自由空間。比如我有一個步兵營需要進攻,我干脆畫一個寬度達到3千米的進攻軸(二戰通常營的進攻正面是600米左右),聲明我這個營在這3千米內如何進攻,都是合規的。假如進攻受阻了,那么我就在這3千米內隨意選擇新的進攻方向再行進攻。事情到這里,就已經很明顯是一個Gamey的情況了。那么我們能否通過增加規則細則的方式來避免這種Gamey呢?答案是理論上有可能,但不現實。如果限制一個進攻軸的最大寬度是500米,那么幾乎立刻就會被新的方法所繞過,例如玩家可以畫出更多的進攻軸,或者說玩家故意把一個進攻軸包含兩條道路,目的是到時候看情況選擇哪條公路。
如果我們嘗試去做進一步的限制,結果也是一樣的,玩家只要想,總是能夠創造出各種各樣的新的Gamey。核心問題在于指揮與控制本身就是一個非常復雜的命題,想要完全復原現實中的決策環境,遠非一兩句話可以做得到。如果長篇累牘地去設置大量的規則,依然很難杜絕Gamey,反而對規則的簡潔性是一種巨大的傷害。不如就像TCS這樣,把規則的框架留下,具體的細則由玩家推演的時候再去根據軍事原則進行溝通和協商,我個人把這種設計方式稱為“通識規則”。客觀來說,“通識規則”的存在,對于目的旨在娛樂和競技的玩家來說,往往不是一件好事情,很容易在兵棋推演的過程中,產生一些爭議。但是對于目的旨在體驗歷史和軍事的玩家,以及對于專業的軍事人員來說,是無價之寶。專業的軍事人員完全可以根據自己的需要,在總的框架下,設置特定的細則,從而達到特定的推演目的。“通識規則”的存在,也是AI無法在可預見的未來做出“完美的”軍事決策的原因之一。道理很簡單,建立在并非百分百準確模型基礎上的AI,通過強化學習之后選擇的最佳策略,很可能會拿出一份人類一眼就能識別出Gamey的方案,從而失去了參考價值。
自上個世紀開始,不管是桌面兵棋還是電子兵棋,都有設計師嘗試過完全“自下而上”設計兵棋。說得簡單通俗一點,就是從最底層的交戰開始模擬,然后向上堆積,形成最終的結果。舉個例子,在戰役級電子兵棋WITE中,德軍一個步兵師進攻蘇軍一個步兵師,在戰斗結算中,你可以看到德軍MG34機槍被蘇軍F-22火炮命中。依照這種理念,好像更容易設計出模擬性較高的兵棋。但從筆者的經驗來看,事實往往是相反的。因為這種設計方式,其最終的模擬性是建立在一系列子模型都要精準無誤的基礎上,這是最好詮釋“失之毫厘,差之千里”的鮮活例子。很多這種設計方式的成品,包括WITE本身,通過最簡單的反證就可以確定為模擬性不合格。


兵棋的終極悖論,或許就藏在那枚被反復推移的算子之中:它既是人類掙脫認知繭房的鑿斧,也是鑄造新繭房的熔爐。當我們在ASL的棋盤上目睹“全走全打”的荒謬,在OCS的推演中看見德軍裝甲洪流吞噬莫斯科的幻象,在TCS的行動計劃里窺見三千米進攻軸的狡黠時,我們真正對抗的從來不是規則漏洞,而是人類用簡化模型理解復雜世界的永恒困境。兵棋設計師如同普羅米修斯,既要盜取戰爭規律的火種,又要時刻警惕這火焰不會焚毀決策者的心智。我們創造兵棋,不是為了預見戰爭的終點,而是為了守護在混沌中抉擇的勇氣。
責任編輯:劉靖鑫