王 鋒
(中國人民解放軍92493部隊13分隊 葫蘆島 125000)
2020年2月18日美國參謀長David Goldfein 提出“聯合全域交戰”,是美軍最新的跨域配合作戰概念[1]。2020年3月5日,《美國空軍在聯合全域作戰中的作用》被美國空軍部門發表,該文件說明聯合全域作戰是未來的大勢所趨,即“在整體策動并協同實施后,配合力量對包括陸、水、天空、電磁譜以及眾多其他地區進行戰斗活動,取得絕對優勢,并圓滿完成使命”[2]。作戰理論的發展對指揮系統提出了極大的挑戰,也對作戰管理系統的發展提出了更高的要求。面臨大量異構復雜多源的信息同時進行提取與分類處理的需要,作戰過程的高速化特點,以及復雜多變戰爭條件下轉瞬即逝的作戰需求,采用新技術、新方法和新手段研制符合未來戰斗模式的作戰管理系統是當務之急。應用層次已由作戰層次提高至戰術層次,凸顯了未來作戰中各兵種間跨地域合作的意義[3~6]。
作戰概念一旦進行演變,控制體系的壓力就撲面而來,它的發展也有更高的雕欄。鋪天蓋地的數據對我們提出要求,我們還要做到兵貴神速,并且還要考慮抓住戰場上面的機遇,發展適應新型作戰概念的指揮控制體系成為燃眉之急[7~9]。
信息化要求下,海上斗爭區域拓展,軍事行動速率提高,形勢迅速轉變,對船舶信息化戰斗指揮力量的需求愈來愈高。為了提高戰斗指揮效益,必須采用自動化的指揮系統。所以,對艦艇武器等電子設備的信息化管理,以及利用計算機技術實現的戰略輔助決策與計算,是當前中國計算機工程應用領域研究的重點[10~12]。
因為指控系統工作在動態條件下,隨著情況變化不斷出現,且在一個時刻內可以同時出現多種條件變化。因此考慮到被控系統本身也是一種有著復雜工作機制的物理系統,按照實際變化的基本規則和經驗,其變化之間也可以同時具有一定的關聯。如果獨自調整某一方案,由于這些關聯性,很可能產生潛在隱患。因此,為了應對同時出現的多種情況,相同的戰斗資源將被多個方案更改。衡量沖突本身的變化可以采用自我匹配的決策,選擇中庸的方案,去處理疑問。其次,由于系統本身原因,更改的策略一定不是完美的,就像拋硬幣無法知道正反一樣,也無法預測真實性。這說明策略具有不可以預測的屬性,也就導致了自我適應的決策僅靠靜止的策略不行[13]。因此自我適應的決策必須具備在線決策能力,可以動態完善策略。
本文以基于搜索的軟件工程理論為基礎,將自我適應的決策看作是一種優化調整,在眾多策略中形成一個空間的集合,尋找最佳的策略。用這種方法滿足決策需求,從而有效地應對內在的與外在的變化。在優先級沒有被定義之前,可以采用基于多目標的搜索優化的技術手段,實現數個更改的衡量、分析和調整。本文提出的基于并行搜索改進的指揮與控制系統的適當決策方法將決策問題轉化為轉換搜索問題,并提供了許多改進原則以滿足在線決策的需求,制定和執行指揮和控制系統決策。同時,基于改進后改進理論的策略選擇策略旨在提高決策效率,選擇最佳策略。
采用上文所講的將自我適應疑問映照到優化疑問的基礎理念,下面介紹其具體內容。在自我適應疑問中,自我適應占有著舉足輕重的作用。所以說,我們將自我適應的策略成為問題的關鍵。在控制的系統中,自我適應策略無處不在,很多行為都能證實,進而得到系統內的信息。換一句話說,我們將自我適應的策略看成無數的可以變化的點構成,也就是過程中可以改變結局的可調整對象,這些對象不僅包含控制系統資源、指控系統的組織構成、組成單元的行為或參數,同時也包括指控系統運行中可調整的屬性。
在OODA 戰斗周期邏輯的基礎上,將軍隊統一調配的過程形成為一種一致的決策程序。對于沖擊的目標,選擇一組檢測節點對目標進行追蹤和識別,然后將這個信息傳遞給通話的部門。通常,目標信息必須通過不一樣的層次的信息傳遞才能到達決策節點。決策節點根據從行列部隊接收到的目標信息做出戰斗命令,并將命令發送給軍隊以發出告警。在上述過程中,率領與調配就是在調查、通話、策略和轟炸的各個過程為作戰單位選擇多個節點,最終為那個任務創造最完美的決策組合的程序。在檢測、通話、策略和轟炸的各個過程,可以根據具體的要求選擇一部分的點位就行,也可以在某個點位中舉例任意的點位,該點位作為可變因素,并且然后使用Monte Carlo method 執行,從而通過實踐選擇最好的參考數據。
序貫決策是優化潛在的或不確定的動態系統的方法,它隨著時間的推移做出可能的不同或不確定的決策,隨著時間的推移做出不同的決策。完整的序貫決策過程涉及許多狀態和行動,狀態之間的轉換取決于一個動作的執行。在全球指揮和控制協調的情況下,狀態被定義為當前戰斗群中現有作戰單位的焦點,其行動是選擇另一個聯合戰斗單位。以沖擊單位的一個節點作為序貫決策過程的最初的形態,以最終的軍事力量集中炮擊的位置作為最后的形態。我們可以認為整個合營的程序就是一個組件,如果最后的形態到來的情況下,這個決策樹就會以合營的方法計算作用的函數的數值,作為經過連續的決策取得的最有價值的數值。例如,圖1 和圖2 說明了在每個OODA 為選定的節點建立決策和控制樹的過程,該圖顯示了尋找的過程從橘色的路徑開始和以血色的路徑結束,綠色的路徑則是合營配合的路徑。沿著這條路線的所有戰斗單位的合并是一個戰斗單位的集合。如果一個任務有通過許多的節點在指定級別進行配合的必要,在符合上述要求的情況下,可以通過在這個決策樹的任一階段中設置很多的后續的節點來進行拓展。

圖1 搜索決策樹

圖2 算法思想
在考察決策方法的有效性時,本文以戰略質量標準為衡量基準,對上述四種決策方法除序貫法外的優缺點進行衡量和評價。策略質量值調整方案的位置坐標是可接受決策空間的理想點之間的距離。首先,基于上述決策過程久經考驗的測試環境,針對每個節點的損失評估進行了20 次實驗,每次計算策略中心策略質量值是可用的。該策略的節點故障率和質量時間如圖3所示。由此,橫軸表示節點故障率,縱軸表示戰術質量數。

圖3 決策效果
在與指控領域的其他方法對比測試結果中可以看出,3 類方法的策略質量值均隨著節點毀傷比例的增大而減少。這說明節點損壞率直接影響策略的質量,因為隨著節點損壞率的增加,策略優化的過程變得越來越復雜。本文提出的基于搜索的自適應決策方法在不同損害率下比基于規則和基于效用的方法具有更好的策略質量。當毀傷比例小于等于30%時,三種方法的策略質量值差異很小;當毀傷比例大于等于50%時,基于規則的策略質量值大大降低,明顯低于其他兩種類型。這是因為基于規則的方法是不能依據當前場景動態產生規則,其策略質量也就有所下降。在策略質量值接近的情況下,本文的方法比基于效用的方法耗時更少,因為基于效用的方法在執行過程中每次需要經過5 次計算,因此比較耗時。通過以上對比可以得出,本文方法生成的策略質量和策略執行的時間消耗明顯優于其他兩種方法,證明了該方法的優越性,即證明了策略質量和時間開銷上的優越性。
針對全域指控背景下艦船作戰指控決策的需求,基于搜索優化理論和自適應決策算法,提出了一種適應性決策方法。該方法將自適應策略視為可以調整的對象,在決策過程中通過搜索優化來選擇最優的策略。通過實驗對比與其他決策方法的效果分析,驗證了本文方法在策略質量和決策效率方面的優越性。在不同節點損傷率下,本文方法具有更好的策略質量,且時間消耗更少。本文方法的研究對于提高艦船作戰指控決策的效果和效率具有重要意義,進一步的研究可以繼續優化算法,拓展應用范圍,并結合實際作戰需求進行驗證,提升戰斗指揮效能。