張玉婷, 楊鏡宇
(1. 國防大學研究生院, 北京 100095; 2. 海軍參謀部機要局, 北京 100841;3. 國防大學聯合作戰學院, 北京 100091)
資源分配問題源于經濟學,旨在將有限的資源,如人力、物力等,通過一定的規則分配給眾多對象,進行資源優化配置,以提升經濟效益。作戰體系結構復雜、規模龐大,在有限的國防預算約束下,對其進行資源分配及統籌規劃是體系建設發展中的一項重要內容,對于提升國防資源利用率、提高軍事效益、形成強大的軍隊戰斗力具有重要的現實意義。
現實生活中,各行各業都存在資源分配問題,許多學者也進行了一定程度的應用研究,并取得了一些成果。文獻[1]提出了一種與資源管理相關的混合整數非線性數學模型,為救災行動等不確定場景下的資源分配選址問題提供了幫助。文獻[2]針對土地資源分配問題,根據當前政策和未來趨勢,構建“糧食-水-能源”關系框架,對光伏產量、可行性、利潤、生物質產量進行了全面評估。文獻[3]基于“灰色-自回歸移動平均模型”算法,構建改進的集裝箱維修費用分配模型。文獻[4]在貪婪調度算法的基礎上,研究下一代光學數據中心網絡資源調度問題,引入并行技術,加快了資源調度速率。文獻[5]為高通量多波束通信衛星系統構建資源分配模型,并通過遺傳算法對模型進行求解。文獻[6]基于改進螢火蟲優化算法,對云計算中的動態資源分配問題進行了研究,提出一種基于負載平衡優化的改進Firefly算法,提高了資源利用效率和生產力。文獻[7]為武器裝備經費分配問題構建數學規劃模型,并通過差分進化方法求解模型。文獻[8]使用機器學習算法預測了醫院每日急診就診資源分配策略。文獻[9]對戰爭不確定因素下的國防和民用支出資源分配問題進行了研究。文獻[10]通過引入Agent構建優化框架,為解決軍事規劃中的成本效益優化問題提供了思路。文獻[11]圍繞戰略管理環節評估,提出一種資源配置需求的形式化描述和探索性方法。文獻[12]利用強化學習的方法,設計了一種基于異步深度強化學習算法的資源分配方法,實現了資源的自動規劃。文獻[13]開發了一種通過統計矩傳播不確定性的方法,優化了建模和分析中的系統資源分配方案。文獻[14]給出了一種基于Web的實時資源分配工具,輔助指揮員完成復雜的資源分配和運輸任務。
可見,當前資源分配問題的研究思路和方法眾多,且在軍事方面已有學者研究了火力資源分配、裝備經費分配、衛星資源分配等[15-20]相關問題,但對于聯合作戰體系建設發展層面的資源分配問題尚缺乏具體的模型和算法。
本文從體系建設發展的頂層設計角度出發,借鑒“基于能力的規劃(capability-based planning, CBP)”[21-22]思想,在國防預算的約束下,通過分析各體系能力需求,構建體系資源分配的數學規劃模型,并采用遺傳算法對模型進行求解,得到體系建設發展的帕累托最優資源分配方案及體系總能力最大值。
體系建設發展中基于能力的國防資源分配問題可描述為:在一個五年規劃內,在總預算B有限的約束下,以體系能力C作為輸入,如何對N種不同類型的體系/系統進行合理的資源配置,達到預算最低、體系總能力最高的目標。基于能力的國防資源分配問題如圖1所示。

圖1 基于能力的國防資源分配問題Fig.1 Capability-based defense resource allocation problem
(1) 對建模將用到的符號做出如下說明
B: 表示一個五年規劃的總預算;
δ: 表示年度費用允許的波動范圍,單位為%;
Si: 代表一級體系,i∈I=(1,2,3,…,n),n表示一級體系個數;
Sij: 代表二級體系,j∈J=(1,2,3,…,mi),其中mi表示第i個一級體系下的二級體系個數;




αSi: 表示第Si個體系的能力權重系數;
βk: 表示第k個能力的權重系數;
γu: 表示第u年能力的權重系數。
(2) 對建模的決策變量做出如下說明

1.3.1 條件聲明
(1) 假定能力生成過程為理想化的累積生成過程,所有種類的能力構成體系總能力。
(2) 假定能力值為標量值,具備可加性。
(3) 假定國防經費在一個五年規劃內按年度平均分配。
(4) 假定在一個五年規劃內,每個二級體系僅有一次建設發展機會,即選擇五年內的某一年進行發展。
1.3.2 模型構建
針對體系建設發展中的國防資源分配問題,采用數學規劃法構建模型。
(1) 目標函數:體系建設發展的體系總能力達到最大值
(1)
(2) 約束1: 所有體系的實際建設發展費用不超過總預算
(2)

(3) 約束2: 年度經費平均分配,且在允許范圍內波動
i∈I;u∈U;j∈J
(3)

(4) 約束3: 一級體系對應的能力加權和滿足最低需求
u∈U;k∈K;i∈I;j∈J
(4)

(5) 約束4: 五年規劃內的第u年,所有體系對應的k種能力加權和滿足最低需求
u∈U;i∈I;j∈J;k∈K
(5)

(6) 約束5: 一個五年規劃內,每個二級體系僅發展1次
(6)

遺傳算法是Holland[23]受自然進化理論啟發而提出的一種搜索算法,是啟發式算法的一種,通過模仿自然選擇和繁殖過程,進行染色體選擇、交叉、變異等運算,并不斷迭代尋找問題的全局最優解。相比傳統搜索和優化算法,遺傳算法有許多優點,如能夠高效處理參數規模大、數學表達式復雜等問題。遺傳算法的流程如圖2所示。

圖2 遺傳算法流程圖Fig.2 Flowchart of genetic algorithm
國內外學者運用遺傳算法解決了許多現實問題。文獻[24]提出一種基于遺傳算法的增強型資源分配算法,實現了云數據中心資源的高效分配。文獻[25]設計了一種具有調度規則和雙親進化的改進遺傳算法,有效逼近了網絡效用和收斂速率。文獻[26]基于遺傳算法開發了一種可靠的柔性供應鏈網絡設計模型,能夠在一定程度上增強戰略能力。文獻[27]針對頜面部彈性體顏色配方問題,通過遺傳算法開發了一種臨床應用程序,輔助臨床醫生制定顏色并降低成本。文獻[28]對P2P網絡借貸問題進行了研究,運用遺傳算法優化了傳統網貸預警模型,提升了預警效果。文獻[29]采用遺傳算法,對數據預處理過程的特征選擇和特征提取步驟進行了改進。
本文提出的國防資源分配模型中的數學表達式復雜,用傳統算法求解較困難,容易導致組合爆炸,因此本文采用遺傳算法進行編程,進行模型求解。為了使算法與模型較好地融合,對遺傳算法進行相關設計,如確定初始種群、確定適應度函數、確定終止條件,進行編碼和解碼、選擇、交叉、變異等。

(7)
考慮到約束5,每個二級體系僅能發展1次,故可以使用實數編碼,將決策變量中的參數u轉換為1-5的實數,即針對一個二級體系,分配一個1-5的實數決定其在哪一年進行發展,于是決策變量個數可縮小至之前的20%。
步驟1確定初始種群
初始種群是種群迭代的基礎,其數量不能過少或過多,否則容易陷入局部最優或增加計算難度。此處設定初始種群規模為200。
步驟2確定適應度函數
通過適應度函數能夠判斷染色體的優劣,本文將目標函數映射為適應度函數進行評估,即體系總能力最大為目標函數,目標函數值越大,適應度越大;反之亦然。
步驟3選擇
選擇算子指從群體中選擇優秀個體、淘汰劣質個體,使得有用的遺傳信息保留下來,提高收斂性。其過程需要根據由適應函數得到的適應度值的大小來實現,即不斷選擇優秀基因進行遺傳,從而完成種群迭代。本文采用較常用的輪盤賭法進行選擇操作,即個體被選擇的概率與個體的適應度有關,適應度越高的個體被選擇的概率越大,適應度越低的個體被選擇的概率越小。被選擇的個體進一步進行遺傳操作。
步驟4交叉
交叉算子是遺傳算法的核心,指由父代個體形成新個體的操作,其過程需按規定選擇交叉點,以及交換交叉點的基因片段。本文采用的交叉策略為兩點交叉和均勻交叉兩種方式結合的交叉。
兩點交叉指在父代中隨機選擇兩個位置進行交叉,若父代1=1-2-3-4-5-4-3-2-1-2,父代2=5-5-5-5-4-5-4-3-2-1。假設選擇的交叉點位置為2和4,則子代1=1-5-5-5-5-4-3-2-1-2,子代2=5-2-3-4-4-5-4-3-2-1;均勻交叉是個體中各個位置的基因都以相同的概率參與交叉,即在每個基因位置上都進行判定,如果隨機數的大小滿足概率要求,則該位置進行交叉,否則判定下一個交叉位置。
步驟5變異
變異算子指替換父代染色體基因片段,產生新的子代染色體序列。本文采用的變異方法為單點變異,即在滿足變異概率的前提下,隨機選擇一個變異位置,將其基因隨機轉換為1-5的值。變異操作后應計算父代、子代染色體的適應度,若子代較優,則變異成功,父代由子代替換;若父代較優,則變異失敗,繼續迭代,直至滿足終止條件。
步驟6確定終止條件
進化次數限制、計算資源限制、最優解限制、適應度限制等均可設置為終止條件。本文設置迭代次數為10 000,通過不斷迭代達到預設的迭代次數并得到最優解時,結束迭代,輸出迭代結果。
以某個五年規劃中的聯合作戰體系建設發展資源分配問題為例進行示例分析。
對模型中的參數做如下設置:
假設 1一個五年規劃內,年數u=5,總預算B=10億元。
假設 2年度費用允許的波動范圍δ=0.3。
假設 3需建設的一級體系的數量n=4,每個一級體系下的二級體系的數量mi=[10,12,14,13]。
假設 4考慮5種體系能力,p=5。
假設 5能力權重系數設置為
αSi=[1.1,1.2,1.3,0.9]βk=[0.89,0.9,1.0,1.05,1.1]γu=[0.05,0.1,0.15,0.3,0.4]


表1 每種能力最低需求

表2 每年每種能力加權和最低需求
設置初始種群規模為200,迭代次數為10 000,利用算法迭代求解模型,輸出一個五年規劃內每個二級體系Sij得到發展的年份,如表3所示。

表3 二級體系發展年份
可見,每個一級體系對應的二級體系在一個五年規劃內分別發展一次,表格中數字代表得到發展的年份。輸出模型求解迭代圖如圖3所示。

圖3 模型求解迭代圖Fig.3 Iterative diagram of model solution
由圖3可知,當種群迭代至大約5 500次后,目標函數值保持不變,得到帕累托最優解,即體系總能力最大值。輸出一個五年規劃內每個二級體系每年的實際發展費用,如表4所示。

表4 二級體系發展費用

續表4
可見,設置的49個二級體系在其對應的年份內均得到發展。輸出一個五年規劃內每個一級體系每年的發展費用,如表5所示。

表5 一級體系每年的發展費用
綜上所述,該示例結果表明,在一個五年規劃內,在達到總能力最大目標的同時,體系建設發展的總費用為9.744 6億元,未超出總預算10億的約束范圍,因此通過該示例能夠驗證所提方法的正確性與可行性。
資源分配是聯合作戰體系建設發展中的重要問題,合理配置資源、實現資源有效利用,對于提高軍事能力意義重大。本文采用數學規劃的方法,基于體系能力對聯合作戰體系資源分配問題構建模型,并運用遺傳算法重復迭代、求解模型,得到模型的帕累托最優解,通過示例驗證了所提方法能夠完成五年規劃內的國防資源統籌分配,進一步支撐聯合作戰體系建設發展的頂層規劃。