周慶忠,王 冰,陸思錫
(后勤工程學院,重慶 400016)
油料保障系統(POL support system,POLSS)將分布油料資源集成,形成多保障自治域,組成油料保障聯盟(POL support alliance,POLSA),自治感知響應動態環境,實現協同保障。在系統開發中,通常將自治與協同性能融入特定功能。這隱含地意味著未對系統投入使用后的效果進行充分檢查,存在自治智能離散層,導致系統自治與協同功能不平衡[2]。在保障任務任何階段,系統可能同時處于多個離散層,以便根據當前保障態勢進行自治控制。若將這類“自治層”處理作為開發系統路線圖,會引發對硬件或軟件的過度關注,將導致最終只是提供特定功能,而不是提高感知態勢、協同保障整體效能。本文對POLSS自治與協同功能不平衡問題進行研究,尋求在分布動態環境下,油料保障自治與協同效能適配的解決方案,對增強POLSS感知環境、協同保障響應能力具有重要意義。
POLSA成員以多自治域層次交互協同模式來實施保障。設 POLSA 有 n 個成員 ai(i=1,2,…,n),ai∈POLSA,將聯盟成員構成自治域Dai。自治域采用松耦合管理方式,以多庫(數據庫、知識庫、政策庫、規則庫等)聯合方式進行數據操作。在油料保障政策全局調控下,共享油料保障資源,實現自治與協同平衡的跨域協同油料保障。構建模型構架如圖1所示。

圖1 POLSS自治協同模型構架
POLSS獲取自治與協同性能主要通過以下3個功能單元的配置來實現。
該單元用于感知保障硬環境變化。融入到物理裝備硬件級別的互動自治,被用來解釋操作指令、控制操作活動,監測物理裝備運行狀態,對采集數據進行實時處理。需感知的態勢很可能是危險情形。例如,加油過程監控,需監測狀態有漏油、泄油、甚至中毒、爆炸。對此,自治功能可以不同方式給予協助,例如遠程遙控加油、飛機空中加油、油庫安全智能監控等[3]。自治神經網絡(autonomous artificial neural network,AANN),是實現自主預測感知裝備狀態的有效方法之一。由多個AANN獨立地感知,融合感知信息形成對裝備狀態的綜合評估。
該單元用于認知油料保障軟環境變化。關注如何根據油料保障動態空間,分配保障資源和任務。保障軟環境態勢對保障質量影響至關重要,各級人員易忽視這點。例如,對多個保障目標,派發幾十個保障任務,每個任務包含多項作業,以往采用大量手工方式進行決策操作,費時費力,效率低且可靠性差。而采用基于優化的規劃工具、智能分析軟件,可輔助決策者,對增長數據量排序,提取相關信息,完成規劃決策。POLSS各類組件Agent和“用戶”角色自治性,使得成員在保障政策許可下,延伸其控制范圍,擴大信息搜索空間,增強應變能力。隨著聯合油料保障行動展開,跨域、跨層和跨角色間協作越為重要。各自治域子系統均配置且共享認知功能,各級決策者在權限范圍內進行通信協作。
該單元用于實現人與系統交互溝通,例如:如何塑造人與系統間工作關系或因果關系的互動;如何學習、增強人與系統協同;如何預測人—系統Agent團隊的可用性和可靠性;如何捕捉和表達在特定保障問題域的人—系統相互作用;如何將油料保障方案特征化呈現給各級決策者。人機交互的主要挑戰是如何增加系統能力,提供相互可預測性(誰何時做什么)、直接能力(不但指定目標,而且如何適應意外)、共同點(包括特殊語言或協議,以確保人和系統共享目標和信息)。
將POLSA成員視為是由保障目標驅動的自治Agent,具有適應保障態勢的自治決策、與其他Agent協作等能力,圍繞保障總目標,按預定策略,根據對所處保障環境的認知,自主地對權限范圍內的保障行動決策。在POLSA頂層設置全局總管Agent TMA,協調、控制成員協同保障。各自治域設置主管Agent MA。根據油料保障決策時自治與協同強弱程度,將MA分為3類。

式中,ni表示第i類自治域的個數。
1)Agent MA1—弱自治弱協同型。例如,POLSA中的煉油廠、石油公司、鐵道運輸部、航運公司等國營、民營單位。MA1具有反應性、持續性。“被動”接受TMA發派的任務,在保障政策約束下,具體行動雖可由其自身控制,但整個執行過程受TMA監控,對環境變化只是適當響應。與其它自治域通信交互較少,不能察覺其它成員的保障任務和目標,獨立地按保障目標執行保障任務。
2)Agent MA2—強自治弱協同型。例如:POLSA中的軍區、武警部隊、警備區、空軍、海軍等后勤部門。除了具有MA1性能外,MA2還具有目標導向性、主動性。其本身具有特定保障目標,行動不受外部自治域狀態變化影響。例如,空軍部門具有航空油料保障目標,當接受全局總管TMA派發的保障任務后,調整其所屬各類Agent狀態,進入油料保障部署,由此所產生的狀態變化呈隱式,其他區域(如海軍、軍區等)保障部署不直接影響其內部活動。執行保障任務時,與其它自治域有一定聯系,察覺到對方保障行動,但不通信與交流保障意圖和計劃。在各自區域并行地完成保障任務。
3)Agent MA3—強自治強協同型。MA3除了具有MA2的性能之外,還具有適應性。根據保障行動結果自身評估保障效能,相互協同,調整保障行動計劃以適應環境。例如,在特定環境,MA3j認知到其當前執行行動狀態對另一個MA3k產生負面作用,影響整體保障質量時,及時調整執行計劃。在執行任務時,頻繁互動保持通信交流信息,明確地表達各自意圖和計劃,實時地感知對方行動,相互間緊密協同。
對各類保障人員Agent進行用戶角色分類,賦予相應權限和職責。
角色1:任務指揮官、主管人員、網絡分析師、技術支持人員,職責為保障規劃、方案評估、應急決策和管理。
角色2:部門領導、團隊負責人及其成員,職責為任務規劃與決策、任務調整與重新規劃、保障失效預測管理、多A-gent通信與協同。
角色3:業務員、加油員、安檢員,操作員,職責為具體行動指導與控制(如控制加油裝置、操作傳感器)、油料保障硬件資源(用油裝備、儲運設備、傳感器等檢測設備)管理、油料裝備故障檢測與健康管理、通信和狀態監控。
供應鏈協同規劃通常基于合同網協議(CNP)和擴充合同網協議(extended contract net protocol,ECNP),基本機理是自治Agent基于各自利益,實現協同任務分配[4,5]。但油料保障事關國家安全,應以聯合行動目標為中心。因此,系統設置油料保障政策調控機制,創建政策引導Agent PAi(i=1,2,…,m),控制聯盟成員協同行動。各PAi所表示的保障策略、原則,儲存在政策庫。PAi設有政策執行點PEP、政策決策點。引入政策監測組件PMP,監控PAi行動及其環境,并將監控數據存儲于事件庫。設置政策合規性檢查組件,監控保障政策執行情況。它覆蓋由PEP所觸發的預期行動。被PMP所捕獲的事件包括各保障執行Agent的相互作用、行動動態和各類保障資源Agent的當前狀態等。
從以下5個設計空間,來實現POLSS自治與協同的平衡,將失衡癥狀與失衡源頭相鏈接。
該空間采用對新保障任務或意外情況的適應能力,來平衡油料保障質量最優化。為了增加自治能力,可能使用基于假設的優化模擬算法,實際保障環境復雜多變,算法使用在一定程度上削弱了對環境感知,阻礙系統適應意外局勢,給系統造成負面影響。不平衡警示有:系統脆性增加,難于適應變化局勢,處于不穩定狀態;保障執行力不持久;人力資源成本超過預期。例如,遠洋島嶼環境聯合行動,油料補給線長、運輸難度大,若片面追求全局統籌最優,會制定出超負荷的不可行方案。應權衡保障質量最優與保障力量部署,采用跨域聯盟成員(如三軍聯勤、中石油、中海油等)協同保障。
該空間用于反映系統效率與完整性間相互作用。基于某些假設的算法用于調整規劃,阻礙了對保障態勢感知。即使系統及其操作者已注意到規劃對于當前態勢不再有效,但算法卻難于及時做出有效調整。追求系統效率常專注于預期效果,卻忽視對執行情況全面檢查,造成系統效率與完整性間不平衡。其警示有:忽視規劃瓶頸問題;雖認識到規劃與當前態勢不匹配,但仍在執行;感知到規劃不適宜當前局勢,回落到設定的重新規劃,卻未考慮當前局勢新約束。平衡該空間需了解油料保障意圖,自主地爭取較多資源或采用不同算法。
該空間表示油料保障資源集中與分布間平衡。關注問題有:確定何時采用集中于一個單位行動的保障模式;何時采用跨聯盟成員的協同保障模式;如何使來自遠程自治域與本域信息可見、不被模糊化;融合各自治域保障信息,用于油料保障決策。不平衡警示是:因管理協同活動人力增加而造成高成本;油料保障分布式部署不合理;未充分利用或不信任分布式油料保障,導致“微觀管理”,聯盟成員被動執行任務,自治能力受損。過度信任聯盟成員,缺少對各自治域保障行動缺乏統一約束,難于維持分布式保障資產合理性。要平衡這一空間需加強規劃和調度能力,動態地派發保障任務。
該空間用于反映油料保障空間本地與全局視圖間平衡。通過網絡,延伸、感知遠程保障環境。對保障區域態勢的感知有時隱蔽或分布在另一個感知里,需從局部和全局視圖中獲取。這兩個視圖不平衡極易造成難于發現保障環境中首要事件和動態變化,數據過載,降低油料保障決策效率。可采取對保障態勢自動感知來解決此問題,迫使決策者冷靜地對保障環境進行感知和推理。并增加自治性。采用感知接口和通道,通過計算機視覺、傳感器饋送、自主推理等方式,協作引導各級決策者,識別和重新關注高度相關事件。
該空間用于表示各自治域聯盟成員的短期目標和長期目標職責之間的平衡,用長期目標平衡短期目標,解決目標沖突。不平衡警示有:職責分布不均,中斷合作與協調,保障成本增加;監控不力;跨域和跨層協同保障時,對系統不信任或過度信任。應根據油料保障決策總則來設計自治與協同能力,平衡自治域保障職責。使各級決策者把重點放在首要保障任務目標,對該任務保持優先級,而不是將精力用于運行管理系統上。
油料保障各種協同過程,如預測、采購、庫存、規劃、績效評估等,涉及保障信息交流[6]。油料保障規劃被視作是信息交換引擎。其主要因素包括:節點操作(如接受、發布任務、發送、接收、儲備、運輸、訂購油料等)、節點策略(保障政策輸入和輸出等)和保障成本(人力、價格、資產等)。問題描述:聯合行動部隊的一組不同的油料保障請求S={y0,y1,…,yn},保障規模n≥2,響應保障執行單位Agent EA={x0,x1,…,xn},n≥2 EA與保障請求呈“一對一”映射關系。對于所有請求y∈S,各Agent x∈EA向每個請求提供的保障質量被定義為 g[x,y],即對于 xi,xj∈EA,∏:EA→S,i≠j意味著∏(xi)≠∏(xj)。保障任務調度規劃目標是使整體保障質量Qst最優化

式中,∏(x)∈S表示 Agent x∈EA對應的請求選擇。max{Qst(2)}定義為Agent EA的最優整體保障質量目標。分配集對應于∏(1)的一個排列。油料勤務知識被分布在Agent EA中,對于所有保障請求y∈S,各執行單位x∈EA最初只具有自己的本地信息g[x,y]。通過保障執行單位A-gent x∈EA間協同分配保障任務請求,獲得最優整體保障質量。
設置節點Agent NAi表示各節點間共享信息過程,NAi具有自治運行能力。NAi間交互通信,由其在特定態勢下的行為來觸發,其行為目的是產生油料保障需求和接受保障任務、識別此局勢下協同或非協同聯盟成員、通過通信協議接收和發送消息。多自治Agent交互支持協同規劃流程,如圖2所示。

圖2 多自治Agent交互支持協同規劃流程
1)信息共享:針對異構數據庫,設置搜索Agent FA,負責訪問、搜索支持保障節點決策所需的信息。
2)信息流:與協同規劃涉及所有保障節點信息。當信息流動考慮與一定必要性相關的事實時,自然流動將停止,直到初始請求已送達。
3)保障節點:當保障信息交流涉及多自治域多節點時,談判協作過程發生。反過來,意味著這些節點以分布協同方式,實時交流信息,以避免來自各區域保障任務所造成的積壓。此時,各節點NAi自主地評估自身能力,在保障相關政策約束下,執行支持相關保障節點所要求的任務。
4)保障任務時序:響應動態環境確定任務執行動態優先級。依據保障策略原則,按各任務動態優先級進行自治式實時任務調度。通過協同保障任務規劃的演變,改進油料儲備策略,避免保障任務過量,獲得油料保障整體最佳效能。
本文所提出的POLSS自治協同模型,根據5個設計空間的平衡狀態來約束調整自治與協同關系,進行多自治Agent的協同保障規劃,從而實現油料保障全局調控。油料保障自治協同建模研究,對于獲得油料保障整體最佳效能、提高油料保障快速響應能力具有重要作用。
[1] 周慶忠.油料勤務[M].北京:國防出版社,2008.
[2] Law K L E,Saxena A.Scalable design of a policy-based management system and its performance[J].Communications Magazine,2003(41):72 -79,.
[3] 周慶忠,曾慧娥.油料裝備智能維修決策系統研究[J].后勤工程學院學報,2009,25(9):33 -37.
[4] Klusch M,Gerber A.Dynamic coalition formation among rational agents[J].IEEE Intelligent Systems,2002(17):42 -47.
[5] McQuay W K.Distributed collaborative environments for systems engineering[J].IEEE Aerospace and Electronic Systems,2005(20):7 -12.
[6] 周慶忠,曾慧娥.基于多智能體的裝備動態優化調撥系統研究[J].機械工程學報,2005,41(2):97 -101.
(責任編輯楊繼森)