周慶忠,田 野,熊 彪
(后勤工程學院,重慶 401311)
?
聯合后勤保障效能評價模型研究
周慶忠,田野,熊彪
(后勤工程學院,重慶401311)
為了解決分布動態聯合后勤保障環境中多個保障決策者和保障實體處于“多對多”設定下協同交互,致使后勤保障受眾多因素制約,調運計劃生成難度加大這一問題,提出了基于Agent的聯合后勤保障效能評價模型。從后勤保障軍事和經濟廣義效能視角,對請領任務的保障實體,計算其保障調運效能,以便優化配置保障資源,為優化后勤保障調運計劃提供量化決策依據。以聯合作戰后勤保障為仿真實例來驗證模型的有效性,仿真結果表明該模型的研究對于快速實現聯合后勤保障總體目標具有實際意義。
聯合后勤保障;調運;效能;決策者;保障實體
隨著軍事后勤保障信息化全面推進,軍地融合后勤保障模式的實施,后勤保障聯盟已逐漸形成。在聯合后勤保障中,決策者Agent DMA(Decision Maker Agent,DMA)遠距離調運后勤保障資源。由于所涉及的保障物資數量龐大、種類繁多、運輸路程遙遠,DMA需獲取和配置來自于不同保障實體Agent UA(Unit Agent,UA)的后勤保障調運服務資源,來實現聯合后勤保障總體目標[1]。
在分布開放、動態復雜的聯合后勤保障環境中,所有DMA和UA均處于“多對多”設定下協同交互。如何評價聯合后勤保障調運效能,合理動態分配保障實體的調運任務,實現優化配置保障資源,是迫切需要解決的問題[2,3]。因此,本文對基于Agent的聯合后勤保障效能評價模型進行研究。雖然所提出的模型以軍事后勤保障領域為研究背景,但其所論述的模型方法,同樣適用于民用商業部門,具有較為廣泛的應用前景。
將基于Agent的聯合后勤保障系統應用于具有分布開發、動態變化特點的復雜環境中,所有決策者DMA和保障實體UA均在一個“多對多”設定場景中實時交互,如圖1所示。
決策者DMA根據保障實體UA的請領任務書效能值E,來評估其執行后勤保障任務的能力。效能值E取決于執行保障任務的軍事和經濟范疇內的廣義成本和后勤保障時間。若某請領任務書的效能值E越高,則意味著該請領任務書所對應的保障實體UA越適合于被選擇來執行特定保障任務。決策者DMA和保障實體UA對效能值E的計算方法不同。決策者DMA根據在搜索樹和引導其路徑的特定分支,來計算效能值E。命名根節點中的任務為根保障調運任務,則存在比根保障調運任務多的任務,每個根任務有一個相關的效能值E[4,5]。UA認為效能值E只是所接收任務和正考慮的請領任務書的函數。
由決策者DMA的評估函數fE來確定效能值E。fE是較為復雜的通用評估函數,適用于許多決策者DMA用于其后勤保障任務。對于每個后勤保障任務,評估函數的大部分組成項是相同的。向各保障實體UA發布每一個保障調運任務時,若均提交完整的函數fE,將可能造成浪費交互信息。相反,假設保障實體UA已具有關于函數fE的知識,決策者DMA則在每次發布保障調運任務時,只須提供計算效能值E的fE函數所需的少量細節,不必提交完整的fE,只需曾經向UA傳達過完整的fE函數即可。換言之,向每個任務提交的評估函數fE,指的是用于計算效能值E的評估函數細節,而不是完整函數。為了以示區別,將計算效能值E的評估函數fE記為fE_d()。

圖1 聯合后勤保障Agent交互

記bi是搜索樹的一個分支,它與任務task(bi)=t的請領任務書apply(bi)=a相關聯,而task(bi)=t又與根節點任務root(bi)=trζ相對應。φ(tr)是返回決策者DMA位于特定根任務tr的加權因子函數。如果φ(tr)>φ(tr'),則表示根任務tr比根任務tr'更為重要。決策者DMA對于請領任務的保障實體,評估其保障調運效能的函數fE_d()為:

每個保障調運根任務的效能E包括:(1)從該根任務已授予請領任務書所得到的當前效能E';(2)為了完成已授予請領書所沒有實現的根調運任務的剩余調運任務集所產生的預期效能E”。
每個分支bi的執行后勤保障調運任務效能E是在該分支上的每個調運根任務的效能E之和。在分支bi上一個根任務trj的效能為:

式(3)fpd()和ftd()為保障調運效率函數和時間函數,其返回值與決策者Agent對后勤調運效能和時間的不滿意度成正比;ω()為加權因子,允許決策者DMA為根任務trj的后勤保障調運計劃,設置保障調運效率和時間的優先級。
記fapp(trj,bi)是返回所有為根任務trj所選擇的請領任務書的函數,這些任務書在決策者DMA的搜索樹從根節點到分支并且包括分支的路徑上。如果root(bi)=trj,則apply(bi)∈fab(trj,bi);否則apply(bi)?fab(trj,bi)。fdif(t,b)函數返回請領任務書apply*被選擇用于后勤保障調運任務t,仍需完成的剩余后勤保障調運任務集,它由一個或多個任務所組成。當選擇從根節點直到分支bi,并且包含分支bi的所有分支(即請領任務書)后,ftst(trj,bi)返回仍需完成的剩余任務集Φ,即返回與bi子節點相關的任務集。則有:

在決策者DMA的根任務trk的搜索樹中的一個特定分支bi為:

式(4)中,φ1()和θ1()函數用于完全或部分地生成保障調運任務tr,其輸入變量為根任務tr和請領任務書集ΩA。對于完成tr的請領任務書a',φ1(tr,a')和θ1(tr,a')返回值分別與決策者DMA對執行后勤調運成本和時間不滿意度成正比。φ2()和θ2()函數采用啟發式算法來估計預期成本和所需時間,以便實現對根任務tr的剩余未完成任務的搜索。其輸入變量為根任務tr和為了完成tr仍需完成的任務集ΩT,函數返回值分別與決策者DMA對執行后勤保障調運成本和時間的預期不滿意度成正比。
對于相關聯的根任務tr,保障實體UA從決策者DMA接收到保障調運任務t,提交請領任務書a來完全或部分實現調運任務t。

所發布的任務task(bi)包含保障實體Agent UA的fE_d()函數使用的請領任務書評估函數f,以便允許UA計算其潛在請領任務書的效能E,以最高值Emax提交請領任務書apply(bi)。
請領任務書評估函數fE_UA()被定義為:

保障實體UA使用式(5)計算請領任務書apply(bi)的效能E,而不是計算分支bi的效能E。
對于保障實體UA,計算關于所發布任務的相關聯根任務root(bi),而不是task(bi)本身的fE_d()元素,關于根任務所需要的信息包含在task(bi)(in f)內。對于UA,定義fφ()和fθ()為:

請領任務書評估函數fE_d()的2個條件為:
條件I:如果UA認為,對于特定后勤保障調運任務,決策者DMA偏好請領書apply(b1)勝過請領書apply(b2),那么,決策者DMA實際上是偏好分支b1勝過分支b2:

條件II:如果用于相同任務的相同請領任務書與DMA搜索樹的不同節點相關聯,則使用式(7)。這意味著,決策者DMA不需要向保障實體UA重新發布任務來讓UA請求任務,當創建一個新節點時,它包含了這個任務,如圖2所示,這節省了決策者DMA與保障實體UA之間的交互信息量和運算時間。
定義請領任務書a1=apply(b1)=apply(b3),a2=apply(b2)=apply(b4)。式中:br1≠br3,br2≠br4,Taskp(b1)=Taskp(b2)=task(b1)=task(b2)= task(b3)=task(b4)=t。若UA認為,對于特定后勤保障調運任務,DMA偏好請領任務書a1勝過請領任務書a2,那么,決策者DMA偏好分支b1勝過分支b2,偏好分支b3勝過分支b4。


圖2 請領任務搜索樹示意圖
函數φ1()、φ2()、θ1()、θ2()分別是線性函數,則式(7)和(8)均滿足于請領任務書評估函數fE_d()。
有兩種情況將使UA請求任務變得復雜。
(1)允許保障實體UA對保障任務只請求執行部分調運物資,或只執行全里程的一部分路程的運輸任務。這類請領任務書,像任何請求執行任務的請領書一樣,須滿足保障調運任務的約束,部分地實現調運任務計劃。例如,對于一個從起始地Pstart與目的地Pend之間運送油料的任務,在Pstart與Pend之間,從Pa到Pb運送油料的部分請領任務書可能是可行運輸調度計劃的一部分。但通常不會考慮這樣的選擇,除非它是唯一的或最好的選擇。
(2)對保障實體UA已臨時授予的請領任務書,過后卻很可能由于后勤保障需求變化(如需求量、保障區域、保障運輸能力、保障資源分布等變化),需重新更改調運指令。保障實體UA難于決定哪個請領任務書(即其路徑、時間和運力容量)最有可能是適合于完成任務的請領任務書。這需花費運算時間來計算執行保障調運任務的效能值,以便形成和檢查各請領任務書的適合性[6]。因此,必須限制請領任務書的搜索域,以便在限定時間表內形成合適的請領任務書集。
在某聯合作戰中,后方指揮部組織了后勤保障實體UAi(i=1,2,…,12)向前線作戰部隊調運后勤物資。保障任務是從地點Pstart調運后勤物資到Pend,表示為T(Pstart,Pend)。決策者DMA向保障實體UA,以任務公告形式發布后勤保障任務t0=T(Pstart,Pend),任務公告內含后勤保障任務分配效能評價函數f,它是后勤保障軍事和經濟廣義效能的隱函數。將與請領任務書a相關的效能評價函數值記為fE_d(a),將其簡寫為fEff,即決策者DMA偏好于具有fEff最大值的請領任務書。決策者DMA希望以最大化評價函數fEff為優化目標,進行后勤保障任務分配。
該后勤保障包括多個保障決策者DMA、保障實體UA,設置專用Agent,感知后勤保障環境變化,如向DMA和UA提供物資運輸地點之間的距離等。UA可行駛130條路線,運輸任務是運送多種物資,物資數量大,運輸距離較長。保障實體Agent UA只運行一次,因為在時間上計算資源有限。
在最惡劣情況下,單一決策者DMA具有兩個大規模的后勤保障運輸任務,要求后勤保障運輸調度計劃樹的深度超過60,需要4個保障實體UA,因此,有限的可用調運服務導致大量回溯。請領任務截止時間設定為2min。適當延長請領任務時間,以確保在DMA制定后勤保障調運計劃之前,保障實體UA有足夠時間使用有限計算資源,按照對請求調運任務的約束條件,檢查其管轄區域的所有調運路線,核查后勤調運運輸能力,制作請領任務書。保障實體UA所提交的請領任務書見表1,請領任務書所涉及的后勤保障調運行徑如圖3所示。

表1 后勤保障請領任務書清單
各保障實體Agent UA,在請領任務截止時間之內,向決策者DMA提交自認為最為理想的請領任務書。到請領任務截止時間后,決策者DMA匯總所接收到的所有請領任務書,計算請領任務書所對應UA執行保障任務的效能,作為優先任務分配次序的依據。

圖3 后勤保障調運行徑示意圖
搜索可行的調運路線構成保障調運計劃集:

計算各調運計劃總體效能,如圖4所示,確定出最優后勤保障調運計劃:PlanEmax→Plan4。

圖4 調運計劃總體效能
理想情況下,每個保障實體UA將具有自己的處理器和較寬松后勤保障運輸調度約束條件,允許它快速地計算執行某項物資運輸任務的成本等項目,請領任務的截止時間設定表示為多少秒,對這一后勤保障運輸調度虛擬場景,正如所預期的那樣,大約在多少分鐘內提供一份后勤保障運輸調度計劃。若以人工方式來制定一個這樣詳細的完整計劃,并且要具有關于運輸單位Agent UA可用的所有信息(如運輸容量、運輸成本、運輸路徑等),只花費多少分鐘來完成計劃制定工作,是難于做到的。
在軍事后勤保障運輸調度實際工作中,現實情況不同于上述虛擬場景。保障實體UA可能遠不止10個,例如就油料保障系統而言,成員單位可能多達幾十個,甚至上百個。決策者DMA借助信息技術工具,從后勤保障系統中,挑選和提取執行某項后勤物資調運任務的候選保障運輸單位UA。這樣便增加了完成后勤保障運輸計劃所需要的時間,以及增加決策者DMA尋找一個后勤保障運輸計劃的復雜度,因為決策者DMA必須先根據后勤調運任務的規模和要求,優選候選的保障實體UA。
所生成的后勤保障運輸調度計劃與預計生成的計劃相似,存在一些微小差異。保障實體UA偶爾采用出人意料的路線,主要是因為保障實體UA在其局部計劃中有一個間隔,例如,它可執行一個低成本的部分路徑運輸任務,在請領任務書中,路線與直接路線稍有偏差。在一些保障調運計劃中,保障實體UA可能需要兩個或兩個以上行程來運輸后勤物資,而并非一個完整行程[7]。可通過在效能評估函數fE_d()中,增設預期運輸成本來考慮這種情況。
后勤保障調運虛擬場景仿真表明,所提出的基于Agent的聯合后勤保障效能評價模型,縮短了響應后勤保障時間,提高了后勤保障調運計劃生成效率,由此而生成的計劃質量遠比傳統手工方法要好。通過對后勤保障調運效能的量化評估,有利于實現后勤保障運輸調度過程的自動化,使得后勤保障決策人員從復雜和繁瑣的后勤保障物資調度工作解放出來,應用計算機和信息技術,由各類Agent替代各級后勤保障管理人員通過網絡交互溝通,獲取后勤保障調運相關信息,從聯合后勤保障系統的各種運輸組織機構中提取和調配運輸服務,更為敏捷快速地實現后勤保障目標。
[1]周慶忠.軍隊油料勤務學[M].北京:國防出版社,2015.
[2]周慶忠,曾慧娥.基于多智能體的裝備動態優化調撥系統研究[J].機械工程學報,2005,41(2):97-101.
[3]Biltgen P.A Methodology for Capability Based Technology Evaluation for System of Systems[D].Georgia Institute of Technology,2007.
[4]Montana D,J Herrero.A Multi-Agent Society for Military Transportation Scheduling[J].Journal of Scheduling,2000,13(4):324-341.
[5]Bitinas E,Henscheid Z,Truong L.Pythagoras:A New Agent-Bases Simulation System[J].Technology Review Journal,2003,(Spring/Summer).
[6]李必鑫,李永紅.基于Agent的油料保障資源發現模型[J].物流技術,2011,30(11):129-131.
[7]周慶忠,孫濤,王冰.基于全能Agent的分布式優化油料保障模型[J].物流技術,2015,34(19):267-269.
Study on Efficacy Evaluation Model of Joint Logistical Support Operations
Zhou Qingzhong, Tian Ye, Xiong Biao
(Logistical Engineering University, Chongqing 401311, China)
In this paper, in view of the problems existing in the dynamic joint logistical support environment, we proposed an agentbasedjoint logistical support efficacy evaluation model, from the perspective of military logistical support and general military utility,calculated the support scheduling efficacy of the task- demand support entities so as to optimize their resource allocation, and at the end,through a simulated example, demonstrated the practical significance of the model.
joint logistical support; scheduling; efficacy; decision-maker; support entity
E233
A
1005-152X(2016)01-0173-05
10.3969/j.issn.1005-152X.2016.01.046
2015-12-20
國防重大攻關項目(2014ZB00088);重慶市重大科技項目(CQF20150709);重慶市社科基金項目(2014YBGL009)
周慶忠(1961-),男,重慶人,教授,博士生導師,研究方向:后勤保障、人工智能和信息工程等。