劉育玲
(西安財經大學管理學院, 西安 710010)
有限資源下的設備維修策略優化問題是近年來工業界和學術界共同關注的重要課題,即在設備運行過程中,維修策略的制定往往受到維修期限、備件庫存、維修工具、維修人員、維修成本等維修資源的約束[1]。因此,在分析設備組成結構及部件運行健康狀態的基礎上,研究如何合理地分配有限的維修資源,使得設備滿足下一階段任務的性能要求或最大化設備的可靠性指標是非常必要的。
在工程應用中,維修工作會受到維修資源的限制,往往不太可能對所有需要維修的部件進行所有可行的維修活動。因此,維修決策者必須根據下一階段任務的需求對整個系統以及資源進行權衡,選擇設備其中一部分部件進行維修活動,這種維修策略稱為“選擇性維修策略”[2]。Hesabi等[3]提出選擇性維修的框架,并通過并-串聯系統構建了其選擇性維修決策模型。Xu等[4]構建了并行系統的選擇性維修模型,并通過多目標優化方法對其維修策略進行了優化。與傳統粗放的維修決策相比,選擇性維修能夠將有限的維修資源用于亟待修理的損傷件或性能退化部件,以最小的維修支出獲取最大對的效益,對實現精確維修、提高維修決策的合理性和科學性、提升設備完成任務的概率具有重要的作用[5]。
在設備選擇性維修的策略下,同一個設備的不同部件可以選擇不同的維修方式。部件的維修方式根據其維修效果可以分為三類:完美維修[6]、最小維修[7]、非完美維修[8]。完美維修指通過更換操作將部件的性能恢復到全新狀態,即理想的修復如新,完美維修一般會產生巨額的維修成本。最小維修是對出現故障的設備進行最小程度的恢復。非完美維修是指設備維修后系統性能雖有所改善,但未能恢復到全新狀態,而是介于當前狀態和新狀態之間的某個狀態,也稱為“修復如舊”,非完美維修的費用一般要低于完美維修[9]。由于非完美維修更加符合工程中實際的維修情形,非完美維修得到了學者們越來越多的關注和研究,并提出了包括虛擬役齡模型[10]、改善因子模型[11]、Kijima模型[12]、沖擊模型[13]等眾多非完美維修的描述模型。
考慮設備的每個部件有多個可選的非完美維修級別時,就會形成多部件設備非完美維修決策問題[14]。非完美維修決策中的優化變量一般是各個部件對應的維修級別,設備往往是由多個關鍵部件通過一定的結構方式組成的,對應的非完美維修決策模型復雜,其維修策略的優化方法是維修決策領域的一個研究熱點[15]。目前非完美維修策略優化常用的方法有:解析法[16]、蒙特卡洛仿真方法[17]、枚舉法[18]、遺傳算法等[19-20]。其中解析法和枚舉法只適合于設備結構簡單或非完美維修級別少的情形;蒙特卡洛仿真方法計算所需的時間長,且對于復雜維修問題只能給出近似的估計結果;遺傳算法存在對初始條件敏感且尋優效率低的不足。對于結構復雜、部件數量多的設備,抑或隨著非完美維修級別的增加,設備非完美維修策略空間呈指數形式增加,加大了設備系統維修策略尋優的難度。因此如何用合理有效的建模和優化方法,解決非完美維修條件下多部件系統的維修決策優化,是一個值得深入研究的問題。近年來,博弈論等啟發式方法在維修決策中得到了學者們的關注[21],Feng等[22]、Yang等[23]通過構建博弈場景將博弈論應用于設備完美維修策略優化問題的求解中。
現以設備可靠性為基礎,選擇各部件的非完美維修級別為優化變量,以多部件設備的維修時間及任務可靠性為約束條件,以設備總維修費用最低為目標構建設備維修策略優化問題模型。進而針對該維修策略優化模型建立相應的合作博弈場景,并提出基于合作博弈理論的維修策略優化方法,實現設備各部件維修級別的優選,并通過算例分析及與遺傳算法等的對比對所提出的方法的有效性進行驗證。
學者Kijima等[12]首次提出的兩種預防維修模型,是后續學者研究非完美維修模型的基礎。第一種是故障強度調整模型,如果假設部件在維修前的故障強度為h(t),則經過維修后部件的故障強度函數表示為ah(t),其中t≥0表示每次維修后的計時,a≥1為故障強度調節因子。第二種是役齡改善模型,如果假設維修前部件的役齡為t,則維修后部件的役齡為bt,其中0≤b≤1為役齡改善因子。
Lin等[24]在上述兩種預防維修模型的基礎上,提出了部件非完美維修的混合模型。假設部件在維修前的故障強度函數為h(t),累積使用壽命為t1,則維修后部件的故障強度表示為g(t)=ah(bt1+t),t≥0,其中,故障強度調節因子滿足a≥1,役齡改善因子滿足0≤b≤1。可以看到,當a=1時,非完美維修混合模型將與役齡改善模型相同;當b=0時,非完美維修混合模型將退化為單一的故障強度調整模型。非完美維修混合模型同時考慮了維修對故障強度函數及役齡的影響,在描述非完美維修建模中已經得到了廣泛的應用。
考慮一臺由m個關鍵部件串聯構成的設備,各個關鍵部件可表示為Si(i=1,2,…,m),如圖1所示。設各部件在維修前的故障強度函數為hi(t),并滿足威布爾分布,表達式為
hi(t)=βitαi-1,i=1,2,…,m
(1)
式(1)中:αi、βi分別為各部件故障強度威布爾分布參數并滿足αi>0、βi>0。
基于部件非完美維修混合模型理論,非完美維修后部件的故障強度函數更新為
gi[li(k),xi,t]=a[li(k)]hi{b[li(k)]xi+t}
(2)

圖1 多部件設備非完美維修模型Fig.1 Imperfect maintenance model of equipment with multiple parts
式(2)中:xi為部件Si維修前的役齡;t為部件Si維修后的計時;li(k)為部件Si的維修等級,k=0,1,…,N。役齡改善因子可以通過維修費用進行評估,如果用Ci[li(k)]表示部件Si在維修等級li(k)下的維修費用,則役齡因子可以通過式(3)評估。
b[li(k)]=1-{Ci[li(k)]/Ci[li(N)]}z
(3)
式(3)中:Ci[li(k)]為部件維修費用,并滿足Ci[li(k)]≤Ci[li(k+1)]和Ci[li(0)]=0,Ci[li(N)]是部件更換如新的費用;z為關聯部件維修費用與役齡改善因子的尺度參數。工程實踐中,不同的維修等級將會使得部件獲得不同的維修效果,例如,對于機械部件而言,常見的非完美維修包括潤滑、打磨、局部修復等維修活動。為了實現對不同維修活動及其維修效果的描述,采用li(k)=k來表征部件的維修等級。部件的維修等級及對應的維修活動的劃分與該部件的維修資源等因素有關,因此不同的部件的維修等級及對應的維修活動往往并不相同。研究中為了便于設備維修建模,假設各關鍵部件的維修等級均包含N+1級非完美維修,其中li(0)代表不對部件進行任何維修活動,而li(N)代表對部件更換如新。
考慮設備維修后下一輪任務的時長為Tm,則部件維修后執行下一輪任務期間累積的故障強度可以通過gi[li(k),xi,t]的積分獲得。積分公式為

(4)
由此,各個關鍵部件通過非完美維修后能安全完成下一輪任務的可靠性可以計算為

(5)
考慮到圖1中設備的各個關鍵部件是串聯的關系,因此維修后設備的可靠性為
(6)
多部件設備的維修策略優化研究中,主要考慮的設備維修指標包括設備維修后可靠性、維修費用及維修時間。為了建模方便,假設各部件隨著非完美維修等級的提高,維修時間及維修費用都在增加,同時維修后的可靠性也會提高。另一方面,設備待維修的各個關鍵部件在設備維修點可以同時進行維修。由此,設備的維修費用可以表示為
(7)
設部件Si在非完美維修等級li(k)下的維修時間為Ti[li(k)]且滿足Ti[li(0)]=0,考慮到在維修點各部件是同時進行維修的,因此設備的維修時間由待維修部件中最大的維修時間來決定。表達式為
T=max{Ti[li(k)],i=1,2,…,m}
(8)
選擇設備各個部件的非完美維修等級為優化變量,進而以降低費用為目標構建維修策略優化數學模型。已知設備的準許維修時長及下一輪任務的最低可靠性要求,通過設備各部件維修等級的選擇使得設備的總體維修費用最低。因此,以維修費用降低為目標的設備維修策略優化問題可以表述為
(9)
式(9)中:ΔT為任務準備期時長,即準許設備維修的時長;Rreq為下一輪任務執行期間設備安全運行的最低可靠性。
多部件設備非完美維修策略優化過程在特定的場景下可以看作一個博弈過程。考慮由多個部件或者子系統串聯組成的復雜設備,假設每個部件或子系統都存在相應的負責人,對于每個部件負責人而言都是希望自己管理的部件能夠得到維修從而達到更好的運行狀態。然而,在設備任務最低可靠性要求及有限的維修資源約束下,不同部件的負責人決定所負責部件的維修級別事實上將是一個相互博弈的過程,本節構建的博弈場景如圖2所示。

圖2 多部件設備非完美維修策略優化的博弈場景Fig.2 Game scenario for the maintenance strategy optimization of multi-parts equipment
由于所考慮的設備多部件之間是串聯的方式,維修約束條件(包括設備可靠性、維修時間等)和整體收益(設備總的維修費用相關)是在設備層面定義的,因此單個部件采用過高的維修等級對于整體收益是不利的,各個參與者之間只能通過相互合作的方式才能取得最優的整體收益。因此所構造的設備非完美維修決策的博弈場景是合作博弈模式,通過設置每輪博弈中各參與者的策略空間構造、收益及博弈規則,能夠使每輪博弈中設備維修方案的更新是朝著優化目標的方向進行,這將構成多部件設備非完美維修決策的博弈框架,具體包括以下兩個階段。
(1)以滿足設備可靠性要求為目標的博弈階段。第一階段合作博弈的主要目標是提高設備維修后的可靠性,因此當設備的可靠性不能滿足任務可靠性要求時,設備的各部件對應的負責人一直將處于第一階段合作博弈中。各個參與者每輪博弈中將根據負責部件的原維修方案制定新一輪博弈中的維修方案,各參與者的收益定義為新的維修方案較原維修方案的改變引起的部件可靠性改變量與維修費用改變量的比值,直觀反映了新的維修方案的性價比。每輪博弈中最大收益對應的部件采用新的維修方案,而其他部件則保持原維修方案。設備的可靠性將隨著博弈的不斷進行得到提高直至滿足設備的可靠性要求。
(2)以降低維修費用為目標的博弈階段。第二階段合作博弈的主要目標是對第一階段獲取的設備維修方案的進一步優化來降低維修費用。每輪博弈中各部件負責人根據原維修方案按照降低維修等級的方向制定本輪博弈中的維修方案,在滿足維修資源和可靠性約束條件的方案中選擇設備維修費用最低的方案為本輪輸出方案,博弈到達平衡狀態后設備的維修費用將為最低維修費用。
對于一個由m個部件組成、每個部件共N+1種非完美維修等級的設備,各部件維修策略的組合共有(N+1)m種,且維修策略組合數量隨部件或維修等級的增加呈現指數增長特征,為設備維修策略的優化選取增加了難度。本節將博弈理論引入到設備的非完美維修策略優化模型求解中,通過設計各部件負責人在每輪博弈中的策略空間及收益函數,使得各部件維修方案通過每輪的合作博弈朝著全局優化的方向進行。
2.2.1 第一階段合作博弈:以滿足可靠性要求為目標的策略優化
當設備的可靠性不能滿足任務可靠性要求時,各部件負責人作為博弈的參與者每輪博弈中將根據部件上一輪的維修方案制定新一輪博弈中的維修方案,使得設備的可靠性不斷提高。第一階段合作博弈優化算法的主要步驟可以總結為以下過程。

(10)
(3)計算部件策略空間中各維修方案下的維修可靠性、費用及時間,并表示為
(11)

(12)
(5)確定每輪博弈中部件的優選維修方案。對于每個部件,從其策略空間中選擇滿足時間約束條件,且收益最大的維修方案作為部件的優選維修方案。如果策略空間中新產生的維修方案不滿足時間約束條件,則選擇原維修方案作為本輪的優選維修方案。
(13)



2.2.2 第二階段合作博弈:以降低維修費用為目標的策略優化
第一段合作博弈本質上是沿著單位新增維修費用獲得最大可靠性增量的方向進行優化的,獲取的維修方案存在的問題在于:由于優化中每步都是沿著單位成本的可靠性增量最大化的方向進行的,使得優化中最后一步獲取的可靠性增量大于任務可靠性需要,從而增加了額外的維修成本。因此,對于第一階段合作博弈優化后的維修方案,還需要以降低維修費用為目標對其進行進一步的優化,即第二階段合作博弈,包括以下主要步驟。


(14)


(15)

(16)
本節提出的基于合作博弈的優化算法依據策略空間的構造分兩個環節:第一個環節中沿著維修性價比(部件可靠性增量與維修成本增量的比值)最大化的方向進行優化,旨在獲得設備維修方案的一個次優解;第二個環節的博弈則沿著最大化降低維修費用的方向構造策略空間和優選維修方案,是對第一階段獲取的維修方案的進一步優化。
3.1.1 設備維修算例模型及參數
考慮一臺由10個關鍵部件Pi(i=1,2,…,10),通過串聯形式組成的設備,每個部件維修前的役齡為xi,假設各個部件故障強度函數滿足威布爾分布且分布參數分別為αi和βi。將不同維修等級下的維修費用Ci(li)和維修時間Ti(li)進行簡化,為
Ci(li)=Ra(li)CR,i
(17)
Ti(li)=Ra(li)TR,i
(18)
式中:CR,i為部件i完全更換如新需要的費用;TRi是其完全更換如新需要的維修時間;Ra(li)是非完美維修等級下部件維修費用及維修時間與完美維修下的比例系數,設備各個關鍵部件的維修參數見表1。考慮每個部件都有7種維修等級,即li=0,1,…,6,其中li=0代表對部件不進行任何維修,而li=6代表對部件更換如新。部件非完美維修混合表征模型中尺度因子選為z=0.8,表2給出了設備不同維修等級下對應的Ra(li)和a(li)。
選取下一個任務的執行時長為Tm=0.4,任務準備期時長為Tlim=10,設備執行任務需要最低的可靠性為Rreq=0.9。需要對設備各部件是否維修及維修的等級進行優化,使得在滿足維修用時不超過任務期準備時長Tlim、維修后設備可靠性不低于Rreq的前提下設備整體的維修費用能夠最低。

表1 各部件維修前役齡及故障強度參數Table 1 Variable values of the enlistment age and hazard rate function distribution of the equipment parts

表2 非完美維修等級下混合表征模型參數Table 2 Parameters of the hybrid model of imperfect maintenance
3.1.2 基于合作博弈理論的求解結果
基于設備各部件的參數,計算得到的不進行維修時設備的可靠性為0.608 1,不能滿足任務的可靠性要求,因此進一步通過提出的合作博弈優化算法對維修策略進行優化。圖3和圖4分別為每輪博弈中輸出的維修方案下設備的可靠性及維修費用。
可以看到,維修方案的優化共經歷了18輪合作博弈。第一輪合作博弈中設備的初始維修方案為li=0(i=1,2,…,10),第一階段博弈優化是以提高設備可靠性為目標、以單位維修費用增量下可靠性增量最大化為優化路徑的,經過12輪博弈后設備可靠性達到了任務要求。此時,設備的可靠性和維修費用分別為R12=0.902 2和C12=90.117,對應的維修方案為

圖3 每輪博弈中維修方案下設備的可靠性(Tlim=10)Fig.3 Equipment reliability under each game round (Tlim=10)
L12=[0 0 2 0 4 0 2 3 1 0]
(19)
此時維修方案對應的維修時間為T=9,滿足維修時間約束條件。第二階段博弈共持續了6輪,可以看到,博弈過程中每輪的維修費用及設備可靠性均保持不變,因而所獲得的維修方案L12是設備優化后的維修方案。
為進一步測試所提出方法的有效性,將任務準備期允許時長更改為Tlim=8,設備維修模型中其他參數均保持不變。采用基于合作博弈的優化算法,每輪博弈中設備的可靠性及維修費用分別如圖5和圖6所示。
可以看到,維修方案的優化共經過19輪合作博弈。第一階段共經過13輪合作博弈,此時設備的可靠性、維修費用及維修時間分別為R13=0.902 1、C13=97.4、T13=7,對應的維修方案為
L13=[0 0 3 1 3 0 1 3 2 0]
(20)
第二階段經過6輪合作博弈后達到終止條件,優化后的設備可靠性、維修費用及維修時間依次為R19=0.900 1、C19=95.6、T19=7,經過優化后的設備維修方案為

圖4 每輪博弈中維修方案下設備的維修費用(Tlim=10)Fig.4 Maintenance cost under each game round (Tlim=10)

圖5 每輪博弈中維修方案下設備的可靠性(Tlim=8)Fig.5 Equipment reliability under each game round (Tlim=8)

圖6 每輪博弈中維修方案下設備的維修費用(Tlim=8)Fig.6 Maintenance cost under each game round (Tlim=8)
L19=[0 0 3 1 3 0 1 3 1 0]
(21)
這是由于第一階段合作博弈算法是沿著單位維修費用增量下的可靠性增量最大化的方向進行優化的,往往優化的最后一步可能會造成設備可靠性的盈余。因此,第二階段合作博弈的就是通過對盈余的可靠性的削減來達到維修費用降低的目標。
3.2.1 算例對比驗證


(22)
可以看到:經過遺傳算法優化得到的設備維修方案能夠滿足維修時間及可靠性的約束條件;然而,通過合作博弈優化算法取得的設備維修費用要低于遺傳算法的優化結果。針對這個算例,進一步采用粒子群算法進行求解。經過粒子群算法優化后的設備維修方案為Lpso=[1 0 2 1 4 0 0 2 2 0],對應的維修后可靠性、費用及時間分別計算為Rpso=0.900 1、Cpso=102.15、Tpso=9。可以看到,粒子群算法優化結果的維修費用要高于合作博弈方法及遺傳算法。

(23)
可以看到:該算例中遺傳算法與提出的合作博弈優化算法取得了相同的優化結果。進一步采用粒子群算法進行求解,優化后的設備維修方案為Lpso=[1 0 3 1 3 0 1 3 1 0],該維修方案對應的維修后設備可靠性、維修費用及維修時間分別為Rpso=0.9043、Cpso=104.6、Tpso=7。可以看到,粒子群算法優化結果雖然能夠滿足維修費用及時間約束條件,然后其維修費用要高于合作博弈算法及遺傳算法。由上述算例對比可以看到:所提出的合作博弈優化方法得到的設備維修方案整體上優于遺傳算法和粒子群算法;遺傳算法對初始值敏感、易收斂到局部極值點;粒子群算法的優化結果均不如合作博弈算法及遺傳算法的優化結果。
3.2.2 不同參數下對比分析
在不同參數下對比合作博弈優化算法與遺傳算法在維修策略優化精度及求解效率上的差別。選擇與表1及表2相同的設備參數,設備維修允許最大時長恒定為Tlim=10,設備最低的可靠性要求Rreq選擇在區間[0.8, 0.96]上并以0.02為間隔進行變化,對于每一個Rreq,分別通過合作博弈優化算法與遺傳算法對維修方案進行優化。通過對比兩種方法的優化結果,發現兩種方法優化后的維修方案均能滿足設備可靠性及維修時間約束條件。圖7和圖8分別給出設備維修費用及優化算法花費時間的對比。
圖7表明提出的合作博弈優化算法在不同的可靠性要求下獲取的設備維修費用不高于遺傳算法、且在部分可靠性要求下明顯低于遺傳算法優化后的維修費用,表明合作博弈優化算法對設備非完美維修模型一的求解具有較好的準確度。另一方面,圖8顯式不同的任務可靠性要求下維修策略采用合作博弈進行優化花費的時間約為0.75 s,而通過遺傳算法進行優化的花費時間則比合作博弈高出至少一個數量級,表明所提出的合作博弈優化算法較遺傳算法能顯著地提高計算效率。

圖7 不同Rreq下合作博弈與遺傳算法優化后 維修費用對比Fig.7 Maintenance cost comparison between cooperative game and genetic algorithm under defferent Rreq

圖8 不同Rreq下合作博弈與遺傳算法所用時間對比Fig.8 Calculation time comparison between cooperative game and genetic algorithm under different Rreq
針對有限資源下多部件設備的非完美維修策略優化問題,本文提出了基于合作博弈理論的維修策略優化方法。該方法將設備各個部件的負責人視為博弈的參與者,每輪博弈中各部件負責人根據上一輪的輸出維修方案及部件狀態來決定本輪的輸出策略,因而通過設置不同狀態參與者的策略空間及收益函數,可以通過多輪動態博弈獲得全局最優的維修方案。
為了驗證本文提出的合作博弈優化算法的有效性,通過仿真算例進行了測試,并與遺傳算法和粒子群算法的優化結果進行了對比。對比研究結果表明合作博弈算法優化后維修策略整體上優于遺傳算法和粒子群算法的結果,且能夠克服遺傳算法對初始條件敏感、易收斂到局部最優值的缺點。此外,合作博弈優化算法的耗時較遺傳算法要低至少一個數量級,表明所提出的合作博弈優化算法能夠顯著地改善多部件設備非完美維修策略的優化效率。本研究可以為當前有限資源下的設備維修策略優化提供新思路。