姜 勇,韋朝奧,陳紹輝,陳 亮,張愛輝,陳 余
設備的剩余使用壽命(RUL)被定義為從當前時間到使用壽命結束時其設備可以有效使用的時間長度。目前,RUL的概念已經被廣泛運用到運籌學、統計學中,其他如材料科學、生物統計學和計量經濟學等領域也有涉及。其中一部分的運用是合理的,例如在“Businessdictionary.com”中,“使用壽命”被定義為資產或財產在使用過程中從開始到最后的目的達成所進行的期限。然而,在會計學中,它被定義為“貶值的資產實現生產力再生及可用的預期期限”。由此可見,使用壽命的具體定義取決于其所在的環境和所需的操作特性。在本文中,假定設備的持有者了解使用壽命的定義,且在此前提下對近年來RUL預測的建模發展進行回顧,并在基于條件維護和狀態預測的生存分析下審查集中統計數據驅動的方法,最后對設備剩余壽命預測技術的合理性進行介紹。
RUL預測主要是基于條件維護(CBM)[1]和狀態預測管理[2]的條件下而進行的,其在設備資產使用過程中具有至關重要的作用,因為它將會影響設備使用維護的規劃、備件的供應、運行性能以及設備資產持有者的盈利程度[3]。不止如此,RUL預測在產品重復使用和回收管理方面以及設備使用過程中的能源消耗、原材料使用、污染程度和垃圾填埋場的使用同樣具有重要的戰略影響[4]。因為產品要想具備重復使用的能力,就必須有足夠長的使用壽命。
由于設備的RUL具有隨機性,所以預測過程主要取決于設備當前已使用時間、操作環境和可以觀察到的狀態監測(CM)或健康信息。在本文中,首先關注了RUL預測下的統計數據驅動方法,由于它只依賴可用的以往觀測數據和統計模型,所以在不依賴任何物理條件或工程原理的情況下可以利用統計數據驅動的方法構建RUL預測模型,繼而將模型擬合到一個概率模型上??梢园l現與其他方法相比,統計數據驅動具有一定的優勢,因為它可以對一些良好的數學特性進行分析。一般來說,用于RUL預測的數據可以劃分為兩種主要類型:事件數據和CM數據。所謂事件數據,就是指記錄著的以往的故障數據。正如文獻[5]中所分析的那樣,為了利用統計數據來實現一個合理有效的RUL預測,可以從目標設備中收集和存儲有用的數據(信息)。然而,對于一些關鍵設備則必須保證預測結果的準確性以及有效性,因為這類數據是稀缺且重要的,在此情況下,CM數據便成為了重要的數據信息來源,因為CM數據是在大范圍數據中被定義,而這些數據卻很可能與RUL的預測技術有關,例如CM信息、操作、性能、環境信息和退化信號。同時這些CM數據是通用的,例如振動數據、石油分析數據、溫度、壓力、濕度、加載速度和環境數據等。也就是說,數據可以是客觀的,也可以是主觀的,這主要取決于數據的性質和收集方法。
由以上分析可以了解到,統計數據驅動的方法依賴于數據的可用性和數據的性質。在這一點上,可以將可用的CM數據劃分為不同的類別,以便能夠以相同的方式進行審查。根據對現有文獻的回顧,將觀測到的CM數據分為直接CM和間接CM[6]。直接的CM數據可以直接描述系統的底層狀態,因此可以說RUL預測實際上是對CM數據的預測。如果可以觀察到,那么設備上諸如磨損和裂縫便是此類數據的典型范例。而間接的CM數據只能間接地描述系統的底層狀態,因為其對于RUL預測的進行需要在CM數據中添加故障事件數據(從振動和油基監測中便可以得到)。據此,可以將對于統計數據驅動的審查分為兩大類,即基于直接觀察狀態的模型和基于間接觀察狀態的模型。后者也被稱為部分觀測狀態模型,因為觀察到的CM狀態與不可觀測的狀態之間存在隨機關系。
其次,由于已經有部分分散在運籌學、可靠性建模、優化維護、故障診斷和生存分析的論文對這個話題進行了討論,所以首先對此類論文進行簡要但完整的回顧介紹,從而說明本文覆蓋了一個以前沒有被全面審查過的領域。
論文的其他組織架構為:第1節對與RUL有關的文件進行簡要的調查分析;第2節對基于直接觀察狀態的RUL預測模型進行介紹;第3節回顧了基于間接觀察狀態的RUL預測模型;第4節通過建立退化模型來對該預測技術進行評估;第5節則對全文的分析進行總結。
在過去的幾十年里,出現了一些關于設備維護、升級優化、建模技術以及故障診斷等方面的優秀評論性文章,這些評論性文章涵蓋了設備維護和可靠性問題等諸多方面。然而,這些文章有一個共同點,那就是很少討論RUL以及與此相關的建模技術,盡管其所審查的一些建模技術已經可以用于RUL預測。
目前可進行RUL預測的設備主要是旋轉機械設備,但是眾所周知,RUL預測技術并不僅僅局限于旋轉機械設備,因為許多工業設備項目(如電子和民用設備)并沒有旋轉部件,但是其在使用過程中仍會出現磨損消耗,所以仍然需要RUL預測。在文獻[7]中,文章將RUL預測技術置于設備故障和數據驅動的物理類別之下,同時依靠底層降解過程的物理特性來預測設備故障的發生。由此可知數據驅動的方法主要是通過收集CM數據和事件數據來直接派生概率模型,這種模型將機器學習和基于統計的方法進行融合,而所用的融合方法則是設備故障研究和數據驅動模型的結合[8]。當然,在統計數據驅動過程中需要對CM數據進行觀察研究,但是研究發現所觀察到的CM數據并不是退化信號,而僅僅是其中的一部分,同時也可以觀察到這部分退化信號的產生實際上是偏向于Gamma過程的。而其他諸如此類的文章也大多強調人工智能技術,對基于生存分析統計的預測技術討論較少。
通過以上論述可以知道,以往用于RUL預測的統計數據驅動方法并沒有得到全面審查,而本文則填補了該項空白,其主要工作是試圖對廣義的基于統計方法的RUL預測方法提出一個全面的論述。在此過程中,不涉及特定類型的機器設備,而是從數據和模型的性質以及統計的角度來進行觀察,這將為基于生存分析的RUL預測技術提供一個連貫統一的參考點。如前所述,將CM數據分為直接CM數據和間接CM數據,且在基于直接CM數據的條件下回顧了基于回歸的的模型,同時在此模型中包含了文獻中所報告的統計數據驅動模型。
研究發現,間接CM數據如果想要與直接CM數據進行聯接,則需要利用一些信號處理技術(例如傅立葉和小波變換等)直接從間接CM數據中提取并計算出能夠代表設備健康狀態的指標。在這種情況下,可以首先使用基于直接觀察狀態的RUL預測模型。
目前,基于設備故障時間分析的傳統方法僅僅依靠故障事件數據[9]來進行判斷,因為除故障事件數據以外的一些數據常被認為是無效數據進而被舍棄。但是有人指出在設備實際使用過程中或許根本不存在無效數據,每一組數據皆有其存在價值,而且基于直接觀測狀態的RUL預測模型作為一種可供選擇的研究模型已經可以對RUL進行有效預測。正如前面所提到的,CM數據可以直接在這些模型中對設備的底層狀態進行描述,也就是說如果CM數據可以進行正確的建模,那么便可以直接預測設備的RUL,且在這個過程中并不需要損耗數據,這顯然是這類預測技術的一個優點。
目前,有兩種常用的基于直接觀察狀態的RUL預測建模的方法。第一種方法是將狀態模型轉化為一個連續性過程,而第二種方法則是使狀態過程滿足離散空間。在這兩種方法的理論基礎上,主要對回歸模型和馬爾可夫模型進行介紹。
首先對回歸模型進行簡要介紹。目前在用于CM路徑研究的所有模型[10]中回歸模型可能是最簡單的,而且研究發現此模型進行過程中最受歡迎的方法是其包含著的機器學習和隨機回歸系數。其中機器學習方法僅利用觀察到的數據和一些統計技術,比如最小二乘法。隨機回歸系數方法則是利用CM數據來對CM路徑進行描述,然后推斷出設備的壽命分布情況??梢詫﹄S機回歸系數模型做以下基本假設[11]:(1)設備的工作狀態隨著操作時間的變化而惡化,并且在任何時候都可以觀察到惡化程度;(2)被監控的設備數量固定,且每一個設備都有相同的退化形式;(3)設備總體的隨機項是已知的。此前也有一些隨機回歸系數模型被提出,而且被用于RUL預測,但是這類模型側重于使用基于傳感器的監測信號來對單個操作設備的RUL分布進行預測分析。分析結果表明,在貝葉斯框架下,建立單個設備的歷史數據與實時CM信息之間的聯系需要不斷提供更新后的模型參數。
與機器學習方法相比,隨機回歸系數模型可以提供RUL預測結果的PDF格式,當然這種PDF的封閉形式只有在特殊情況下才可用。而在大多數情況下,必須使用逐步近似或模擬的辦法來尋找近似的RUL預測數據。但是隨機回歸系數模型也有一個問題,就是它不能對RUL預測的時間變化進行建模分析。這主要是因為隨機回歸系數模型沒有FPT動機,而且由于高斯噪聲的普遍使用,使得它在一定程度上限制了模型的非單調性。
其次對馬爾可夫模型的特點進行簡單介紹?;隈R爾可夫的模型有兩個基本假設。一是設備未來的退化狀態只取決于當前的退化狀態;另一個是設備系統的運行狀態可以直接由所觀察到的CM信息顯示出來。目前馬爾可夫模型已經被廣泛應用于RUL預測和設備維護決策中,其主要原因是馬爾可夫模型可以使狀態定義更接近于工業中使用的其他隨機模型,且容易被理解使用,而且馬爾可夫理論在可靠性分析和RUL預測上具有很強的數學基礎。但值得注意的是,馬爾可夫模型的RUL預測過程存在一定的局限性,這一局限性有可能對有效結果的得出產生影響。而且在馬爾可夫模型中,系統狀態間的轉移概率通常由經驗知識或大量的樣本決定,而這些樣本并不總是可靠的。換言之,如果想要RUL預測的結果合理,馬爾可夫模型仍有需要改進的地方。
用于RUL預測的所有模型中有三種類型是基于間接觀察狀態的。第一種是基于隨機過濾的模型[12];第二種是基于協變量的風險模型(PHM)及其變種[13];第三種是基于隱馬爾可夫模型(HMM),在這三類模型中基于隱馬爾可夫模型(HMM)由于其概念清晰而被應用于設備RUL預測技術中[14]。下面將具體對基于協變量的風險模型在RUL預測過程中在的應用進行考察。
在設備實際使用過程中,機械部件的磨損以及電子設備的損壞、退化過程是由一個或多個稱為協變量的因素引起的。例如,設備運行過程中會因受到溫度、材料性能和運行速度的影響而產生磨損??梢哉f這些隨機變化的協變量影響著設備的使用壽命周期。因此,在RUL預測技術中引入這些協變量是很重要的。
作為一種最常見的基于協變量的模型,比例風險模型由于其通用性、靈活性和簡單性而一直備受歡迎。而且由于PHM在統計科學中具有通用性,所以PHMs一直被廣泛用于將系統CM變量、外部因素與系統的故障聯系起來這一過程中。在其他統計方法中,PHM最重要的優點是協變量信息可以很容易地與基線危險函數相結合。據此,可以很容易地評估不同協變量對設備使用壽命預測的影響,對于此過程,可以用公式來表述:

在此公式中,Z(t)表示整個協變量信息的歷史時間,t表示設備的使用周期。從上面的公式可以看出,PHM的運行需要依靠事件數據,如故障、審查數據以及CM數據信息。
基于這種情況,在設備RUL預測過程中可以參考結合工廠的運行狀況。因為這樣可以從RUL預測過程中得到有效的CM數據,從而克服傳統預測方法所具有的缺點。同時在基于協變量的模型框架中,可以利用一些基于基本PHM的變體來構建危險建模,如比例強度模型。但是,值得注意的是,這些變體的應用程序比PHM更少。也就是說即使其他變體在理論基礎、概念上以及可行性方面確實有對RUL預測的潛力,但是在他們被操作者接受之前仍然還有一些方法要去做。
最后需要知道用基于協變量的風險模型來對RUL進行預測所存在的主要問題是:(1)模型混合了不同的協變量,而在這些協變量中有部分變量會對預測的結果產生影響。例如,在發動機的機油分析方案中,油液濃度是評估發動機磨損的良好指標。然而,發動機機油中的污染物同樣會對發動機磨損;(2)PHM與任意給定時刻的協變量之差具有正比關系,而這一關系給工程設備的有效使用和可靠性評估帶來了嚴重的限制,其對于具有不同協變量但基線風險相同的工程設備來說也存在干擾;(3)基線危險函數的參數采用過程中需要足夠的故障事件數據和相關的CM數據,但是這些數據有時并不能完全得到或者保證正確。
通過對近年來RUL的建模發展進行回顧,以及在基于條件維護和狀態預測的生存分析下對集中統計數據驅動的方法進行審查,發現基于生存分析的RUL預測技術較以往的預測技術有著預測結果有效合理的特點。為了對其進行驗證,本節建立了一類退化模型,通過建立這類退化模型來對功能設備的隨機參數進行重新估計,進而使用這些更新的參數來預測被監控設備的剩余壽命分布。
本文中提出的退化模型適用于具有指數遞增或遞減形式的具體退化現象,所進行驗證的預測技術滿足于這類退化模型的運行特點。Gebraeel等人[15]提出了多種退化模型的剩余壽命分布,這些模型包含了線性、多項式以及其他的指數類型。此外,Gebraeel也提出了依賴于隨機參數的模型,以及其他用于推導剩余壽命分布的計算方法。
首先用一個指數模型來模擬一個具有指數模型分量的退化信號,并且讓此模型對隨機誤差過程中的誤差項進行假設,同時對單個構件模型的未知隨機參數進行估計。一旦確定了這些未知參數的具體分布情況,便可以得到單個設備的剩余壽命分布。
讓S(tn)表示連續隨機過程中的退化信號,t為連續時間t1、t2、…(tn≥0),在此條件下對時間t內的退化信號進行建模,且對分布在離散點上的退化信號進行觀察。

在此式中,n=1、2、…,φ是一個已知的常數,θ是對數正態隨機變量,β是一個正常的隨機變量,ε(tn)則是一個遵循正態分布的隨機誤差項,其方差為σ2。在觀察過程中假設θ、β相互獨立,而且其他與此模型有關的數據信息,都將被用于模型退化分析。
對于這個指數模型,發現在時間tn內使用被記錄的退化信號將是很方便的,基于此,用L(tn)來定義被記錄的退化信號:

在以上公式中,L1、L2.…所表示的數值即是在n=1、2…條件下所得出的模型數據,但是考慮到所得數據符合二元正態分布的特點,所以對其進行命題假設,從而使其滿足剩余壽命分布的推導過程。

在模型建立完成后,需要對剩余壽命分布進行分析確定,從而保證對基于生存分析的設備剩余壽命預測技術的驗證是科學的,而要做到這一點,首先計算后驗分布,進而觀察被記錄的退化信號值。

現在,對T時刻下設備的剩余壽命進行表示:

如上述分析,已經展示了如何確定設備上的剩余壽命分布,而且注意到,T不是一個正常的隨機變量,因為T的分布與伯恩斯坦分布[16]類似。但是可以確定的是只要得到一個新的退化信號,就可以對設備的剩余使用壽命進行重新估計,而且這個過程可以很容易地在電子表格上得到體現,換句話說就是基于生存分析的設備剩余壽命預測技術對于設備的使用壽命預測是可行合理的。
在本文中,回顧和總結了基于條件維護和狀態預測的生存分析下的RUL預測技術的建模發展,且審查了集中統計數據驅動的方法。本文也將研究建立的RUL預測模型分為了兩大類討論,即基于直接觀察狀態和間接觀察狀態的RUL預測模型。同時本文通過建立退化模型來對基于生存分析的RUL預測技術進行了檢驗,且通過對于退化模型的分析,證明此RUL預測技術在合理操作下是可行且準確的。
參考文獻:
[1] Wang,W.,Zhang,W.An asset residual life prediction model based on expert judgments[J] .European Journal of Operational Research,2008,188:496-505.
[2] Pecht,M.Prognosticsand Health Management of Elec?tronics[M].John Wiley,New Jersey,2008.
[3] Altay,N.,GreenIII,W.G.OR/MS research in disaster operations management[J] .European Journal of Opera?tional Research,2006,175:475-493.
[4] Mazhar,M.I.,Kara,S.,Kaebernick,H.Remaining life estimation of used components in consumer prod?ucts:Life cycle data analysis by Weibull and artificial neural networks [J].Journal of Operations Manage?ment,2007,25:1184-1193.
[5] Jardine,A.K.S.,Lin,D.,Banjevic,D.A review on machinery diagnostics and prognostics implementing con?dition-based maintenance[J].Mechanical Systems and Signal Processing,2006,20:1483-1510.
[6] Wang,W.,Christer,A.H.Towardsa general condition based maintenance model for a stochastic dynamic system[J].Journal of the Operational Research Society,2000,51:145-155.
[7] Pecht,M.Prognostics and Health Management of Elec?tronics[M].John Wiley,New Jersey,2008.
[8] Pecht,M.,Jaai,R.A prognostics and health manage?ment roadmap for information and electronics-rich system[J].Microelectronics Reliability,2010,50:17-323.
[9] Kalbfleisch,J.D.,Prentice,R.L.The Statistical Analy?sis of Failure Time Data [M].Wiley, New Jersey,2002.
[10] Heng,A.,Zhang,S.,Tan,C.C.,Mathew,J.Ro?tating machinery prognostics: State of the art, chal?lenges and opportunities[J].Mechanical Systems and Signal Processing,2009,23:724-739.
[11]Wang,W.A model to determine the optimal critical lev?el and the monitoring intervals in condition-based main?tenance [J].International Journal of Production Re?search,2000,38(6):1425-1436.
[12]Wang,W.A model to predict the residual life of rolling element bearings given monitored condition information to date [J] .IMA Journal of Management Mathemat?ics,2002,13:3-16.
[13] Jardine,A.K.S.,Banjevic, D., Makis,V.Optimal replacement policy and the structure of software for con?dition-based maintenance [J].Journal of Quality Maintenance Engineering,1997,3(2):109-119.
[14] Bunks, C., McCarthy, D.Condition-based mainte?nance of machines using hidden markov models[J].Mechanical Systems and Signal Processing, 2000,14 (4):597-612.
[15]Gebraeel,N.,Lawley,M.,Li,R.et al.Life distribu?tions from polynomial and exponential component degra?dation signals: Bayesian approach [D].Purdue Re?search Memorandum,Purdue University,West Lafay?ette,IN 47907,USA.2001.
[16] Ahmad,M.and Sheikh,A.Bernstein reliability mod?el: derivation and estimation of parameters[J] .Reli?ability Engineering,1984,8:131-148.