孫旭
(船舶系統工程部,北京 100036)
目前,電子設備的日常維護、維修主要依賴于設備的生產廠家,而且是以在出現故障后進行現場維修的模式來完成的,屬于被動式故障排除,這導致電子設備的技術含量日趨提高與使用維護的手段和能力相對較低的矛盾日益突出。隨著現代電子設備的集成度、復雜性、綜合化、智能化的不斷提高,為了以更經濟有效的方式滿足現代電子設備對綜合保障能力的需求,能否在執行任務之前,通過一些方法準確地預測在短時期內可能出現的故障,并給出對可能出現故障的處理方法或在未來一段時間內如何預防這些故障的出現,以保證在執行任務過程中,電子設備始終處于良好的技術狀態。滿足這一要求不僅需要能及時診斷、排故,而且需要事先預測設備的“健康”狀態。
從原理上講,不同的故障部位和原因引發的故障征兆是不同的,即他們故障征兆和故障原因、部位之間存在著某種線性或非線性的映射關系。因此,只要找到這種映射關系即推理方法和模型,再通過對電子設備功能性能的測試,對故障征兆進行采集和分析,利用它們之間的映射關系,就能在故障發生前,對可能發生故障的原因和部位進行預測。故障預測和健康管理(PHM)技術就是基于這種思想產生的。
PHM系統首先要能實時掌握電子設備工作狀態,最大程度地利用現有故障特征檢測和診斷技術,綜合先進的軟件建模技術實現低虛警率及精確的故障診斷和預測。通過對歷史數據的分析和處理,產生并不斷修正電子設備健康狀態評估結果。同時通過向維修保障基地傳輸故障信息,啟動自主式后勤保障的系統程序。
電子設備綜合保障及PHM系統體系結構如圖1所示。在圖1中,PHM處理中心是現代電子設備保障體系的核心,它替代了以前的事后維修保障模塊。
PHM系統采用開放式的體系結構(OSA),方便各種故障診斷和預測方法的不斷補充、完善。PHM的設計、實現要與電子設備的研發同步進行,融為一體,使基于PHM的維修保障體系與后方維修保障機構協同工作,構成網絡化、一體化的遠程電子設備維修保障體系。PHM系統結構必須便于從部件級到系統級都能綜合應用故障診斷和預測技術。從分級預測開始,向上綜合成系統或設備總體級的預測。
PHM系統功能強大,各環節之間相對獨立,又緊密聯系。
1)狀態監測和功能、性能測試
電子設備的狀態監測和功能性能測試是PHM系統的基礎。
實際上,需要監測的參數和測試的功能性能數目是很龐大的,且這些參數在性能上存在一定程度的重疊。這就需要對其進行特征提取,經過數據和特征量的融合,用少于原始參數數目的特征量來完整、準確地描述電子設備運行的狀態。這樣可大大降低故障診斷的復雜程度和計算量。將這些監測和測試結果保存起來,可為電子設備的故障預測、健康狀態管理提供依據。
2)故障診斷定位
當電子設備出現故障時,能迅速、準確地定位故障,提供排故方法并將相關信息保存,為電子設備的故障預測、健康狀態管理提供信息。
3)故障預測
根據對電子設備當前狀態的監測、功能性能測試信息、故障診斷定位信息和預測模型,得出今后一段時間內可能出現的故障及相關保障用信息。
4)綜合保障和健康狀態管理
在預測出將來一段時間內可能出現的故障后,可以提出“預先”維修、保養的方法,以便在電子設備真正發生故障前采取措施,將傳統的事后維修轉變為視情維修,從對故障的被動反應到主動預防,實現自主式保障。對電子設備的組成零部件的未來進行剩余使用壽命的評估,對整個電子設備的未來進行剩余使用壽命的預估,最終對電子設備未來的總體技術狀態進行評估。通過綜合保障的輔助決策、自動化和信息化管理,可實現電子設備備件、工具和維修人員的管理,減少全壽命周期的各項費用。
典型的PHM系統工作流程如圖2所示。它包含了數據采集和處理、特征量提取、數據融合、狀態檢測、功能性能測試、故障診斷、故障預測、健康狀態管理等環節。

圖2 PHM系統工作流程圖Fig.2Work procedure diagram of PHM system
PHM系統通過狀態監測和功能性能測試獲得大量的原始數據,經過數據融合等數據處理技術,得到可信的有用信息。經過適當的數據傳輸,從有用的信息中提取出特征狀態。這些狀態中包含有電子設備的當前狀態信息,經過分析,推出電子設備的良故等。如果狀態信息不正確,說明電子設備故障需要進一步進行故障診斷、定位。無論狀態信息正常或故障,這些信息均可作為故障預測、綜合保障和健康狀態管理的基礎數據被保存起來,并據此不斷地修正、完善故障預測和健康狀態管理。
對電子設備未來狀態的故障預測技術是PHM系統的核心和難點。
1)預測的不確定性
它是故障預測的固有特性。電子設備的故障機理本身是一個隨機的復雜過程,準確地掌握所有故障產生機理、故障模式與現象的對應關系等是很困難的,這不僅需要理論設計還需要大量的工程驗證,工作量極大。而且,預測過程本身也會產生誤差。采用的預測方法、預測模型等不同,產生的結果也不完全相同,結果的置信度也不一樣。故障預測方法必須考慮準確度、精密度和置信度之間的關系,用不確定度的形式給出預測結果。
2)預測的方法不能通用
由于對物理模型和專家系統的依賴,各種預測方法往往是各不相同。不同類型的故障應該采用不同的預測模型和專家系統,所以它們不具備通用性。而且不同專業、鄰域的預測方法也不盡相同,使用哪一種預測方法也需要試驗的驗證。
3)預測結果驗證困難
①驗證的方法還不夠完善,驗證的工作量很大;
②缺乏統一的、廣泛認可的故障預測評估方法和標準。
目前,故障預測方法很多,分類也沒有統一的標準。本文將故障預測方法按照如下方法進行分類。
1)基于異常現象信息的故障預測
基于異常現象信息(如溫度、電壓、電流等)進行故障預測就是利用歷史統計數據、故障注入獲得的數據等已知信息,通過預測模型和專家系統等技術,最終形成并不斷修正電子設備異常現象與故障損傷關系模型的曲線,達到預測的目的。
這里所說的異常現象主要是指發生故障之時所表現出來的參數變化。參數變化有在允許范圍之內和超出有效范圍兩種情況。用變化的參數對比電子設備未來狀態的曲線來判斷電子設備是否將要進入故障狀態。
建立異常現象與故障損傷關系模型可以采用概率趨勢分析法、人工神經網絡(ANN)趨勢分析模型、基于系統模型的趨勢分析等方法。
①概率趨勢分析模型
通過建立異常現象對應的關鍵參數集,依據歷史數據建立各參數變化與損傷狀態的概率
趨勢模型(退化概率軌跡),與當前多參數概率狀態空間進行比較,進行當前健康狀態評估與趨勢分析。通過當前參數概率空間與已知損傷狀態概率空間的干涉來進行定量的損傷判定。
②人工神經網絡(ANN)趨勢分析模型
該方法通過ANN的非線性轉化特征及其智能學習機制,利用監測到的故障現象等信息來建立電子設備故障損傷狀態之間的聯系。利用已知的“異常特征-故障損傷”退化模型曲線,或通過故障注入建立與特征分析結果相關聯的退化模型曲線,對ANN模型進行“訓練/學習”;然后利用“訓練/學習”后的ANN和當前產品特征對電子設備的故障損傷狀態進行判斷。由于ANN具有自適應特征,因此可利用非顯式特征信息來進行“訓練/學習”與故障損傷判斷。
③基于系統模型進行趨勢分析
利用被觀測對象動態響應模型(包括退化過程中的動態響應),針對當前系統的響應輸出,進行參數辨識,對照正常狀態下的參數統計特征,進行故障診斷、故障預測。這種方法提供了一種不同于概率趨勢分析、ANN的途徑,具有更高的置信度和故障早期預報能力。
2)基于使用環境信息的故障預測
基于使用環境信息的故障預測就是采用壽命消耗監控(LCM)方法來預測。這是目前主要的預測發展方向。壽命消耗監控方法是以環境信息(包括電子設備使用環境、使用時間、已經出現的故障等信息)為基礎。它基于電子設備的失效物理模型,通過對環境應力和工作應力監測,進行累計損傷計算,進而推斷出電子設備的剩余使用壽命。
壽命消耗監控方法的基礎是對電子設備失效模式、失效機理的深入了解,建立量化的失效物理模型。其典型模型包括焊點疲勞、電遷移、熱載流子退化、時間相關介電質擊穿(TDDB)、錫須、導電細絲形成(CFF)等,這些技術相對成熟些。
3)基于損傷標尺的故障預測
損傷標尺就是針對一種或多種故障機理,以與被監控電子設備相同的生產工藝制造出來的、預測壽命比被監控的電子設備短的產品為基礎,建立損傷關系模型曲線。被監控電子設備的狀態參考該模型曲線來判斷、預測,它是基于對被監控對象特定失效機理的認識來預測的。損傷標尺方法可以做到定量設計。
采用電子設備技術狀態的“專家系統”,通過對電子設備的狀態監測、功能和性能測試的信息以及故障診斷和預測的綜合分析、處理,得到當前和將來電子設備技術狀態水平的評估,對整個電子設備的剩余使用壽命進行預估,最終實現對電子設備健康狀態的管理。
雖然世界各國對電子設備PHM技術表現出濃厚興趣,而且發展迅速,但電子設備的PHM技術還遠未成熟,與大規模的工程應用還有相當的距離。在以下方面面臨著巨大挑戰:
1)建立電子設備基于物理特點的損傷模型;
2)殘余使用壽命預測的不確定性;
3)間歇性失效的預測方法還很不成熟。
這就說明,目前PHM系統的應用還不具備全面推廣的條件,今后要做的工作還很多,困難也很大。
當前PHM技術的發展體現在以系統級集成應用為牽引,提高故障診斷與預測精度、置信度,降低虛警率,擴展健康監控的應用對象范圍,支持CBM與AL的發展。所以,今后將在以下幾個方面加大研究和試驗力度。
1)采用與工程同步設計的原則,將PHM系統的設計與被監控電子設備的開發同步進行。這就要求有一套完整的管理程序和技術要求來保障;
2)進行PHM系統的定量性能評價與驗證,對設備的單機級、系統級的PHM,通過采用各種仿真或試驗來評價與驗證設計的正確性。
1)研究混合型及智能型數據融合技術
對于數據的搜集和傳輸,目前的發展方向體現在傳感器的高精度、小型化、集成化、惡劣環境的適應性、可靠性、低能耗、高速傳輸的傳感器網絡等方面。不斷加強經驗數據與故障注入數據的積累,提高診斷與預測的置信度,降低虛警率。
2)不斷尋求高質量的健康監控及管理途徑
通過應用靈巧、健壯的傳感器設備,提高數據源監測精度,與故障預測技術相結合,減少故障不能重現(CND),降低虛警率。
研究如何實現壽命消耗監控(LCM)的不確定性的定量評價,如何把壽命消耗監控與損傷標尺技術相結合,提高壽命消耗監控的置信度。
3)混合型故障預測算法
由于故障預測研究的難度大,使用單一的方法進行故障預測往往難于實現其高可靠性、高置信度、低虛警率的要求。因此將多種不同的故障預測算法有機結合,進一步提高預測系統的綜合性能。
4)仿真驗證系統研究
故障預測結果的驗證是個復雜的問題。如果采用真實的試驗來驗證,則需要一個較大的樣本空間、設備失效模式模擬等,難度和工作量都很大。仿真驗證系統對于預測算法開發和驗證工作都將起到極大的輔助作用。而且對安全性要求很高的設備進行建模仿真驗證,可以減少危險性。采用該方法可以適當減少對驗證試驗的需求,但這對建模和仿真的能力提出了更高的要求。
PHM系統是一個復雜的系統工程,涉及到電子設備本身的專業技術、維修保障技術、硬軟件領域等多個專業、鄰域。要想把它廣泛地應用在工程上需要各行各業的專業人員的合作,在技術上還有很多困難需要攻關。今后應該重點開展PHM系統體系、故障預測、健康管理等的設計和驗證工作,盡快應用于各行各業中。
[1]曾聲奎,吳際.故障預測與健康管理(PHM)技術的現狀與發展[J].航空學報,2005,26(5):626-632.
ZENGSheng-kui,WUJi.Statusandperspectivesof prognostics and health management technologies[J].Acta Aeronautica et Astronautica Sinica,2005,26(5):626-632.
[2]王晗中,等.基于PHM的雷達裝備維修保障研究[J].裝備指揮技術學院學報,2008,19(4):83-86.
WANG Han-zhong,et al.Research on the maintenance support system for radar equipment based on the PHM[J].Journal of the Academy of Equipment Command and Technology,2008,19(4):83-86.
[3]張寶珍,曾天翔.先進的故障預測與狀態管理技術[J].測控技術,2003,22(11):4-6.
ZHANGBao-zhen,ZENGTian-xiang.Advancedpro prognosticsandhealthmanagementtechnology[J].Measurement&Control Techonology,2003,22(11):4-6.
[4]姜云春,等.裝備自治性維修保障概念與體系研究[J].中國機械工程,2004,15(5):402-405.
JIANG Yun-chun,et al.Research on autonomic logistics for equipments[J].China Mechanical Engineering,2004,15 (5):402-405.