馬彥恒,宗子健,劉新海
(軍械工程學院 無人機工程系,河北 石家莊 050000)
隨著裝備發展日新月異,裝備保障理論也不斷豐富與完善,從故障檢測、診斷到以可靠性為中心的維修管理(reliability centered maintenance,RCM)和故障預測與健康管理(prognostics and health management,PHM),裝備的保障手段也從基于單個裝備使用過程中的故障診斷、維修,發展到基于全壽命周期的維修決策和健康管理。但是隨著信息化技術的快速發展,裝備發展呈現出體系化、網絡化、智能化的發展趨勢,對裝備的保障提出了新的要求。馬彥恒等在文獻[1]中提示出了一種基于大數據的深度學習技術的、新的裝備保障理念——認知測試性(cognitive testability,CT)。它的提出,使裝備的自我感知、精確化保障成為可能。
認知測試性是在PHM的基礎上發展而來的,它將PHM的理念,延伸至裝備設計階段,通過約束和規范測試性設計,將PHM的功能內在化,將裝備的PHM設計與裝備功能設計相結合,使得PHM與裝備有機融合,排除不完善、不標準、不系統等問題,使裝備自身具有信息的獲取、交互和深度學習能力。
但是,認知測試性的研究是一個新概念、新理論,尚處于發展階段。本文在前期研究的基礎上,旨在通過對比RCM和PHM,進一步闡述認知測試性指標體系和指標的概念、體系構成,分析認知測試性的物理基礎,深入剖析認知測試性的內涵,進一步說明認知測試性對于信息化裝備的重要性和必要性。
RCM是一種系統工程方法,其最初思想產生于20世紀60年代。當時,美國航空維修費用劇增,占到了總費用的30%,形成了“買得起,用不起”的現象[1-5]。為了權衡維修費用與效果,于是產生了RCM[6]。它的基本思路是:對系統進行功能與故障分析,明確系統內各故障的后果;用規范的邏輯決斷方法,確定出各故障后果的預防性對策;通過現場故障數據統計、專家評估、定量化建模等手段,在保證安全性和完好性的前提下,以維修停機損失最小為目標優化系統的維修策略。
與傳統維修理念相比,RCM對故障的理解更加科學合理。
在傳統維修觀念中,設備故障是與使用時間相關的,設備越老,故障越多,設備越新,故障越少,無明確的潛在故障的概念,偏重于定期維修,維修可以提高裝備的可靠性,對可能出現的任何故障都可以進行預防維修。
在RCM理念中,設備故障與使用時間沒有關系,有明確的潛在故障的概念,傾向于視情維修,維修不能提高設備的可靠性,只能恢復或保持設備的固有可靠性;只有故障后果嚴重、技術可行而又有效的預防維修才有必要實施,否則應該放棄;要求使用、維修和研制部門的協作。RCM理念的應用在維修管理中產生了巨大的效益,說明RCM理念具有科學性和先進性。
RCM僅是對故障認識上的轉變,PHM相對于RCM來說更進了一步,而PHM則深入到了故障產生的機理和故障發展趨勢。
PHM是綜合運用傳感器、人工智能及計算機等各種先進技術,通過監測和故障診斷技術獲取裝備狀態和故障信息,預測故障發展趨勢,采取有針對性的維修措施,從而提高裝備維修管理的精確化程度。
PHM的工作原理(如圖1)是通過傳感器從系統的不同層次獲取監測數據,通過處理和分析相關的數據,形成診斷和預測結果,給出系統的剩余壽命分布、性能退化程度或任務失效概率,從而為維護計劃提供決策信息[7]。預測是PHM的關鍵技術,其中故障預測方法主要可以分為3類:基于模型的故障預測技術、基于數據驅動的故障預測技術和基于統計可靠性的故障預測技術[8-9]。
總體上看,無論是RCM還是PHM,它們對裝備的作用,均體現在“管理”上,主要是針對裝備的個體進行保障,是從外部對裝備單體發生作用,而裝備本身是被保障對象,是被動的。隨著智能化技術的發展,裝備對自身狀態的自我感知能力是裝備發展的必然趨勢,為適應這一趨勢的需要,認知測試性的概念應運而生。
認知測試性是測試性概念[10]的拓展,指產品能及時準確地感知其狀態(可工作、不工作或性能下降程度),預計其狀態變化趨勢及內部故障發生概率,并給出應對策略的設計特性[1]。以實現認知測試性為目的進行的設計被稱為認知測試性設計(design for cognitive testability,DFCT)。
與傳統測試性的概念相比,認知測試性強調對狀態的感知,對性能下降的程度進行更加精確的區分,并增加了狀態變化趨勢的預測和智能決策的內容。
從以下方面對認知測試性及其設計內涵進行理解:① 認知測試性描述了測試信息獲取的過程和方法;② 認知測試性是產品本身的一種設計特性;③ 認知測試性設計的最終目標是滿足產品的全壽命周期要求,提高產品的任務可靠性水平。基于此目標,認知測試性設計已不僅僅滿足于確定產品自身當前狀態,而且要滿足感知狀態變化的需求,也就是獲取的信息不僅要包括當前的、獨立的、內部的、量化的測試信息,而且要包括歷史的、相關的、外部的、經驗的信息,這些信息也不僅局限于反映電參數的變化,而且可以包含先驗知識的融合信息;④ 認知測試性突出了信息流在產品設計中的作用,是一種積累與演化的過程。
認知測試性指標體系分為3級,一級指標有3個,二級指標有7個,三級指標有18個。認知測試性的指標體系如表1。
其中,故障診斷能力與傳統測試性指標內涵相差不大,在此不再贅述,下面主要介紹信息獲取能力和智能預測與決策能力的指標及內涵。
(1) 同型裝備狀態監測/故障與維修/使用環境歷史信息獲取完備率
武器裝備在使用、維修到壽命終結的各個階段,包含了能反映和影響裝備壽命與故障發展趨勢的大量歷史信息,有效利用同型其他裝備各類歷史信息,必將對在用或即將使用裝備的故障預測有重要參考價值。
同型裝備狀態監測/故障與維修/使用環境歷史信息獲取完備率,是指獲取的與被測對象同類型的裝備狀態監測/故障與維修/使用環境歷史信息的完備程度。其中狀態監測歷史信息(condition monitoring historical information)是指同類型裝備從出廠正式交付使用開始,監測到的各項性能數據。故障與維修歷史信息(fault and repair historical information)是指同類型裝備從出廠正式交付使用開始,記錄的所有故障以及各級、各類維修的詳細數據。使用環境歷史信息(use environment historical information)是指同類型裝備從出廠正式交付使用開始,記錄的所有詳細的使用環境信息。
(2) 裝備狀態監測/履歷/使用環境信息獲取完備率
對獲取的同類型其他裝備的歷史數據進行分析,得到了歷史故障規律。如果將當前在用裝備的各類信息通過多種方式和途徑傳遞給后方服務器,通過數據分析得到的規律與歷史故障規律進行融合,可以進行當前裝備的故障預測,以便得到更加準確、有效的故障預測結果。
裝備狀態監測/履歷/使用環境信息獲取完備率是指獲取的被測對象自身狀態監測/履歷/使用環境信息的完備程度。其中狀態監測信息(condition monitoring information)是指裝備從出廠正式交付使用開始,監測到的各項性能數據。履歷信息(vitae information)是指裝備從出廠正式交付使用開始,記錄的所有詳細的執行任務、發生故障、進行各級各類維修的數據。使用環境信息(use environment information)是指裝備從出廠正式交付使用開始,記錄的所有詳細的使用環境信息。
(3) 信息相關度
信息相關度(information correlation,IC)用來描述獲取的用于故障預測的同類型裝備的歷史信息與裝備自身信息的相關程度。相關程度越大,利用歷史信息估計出的裝備的狀態、故障類型、故障趨勢和故障時間等就越準確。
(4) 信息充分率
信息充分率(information sufficient rate,ISR)是指獲取的用于故障預測的各類信息樣本的充分程度。獲取的樣本足夠多,相關度越大,信息融合能力就越強,對裝備的狀態信息判斷越準確。
(5) 關鍵故障預測率
關鍵故障預測率(critical fault prognostics rate,CFPR)是指在被測單元執行任務前,正確預測到的關鍵故障數與被測單元發生的關鍵故障總數之比。
(6) 預測虛警率
預測虛警率(prognostics false alarm rate,PFAR)是指在被測單元執行任務前,發生的預測虛警數與同一時間內的故障預測指示總數(包括預測虛警數和真實故障預測指示次數)之比,用百分數表示。其中預測虛警是指預測到被測單元有故障,而實際上該單元不存在故障的情況。
(7) 故障前置時間
在被測單元的實際性能與理想性能之間達到一定值時,將該時刻記為A;當被測單元的實際性能低于最低要求時表現出故障,將該時刻記為B,A到B的時間定義為故障的前置時間(fault lead time,FLT)。預測主要關注初始故障到其發展至系統或部件失效之間的這段時間。故障前置時間越長,越有利于后期實施保障決策。
(8) 故障預測決策準確率
故障預測決策準確率(fault prognostics decision-making accuracy rate,FPDAR)是指被測單元在執行任務前,正確預測到關鍵故障后準確實施保障決策數與實施保障決策總數之比。該指標用來描述所做保障決策的準確性。

表1 認知測試性指標體系Table 1 Cognitive testability index system
(9) 故障應對決策響應時間
故障應對決策響應時間(fault decision-making response time,FDRT)定義為預測出故障到完成保障決策所經歷的時間。認知測試性工作應設法減少故障應對決策響應時間,確保做出的保障決策的及時性。
從認知測試性的指標體系看,認知測試性與傳統測試性的主要區別在于:① 前者重“信息”,后者重“信號”。對信息獲取能力的約束體現的是大數據和深度學習的基本要求;而“信號”反映是裝備當前的狀態,是 “信息”的一種原始狀態。② 前者重“全體”和 “體系”,后者重“個體”。前者可以使裝備體系作為統一的整體進行全壽命保障,而后者重在對個體單裝的保障。③ 前者重“任務可靠性”,后者重“裝備完好性”。前者更突出“事前”的保障決策,而后者體現的是“事后”的要求。因此,可以看出,認知測試性是對傳統測試性的拓展與完善。
基于認知測試性的信息交互示意圖,如圖2所示。在認知測試性標準設計的裝備體系中,一方面,裝備自身可以利用獲取的信息進行自主學習,感知自身狀態并得出自我保障需求決策;另一方面,裝備個體信息、使用環境信息與同型裝備信息所構成的大數據提供給大數據支援中心,大數據支援中心通過對大數據進行深度學習,并依據一定的決策機制,將維修決策反饋給裝備體系,裝備根據決策做出反應。認知測試性體現了從數據到信息再到知識的演化過程。
大數據、云計算和物聯網是認知測試性的基礎,而現在這些技術正處于蓬勃發展的時期。先進的傳感器技術也使得信息的全面獲取成為可能。高速傳輸和處理、信息融合、網絡等信息技術和高新技術的迅速發展,意味著裝備可以依賴后方支援系統來處理信息和進行智能決策,從而可以實現裝備的輕量化和降低制造成本。而且在不久的將來,新的技術也會不斷出現,一些關鍵性技術會更加成熟,可見,認知測試性在物理基礎上是可行的。
隨著科學技術的迅猛發展和裝備的更新換代,傳統測試性已經落后于現在裝備的發展,不能夠滿足裝備的保障需求。一方面,新概念裝備[1]的出現,使傳統的測試性設計與智能化裝備不匹配,不兼容;另一方面,由于現代戰爭“多維度、一體化、快節奏、即時精確打擊”的特點,對裝備的測試性要求已從注重隔離故障、降低裝備全壽命周期費用,轉變為基于狀態的預防性視情維修、滿足裝備的任務可靠性需求,這種需求在航空裝備中體現的尤為突出。
基于以上考慮,認知測試性彌補了傳統測試性的缺陷,在故障診斷能力的基礎上加入了信息獲取能力和智能預測與決策能力,更加適合裝備的發展需要。
與RCM和PHM相比,認知測試性對故障的認識更加深入,它考慮了環境因素對部件的影響,在不同的環境下,部件會發生不同的故障,且故障的機理也不盡相同,加入環境因素可使對故障的認識更加全面。同時認知測試性秉承RCM的理念,以關鍵故障預測率為指標,只關注后果嚴重和可預測的故障,對于不可預測的故障應進行故障的定期檢查和維護,不在認知測試性的考慮范圍之內,否則應該放棄。其優勢主要體現在以下幾個方面:
(1) 認知測試性對信息的利用更加全面。PHM的信息主要來源于歷史監測數據、歷史統計數據和產品參數(模型),信息來源比較單一,忽略了環境因素的重要作用,無法達到理想的預測效果[10-15]。認知測試性的信息來源廣泛,不僅包括裝備自身的狀態信息,還有同型號裝備的歷史信息、使用環境信息、維修使用信息和履歷信息,為故障預測提供了大量的信息。
(2) 認知測試性更加注重事前維修。認知測試性是在故障預測的基礎上,產生維修決策,以達到在故障發生前排除故障的目的。
(3) 維修目的不同。RCM和PHM的目標是實現裝備的完好性和經濟性,而認知測試性則是更多考慮任務可靠性,保證裝備能夠更好地完成任務,必要時可犧牲一些經濟性,以在戰爭中取得更大的效益。
(4) 設計對象不同。RCM和PHM一般是面向單個裝備設計,對象是個體;而認知測試性是面向裝備體系設計,對象是系統。
認知測試性具有廣闊的發展前景,它不僅僅局限于同型裝備中的應用,還可以應用到不同型號的裝備上,甚至是不同種類裝備所構成的裝備體系。而且認知測試性不僅僅局限于環境、裝備和大數據支援中心之間的聯系,還可以關聯后勤保障系統、人員培訓機構,對備件的訂購、人員的培訓等起到優化配置的作用,終極目標是實現對整個裝備、環境、人員和后勤等構成的系統的優化管理。
通過對RCM,PHM和認知測試性的介紹,不難看出,認知測試性與RCM,PHM的區別,主要包括4個方面:① 認知測試性對保障的設計要求更提前、更主動;② 對信息的利用更加全面、更充分;③ 針對的研究對象更體系化;④ 更加注重事前維修和任務可靠性。從RCM到PHM,對裝備保障的認識逐步深入,逐步完善,對裝備的維修保障體系的建立都起到了關鍵作用。可以預見,認知測試性的發展必將對體系化、網絡化、智能化以及大數據、深度學習時代背景下的裝備保障產生重要影響。Technologies[J].Measurement&ControlTechnology,2008,27(2):5-7.