宋 秦,翟正軍,郭陽明
(西北工業大學 計算機學院,陜西 西安710072)
現代化、快節奏的高技術戰爭的特點是作戰規模大、強度高、對抗激烈。在這種條件下,各種武器系統必須保持良好的狀態,必須具備根據戰場形式變化實現快速部署和快速反應的能力和維護保障能力,這就要求武器系統在時刻保持裝備的戰備完好性的同時,保障系統必須能準確評估武器系統的實際狀態和戰斗水平,以保證作戰任務的成功率。隨著現代數字技術、微電子技術的迅速發展,武器系統中大量采用了復雜的先進電子產品,電子產品的性能不斷提高,集成度越來越高,越來越復雜,特別是各種微型電路的應用,給測試和維護帶來了嚴重的問題和負擔,加之這些電子產品的工作環境條件惡劣,也使得電子產品的故障預測和健康管理成為當前影響戰備完好性、使用和保障費用的主要因素之一。這些已引起了美英等國軍方的普遍關注。從目前的文獻可以看出[1-9],國外已經開展了稱為電子產品故障預測與健康管理(electronics failure Prediction and Health Management,ePHM)的關鍵技術研究與應用開發,ePHM及其相關技術已成為PHM研究的一個新的熱點,并成為PHM未來研究的重點[10]。
近年來,大量高技術、信息化武器系統/裝備在我國各軍種的陸續服役,使得復雜先進電子產品的維護保障逐漸成為我軍未來使用、維護、維修的重點。提早開展電子產品故障預測與健康管理的核心關鍵技術――電子產品故障預測理論和方法研究,對提高復雜武器系統可靠性、維修性、測試性、保障性和安全性,以及降低壽命周期費用具有十分重要的意義。
眾所周知,在進行試驗測試研究時,往往需要布置多個測點,一般來說測點愈多,愈能夠更多地了解所測物理量真實狀況。但是,測點愈多,所需的儀器設備也就愈多,工作量也會大大增加。人們一般希望用盡量少的測點,達到試驗的目的,在試驗中工作量較小的情況下得到比較完整、合理的試驗數據[11]。目前國外開展的ePHM研究中主要的方法是通過嵌入到電子產品中的傳感器收集和分析與故障密切相關的參數,利用關鍵參數的變化來診斷和預測故障,如利用焊接件焊點的電阻變化來預測電子產品的殘余壽命,利用動態功耗來預測電路故障等。針對ePHM系統中大量的航空電子產品的故障預測需求,如何合理的選擇測點并尋找傳感器布局的優選方案已成為一個迫切需要解決的問題。
電子產品尤其是航空電子產品,其系統結構組成復雜,工作環境條件惡劣,要求具有更高的可靠性,對其進行視情維修/維護顯得尤為重要。因此在研究測試點優化問題時應結合航空電子產品的特性和工作環境,借鑒已有的PHM和ePHM研究成果,從狀態監測獲取信息的完備性、準確性以及利用信息的充分性出發,開展電子產品故障預測中測試點優化方法的研究。
航空電子產品結構組成復雜,當某種故障將要發生或某些輕微故障發生后,可能導致產品中多個測量點處會出現故障。診斷就是檢測故障和隔離故障的過程,而來源于測試點的參數信息是診斷過程中檢測和隔離故障的基礎。因此,要對電子產品的故障進行準確監測和預測,首先必須搞清楚電子產品中可能或已經出現的故障情況并明確其危害性,從而進一步確認監測源[12]。
對于一個系統而言,可能發生的故障模式難以窮盡,如果把所有因素都考慮進去,勢必使測試設計極為復雜。因此,必須先進行故障模式、影響及危害性分析,以確定故障率高、危害性大的故障模式,把這些故障模式作為測試點選取的參考重點。故障模式影響及危害性分析 (Failure Mode and Effects Criticality Analysis,FMECA)目前已是一種趨于成熟的方法,被廣泛應用于設計評審和可靠性分析,表 1列出了一些電子產品的常見故障模式,這些故障模式基本上概括大多數產品可能發生的故障現象[13]。
電子產品故障危害性分析主要的指標有致命度和風險指標,量化后的致命度和風險度數值代表了故障模式的破壞力大小。致命度的計算公式:

影響度的評估項目一般為所有項目的總和。例如發生某個故障時,子系統、系統、安全性、經濟性和環境方面均受到影響,這時影響度的計算公式:

通過對具體電子產品對象的故障提取,故障模式危害性分析,進一步確定監測源,進而研究利用測量值確定測試點的選取和優化方法。在選取測試點時要特別關注一些位置,例如,在重要信號的反饋回路上,在較長的時序邏輯通道上,在有冗余電路上增加測試點等。針對具體的電子產品對象,期望提出一種數學模型,根據一定的優化算法和約束條件,以最大檢測精度、最大檢測覆蓋面、最小成本等為準則確定其約束模型,目標模型,從而提出一種測試點優化的方法。
綜上可以得出電子產品測試點優化的一般步驟:
1)電子產品的故障模式和危害性分析 通過故障模式和危害性分析進行電子產品的故障診斷,目前數字電路和模擬電路各自的故障診斷方法已存在很多,主要的研究方向集中在如何對數模混合電路進行故障診斷。
2)測試點的選取 根據故障模式和危害性分析得出風險度/致命度評估分析表,以最大檢測精度、最大檢測覆蓋面、最小成本等為準則,為具體電子產品的測試點定義選取規則,選取合理的測試點。
3)測試點的優化 利用優化算法和優化模型,考慮各測試點可以布局的傳感器方案,對已選定的測試點進行優化。

表1 電子產品典型故障模式Tab 1 Typical failure modes of electronic products
可測試性(Testability)又稱為測試性,是系統和設備能及時、準確地確定其工作狀態(可工作、不可工作、工作性能下降),并隔離其內部故障的一種設計特性。可測試性是武器裝備本身的一種設計特性,描述了測試信息獲取的難易程度。
測試點優化是可測試性研究的一個方向,其最常見的設計指標是故障檢測率,可以根據已確定的系統可用度、可靠度,通過權衡分析,確定故障檢測率和隔離率要求。也可以根據故障檢測率和隔離率來估算系統的可用度或可靠度。
可用度 A(ta)與故障檢測率 PFD、可靠度 R(tm)之間的關系可用式(4)表示:

式中,A(ta)表示系統在 ta時間的可用度;R(tm)表示系統在任務時間 tm內無故障工作的概率,R(tm)=exp(-λtm),其中,λ 為系統故障率。PFD表示系統發生故障在任務事件或任務后檢查時間內檢測出的概率;M(tr)表示檢測出的故障在tr時間內修復好恢復到使用狀態的概率。
由可靠性理論推出,大部分電子器件的失效率與時間的關系可呈現浴盆曲線。經過老化篩選的電子器件,多處于偶然失效期,失效率則近似為常數。相應的,電子設備的失效率也遵從相似的關系。失效率λ與平均故障間隔時間MTBF的關系如下:

外部環境因素會對電子器件造成損傷,降低其可靠性,是引發電子設備故障的重要原因。表2給出了影響電子產品可靠性主要的環境因素[12]。

表2 影響電子元器件可靠性的環境因素Tab 2 The environmental foutors affect the reliability of electronic components
數字電路設備中一個元器件、一個電路或設備的物理故障是千變萬化的。為了研究故障對電路或設備的影響,診斷故障的位置,必須對故障作一些分類,選擇最典型的故障,這個過程稱故障的模型化。數字電路中一般說來其故障總數是有限的,其中大部分故障都可以用固定型模型化故障s-a-1和s-a-0來仿真。數字電路的故障診斷包括故障檢測和故障定位。目前主要診斷方法有:窮舉測試法、偽窮舉測試法和測試碼生成法等。而對于模擬電路,由于其元件參數具有容差、普遍存在非線性和反饋等原因,使得模擬電路的故障診斷較數字電路的故障診斷復雜得多[14]。
模擬電路故障診斷常用的方法有元件參數辨識法,這種方法已經比較成熟,但是需要特定的數學模型,且絕大部分方法都是針對無容差電路的元件級診斷,計算量大,一般只適用于離線診斷,難以應用于在線工程診斷。對于無容差電路的元件級診斷,用神經網絡方法可以取得很好的效果。在眾多方法中,故障字典法因適用于非線性電路及診斷條件沒有嚴格的限制、且簡單有效、實用性強,因而在工程上多用這種方法。但是,它不能用于軟故障診斷,且由于多故障的組合數太大,在實際中只能用于解決單個硬故障問題,因而其應用受到限制[14]。
電路故障診斷研究從多故障法和字典法開始起步,主流是研究多故障的診斷方法。近年來,以神經網絡為代表(包括神經網絡、進化計算以及它們的融合)的智能計算技術成為許多領域的研究熱點。目前,神經網絡技術在故障診斷領域的應用研究也取得了很大的進展。
如何根據特定的電子產品選取合適的故障診斷方法,并有效使用這種方法得到合理的監測源,已成為測試點優化研究中面臨的第一個挑戰。
在測試點的優化方案中,一般是根據給定的性能指標,利用試湊法來確定相關的幾何參數,應用這種方法不能保證得到的解是最優解。在優化設計算法中有強搜索方法和弱搜索方法。強搜索方法是利用目標函數及約束函數的梯度信息以確定性方式進行搜索,如梯度法,其優點是搜索效率高,收斂速度快,缺點是容易陷入局部最優解;弱搜索方法是通過在設計空間中大量地采樣,以隨機方式進行搜索,如窮舉法,其優點是能夠解決和處理非凸和不連續的目標函數,能以較大的概率搜索到全局最優解,缺點是搜索效率低,收斂速度慢。
隨著人工智能技術的發展,神經網絡和遺傳算法等一系列優化算法正在被各領域的研究者使用。遺傳算法(Genetic Algorithms)是基于生物進化理論的原理發展起來的一種高效的隨機搜索與優化的方法。它是一種啟發式的隨機搜索方法,根據"生存競爭"和"優勝劣汰"的原則,使所要解決的問題從初始解逐漸逼近最優解。可以說遺傳算法是強搜索方法和弱搜索方法的結合,既不會偏向于局部最優解,又能啟發式地自適應搜索到全局最優點[15]。
人工神經網絡(Artificial Neural Network)是對人腦最簡單一種抽象和模擬,是由大量的神經元按照一定的拓撲結構和學習算法所構成的,是一個具有高度非線性的超大規模連續時間動力系統,其主要特點有分布存儲和容差性,自適應性和自組織性,并行處理性和層次性[16]。
在測試點優化方案的建立過程中,應有效利用人工智能技術選取符合特定電子產品的優化算法,以最大檢測精度、最大檢測覆蓋面、最小成本等為準則確定其約束模型,目標模型。
測試點的優化問題是電子產品故障預測與健康管理技術的重要分支,是從監測源的角度來探索ePHM的理論和方法。由于國內對PHM以及ePHM的研究起步較晚,只是近兩年才開始進行ePHM初步的研究,ePHM技術目前遠未達到成熟,尚不能進入應用,但它代表了PHM未來的一種重要發展趨勢。我國應積極開展對ePHM技術的研究,以便盡快與國際接軌。
[1]Gandy M,Line K.Joint strike fighter-prognostics and health management(PHM)[R].Lockheed Martin Aeronautics,2004.
[2]Goodman D,Hofmeister J,Judkins J.Electronic prognostics for switched mode power supplies[EB/OL].(2007-02-21)[2010-03-01].www.sciencedirect.com.
[3]Johnson S B.Introduction to system health engineering and management in aerospace[A].1st Integrated Systems Health Engineering and Management in Aerospace[C].California,USA:Napa, November 7-10,2005.
[4]Brown D W,Kalgren P W,Byington C S,et al.Electronic prognostics-A case study using global positioning system (GPS)[EB/OL].(2007-02-20)[2010-03-01].www.sciencedirect.com.
[5]Sandborn P A,Wilkinson C.A maintenance planning and business case development model for the application of prognostics and health management(PHM)to Electronic System[EB/OL].(2007-02-16)[2010-03-01].www.sciencedirect.com.
[6]Brown E R,Erin-Elaine Moore,McCollom N N , et al.Prognostics and Health Management[S].IEEE AC paper#1597,Version 3,Updated January 19, 2007.
[7]Hess A.Prognostics&health management-a thirty-year retrospective[A].1st Integrated Systems Health Engineering and Management in Aerospace (ISHEM 2005)[C].California,USA:Napa,November 7-10,2005.
[8]Johnson S B.Introduction to system health engineering and management in aerospace[A].1st Integrated Systems Health Engineering and Management in Aerospace[C].California,USA:Napa,November 7-10,2005.
[9]Hess A, Fila L.The joint strike fighter (JSF)PHM concept:potential impact on aging aircraft problems[A].Proceedings of the IEEE Aerospace Conference[C].Big Sky: Montana,2002-06
[10]于小偉,張寶珍.國外電子產品PHM技術主要研發方法與面臨的挑戰[EB/OL].(2008-09-17)[2010-03-01].http://www.jungong.net/_info/content/con-kjcs_12683.htm
[11]王川.測試中測量點的最優分布[J].中國測試技術,2007,33(3):13-15.
WANG Chuan.The Optimal Distribution of Measurement Points In The Test[J].China Measurement&Testing Technology,2007,33(3):13-15.
[12]韓國泰.航空電子的故障預測與健康管理技術[J].航空電子技術,2009,40(1):30-38.
HAN Guo-tai.Prognostics and Health Management of Avionics[J].Avionics Technology,2009,40(1):30-38.
[13]王紹印.故障模式和影響分析(FMEA)[M].廣州:中山大學出版社,2003.
[14]王曉峰,王立梅,康銳.電子線路的故障診斷和測試點的選擇[J].電子產品可靠性與環境試驗,2001(4):2-6.
WANG Xiao-feng,WANG Li-mei,KANG Rui.Fault diagnosis and test site selection of electronic circuit[J].Electronic Product Reliability and Environmental Testing,2001(4):2-6.
[15]張菁華,石庚辰,任國祥.遺傳算法在傳感器優化設計中的應用[J].探測與控制學報,2004,26(4):45-48.
ZHANG Jing-hua,SHI Geng-chen,REN Guo-xiang.Genetic algorithm in optimal design of sensor[J].Journal of Detection&Control,2004,26(4): 45-48.
[16]呂敬祥.基于BP網絡與遺傳算法的模擬電路故障診斷理論和方法[D].長沙:湖南大學,2005.