(中國航空計算技術研究所,西安 710068)
伴隨著航空電子產品裝機數量的不斷增加,該類產品的故障也隨著增加,這些故障中大部分可以找到原因并修復,但也有少量的在機上或外場維修中因故障而更換的設備或部件,返場維修后卻發現沒有故障或發現不了故障, 即所謂的“未發現故障”(No Fault Found,NFF)。NFF的原因很復雜,有的是因為設備本身沒有故障,但在裝機檢測后被判定為有故障,有的是設備本身存在斷續性故障但檢測維修時卻檢測不出來,或者是測試設備的覆蓋率不足不能將故障檢測出來。
“未發現故障”(NFF)是國際上近年來困擾各航空公司和各型軍用飛機的一大難題,在2004年召開的國際航電維修會議(AMC)上,NFF被列為最重要的問題。在此后的歷屆AMC年會上,NFF繼續成為大家關注的焦點[1]。
NFF的故障率居高不下(據統計航電系統NFF的發生率為30%左右),使得航空公司和各種軍機的維修費用明顯增加[2]。NFF不是某一單方面的因素造成的,要減少NFF的故障發生率,需要多管齊下。本文將重點分析造成NFF故障頻發的原因,介紹某機載設備此類故障產生的原因及解決方法。
NFF故障產生的原因較多,復雜的航電設備可能是導致NFF故障率上升的原因之一,機上電子設備之間的互相干擾以及供電系統的不穩定性也是產生NFF故障的原因之一。
減小NFF的故障發生率,減少維修費用,降低成本,確保飛行安全,是大家共同的目標。要做到這一點,就需要深入、具體地分析產生故障的原因。
NFF故障表面上看是一種偶發性故障或不確定性故障,其實往往隱含著某種質量隱患,如設計隱患、生產工藝隱患等,不能簡單當作個性問題處理,也不能簡單當作虛警、誤報等個案處理,它常常隱含著某種設計缺陷,追查下去也許會發現偶然事件背后隱含的必然性。
我們在設計初期往往更多地考慮產品的功能和性能,而忽視了測試性設計,或者對測試性設計考慮不足,使得測試覆蓋率很低。其實在產品真正投入使用后,測試功能就顯得尤為重要。許多NFF不是設備故障產生的,而是由于缺乏理想的診斷能力而造成的。
技術文檔編寫不詳細、圖紙錯誤較多始終是困擾我們的一大問題。文檔不具備可操作性,只有編寫者自己才能讀得懂的文件比比皆是,操作者拿著維修說明也無法操作,給維修工作帶來很大的困難,問題不能得到解決。
提高維修人員的技術水平是亟待解決的問題。使維修人員對產品的作用、功能、性能、工作原理以及在機上的工作環境等情況有比較全面的了解,對排故工作將會起到很大的推動作用。高水平的維修人員憑借豐富的經驗能夠找到故障的真正原因,從而減少NFF故障的發生[1]。
時間壓力是造成NFF的主要原因。為保證飛行,排故的時間非常有限,要在很短的時間內復現故障、進行故障定位并修復設備,難度非常大。對于偶發的NFF故障件,測不出問題時可能會重新裝機,埋下隱患,反復發作的NFF故障件只能用備件代替。
首先應該針對故障產生原因的幾個方面,在產品的設計階段盡量采用經過驗證的成熟設計電路,避免設計缺陷;在方案論證階段充分考慮測試性設計,提高測試覆蓋率,提高自診斷能力;技術文檔的編寫要求全面、準確、操作性強,為維修人員提供有價值的技術資料。除了以上環節,還應從以下幾方面著手減少NFF故障發生。
對故障產品建立數據庫。每當有故障件返廠維修時,對故障現象和故障類型進行記錄,結合以往的歷史數據進行分析,具有豐富工程經驗的技術人員通過對故障類型、故障發生時機的對比分析,能夠獲得排故所需的信息,某些連續兩次或兩次以上出現同一故障現象的NFF,很可能存在測試設備不能檢測的故障,就需要采取非正常的方法進行排故和定位。所以,建立數據庫對排故工作的順利進行將會提供很大的幫助。
NFF故障件往往分為兩類,一類是由于虛警、誤報等原因產生的故障件,這類產品經過全面測試確保正確后可重新裝機;另一類是真正的NFF故障件,這類產品我們檢測不出故障,但實際上確實發生了故障。對于第二類故障,如果出現3次同類的NFF故障,就應該列入“黑名單”,對它進行徹底檢查,如果能找到導致故障的真正原因并解決問題,可以重新裝機,否則只能更換備件,用作地面調試用,對列入“黑名單”的故障件要慎重使用[1]。
溝通與交流對于故障件的排故至關重要,通過交流,掌握了故障的產生時機、產生條件等重要信息,有助于我們分析故障產生的原因、故障發生時各項參數的運行情況、現場其它設備的運行狀態等信息也對排故和定位提供有力的支持,描述詳細的故障報告表對于故障定位也必不可少。
為保證正常飛行,足夠的備件必不可少。在有限的時間內要把所有問題全部解決基本上是不可能的,要保證安全可靠,準備足夠的備件很有必要[3]。
以上介紹了NFF故障產生的背景、產生的原因、產生的危害以及解決的辦法,下面以某設備為例,介紹一例典型的機載設備“未發現故障”的處理方法。
某計算機裝機后偶爾出現報“AA-OFF”故障,返場維修時卻檢測不出故障,給產品排故帶來很大的困難。經與現場人員聯系,反映在得到“AA-OFF”故障時,飛參系統還在記錄數據,由此判斷CPU還在運行,那么可能的原因就是總線傳輸模塊故障導致該設備不能正常通信,從而產生“AA-OFF”現象。于是對總線模塊進行了反復測試,誘發故障,但故障不能復現,最后采取了更換總線模塊的辦法重新裝機,裝機后有時偶爾還會報相同故障。
隨著時間的推移,“AA-OFF” 現象有所增加,為了誘發故障,對返修件進行了大量的試驗,例如高低溫摸底試驗,模擬飛機的實際工作環境進行了振動試驗、濕熱試驗,考慮到機上供電系統的相互影響,進行了電磁兼容試驗,但一系列試驗都沒有激發故障復現。
為了得到第一手資料,對多個用戶進行了走訪,了解現場情況。通過對故障發生時飛行記錄數據的回放和分析,發現在“AA-OFF”出現時,飛行參數記錄儀相關的傳輸數據一直不更新,說明發生故障時CPU已經工作異常,依據這一現象,初步排除總線模塊的問題,問題暫時定位為與主處理機相關的問題。
通過進一步交流與溝通,得知該現象大部分發生在地面通電過程中或發動機開車后電源切換時,于是將目光聚焦在供電系統及電源模塊上。
電源模塊供電電壓為28 V,設計的允許輸入電壓為18~32 V??紤]到故障發生時機都出現在地面通電過程中或發動機開車后電源切換時,所以不排除由于外部電網波動或干擾導致電源模塊工作不正常,為此進行了大量的驗證試驗。
對電源進行了拉偏試驗,當28 V輸入電壓降至15 V左右時,+5 V輸出電壓降至+4.5 V左右,CPU模塊停止工作;當輸入電壓回升時,CPU有時恢復正常,有時不能恢復,出現“死機”現象,復現了故障。
圖1是在試驗室對電源模塊采集的信號,在供電端發生掉電波動時,輸出電壓5 V將下降到4.5 V左右。

圖1 掉電時+5 V信號波形Fig.1 +5 V waveform during power-fail
對于出現的“死機”現象,分析認為:當28 V輸入電壓降至15 V左右時,+5 V輸出電壓下降,當+5 V電壓降至某個點時,可能引起某些芯片工作異常,但此時并沒有引起復位電路復位,若此時28 V電壓迅速拉起,+5 V恢復正常,而那些已經產生異常的芯片不能回到復位狀態,CPU不能正常工作,處于“死機”狀態。
至此,故障現象復現,并與故障發生時機相吻合。
根據以上分析,供電系統波動時電源模塊輸出異常是故障的主要原因,對電源模塊提出以下修改方案。
(1)增加儲能電容,延長掉電保持時間
原來的電源模塊掉電保持時間為6 ms,增加儲能電容后,掉電保持時間增加到40 ms左右。波形如圖2所示。

圖2 掉電后+5 V保持時間延長Fig.2 +5 V signal delay after power-fail
(2)增加欠壓關斷功能,提高復位的可靠性
原來的電源模塊在供電電壓低于16 V時,電源模塊處于開環工作狀態,輸出不穩壓,輸出電壓隨著輸入電壓的下降而下降,輸入過渡狀態的電壓為16 V,引起+5 V異常。
更改后給電源模塊增加欠壓關斷功能,當電源模塊供電電壓低于16 V以下時,將電源模塊的輸出電壓全部關閉;在供電電壓恢復到16 V時,打開電源模塊的輸出,+5 V輸出正常供電,避免了由于+5 V輸出的不穩定造成的設備工作異常。
通過以上措施,避免了外部供電電源的過渡態和異常態對設備的影響。
事實證明更改方案正確,措施到位。更改方案落實后無一例故障復發現象,達到了預期的目的。
上述NFF故障產生的原因是設計缺陷,在設計初期對產品的使用環境了解不足;排故過程中多次反復是因為交流溝通欠缺,對故障發生時機和故障現象把握不準,減少NFF故障需要從設計、生產、售后等多個環節入手。生產階段要嚴把質量關,包括對元器件、原材料的采購和二次篩選,生產過程要嚴格工藝紀律,任何一個環節不到位都可能造成質量隱患;對于由多家單位合作的項目,設計初期應該明確需求,故障出現后應及時準確反饋信息,降低故障發生率。在后續的研究中,將進一步加強對NFF故障原因的分析與收集,尤其是多設備之間電磁干擾造成的影響以及設備接口之間偶發故障的技術原因分析。
參考文獻:
[1] 比爾·伯切爾. 航電設備的“未發現故障”[J]. 國際航空,2007 (5): 50-54.
Bill Burchell. No Fault Found[J]. International Aviation, 2007 (5): 50-54.(in Chinese)
[2] 弗蘭克·杰克曼,成磊. 民用航空維修市場預測[J]. 航空維修與工程,2006 (4): 10-11.
Frank Jackman,CHENG Lei. MRO Market up Modestly as Efficiencies Take Hold[J].Aviation Maintenance & Engineering, 2006 (4): 10-11.(in Chinese)
[3] 賈麗巖. 航電設備故障測試和維修的新挑戰[J]. 航空維修與工程,2006 (4): 50-51.
JIA Li-yan.New Challenges to Avionics Fault Testing and Repair[J].Aviation Maintenance & Engineering, 2006 (4): 50-51.(in Chinese)