顏世剛
(92941部隊94分隊 葫蘆島 125001)
艦炮火控設備板級故障快速分析定位方法
顏世剛
(92941部隊94分隊 葫蘆島 125001)
結合某新型艦炮武器試驗中故障排除實際經驗,針對裝備故障定位分析,提出了板級故障樹分析法;對其中涉及的基本概念、方法步驟等方面進行了介紹。通過裝備的故障實例,對板級故障分析法的應用進行了詳細闡述;實踐證明板級故障樹分析法對裝備各類軟硬故障定位分析有很高的實用性和推廣價值。
故障; 板級; 故障樹; 事件
Class Number TJ391
隨著新型武器裝備技術快速發展,裝備的復雜度、集成度越來越高,裝備功能模塊化,模塊集成板級化,單塊板子能實現多種復雜功能。武器裝備在出現故障時,對于故障板子如何通過正確有效的方法分析模塊故障,定位故障點,這在戰場快速維修中至關重要;迅速定位故障點,是快速修復武器裝備的關鍵,而科學合理的故障分析方法是快速故障定位的基礎和前提[1]。一種科學合理能夠快速定位故障的分析方法,其一能夠縮短故障修復時間,快速恢復裝備狀態,保證作戰任務的完成,其二提高設備故障維修效率,節省相關經費。本文根據在多型艦炮武器系統試驗中排除故障的實際經驗,總結出一套行之有效的板級故障定位分析方法,對于各類裝備板級故障的快速定位修復,具有很強的實用性和指導意義。
板級故障定位分析方法的理論基礎是故障樹,通過建立板級故障樹,并對故障樹的每一個事件按照故障樹的邏輯關系展開具體分析;依據板級電路功能和電路邏輯關系,分析故障樹事件的組成,定義故障樹的頂事件和底事件,分析硬件電路的邏輯,建立板級樹狀邏輯關系故障圖,按照板級故障樹的層次邏輯定性和定量分析排除故障,稱之為板級故障樹分析法。
2.1 板級故障樹分析法的基本概念
故障樹分析方法是一種安全可靠的分析技術,也是目前故障診斷中應用較多的方法之一,它建立在對故障經驗庫基礎上,采用逆向推理,將系統級的故障現象(頂事件)與最基本的故障原因(底事件)之間的內在關系表示成樹形的網絡圖,各層事件之間通過“與”、“或”“非”、“異或”等邏輯關系相關聯[2,5,8]。板級故障樹分析法通常把故障狀態稱為頂事件,然后找出系統故障和導致系統故障的諸原因之間的邏輯關系。并將這些邏輯關系用邏輯符號表示出來,由上而下逐層分解,直到不能分解為止,推導出各故障和各單元故障之間的邏輯關系,利用這種邏輯關系從頂層事件故障出發,逐漸向下演繹,最終找出對應的底層故障原因。
2.2 板級故障樹建立的基本步驟
1) 確定頂事件。頂事件是指定進行邏輯分析的故障事件,一般為故障現象。
2) 分析頂事件。尋找引起頂事件發生的直接、必要和充分原因。將頂事件作為輸出事件,將所有直接原因作為輸入事件,也稱底事件,并根據這些事件實際的邏輯關系用適當的邏輯門相聯系,并按板子硬件電路功能邏輯進行分析。
3) 分析每一個與頂事件直接相聯系的底事件。如果該事件還能進一步分解,則將其作用下一級的輸出事件,如同步驟2)中對頂事件那樣進行處理,底事件單元確定要盡量按照板子中相對獨立的硬件電路功能來劃分。
4) 重復上述步驟,逐級向下分解,直到所有的輸入事件不能再分解或不必要再分解為止,即建成了一棵故障樹。
5) 分析排查每一個底事件,找出故障的底事件,分析底事件,也就是分析一個個縮小簡單的硬件電路功能單元,看是否能實現其正常的功能。
3.1 故障現象
在某型艦炮武器系統試驗中,火控設備的射擊指揮臺任務計算機多次出現死機現象:應用程序停滯,與外部通信停止,外接操控設備無響應,多次死機之后該計算機無視頻信號輸出,無啟動提示音,不能正常啟動。經分析確認,該計算機的CM主板故障。
3.2 故障主板功能及上電過程分析
CM主板為單板加固計算機模塊,主要功能包括處理器子系統、存儲子系統、顯示子系統、I/O接口子系統和總線接口子系統。通過分析CM主板電路邏輯[3],得出其上電啟動過程原理如圖1所示。

圖1 CM主板上電啟動過程原理框圖
上電后,+5V電壓監控芯片輸出PWRGOOD高電平信號;1.5V_PWRGD和PWRGOOD信號經過與門后,輸出ICH1.5V_PGD高電平信號;PWRGOOD信號啟動南北橋電壓轉換電路。南北橋電壓轉換電路輸出電壓VCCP_PWRGD及VCC_GMCH_PWRGD,這兩個信號經過與門后輸出IMVP_PG高電平信號;IMVP_PG和ICH1.5V_PGD信號經過與門后,輸出ALL_PWRGD_OK高電平信號;ALL_PWRGD_OK信號通過與門輸出PWRGD_OK高電平信號;處理器核心電壓轉換電路檢測到IMVP_PG及PWRGD_OK信號為高電平后,啟動CPU核心電壓轉換電路;ICH7M檢測到CPU_VR_PWRGD和PWRGD_OK信號都為高電平后,發出H_PWRGD高電平信號給處理器,并發出PLT_RST低電平脈沖;PLT_RST低電平脈沖信號復位并初始化BIOS、網絡控制芯片、PCI橋接芯片、IDE、U7等;U7收到PLT_RST脈沖信號后,發出H_CPURST#,復位CPU;ICH7M發出PLT_RST低電平脈沖后,發出H_INIT低電平脈沖給BIOS芯片和CPU,CPU收到該信號后,執行BIOS內容。
3.3 板級故障樹的建立
通過對CM主板進行初步故障測試分析以及上電過程分析,先確定頂事件,把故障現象定為頂事件,即:主板上電無法啟動,根據故障現象、主板功能、板子上電分析和1.2故障樹建立的基本方法步驟分析,劃分底事件,建立故障樹,如圖2CM板上電不能啟動故障樹所示。

圖2 CM板上電不能啟動故障樹
故障樹中頂事件為:D:主板上電無法啟動。
底事件包括:D1:BIOS程序故障;D2:時鐘信號故障;D3:電源故障;D4:主要控制信號故障;D5:外圍器件故障;D6:北橋芯片U7故障。
3.4 故障樹事件排查分析
3.4.1 排查D1 BIOS程序故障
BIOS程序燒寫錯誤或BIOS芯片損壞會導致主板上電無法正常啟動。將功能確認正常的已燒寫BIOS程序的芯片安裝到故障板卡上,主板上電無法啟動,故障未消除;將故障板上的BIOS芯片安裝到功能確認正常的板卡上,主板上電正常啟動。通過將故障板和正常板卡上的BIOS芯片對調試驗,可以確認故障板上的BIOS芯片及程序良好,除底事件D1。
3.4.2 排查D2時鐘信號故障
板上的時鐘信號故障會造成板上主要芯片無法正常工作,最終導致主板無法正常啟動。給板上芯片提供時鐘信號的晶體及芯片有:Y3,OSC1,Y1;板卡上電后,用示波器對各時鐘信號進行測量,Y3的頻率為33MHz,Y1的頻率為14.3MHz,,OSC1的頻率為27MHz。經過檢測對比,上述時鐘信號波形與正常主板相應波形完全一致,滿足芯片工作對時鐘信號的要求,因此上述時鐘信號波形正常,排除底事件D2。
3.4.3 排查D3電源故障
電源是向芯片及其他電子部件提供電能的裝置,當板上某個電壓出現故障時,個別芯片無法正常工作,也會導致主板上電無法啟動。CM主板上的電壓有:12V,5V,3.3V,1.8V_DDR2,0.9VS,VCC_GMCH_CORE,2.5VS,1.05VS,VCC_CORE,1.5VSB,M22_2.5V,M22_1.8V,VDDC_CT,VCC3.3V等,通過萬用表對板上各電壓進行測量發現,測量電壓2.5VS時為0V,而非正常的2.5V,其他電壓測量為正常,因此對2.5VS電壓進行對地阻抗測量,發現2.5VS對GND短路。通過對板上供電電壓進行測量,確認電源故障是導致主板無法啟動的一個原因,底事件D3電源故障是導致主板無法啟動的一個原因。
3.4.4 排查D5外圍器件故障
由D3底事件得知,板上2.5VS對GND短路,2.5VS主要給北橋U7供電,北橋芯片無法正常工作導致主板上電無法正常啟動。2.5VS由電源芯片U40(ISL6537)產生的,相關電路圖見圖3所示。
為了確認具體故障點,將Q21去掉,用萬用表測量Q21前后兩端發現,電源芯片U40端短路故障消失,北橋一端短路故障仍然存在,所以將故障范圍確定在北橋和北橋外圍器件(電容)上。板上電源2.5VS的去耦電容包括C261、BC141、BC160、C359,C107、C686、BC153、C343,將所有關聯電容去掉后,短路故障未消除,排除此底事件D5。
3.4.5 排查D6北橋芯片U7故障
在排除底事件D5后,造成2.5VS對GND短路的故障點暫時確認為北橋芯片U7故障。北橋芯片U7提供處理器的64位前端總線,集成內存控制器,提供×16 PCi-Express總線(用于擴展獨立顯示芯片),北橋芯片負責與CPU的聯系并控制內存和顯示數據。將北橋芯片U7焊下后,用萬用表測量故障板上2.5VS和GND兩端,結果短路故障消失,更換新的北橋芯片U7之后此主板可以正常啟動,底事件D6北橋芯片U7故障是造成主板無法正常啟動的原因。

圖3 2.5VS電壓相關電路圖
3.4.6 排查D4主要控制信號故障
在排查底事件D3時得知,板上電壓存在故障,在電壓存在故障的前提下無法對板上主要控制信號進行測量分析。更換新的北橋芯片U7之后對主要控制信號進行相關測量,各信號皆正常,由此可真正排除底事件D4。
3.5 故障定位及解決措施
根據上述分析排查可得出北橋芯片U7故障是造成主板無法正常啟動的原因,將故障板上的U7更換后主板可以正常啟動。
板級故障樹分析法通過清晰的故障樹圖形,直觀地列出功能板內各模塊的內在的聯系,并指出內部電路之間發生故障的邏輯聯系,因此容易找出系統的薄弱環節[9~10]。板級故障樹分析的過程也是一個對裝備硬件結構原理更深入認識的過程。通過板級故障樹,使維修人員能夠清晰把握裝備功能實現的內在聯系以及板級電路的邏輯原理,弄清各種潛在因素對故障發生影響的途徑和程度,在分析過程中便能發現問題,及時加以解決。它不僅分析了現有的問題,而且提出了解決辦法和改進措施,從而增加了使用維修人員對裝備的原理、結構、硬件邏輯等認識的深度。
故障分析中要考慮諸多因素,板級故障樹分析法都能考慮進去,它不限于對裝備故障進行一般性分析,而是分析裝備的各種故障狀態、板級硬件電路的邏輯關系。故障樹建成后,對其他使用維修人員來說有了一個內容豐富、邏輯嚴密、形象快捷的維修指南。裝備板級故障樹分析方法,對于快速定位分析裝備板級故障提供了一個很好的思路,對于各類裝備中弱電路類故障排除具有極強的借鑒意義和推廣價值。
[1] 馬世寧,等.裝備戰場應急維修技術[M].北京:國防工業出版社,2009:1-9.
[2] 包勇,張德銀,莊緒巖.基于動態故障樹技術的故障診斷專家系統[J].四川大學學報(自然科學版),2014,51(6):1211-1216.
[3] 史新福,等.32位微型計算機原理.接口技術及其應用[M].北京:清華大學出版社,2007:15-50.
[4] 金亮亮.基于故障樹的航天器故障診斷專家系統研究[D].南京:南京航空航天大學碩士學位論文,2008:12-23.
[5] 孫濤,李曉芳,石晨光,等.基于本體的艦炮故障樹建模方法研究[J].艦船電子工程,2014(8):103-106.
[6] 王曉輝,龔俊宇,紀浩.測控系統典型案故障例分析[J].計算機測量與控制,2015,23(8):2610-2613.
[7] 白穎,李俊年.基于故障樹的某型艦炮轉彈阻鐵不解脫故障分析與處理[J].四川兵工學報,2014(1):28-30.
[8] 胡隆基.基于故障樹分析法的某型高炮隨動系統故障診斷[J].四川兵工學報,2011(4):40-43.
[9] 高美娟,劉白林,張振華.火控系統故障預測與健康管理技術[J].火力指揮與控制,2015(5):1-3.
[10] 樊水康,郭會兵,郭慧鑫.火控系統故障檢測與智能診斷[J].火力指揮與控制,2014(6):143-145.
Fast Location Method of Board Level Fault of Shipborne Gun Fire Control Unit
YAN Shigang
(Unit 94, No. 92941 Troop of PLA, Huludao 125001)
For equipment failure analysis and location, the paper combined the practical experience of trouble shooting in a new shipborne gun weapon system test, proposed the analytical method of board level fault tree. In the paper, some basic concepts, method and steps were introduced. Combined with a example of equipment failure, the paper discussed the application of the analytical method of board leve fault tree in detail. Practical results indicated that the analytical method of board leve fault tree had better practicability and value popularization.
fault, board level, fault tree, event
2016年8月1日,
2016年9月23日
顏世剛,男,碩士研究生,高級工程師,研究方向:武器系統試驗鑒定與仿真。
TJ391
10.3969/j.issn.1672-9730.2017.02.026