魏永國,李 波,謝 芳,徐 瑋,歐陽李青,顧莉軍,高 飛,徐 昕
(上海航天電子技術研究所,上海 201109)
近年來,隨著運載火箭高密度發射任務需求,對運載火箭的測試設備的可靠性提出越來越高的要求。測試設備的高可靠性在某種程度上決定著運載火箭測試發射效率,因此,設計智能化高可靠性的運載火箭測試系統對于高密度發射具有重要意義。
BIT(build in test,機內測試或機內自檢測)技術是一種具備系統自檢、故障診斷、故障隔離能力的測試性設計方法。隨著相關理論及技術的進一步發展,BIT技術被廣泛應用于航空航天、船舶、車輛等對可靠性有較高要求的大型復雜系統中[1-2]。BIT技術通過自身軟硬件實現測試功能,利用系統及設備自身的自檢激勵裝置,組建自身閉環回路測試,可以完成對系統及設備功能、性能評估,并對存在的故障進行鑒別和隔離,在實際工程應用中,對于復雜的可靠性要求較高的場合,可以有效地提高系統及設備的狀態監測能力和故障診斷能力,降低系統及設備的故障維修時間[3-7]。
目前,運載火箭縮短測試周期、優化測試流程、提高發射成功率是發射任務的重要目標。運載火箭測發控系統是火箭測試發射過程的重要組成部分,完成火箭射前測試點火。其中測試部分是運載火箭組織實施發射的最后關鍵一個環節,是有線檢測運載火箭運行狀況的唯一有效手段,其可靠性對于運載火箭發射至關重要。因此,提高測試可靠性,提高故障檢測、故障隔離及排除效率對于火箭測發過程具有重要意義。
通過運載火箭測試發射過程分析,地面測試系統需要具備以下測試能力:
1)測試功能完整完備、質量可靠、操作智能簡單、維護方便,故障時對箭上產品無影響;
2)測試設備進入系統測試流程前,能夠完整地對其自身測試能力進行自檢評估,根據評定結果解決測試設備中出現的各種故障,達到可以進入系統測試的要求;
3)進入系統測試后,按照系統測試流程,實時監測處理測試結果,根據測試結果辨別箭上設備工作運行狀態,對于自身設備出現的故障,需要及時做出故障定位,以對火箭系統測試流程影響最小為前提,及時解決故障并重新恢復測試流程;
4)系統測試完成后,完成火箭測試流程數據判讀處理,并形成自身測試記錄日志,以備設備后期維護使用。
從BIT系統需要實現的功能出發,BIT設計過程中,按照BIT系統的設計原則規劃,并進行系統故障模式及對應故障模式的危害性分析[8],這些分析作為構建BIT系統的基礎數據,在此基礎上完成系統模型搭建,系統詳細設計和可靠性評估、性能評測等工作。
BIT系統主要用于系統及設備狀態監測、故障診斷和故障隔離功能[9-10],實現系統及設備關鍵參數的監測,能夠實時檢測系統及設備的工作狀態,及時判定系統及設備的功能、性能是否正常,保障系統及設備測試流程正常進行,在系統及設備發生故障時,依據設定的指標要求將故障隔離,在故障隔離點進行排故決策,適時解決系統及設備中存在的故障環節。
BIT系統設計時需要遵循以下設計原則[11]:
1)同步性原則:系統方案論證階段同步開展BIT設計;
2)通用性原則:BIT設計應具備通用性,以便降低設計成本;
3)簡潔化原則:盡量復用系統硬件,避免將系統及設備設計復雜化;
4)全面性原則:BIT設計時需要考慮故障檢測率和隔離率的要求,提高系統及設備的實用性;設計時需考慮不影響系統及設備的正常流程;設計時需考慮軟件監測和硬件檢測相結合的方法,提高可測試效率;同時預留外部接口,便于系統及設備進一步擴展,提高系統及設備的兼容性。
按照系統及設備的BTI設計原則,BIT設計時一般遵循以下的設計原理[12-13]:
1)分析系統及設備的測試特點,采用自頂向下的原則,確定測試系統及設備的層次結構,規劃總體方案布局,將測試系統及設備合理劃分為各邏輯功能模塊和單元,實現系統及設備模塊化設計。
2)需要開展測試系統及系統的故障模式影響分析(簡稱為 FMEA)和故障模式影響及危害度分析(簡稱為FMECA),系統及設備設計時將FMEA及FMECA指標納入其中,包括BIT功能要求、測試項的選取、測試性設計方法的選取以及運用軟件設計等。
3)明確測試系統及設備的測試性設計要求指標。包括系統的故障覆蓋率、故障檢測率、故障隔離率。
4)進行測試性分析及評估,驗證BIT設計是否滿足測試性指標要求,并對設計的系統及設備進行評估。
依據系統設計的特點和使用要求,BIT主要包含以下3種模式[14],如表1所示。

表1 BIT測試系統工作模式
1)上電 BIT:主要用于檢查系統在工作前的功能與性能是否正常;
2)周期 BIT:對系統工作時的關鍵功能特性進行實時監測與記錄并將結果及時反饋給系統;
3)維護BIT:主要用于系統的維修檢測,通過數據判讀確定系統工作性能,并完成故常排查和維修,使系統恢復正常工作狀態。
BIT測試系統工作流程如圖1所示,其運行機制如下:

圖1 BIT測試系統工作流程
1)首先系統加電,進入初始化檢測,檢查上電過程中設備硬件是否存在故障,模塊驅動是否工作正常,軟硬件進行初始化動作,對設備軟硬件進行置位清零,確保設備初始工作狀態正確;同時檢測是否為虛警故障,若是則進行狀態置位,若否進行故障排查。
2)初始化檢測正常完成后,進入上電BIT檢測環節,對系統對各設備進行BIT測試,檢測正常進行系統流程測試,若否則進行故障排查。

圖2 運載火箭BIT測試系統總體框架
3)系統流程測試是設備在系統中的關鍵應用環節,如果出現故障,可利用周期BIT進行故障定位及排查。在確定設備故障的情況下,直接進入維護BIT檢測,以便快速完成故障定位處理。
4)周期性BIT檢測可實時監測系統中硬件設備及軟件運行情況,及時發送BIT信息,給出狀態置位情況,檢測過程不影響系統流程測試。
5)進入維護BIT檢測,快速故障定位后完成故障決策處理。同時進行系統狀態置位,回到系統流程測試環節。
BIT測試系統設計根據測試對象的系統特點,航天領領域具有成熟的行業規范,系統設計時按照航天型號產品的系統功能及性能具體指標要求,遵循測試性大綱、維修性大綱和安全性大綱的要求,設計合理的系統測試內容、測試項目及測試參數,以滿足系統及設備在研制和使用階段不同的使用要求。
由于運載火箭對于地面測試系統除功能完備、質量可靠等要求外,其中快速維護,保障測試發射流程順利進行,保證發射任務能夠零秒發射也是一個關鍵指標,這對于衛星及其它飛行器精準入軌、節約燃料均有重要意義。
圖2為某通用型運載火箭BIT測試系統總體框架。該系統利用PXI總線技術,利用冗余設計將兩套運載火箭測試功能模塊掛接在PXI總線上,通過人機交互軟件系統進行火箭測試系統流程調度管理,實現測試系統故障決策、冗余切換、數據分析等能功能。
該系統將故障排除做到模塊板卡級,對于系統中器件故障直接選擇對應上一級模塊板卡排查,利用隔離故障板卡及快速切換冗余功能,保障系統測發流程的順利執行。對應故障器件在系統工作接收后,維護BIT模式中進行分析排查。
按照系統功能,BIT測試系統工作過程及實施如下:
1)PXI測試單元工作狀態查詢:如圖3所示,系統上電后及流程測試中,人機交互式軟件實時讀取PXI測試單元中PXI機箱傳感器數據,包括電源電壓、PXI機箱工作溫度,風扇電壓及轉速,控制器CPU及內存工作狀態。檢查PXI測試單元各功能模塊驅動是否正常在線,各功能模塊初始化是否正常;通過返回值可以監測到PXI測試單元初始狀態,若初始化異常,可通過人機交互軟件系統直接切換到備份PXI測試單元。
2)激勵、控制功能檢測:測試系統激勵信號是利用系統母線24 V電源作為基準,連接DC/DC模塊,再通過運放調理電路連接PXI采集模塊,電源管理控制利用PXI隔離輸出接口電路,輸出TTL電平,使用光耦芯片連接驅動電路,可以實現控制電路與功率輸出之間隔離,激勵信號輸出端連接采集模塊,對輸出的激勵信號進行實時測量監測,測試合格后通過繼電器控制模塊輸出給箭上產品,避免地面測試設備異常給箭上產品帶來的損傷。對于箭上某些重要信號,繼電器控制輸出可以采用并聯雙輸出的方式連接與火箭連接,可以提供地面測試設備的可靠性。圖4為激勵控制輸出單元示意圖。

圖4 激勵控制輸出單元
系統BIT設計時,設置了激勵自檢功能,利用測試系統母線給激勵控制單元供電,控制輸出端繼電器模塊處于常開狀態,通過激勵輸出連接采集模塊構成一個自檢閉合回路。
系統上電后,系統流程測試前,輸出交直流電壓、電流信號進行判定,檢查是否滿足系統要求,若滿足系統要求則進入系統流程測試;若不滿足系統要求,則進行模塊維護更換處理后參加系統流程測試。
系統測發流程測試中,如出現激勵異常,故障隔離后,經人機交互軟件判定后切換至冗余備份PXI測試單元進行系統流程測試。
3)采集功能檢測:運載火箭測試系統模擬量采集分為兩種,一種為關鍵節點的模擬量采集,系統測試時,只對某節點加電時刻的模擬量進行單次采樣;另外一種為持續關注的模擬量采集;由于火箭模擬量采集需求較大,為降低工程設計成本,這兩種模擬量采用兩種采集方式,對于第一種模擬量采集采用多路切換輸入接口連接箭上單次采用的模擬量,系統流程需要進行測量時,將當前模擬量利用多路切換輸出連接萬用表模塊,通過切換測量可實現多個模擬量多時段測試。第二種模擬量連續采集采用PXI模擬量AD采集模塊,采集模塊輸入端需要設置調理電路,通常需要進行分壓及物理隔離處理,分壓處理可滿足連續模擬量采集模塊的采集量程,物理隔離應用在測試系統中,是實現火箭與地面測試設備的隔離,避免地面設備故障時對箭上產品的損害,隔離單元主要由衰減電路、隔離放大器、電源電路及PXI接口電路組成,模塊功能如圖5所示。PXI總線主要為模塊提供+5 V電源,通過隔離電源模塊將+5 V轉換為+15 V,為系統內隔離放大器供電,實現信號通道間隔離。前端衰減電路實現0.122的衰減比例,保證信號輸入范圍可以達到±40 V。

圖5 隔離單元
系統BIT設計時,每個采集模塊預留自檢通道,作為系統監測采集功能的手段。
系統上電后,系統流程測試前,利用PXI測試單元的母線供電作為信號源發生器,輸出至采集模塊進行連續模擬量采集和單次采樣模塊采樣測試,可以通過曲線繪制、數據處理判讀檢測采集模塊是否工作正常,若工作正常,則進入系統流程測試;尤其在系統流程測試過程中,可以實時監測采集模塊的工作狀態,出現采集模塊故障時,通過人機交互軟件切換備份模塊,同時也對火箭故障狀態及時作出定位,及時采取排故措施。
4)時串、電爆電路、電磁閥功能檢測:時串及電爆電路信號在火箭系統被認為是一種“數字量信號”,主要用于火箭分離信號的測試,信號正常輸入為28 V,在輸入信號大于17 V時,為高電平狀態,當輸入信號小于15 V時,為低電平狀態。因此開關量信號屬于一種數字信號,即只有“0”和“1”兩種狀態的信號。但由于現在處理器的IO電壓一般支持TTL電平或CMOS電平,為此在處理前端,首先需對信號進行幅度變換,即將大于17 V的信號轉換成TTL或CMOS信號的高電平信號,而將幅度小于15 V的信號轉換成TTL或CMOS的低電平信號。為此在處理前端,首先需對信號進行有效隔離,并實現28 V到CMOS電平的轉換。隔離轉換電路應具有足夠的響應速度,并能承受40 V輸入信號。隨后系統對轉換后的信號進行采集、濾波和判別,濾波的目的是消除信號中所存在的抖動。系統算法根據所采集到的信號,判斷信號的跳變狀態、剔除突發脈沖噪聲、抑制抖動效應、控制信號跳變間隔,同時根據判決結果實時向上位機發出中斷請求或提供上位機實時查詢功能。同時系統應能接收上位機的命令,并根據上位機命令執行相應操作,返回相應的執行結果。開關量檢測電源如圖6所示。

圖6 開關量檢測電路
電磁閥信號測試主要是檢測箭上動力電磁閥及姿控電磁閥動作過程的電流曲線,從本質來看是一種小幅值高精度模擬量采集。測試電路由前端輸入電路和數據處理電路組成,前端電路主要對輸入信號進行調幅,抗擾處理,對于每路信號采用單獨的AD轉換信號,每個通道采用獨立的隔離電源模塊,可以保證采樣速度和信號隔離,避免通道之間相互干擾以及對箭上系統的影響。前端輸入電路如圖7所示。

圖7 電磁閥采集前端處理電路
電磁閥的數據前端處理由FPGA完成。FPGA完成對AD轉換后的信號進行Sinc3濾波,輸入緩存,并標記時鐘,再經過FIFO緩存后通過HP接口傳輸給DDR3。PS端將DDR3的數據實時存儲在FLASH,并通過PXI總線對數據進行打包發送。
時串、電爆電路、電磁閥功能BIT設計同3)一致,同時融合控制功能的自檢測能力。時串信號自檢時,信號源信號接入時串模塊時,接入不同控制模塊的檢測通道,同時可以考核到控制模塊的功能。
上電BIT設計和周期BIT設計同4)一致。
5)模發激勵、遙測量測試功能檢測:模發激勵信號和遙測量測試功能作為運載火箭特殊的電氣類信號,模發激勵信號主要用于地面測發設備與火箭箭載計算機通訊的關鍵控制信號,兩端接口均使用非標準的RS422接口完成,模發激勵包括模發數碼和模發移位時鐘2類信號,模發信號要求為8位,模發信號高電平幅值大于1.5 V,小于6 V(寬度1 μs處)。模發移位時鐘脈寬2.5 μs,周期10 μs;模發數碼時鐘脈寬5 μs,周期10 μs。
箭地遙測數字量用于火箭箭載計算機飛行前后運行狀態監視,遙測量數字量測試主要完成箭載計算機3CPU下傳的3路電平信號,遙測數字量接收采用RS422接口,遙測數字量以TTL電平輸出,遙測數字量包括YC數碼和YC移位時鐘2類信號。其中YC移位時鐘脈寬5 μs,周期10 μs,占空比50%;YC數碼為不歸零電平碼,周期10 μs。
模發激勵解碼遙測量測試單元如圖8所示。

圖8 模發激勵解碼遙測量測試單元
本系統采用RS422串口通訊接口與箭載計算機接口的匹配,通過FPGA設計多路串口數據收發功能,包括模發激勵、模發解碼、遙測量發送、遙測量接收機異步422備用通訊,完成模發激勵、遙測量接收功能。
模發激勵、箭地遙測數字量模塊不能通過利用外部標準源的信號進行功能測試,在模塊BIT設計階段,需考慮該功能的自檢方法,因此通過模塊自檢功能進行檢測。系統上電后,模發激勵模塊逐條發送模發指令,同時進行模發解碼,讀出寄存器輸出指令,例如發送0xEO,解碼為“封箭機”,可檢測模發激勵模塊工作是否正常。箭地遙測數字量測試功能同模擬激勵模塊,也通過其自帶的遙測量發送功能,可在系統上電后及系統流程中進行模擬功能自檢。上電BIT設計和周期BIT設計同 4)一致。
6)RS422通訊功能檢測:如圖9所示,422通訊功能主要實現箭機、捷機、光纖慣組、程配與地面主機的422通訊,通過箭地接口將422通路與串口設備連接,選用422串口服務器,該模塊具有16路獨立422通訊通道,它將422接口轉換成以太網接口,通過端數傳網絡與主機連接,完成與主機的422通訊,考慮到箭地422通訊的重要性和可靠性,系統設計時冗余422通道,提供兩條獨立信道,通過PXI繼電器控制模件實現兩通道的切換,同時監測串口服務器可對箭地422通訊的上下行數據進行接收監測。

圖9 RS422通訊結構
上電BIT設計和周期BIT設計同 4)一致。

圖10 運載火箭BIT測試系統工作流程
按照運載火箭測發流程開展軟件流程設計,圖10為系統工作流程,人機交互式軟件采用模塊化多線程設計。首先讀取軟件配置信息,獲取本軟件運行的計算機絕對路徑地址,讀取網絡配置、協議配置、激勵通道、模擬量采集模塊配置、開關量采集模塊配置、采樣模塊配置、控制通道配置、模發解碼遙測量等模塊配置。同時獲取本機操作系統的日期和時間,作為存盤文件名稱關鍵字,判斷是否存在當日的文件夾,如果沒有創建當日的文件夾,再在當日文件夾中分別測試源碼數據文本文件。下一步完成PXI機箱及測試模塊初始化,異常則啟用冗余設備,切換PXI測試單元。完成初始化后進行PXI機箱及模塊的自檢,自檢異常則啟用冗余設備,切換PXI測試單元。
自檢完成后測試模塊復位和計時器的復位,程序主模塊完成程序運行判別,防止重復開啟軟件,打開窗口最大化,網絡初始化,連接服務器,線程初始化,等待服務器轉發的測發主機工作指令,其中軟件主線程作為單獨一個線程運行,主要負責TCP字節流的組幀,解析處理。按照協議功能號分別執行,并回令給測發流程主機,本線程采取循環查詢模式,每條指令按先進先出模式處理,每條指令之間延時1 ms。各功能模塊執行相應的測試功能,返回相應測試值。
數據分析依托通訊進行數據的收集與保存,同時基于這些數據,實時或者事后提供給火箭測發崗位人員以直觀的數據顯示、數據對比判決等,協助崗位人員進行判斷決策。
現役某型運載火箭使用該BIT運載火箭測試系統進行集成綜合試驗,以參加全系統綜合檢查項目為例,在該測試項目開始前,測試系統加電預熱階段,進行上電BIT自檢測試,測試結果如表2所示,按照系統設置的功能模塊進行自檢,測試結果均合格,由于采集功能模塊、時串功能模塊、電爆電路功能模塊、電磁閥功能模塊測試通路數量龐大,上電自檢測試均設計到模塊級別,可完全識別出模塊級別的工作狀態。若設計進一步所有測試通道及器件級別的自檢測試環節,將增加測試系統的復雜性和設計成本,反而降低了系統的可靠性。系統中其他測試功能模塊均100%覆蓋系統測試全過程。結果表明該測試系統工作正常,具備滿足參加后續試驗的條件,若出現上電BIT自檢不合格,可以按照系統設置的故障預案進行排查和故障處置,及時切換備份通路或替換故障功能模塊,保障系統測試流程。

表2 BIT系統上電自檢測試結果
上電BIT自檢合格后,可以按照全系統綜合檢查項目進入運載火箭測試流程,該系統進入周期BIT工作模式,根據系統研制的數據顯示處理平臺,可以對運載火箭及其測試系統運行狀態進行實時監測,專業技術人員可以根據測試數據對火箭及其測試系統的工作狀態進行綜合判定。圖11為數據實時顯示界面。

圖11 數據實時監測界面
為驗證維護BIT工作模式,在該系統參加火箭全系統綜合檢查項目中,模擬箭地RS422通訊故障,人為斷開箭地RS422通訊通路,系統箭地RS422數據裝訂中止,系統迅速斷開該故障RS422通訊主通路,做到故障隔離,同時啟動備份箭地RS422通訊通路,重新進行RS422數據裝訂,箭地RS422通訊恢復正常,其中故障定位到故障處理約10 s,完全不會影響運載火箭正常的測試發射流程。
該運載火箭BIT測試系統可全面覆蓋設備自身的測試功能,能對自身的功能及性能進行自測試,可以將故障定位到功能模塊級。同時能夠滿足被測對象的測試需求,實時監測系統運行狀態,并對火箭及其自身出現的故障做出診斷,及時進行故障隔離處置。
在系統BIT設計中,采用故障檢測率、故障隔離率、BIT虛警率等指標來衡量BIT方案的優劣[15-18]。
1)BIT故障檢測率:rFD是指用 BIT 正確檢測到的故障數與故障總數之比,見式(1):
(1)
式中,NT為待測產品故障總數;ND為用BIT 正確檢測出的故障數。
2)BIT故障隔離率:rID是指用BIT 能夠正確隔離到不大于L個故障類型的故障數與檢測到的故障總數之比,見式(2):
(2)
式中,NL為在規定條件下用規定方法正確隔離到不大于L個故障類型的故障數(設規定的故障類型數為L,也即被識別故障定位到L個類型中。L即模糊度,表示故障隔離的分辨能力:L=1,即模糊度等于1,為無模糊)。
3)BIT虛警率:rFA是指BIT 發生的虛警數與故障指示總數之比,見式(3):
(3)
式中,NFA為虛警次數;NF為真實故障指示次數。N=NF+NFA,為BIT指示故障(報警)的總次數。
虛警是指 BIT 指示被測產品有故障,而實際不存在故障的現象。在BIT設計使用過程中,解決虛警問題始終是檢驗系統可用性的關鍵因素之一[19-21]。可利用大數據設置BIT檢測參考值和閾值。
以某通用型運載火箭測試系統中激勵功能BIT門限參數設置為例,首先獲取不同環境不同測試項目中某激勵信號測試值,且均符合系統要求。
amax=max(α1,α2,…,αn)
(4)
式中,α1,α2,…,αn為n個實測值,αmax為其中的最大值。
βmin=min(β1,β2,…,βn)
(5)
式中,β1,β2,…,βn為n個實測值,βmin為其中的最小值。
(6)
式中,r為αmax與βmin的中間值,作為BIT測試系統中激勵功能判定的門限值,在系統引用中很大程度地降低了虛警率。
本文為解決運載火箭測發控系統測試流程復雜、故障排查難的問題,為提高測試可靠性、設備維護性,提出將BIT技術引入運載火箭測試領域,構建運載火箭BIT測試系統,上電BIT階段,可完整自檢測系統各功能模塊測試狀態;周期BIT階段,實時監測系統及設備的運行狀態;維護BIT階段,對系統及設備出現的故障進行修復。實現了系統參加試驗全過程狀態可檢測,出現的故障可隔離并能夠及時處置,縮短了系統故障診斷時間,簡化了現場工程技術人員維護工作,優化了運載火箭測試發射流程,在實際應用中具有良好的工程應用效果。