張日取 藍世祥 石金保 黃春香 任 旭 趙雪松
(1.華立科技股份有限公司,浙江 杭州 310023;2.深圳供電局有限公司,廣東 深圳 430223)
隨著數字智能電網的快速發展,具有數字化、互動化以及自動化功能的智能電能計量設備被大力推廣應用,出現了智能電能計量設備功能、事件判斷以及通信規約等一系列數據傳輸標準和技術規范,由集中抄表設備通過遠程通信模塊將相關數據上傳至主站,遠程通信模塊的數據傳輸質量直接決定了電網運行體系的效果和電網智能化程度。在現場實際應用的過程中,遠程通信模塊受到各項技術條件(例如環境、技術規范等)的制約,會出現不同程度的失效現象,文獻[2]提出了基于元器件應力法的可靠性預計與基于加速壽命試驗和加速退化試驗相結合的可靠性試驗,部分廠家提出了進行可靠性設計、利用高可靠性材料或采用先進工藝3種提高遠程通信模塊可靠性的對策。文獻[3]介紹了在遠程通信模塊檢測過程中應注意和重點關注的內容,部分廠家設計了一種遠程通信模塊電應力可靠性試驗平臺,該平臺能夠模擬現場運行條件,并通過長期運行提前發現遠程通信模塊的故障,但在設計遠程通信模塊的過程中進行有針對性的系統測試和分析的相關研究較少。
當前,行業內沒有廠家針對實際使用過程中產生的問題進行針對性測試。該文以目前行業內通用的遠程通信模塊為對象進行研究和總結,嘗試為同類產品的可靠性測試技術研究提供參考,結合可靠性領域、儀器儀表行業內的先進研發流程和已有的物聯網配電系統檢測、測試等技術,為遠程通信模塊的生產、測試及失效分析提供參考。
該文以目前掛網運行的遠程通信模塊為例,開展通用的失效分析研究,介紹遠程通信模塊通用軟、硬件失效機理和現象。同時,結合遠程通信模塊的特性和設計要求等條件進行探討。
失效分析有2種方法:1)故障樹分析法(Fault Tree Analysis,FTA)。2)故障模式與影響分析(Failure Modes and Effects Analysis,FMEA)。
故障樹(FTA)分析由頂事件、中間事件和底事件3個部分組成。頂事件、中間事件和底事件通過各種邏輯門進行連接,不同的邏輯門代表不同的意義(使用不同的符號)。
故障模式與影響分析(FMEA)是產品開展維修性分析、安全性分析、測試性分析和保障性分析的基礎,分析研究產品在使用階段可能或實際發生的故障、故障原因及其影響,提高產品的使用性、可靠性,為產品的測試改進、質量評價以及使用維修決策等提供依據。在使用階段FMEA包括硬件FMEA、軟件FMEA以及過程FMEA等。
遠程通信模塊故障一般包括不能通信、通信不暢以及部分數據丟失。通過FTA方法進行機理分析可以得出發生故障的具體原因,例如電源開路、穩壓芯片損壞、電容器損壞、光耦器件損壞以及TVS管損壞等。詳細機理分析如圖1所示。

圖1 遠程通信模塊故障
現場運行的計量終端與上、下行通信單元等組成通信鏈路。主處理器通過下行通信單元抄讀電表數據,對采集到的數據進行存儲和處理并生成相應事件記錄,其結果保存在存儲器中,可以通過上行通信單元(GPRS/CDMA、10M/100M以太網)向主站提供數據、記錄。其中,通信模塊包括遠程通信模塊、485通信模塊、載波/微功率無線通信模塊以及相關的保護電路。由電源模塊提供工作電源,電源模塊是計量終端的電源管理部分,發揮隔離、保護、電壓變換、穩壓以及降噪等作用。其主要失效點如圖2所示。

圖2 通信模塊故障機理分析
計量終端軟件平臺采用ARM平臺、嵌入式操作系統以及模塊化設計,一般由模組化終端硬件層、操作系統層以及業務應用層組成。上行通信可以輔助GPRS、CDMA和以太網互換通信模塊,下行通信可以兼容RS485、MBus、載波、小無線以及ZigBee等通信方式,從而接入不同種類的能源計量設備。計量終端多采用層次化軟件結構設計,層次化軟件結構具有以下4個優點:1) 簡化軟件的設計、開發以及維護工作。支持基于抽象程度遞增的系統設計,設計者可以按遞增的步驟對復雜系統進行分解。2) 提高了重用率。將應用邏輯作為單獨的構件從系統中分離出來,有利于這些構件在該系統甚至是以后的系統中得到重用。3) 有利于在開發者之間適當地分配不同層的開發任務。4) 具有較高的可維護性、可修改性以及可擴展性。實踐證明,層次化體系軟件結構設計具有便于增加新功能、系統具有可擴展性以及系統維護更方便等優點。因為每層只能與相鄰的上下層交互,所以功能的改變最多影響相鄰的上下層,可適用不斷變化的業務需求。
通過上述對計量終端軟、硬件設計架構的分析,充分解讀了客戶需求。客戶未明確或存在隱含性需求就可能給產品設計帶來質量風險。這些質量風險通常會在產品運行過程中顯示為各類故障現象,收集、分析這些故障現象并形成產品故障現象庫(簡稱故障庫),結合現場發生的故障現象,綜合分析得到故障庫的故障現象,分析結果見表1。

表1 遠程通信模塊故障現象一覽表
根據上述故障分析可知,遠程通信模塊故障現象主要體現在以下4個方面:1)通信信號性能。2) 電源影響模塊通信的可靠性。3) 模塊與終端的匹配性。4) 模塊可靠性。根據失效分析設計測試用例及測試方案可有效降低由上述4個因素引起通信模塊失效的概率。
根據通信信號性能指標可以對通信信號性能進行測試,如圖3所示。

圖3 通信信號性能測試原理
測試步驟如下:1) 通過頻譜儀獲取測試環境的背景噪聲。2) 測試未經衰減的通信信號強度。3) 得到信號強度值=-。4) 將衰減器的值置為,測試信號強度。5)得到經過衰減后的信號強度值為,=-=-。因為功分器和程控衰減器存在插入損耗,所以-<-(注:每次衰減測試均測試模塊是否在線)。
模塊產生信號后,信號就分為2路,一路進入功分器后直接經過多路程控開關,由頻譜儀直接測試其信號強度。圖4為某通信模塊的信號強度。
由圖4可知,該信號的背景噪聲約為-55 dBm,即模塊信號強度為-33.65-(-55)=21.35 dB。

圖4 通信信號強度
通過測試不同模塊通信信號的強度,就可以比較遠程通信模塊信號的優劣。
遠程模塊測試原理如圖5所示,包括電源、PC系統、串口服務器、控制測量板以及各電源控制開關等設備,主控模塊對系統電源上電、下電、切換及通信模塊供電電源變化等狀態進行控制。同時,控制系統與通信模塊之間的數據傳輸及主控與PC系統之間的數據傳輸等。

圖5 遠程模塊測試原理圖
通信模塊電源為5 V(±5%),通信模塊電源從5 V開始工作,每次電壓的變化值為0.25 V,每次電壓步進后測試通信是否正常,其電壓變化如圖6所示。

圖6 電壓波動圖
步驟如下:1) 將電壓降低至4.75 V,通信3次。2)將電壓上升到5.25 V,通信3次。3) 將電壓降低至4.5 V,通信3次。4) 將電壓上升到5.5 V,通信3次。
如果在上述任一電壓下通信不成功,就說明模塊受電源電壓影響較大,對比不同模塊的通信情況,可以了解各模塊的通信性能。由于模塊電源是由采集終端體提供的,因此可以從側面測量采集終端的電源性能及容量,及時了解采集終端電源提供不足時對遠程通信模塊通信效果的影響。
設置電源變化曲線測試模塊通信是否正常,其電壓變化如圖7所示。電源在5 s、10 s、10 s以及20 s時,從0 V上升到5 V,在5 V保持15 s,以正常通信為截至時間。

圖7 電壓緩升緩降圖
比較模塊不同的電源電壓升、降過程對通信的影響,從而比較不同模塊的通信性能。模塊工作電源是從0 V上升到5 V后開始穩定的,而模塊內部其他芯片的工作電壓一般為3.3 V,如果各電源之間的時序不匹配,那么模塊就可能會進入死機狀態,無法工作。
1 s內上電、1 s內下電循環50次后,系統給出5 V正常電源,測試模塊是否能正常通信,電壓變化如圖8所示。

圖8 快速上電、下電電壓變化圖
先上電5 V,持續3 s后掉電,然后上電持續4 s后掉電,再上電持續5 s后掉電,依次持續15 s后,再給出5 V工作電源,測試模塊是否能正常通信測試系統讀取電壓并實時顯示相關信息。由于模塊內部芯片電源工作電壓分別為5.0 V和3.3 V,因此,如果施加電源不停地通斷,就可能會導致遠程通信模塊電工作異常,出現數據傳輸錯誤或報文/幀異常的現象。
該文提出了一種基于失效再現技術的遠程通信模塊可靠性測試方法,該方法結合現場發生的故障對故障進行失效機理分析,歸納失效的主要因素,并針對目前覆蓋大部分運行現場故障現象的主要因素,設計了遠程通信模塊的測試系統,以驗證通信信號性能及電源可靠性對遠程通信模塊通信可靠性的影響,將實際檢測結果與檢驗數據結合起來,通過比較不同廠家的測試數據對各遠程通信模塊進行綜合評價,可有效降低遠程通信的綜合故障率,通過測試數據可有效評價遠程通信模塊的質量并預估其壽命,為遠程通信模塊檢測提供了一種可靠性測試方法。