陳森 梁爽 陳晨 于士謙 侯俊飛
(許繼電氣股份有限公司,河南 許昌 461000)
目前,國內電力生產運行、經營管理所使用的繼電保護電力專用芯片依賴于進口。隨著芯片和信息安全的重要性日益突出,一旦出現類似華為芯片禁令事件,就無法保證電網所需的繼電保護裝置等電力設備的正常供應。為此,加快推進國產化的自主可控新一代繼電保護裝置的研制進度,并盡快成熟應用,著力解決核心技術的“卡脖子”問題就顯得尤為重要[1]。
繼電保護裝置在電網系統或設備出現故障后,能及時反應并發出故障信號,并以斷路器跳閘的方式將故障位置進行隔離,從而對電網其他系統和設備進行保護[2]。繼電保護裝置一旦投入正式運行,就要不間斷工作10 年以上,且要受到極端自然環境的考驗,極易導致繼電保護裝置出現功能受損等問題,從而引起電力系統的連鎖反應,因繼電保護裝置本身出現異常或故障導致系統無法正常運行,嚴重時會導致重大的財產損失和人員傷亡等[3]。
繼電保護裝置出現的故障有以下5種[4]。①繼電保護裝置供電電源輸出功率不穩定,從而導致保護裝置判斷不準確。②繼電保護裝置插件上的零部件損壞導致裝置出現故障,最終導致保護裝置失靈。③繼電保護裝置長期處于強電磁環境中,導致保護邏輯出現誤動作。④站用直流系統出現故障。如電壓降低將導致保護裝置異常,直流接地會導致保護裝置誤動或拒動等。⑤斷路器控制回路故障。如斷路器控制回路斷線造成斷路器無法正常分閘、合閘,從而出現故障不能切除、越級跳閘等問題。
某型號110 kV 變壓器保護裝置為自主可控新一代智能變電站的繼電保護裝置,該裝置從軟件到硬件已全部實現國產化。
繼電保護裝置在中試測試模擬現場發生低壓1分支復壓過流故障,保護裝置的低壓1 分支復壓過流保護可靠動作,但不出口。為了查看保護裝置的采樣值是否符合檢測標準的精度要求,通過繼電保護測試儀給該裝置施加穩定的電壓和電流,分別查看裝置的就地保護板和啟動板的采樣值,發現保護板的采樣值均正常,但啟動板的低壓側電壓和電流采樣數據均為0,繼續查看零漂菜單,低壓側電壓電流零漂值均為非0。
發現問題后要及時向設計人員及項目負責人進行反饋。為了便于查清問題產生的原因,采取保留問題現場的措施,未對問題裝置進行斷電重啟、插拔插件等操作,決定在另一個同型號的裝置上復現該問題,驗證該問題是否與預想問題的產生原因一致,待故障現象復現后,才能對問題進行正確的定位、解決以及驗證。
繼電保護裝置的硬件核心架構的示意圖見圖1。

圖1 裝置硬件核心架構示意圖
啟動CPU 插件和保護CPU 插件都擁有獨立的內存、Flash、FPGA 及ADC 模塊,保護邏輯完全相同。2 套系統并行運行,啟動CPU 控制啟動繼電器,保護CPU 控制出口繼電器,啟動CPU 和保護CPU 的保護邏輯同時滿足的情況下才能出口跳閘,雙CPU架構極大地提高繼電保護裝置的可靠性。
通過閱讀源碼程序、調試、實時仿真、日志分析等方法,首先排除該問題是因程序設計所導致的,最終確定有可能是硬件故障導致的。
該裝置在中試測試過程中,低壓1 分支復壓過流保護可靠動作但不出口的根本原因是啟動板采樣出現問題。因繼電保護的保護出口邏輯采用“啟動+跳閘”的串聯控制邏輯,只有啟動CPU、保護CPU 同時動作時,裝置才會動作。其中,啟動板所屬的低壓側電壓、電流采樣數據均為0,可進一步推斷故障發生在啟動CPU 板上,尤其是啟動CPU 板上的相關采樣電路。由于故障過程中的采樣數據均為0,打開啟動CPU 板的硬件電路,其中FPGA 與AD 芯片示意圖見圖2。
由圖2 可知,啟動CPU 插件共有9 片AD7656(AD 芯片型號)。其中,1 片AD7656 用來采集5 V和2 組±15 V 電源,并用于電源的自檢,其余8 片用來采集模擬量,2 個±15 V 電源作為電源輸出模塊,分別為2 個4 片的AD7656 供電,且這4 片AD7656由同一個±15 V電源進行供電。

圖2 FPGA與AD芯片示意圖
因低壓側采樣數據為0,極有可能是其中的4片AD 芯片無法采集到的模擬量,啟動CPU 插件的AD芯片供電部分,其原理圖見圖3、圖4。

圖3 1~24路供電部分原理圖

圖4 25~48路供電部分原理圖
通過測試分析,初步確定±15 V電源供電的AD芯片采集異常,使用萬用表分別測量1~24 路AD電源芯片供電電壓±15.0 VCC1 和25~48 路AD 電源芯片的供電電壓±15.0 VCC2。其中,+15.0 VCC2實測約為1.2 V、-15.0 VCC2 實測約為0.1 V,即25~48 路AD 電源芯片的供電電壓±15.0 VCC2 出現異常。將25~48 路AD 電源芯片L5 和L6 電感去掉,U14 的輸出±15 V 均正常,使用萬用表測量+15.0 VCC2、-15.0 VCC2之間的電阻,測量值為0。因此,初步判定是因為AD芯片或電容短路。
AD芯片的原理圖見圖5,將與±15.0 VCC2連接的電容C32、C33、C37、C38、C711、C712、C713、C714逐個去掉(其他電容保留),經排查后發現,將C714(0603-25 V-10 μF-X5R)電容去掉后,裝置出現的現象與問題現場保留的裝置現象完全一致。將更換新電容的啟動CPU插件插入裝置,給低壓側模擬量施加額定電壓和額定電流,啟動板的低壓側采樣數據恢復正常。由此最終確定采樣故障發生的原因。

圖5 AD芯片原理圖
對失效電容進行失效分析,其中外觀檢查、紋波電壓測試、紋波電流測試等均正常,而電性能測試、破壞性物理分析(DPA)、電容溫度測試出現異常現象。
4.1.1 外觀檢查。未發現樣品的瓷體有裂紋、缺損等。
4.1.2 電性能測試。送檢電容型號為0603/25 V/10 μF、實驗室溫度為25.3 ℃、濕度為55%,使用HP 4284A LRC 電容器測試儀和HP 4239A 絕緣電阻測試儀對電容進行電性能測試,測試條件為C/DF 為1 kHz、1.0V,IR 為25 V,測試時間為1 min。電性能測試結果見表1。

表1 常溫電性能測試結果
4.1.3 破壞性物理分析(DPA)。對失效電容進行DPA 研磨,內部存在過載擊穿現象,擊穿后裂紋向兩邊延伸,如圖6所示。

圖6 樣品研磨局部放大圖
經外觀檢查、電性能測試和破壞性物理分析(DPA),并結合片式多層瓷介電容器典型失效模式、類似失效案例和積累的失效產品圖片資料,此次失效可能是電容器在使用或測試過程中遭受異常大電壓或大電流沖擊,從而導致電容器內部被擊穿,擊穿后形成的裂紋向內電極方向兩端延伸,并穿過內電極,導致電容器絕緣電阻下降。
紋波電流或電壓是指電流中的高次諧波成分帶來的電流或電壓幅值的變化,可能會導致擊穿。由于使用的是交流電,會在電容上發生耗散。如果電流的紋波成分過大,超過電容的最大容許紋波電流,會導致電容被燒毀。
4.2.1 紋波電壓測試。U40A(AD芯片AD7656)電源管腳VDD和VSS處電容C606、C608安裝了不同容值的電容(0603-25 V-10 μF-X5R、0603-50 V-1 μF-X7R),U40A 電源管腳VDD 和VSS 處的紋波電壓相差不大。U40A電源管腳如圖7所示。
4.2.2 紋波電流測試。將圖7 中與U40A 電源管腳相通的電容C608 的一個管腳直接與焊盤連接,另一個管腳經導線與焊盤連接,瞬態電流僅為3 mA。將D16 去掉,改成導線連接,其紋波電流約為32 mA。流經D29 的總電流(-15 VCC1)約為31 mA,其紋波電流約為5 mA。

圖7 U40A電源管腳
在電容溫度測試中,將智能IO 插件的11 路硬壓板開入接DC220V,為解決測試電容溫度時熱耦接觸不可靠問題,用北極銀導熱硅脂均勻涂抹在熱耦上,以盡可能接近電容本體溫度,電容本體溫度如圖8 所示。

圖8 電容本體溫度
從溫度測試結果可知,電容溫度最高可達84.4 ℃,接近運行工作溫度的上限,考慮到環境溫度和熱耦接觸緊密程度帶來的誤差,電容本體溫度可能超過85 ℃。
在未經失效分析測試前,懷疑電容短路是由大電壓、大電流擊穿造成的,但通過紋波電流測試,AD啟動數模轉換所需的瞬態電流約為32 mA,此瞬態電流即使全部由電容(0603-25 V-10 μF-X5R,以下簡稱X5R)提供,也不足以損壞電容。因此,可初步排除大電流沖擊損壞,考慮是電壓擊穿。X5R 電容的工作溫度為-55~85 ℃。在85℃時,X5R 電容的額定電壓降額至70%,廠家推薦工作溫度不應超過85 ℃,超過85 ℃后,電壓和溫度曲線不再是線性關系。其中,X5R 電容的電壓和溫度線性關系圖見圖9。

圖9 電壓和溫度線性關系圖
將啟動CPU插件上的AD電源回路中燒壞的電容(0603-25 V-10 μF-X5R)更換成工作溫度范圍更廣、可靠性更高的電容(0603-50 V-1 μF-X7R)后,再對該裝置的可靠性進行測試,該裝置再未出現低壓側啟動板無法采樣的現象。
對繼電保護裝置,尤其是自主可控新一代繼電保護裝置進行試驗具有重要意義。通過模擬繼電保護裝置在自然環境中正常運行所遇到的各種復雜狀況,盡可能找到設計中存在的缺陷,從而消除缺陷。從整機散熱到元器件選型,任何一個瑕疵都有可能成為引起整個裝置系統崩潰的元兇,所以選擇可靠的元器件是最基礎的,也是最不容忽視的關鍵一步。