張 毅,徐方辰,戴麗娟,奚 揚
(國家石油天然氣管網集團有限公司西氣東輸分公司,上海 200126)
分布式光纖聲傳感系統(DAS)具有分布式檢測、檢測距離長、抗電磁干擾等優點,在周界安防、軌道入侵、油氣管道檢測等諸多領域被廣泛應用。使用傳統的機器學習算法識別振動信號的主要優點在于需要的數據量較小,識別時間較短,但缺點是難于找到能很好表達振動信號的特征參數,對特征參數的設計需用到非常專業的知識和經驗,如果特征參數設計不合理,最終得出識別模型的識別效果可能很差。常用的傳統機器學習模型主要有:支持向量機(SVM)、隨 機森林樹、極值梯 度 下降(XGBOOST)等。隨著神經網絡的研究深入以及在圖像識別領域取得的可觀應用成果,使用神經網絡來對DAS中振動信號進行識別的研究項目也已陸續涌現,其優點在于不需要設計特定的特征參數,神經網絡會自動提取出振動信號中的特征參數,但缺點是神經網絡的訓練需要巨量的數據,而且相較于傳統的機器學習算法識別時間也要更長一些。常用的神經網絡結構有:多尺度卷積神經網絡、深度神經網絡、二維卷積神經網絡等。考慮到傳統機器學習算法很難設計識別的特征參數,所以目前大多數的研究主要集中在神經網絡對振動信號的識別上。
由于神經網絡對振動信號的識別過程較為耗時,為了提高模型對振動信號識別的實時性,則提出了使用基于短時能量與短時過零率的端點檢測(SE_ZCR_VAD)方法對振動信號進行預識別。在對采集的振動信號進行去噪處理后,首先使用SE_ZCR_VAD對采集的信號進行識別,如果SE_ZCR_VAD檢測出信號中不存在振動信號,直接將信號輸出為噪音;若存在振動,則將該振動信號送入一維的Resnet18神經網絡識別模型中進行識別,從而得出最終的振動類型。由于在實際應用中,大部分信號為噪音,因此僅有少部分信號需要使用神經網絡識別模型進行識別,所以該方式能有效降低識別時間。經過實驗證明,該方式將噪音的識別時間降低到了3.5 ms,對振動信號的平均識別準確率達到96.3%。
基于相敏光時域反射計(φ-OTDR)的DAS的系統結構如圖1所示。該系統使用超窄線寬激光器(DFB-LD)作為系統的能源,激光器發出連續光通過聲光調制器調制為脈沖光,為了提高系統的測量距離與檢測精度,使用摻鉺光纖放大器(EDFA)對脈沖光進行放大,由于摻鉺光纖放大器會引入自發輻射噪音(ASE),因此使用帶通濾波器(BFP)對放大后的脈沖光進行濾波操作,濾除ASE噪音后,脈沖光通過光環形器(OC)進入傳感光纖,并且在傳感光纖中返回后向瑞利散射光(BRS)。BRS通過OC進入到EDFA進行放大,放大后經過BFP進行濾波,然后被光電探測器(PD)檢測,將光信號轉為電信號,使用DAQ信號采集模塊對電信號進行采樣并送入處理器模塊進行處理。

圖1 φ-OTDR結構圖Fig.1 Structure diagram of φ-OTDR
基于SE_ZCR_VAD的識別系統主要包含信號采集模塊、去噪模塊、端點檢測模塊和識別模塊。信號采集模塊由φ-OTDR系統組成,采集信號傳入電腦內進行存儲。識別系統的結構如圖2所示。

圖2 識別系統的結構示意圖Fig.2 Schematic diagram of the structure of the recognition system
1.2.1 去噪模塊
對振動信號進行去噪操作,可以有效提高信號的信噪比,能明顯改善后續對振動信號的識別效果。為了能最大程度降低信號中的噪音,選擇使用小波閾值折衷去噪對振動信號進行去噪處理。
使用小波閾值折衷去噪首先需要對振動信號進行小波變換,小波變換可以表達為:

其中,為尺度因子;為平移量;為母波函數。
通過設置合適的與可以同時得到較好時間分辨率與頻率分辨率。本文對信號進行變換得到小波分解系數,并且設置相應的閾值對小波系數進行篩選。常用的閾值有硬閾值、軟閾值、折衷閾值。其表達式分別如下:

這里,式(2)為硬閾值,式(3)為軟閾值,式(4)為軟硬折衷閾值。由于軟硬折衷閾值同時具有硬閾值與軟閾值的優點,因此選擇使用軟硬折衷閾值作為最終的閾值選擇。對分解后的小波系數進行閾值篩選后,就可以將保留下的小波系數進行重構,從而得到去噪信號。
1.2.2 端點檢測模塊
端點檢測模塊的主要作用為檢測采集信號中是否存在振動,對不存在振動的信號直接判定為噪音進行輸出;對存在振動的信號則送入識別模塊進行識別。由于在實際應用中噪音占絕大多數、并且不需要施以訓練,因此使用端點檢測對噪音信號進行直接檢測能有效提升識別速度。
端點檢測模塊首先需要對振動信號進行端點檢測,將信號中的振動位置檢測出來,端點檢測的特征量選擇為短時能量與短時過零率。短時能量()與短時過零率()的數學公式分別見如下:

其中,()為窗函數。
由于端點檢測可能會被系統中毛刺或者噪音影響而出現檢測出錯的情況,所以還需要對檢測出的振動片段進行分析,檢測振動片段的有效性。具體算法步驟為:
(1)檢測信號中是否存在振動,若不存在振動,直接將該信號輸出為噪音,若存在振動繼續執行算法。
(2)對一個振動信號中的所有振動片段長度、短時能量進行計算,并且保留所有振動片段長度與短時能量信息。
(3)得出一個信號中振動片段長度的最大值,將該最大值與長度閾值進行比較,若最大長度小于長度閾值,將該信號輸出為噪音;得出一個信號中短時能量的最大值,并且將該最值與短時能量閾值進行比較,若小于短時能量閾值將該信號輸出為噪音。
1.2.3 識別模塊
對振動信號的識別主要需要使用Resnet18網絡對一維振動信號進行識別。識別模塊主要包含離線訓練部分與在線檢測部分。其中,離線訓練主要是依靠采集得到的數據集對Resnet18網絡進行訓練,在線檢測部分是使用訓練好的模型對采集的振動信號進行實時的檢測。
本次實驗采用的基于φ-OTDR的DAS所使用的DFB-LD的線寬為3 KHz、輸出功率為10 mW,聲光調制器的帶寬為100 MHz,EDFA的放大增益為27 dB,PD帶寬為200 MHz,DAQ的采樣速率為200 MHz/s。識別的振動類型為汽車在路面行駛的振動、施工機械作業的振動、手敲擊光纖的振動、噪音。采集的振動數據數量見表1。

表1 振動數據數量Tab.1 Number of vibration data
使用小波閾值折衷去噪的去噪結果如圖3所示。圖3(a)為去噪后的振動信號,圖3(b)為未去噪的振動信號,對比兩圖可以看出使用小波軟硬閾值折衷去噪能將振動信號中的噪音有效去除。小波軟硬閾值折衷去噪的分解層數設置為5,母波函數選擇為“sym8”。

圖3 振動信號Fig.3 Vibration signals
通過將4種振動數據進行混合,每種數據選擇200個,共800個振動樣本。將800個振動樣本隨機打亂后,再輸入到端點檢測模塊進行噪音檢測,檢測結果見表2。從表2中可以看出振動信號的識別準確率為94.6%,對噪音信號的誤檢率為5.4%。800個樣本的總識別時間為2.8 s,一個樣本的識別時間為3.5 ms。端點檢測中長度閾值設置為180,短時能量閾值設置為0.53。

表2 端點檢測識別結果Tab.2 Endpoints detection identification results
考慮到噪音信號由端點檢測模塊進行識別,因此在振動識別模塊中,不再設置對噪音信號的檢測,振動信號識別模塊僅對3種振動信號進行識別。每種振動信號采集500個樣本,將振動信號進行隨機混合后按照7:3的劃分比例將振動數據分割為訓練集與測試集。將劃分好的訓練集使用去噪算法進行去噪處理后加載到Resnet18網絡上進行訓練,模型訓練完成后使用測試集進行測試驗證。對測試集進行驗證得到的混淆矩陣如圖4所示。Resnet18網絡使用的損失函數為交叉熵損失函數,一維卷積層中使用的激活函數為,分類器使用全連接神經網絡,激活函數為。

圖4 測試集混淆矩陣Fig.4 Test set confusion matrix
從圖4中可以看出,Resnet18模型對3種振動事件的識別準確率較高,其平均識別準確率達到了96.3%。每個樣本的識別時間為3.5 ms。通過混淆矩陣分別計算模型的召回率、精度、參數。測試集的性能參數見表3。從表3中可以看出,使用Resnet18網絡模型對振動信號的識別性能較好,召回率、精度、的值都能達到96%。

表3 性能參數Tab.3 Performance parameters
在訓練好Resnet18網絡模型后,就可以直接將采集的信號送入監測系統中進行實時的監測。檢測中,噪音信號由端點檢測模塊進行識別,其余振動信號由Resnet18網絡進行識別。通過在線系統對800組樣本信號進行檢測后得出的結果見表4。

表4 在線監測識別結果Tab.4 Online monitoring and identification results
通過使用基于端點檢測的方式對噪音信號進行識別,能有效提升系統對采集信號的識別速度。論文提出方式對噪音信號的識別時間僅需要3.5 ms,對噪音的識別準確率達到100%,且對振動信號的誤檢率僅為5.4%,通過使用Resnet18網絡對振動信號的平均識別準確率達到了96.3%。