朱宗玖, 王寧
(安徽理工大學電氣與信息工程學院, 淮南 232001)
相位敏感光時域反射儀具有分布式測量、抗干擾能力強、靈敏度高等優點[1-2],被廣泛應用于能源輸送管道安全預警[3]、輸電線狀態監測[4]、工程結構安全監測[5]、周界安防[6]等領域。然而,在實際的相位敏感光時域反射儀(phase sensitive optical time domain reflectometer, Φ-OTDR)系統中,傳感光纖所處的環境復雜多變,天氣變化、動物活動及行人誤碰等因素的影響而產生的干擾可能會引起假報警,從而導致系統具有較高的誤報率[7]。目前有兩種方法用于降低Φ-OTDR系統的誤報率,一是改進硬件結構,如采用Φ-OTDR與馬赫-曾德爾干涉儀或邁克爾遜干涉儀相結合的方式,但該方法成本高且硬件結構復雜[8]。二是選優化模式識別算法,提高振動事件識別的準確率,進而降低系統誤報率[9]。
為了在降低Φ-OTDR系統誤報率的同時避免增加系統成本和復雜性,通常采用第二種方法。Wang等[10]提出了一種基于深度雙路徑網絡的模式識別方法,對鐵路周邊的7種擾動事件進行分類,準確率達到97%,但更深的網絡結構導致振動信號分類時間變得更長。Saleh等[11]采用變分模態分解(variational mode decomposition,VMD)和線性支持向量機(linear support vector machine,LSVM)對擾動信號進行分類,在信噪比為-4~-8 dB和-8~-16 dB的情況下分類精度分別達到79.5%和75.2%,識別的準確率較低。Zhou等[12]提出了一種YOLO(you only look once)與光纖振動傳感系統相結合的方法對振動信號進行分類,但該方法只能識別單一類型的事件。
為了降低Φ-OTDR系統的誤報率,縮短振動事件識別時間,提出一種多域特征提取與PSO-SVM相結合的模式識別算法。在特征提取階段,對振動信號進行差分處理后通過小波包分解得到信號的能量特征,并與差分信號的時域特征相結合構成特征向量。在信號分類階段,利用粒子群算法優化SVM分類器參數,并借助Ф-OTDR事件數據集進行驗證。該方法突破了單一特征參量目標識別易受到干擾的問題,提高了多種擾動事件識別的準確性。
Φ-OTDR系統通過檢測傳感光纖中后向瑞利散射光的相位變化獲取外界擾動信息[13]。傳感光纖不受外界擾動影響時,系統產生的后向瑞利散射光相位近似保持穩定;當外界擾動作用在傳感光纖上的某一段時,該位置后向瑞利散射光的相位發生相應變化,且變化幅度與擾動事件種類相關,通過對后向瑞利散射光強度進行解調,即可得到擾動信息。
在Φ-OTDR系統中,函數發生器(function generator,FG)產生脈沖,激光器發出的連續光經聲光調制器(atoracousto-optical modulators,AOM)后轉換為光脈沖信號,該光脈沖信號被輸入到摻鉺光纖放大器(erbium-doped fiber amplifier,EDFA)以提高輸入功率,然后經環行器進入到傳感光纖中,產生的瑞利散射光通過環行器反射回光電探測器(photoelectric detector,PD),接收到的信號由數據采集卡(data acquisition card,DAQ)采集,最后將數字信號存儲在計算機上以用于后續分析。Φ-OTDR系統結構如圖1所示。

圖1 Φ-OTDR系統結構Fig.1 Φ-OTDR system structure
當Φ-OTDR系統受到外界擾動事件影響時,光纖振動信號的某些特征會發生相應變化,利用這些特征可以有效識別擾動事件種類。特征量較少會導致系統魯棒性差、誤報率高,因此采用多域特征提取來提高系統對擾動事件識別的準確率,增強系統的穩定性。
2.1.1 時域特征提取
時域特征值是衡量信號特征的重要指標。根據光纖振動信號時域波形中隱含的信息,如最大值、峰峰值、方差等,可以對擾動事件的種類進行識別。在提取光纖振動信號的時域特征時,為了消除數據本身的影響,首先對數據進行差分處理,然后再進行特征提取。從時域差分信號中提取的15個時域特征分別為:最大值、最小值、峰峰值、均值、方差、整流平均值、標準差、方根幅值、均方根、峰值因子、波形因子、峭度因子、脈沖因子、裕度因子、偏度因子。
2.1.2 小波包能量特征提取
光纖振動信號的統計特性隨時間變化,即為非平穩信號。小波變換保留了傅里葉變換對信號頻率的分析,同時又引入了時間分辨率的概念,對于復雜多變的非平穩信號,可以進行有效特征提取[14]。由于其固有性質,小波變換主要是對信號的低頻成分進行處理,而對于光纖振動信號,需同時知曉它的低頻與高頻信息,以便全面的獲取信號信息。小波包變換解彌補了小波變換對光纖振動信號高頻部分分解的不足,可以對信號的全頻分量進行分解,避免了信號特征的缺失。小波包分解原理如圖2所示。

圖2 小波包分解原理圖Fig.2 Principle diagram of wavelet packet decomposition
通過小波變換對信號S0,0做N層分解,則信號S0,0可表示為
S0,0=SN,0+SN,1+…+SN,2N-1
(1)
式(1)中:SN,0,SN,1,…,SN,2N-1為信號S0,0經N層小波包分解后的子頻帶,則有
(2)
式(2)中:t為時間;i=0,1,…,2N-1;EN,i為子頻帶SN,i的能量。
由此提取光纖振動信號的小波包能量作為特征值,并結合時域特征組成特征向量。
2.2.1 支持向量機
支持向量機(SVM)是一種從統計學習理論中衍生出來的二分類算法,已被廣泛應用于模式識別[15-16]。其基本原理是對于非線性可分的數據,通過非線性映射函數轉換到高維空間實現分類。
假設光纖振動信號的數據集T={(x1,y1),(x2,y2),…(xn,yn)},yi∈{-1,1},其中,i=1,2,…,n;xi為振動信號的特征向量集合;yi為振動信號種類的標簽,其分類超平面可表示為
f(x)=ωTx+b
(3)
式(3)中:ω為權系數向量;x為樣本空間內任意一點;b為偏置。
在SVM分類器中引入松弛變量ξi≥0,以容忍異常數據, 此時超平面求解問題變為約束條件下的凸函數優化問題,可表示為
(4)
式(4)中:c為懲罰系數,用于控制不滿足最小區間的數據樣本的貢獻,當樣本分類錯誤時,c越大,代表懲罰程度越重。
采用擬采用高斯核函數將x映射到高維空間φ(x)上,使樣本空間線性可分,其中φ為映射函數。高斯核函數k(xi,xj)的表達式為

(5)

因此,可通過對參數c和g進行優化以提高SVM分類器的分類精度。
2.2.2 粒子群算法
粒子群算法(particle swarm optimization,PSO)是一種能夠在全局范圍內進行參數尋優的群體智能優化算法[17-18]。PSO算法將待優化問題的每種解轉化為D維空間中包含N個粒子的粒子群,在每次迭代期間,粒子的速度和位置保持不變,在下一次迭代中,每個粒子根據當前個體最優位置與群體最優位置運動,最終獲得最優解。粒子的速度和位置分別由式(6)、式(7)確定。

(6)
(7)

懲罰因子c和核函數參數g對SVM分類器的性能起著決定性的作用,利用粒子群算法對SVM的參數c和g的選擇進行優化。
基于PSO-SVM的光纖振動信號識別流程如圖3所示。該算法的主要步驟如下。

圖3 光纖振動信號識別流程圖Fig.3 Optical fiber vibration signal recognition flow chart
步驟1數據預處理。提取光纖振動信號的時域特征和小波包能量特征,并對特征向量進行歸一化處理。
步驟2SVM分類器模型構建。選擇高斯核函數作為SVM分類器的核函數,初始化懲罰因子c和核函數參數g。
步驟3參數優化。初始化粒子群后對參數c和g編碼,利用數據集對c和g的選擇進行優化,構建最優SVM分類器模型。
步驟4振動事件識別。利用優化后的SVM分類器對光纖振動信號進行識別。
為了驗證本文算法的有效性,利用北京交通大學Ф-OTDR事件數據集[19]進行研究,該數據集包含背景噪聲、挖掘、敲擊、澆水、搖晃和行走6類典型事件,每個事件的時空信號樣本在時域上由10 000個點組成,在空域上由12個相鄰的空間點組成。數據集中每種事件對應的樣本數量如表1所示。

表1 6種事件對應的樣本數量Table 1 Number of samples corresponding to the six events
對6種事件進行差分處理后的結果如圖4所示。從圖中可以看出,背景噪聲在時域和空域中分布均勻且強度低;挖掘和敲擊事件都有一個明顯的峰值,由于泥沙的回流作用,挖掘事件具有較長的時間分布;澆水和搖晃事件在時域中都為連續信號;根據人走路的步頻,行走事件在單個樣本中具有多個不同的峰值。
特征的類間距離與類內距離之比可以表征其識別能力,提取的特征要盡可能使不同模式的信號具有較大的類間距離,相同模式的信號特征具有較小的類內距離,且需要考慮減少數據量以方便后續運算。因此,在對振動信號進行時域特征提取時選擇8個類間距離大、類內距離小的特征,分別為最大值、最小值、峰峰值、方差、整流平均值、均方根、峰值因子和裕度因子。根據8個特征的類間距離,從中隨機選取20個樣本第六空間采樣點中區別較為明顯的兩個特征,如圖5所示。

圖5 6種擾動事件的兩個時域特征Fig.5 Two time-domain characteristics of six disturbance events
光纖振動信號經過小波包分解成不同分布的子頻段,隨分解層數的增多,信號頻帶劃分的越精細,提取到的信號信息越豐富,但分解信號所需時間將大大延長,且提取的特征向量維度將呈指數級增加,延長分類算法的計算時間,因此分解層數并不能越多越好。為了確定小波包分解的最佳層數,對數據集中的樣本采用db3小波基進行不同層數的分解,與時域特征結合,組成相應分解層數的特征向量,使用PSO-SVM分類器觀察平均分類準確率的變化,結果如圖6所示。

圖6 不同小波包分解層數的平均分類準確率Fig.6 The average classification accuracy of different wavelet packet decomposition levels
從圖6可以看出,分解層數低于6層時,平均分類準確率隨分解層數的增加而增加,在分解層數為6時達到最大值,當分解層數大于6時,平均分類準確率呈下降趨勢。在綜合分類精度與計算時間的考慮下,選擇6層小波包分解提取光纖振動信號的特征。
由于不同特征的幅值數量級相差較大,為了防止幅值較小的特征在分類時失去作用,采用Max-Min歸一化對特征向量x=(x1,x2,…,xn)進行處理。
(8)
式(8)中,x′i為歸一化后的結果;xi為原始數據;xmax、xmin分別為所對應參數的最大值和最小值。
采用的數據集共包含15 612個樣本,將其中的70%(10 928個樣本)劃分為訓練樣本,另外的30%(4 684個樣本)劃分為測試樣本,采用提出的模式識別算法進行分類,將分類過程重復多次以獲得平均結果,為了分析本文算法的分類性能,分別給出6種事件的混淆矩陣和入侵事件(包括挖掘、敲擊、搖晃)與非入侵事件(包括背景噪聲、澆水、行走)的混淆矩陣,分別如圖7、圖8所示。

混淆矩陣對角線上的值表示正確的分類結果

混淆矩陣對角線上的值表示正確的分類結果
從圖7中可以看出,本文算法對6種事件分類的準確率均超過了90%,平均分類準確率達到95.6%,其中,挖掘、澆水和搖晃事件在識別時有一些偏差,4.0%的挖掘事件被識別為敲擊事件,6.0%的澆水事件被識別為搖晃事件,5.3%的搖晃事件被識別為澆水事件,這與它們的時域特征相似有關。入侵事件識別的準確率達到96.9%,非入侵事件識別的準確率為96.4%。為了進一步分析分類器性能,表2給出6種事件的精確率、召回率和F1值。

表2 算法評價指標Table 2 Algorithm evaluation index
在樣本數據一致和特征向量提取方法相同的情況下,使用SVM、GA-SVM等常用分類算法對6種事件進行識別,結果如表3所示。可以看出,SVM、GA-SVM的平均分類準確率分別為90.7%、93.6%,PSO-SVM的平均分類準確率最高,為95.6%,說明PSO-SVM能夠更有效地識別光纖振動信號。

表3 不同分類算法的平均分類準確率Table 3 Average classification accuracy of different classification algorithms
(1)針對Φ-OTDR系統中誤報率高的問題,提出了一種多域特征提取與PSO-SVM算法相結合的模式識別方法。該方法突破了單一特征參量事件識別準確率低的問題,提高了系統的可靠性。
(2)通過對數據集中的樣本進行不同層數的小波包分解以確定最優分解層數,提取相應分級層數的小波包能量后與時域特征相結合組成特征向量,并將其放入分類器中訓練,對6種事件(背景噪聲、挖掘、敲擊、澆水、搖晃、行走)分類的準確率分別為100%、92.0%、99.3%、92.7%、94.3%、95.0%,平均分類準確率達到了95.6%。
(3)在樣本數據一致和特征向量提取方法相同的情況下與SVM、GA-SVM進行對比,結果表明:所提出的模式識別方法能夠較好地識別不同類型的擾動事件,可為Φ-OTDR系統性能的進一步提高提供有益參考。