李榮磊, 裴莉莉, 關 偉, 袁 博, 李 偉
1(長安大學 信息工程學院, 西安 710064)
2(交通運輸部公路科學研究所, 北京 100088)
我國交通部建立了足尺路面環道試驗場[1]來更好地研究道路結構、交通荷載、氣候狀況等因素對道路壽命的影響問題, 通過埋設傳感器對瀝青路面各項性能進行測量[2], 感知數據基本能夠反映不同路面結構的健康狀態. 為能夠準確研究車輛輪跡帶的分布所導致的路面受力情況的不同, 從而進行全路域受力分析以及研究車轍演變規律, 需要及時發現該類感知數據的異常, 因此本文對車轍兩側壓力感知數據展開研究.
傳統的異常數據辨識需要結合主觀判斷來完成,在篩查過程中需要耗費大量時間和精力, 同時人工篩查的結果在很大程度上受到人為因素的影響, 無法得到客觀準確的分析結果, 導致在評價道路健康狀況時出現偏差[3-6]. 近年來不少學者在數據自動檢測和異常辨識方面展開了研究. Park 等人[7]提出了一種基于不同感知數據的深度學習網絡來辨識車輛行駛位置的方法. 在網絡設計中采用了長短時記憶單元和集成學習,并采用了特征選擇技術, 在不損失性能的前提下排除了不必要的感知數據. 通過實驗對所提出的深度學習網絡結構進行了訓練和驗證. 通過4 種不同的試驗驗證了該方法具有良好的分類性能. 金鵬等人[8]提出了一種利用深度信念網絡對傳感器異常數據進行檢測的算法. 創新點在于對高維數據進行降維, 主要處理方法是利用文章中提到的深度信念網絡對數據的特征進行提取, 并利用QSSVM 結合滑動窗口模型針對降維后的數據實現了在線實時監測, 新算法不僅降低了時間復雜度, 而且獲得了更好的檢測效果. 使用了抽樣的方法對數據做了相應的預處理以統一尺度, 之后將處理好的數據切片作為原始輸入數據, 利用包含4 層特征提取層的網絡模型進行訓練, 相比其它傳統方法提高了檢測精度. 錢宇騁等人[9]針對在線監測數據中異常值特點, 以及一般的異常狀態檢測方法是基于閾值, 噪聲數據難以及時甄別的問題, 提出了一種基于灰色關聯度和K-means 聚類的方法, 并通過某變電站的在線監測數據對此算法進行驗證, 結果表明此方法準確率高, 具有一定的實用價值. 陸秋琴等人[10]提出了一種組合異常數據檢測算法(SWDS-LOF)以檢測異常值, 并利用多項式擬合的方法對異常數據進行修正. 最終以某汽車公司的監測數據為例進行實證分析并驗證所提算法和所建模型, 檢測所得效果優異, 證明了此方法的有效性.
以上提到的對傳感器異常數據辨識方法大多采用的是長短時記憶單元、聚類、閾值分割等, 數據的選取需要結合橋梁等各類復雜場景[11-13], 對數據的格式要求較高, 數據的預處理往往比較復雜[14], 之后還需要建立具體的模型不斷進行調優[15], 效率低下且檢測精度不高.
為解決足尺環道試驗場海量感知數據異常辨識問題[16], 本文將數據可視化為圖像, 在數據預處理方面不需要過于復雜的操作. 在圖像分類方面, 深度學習方法往往是一種不錯的選擇, 其不僅具有可觀的檢測速度,而且經過結構與參數上的調優, 最終能達到良好的效果[17]. 本文根據數據的各項特征選擇輕量級的卷積神經網絡模型GhostNet[18]進行參數與結構上的設計, 對異常數據進行辨識, 并選擇傳統的ResNet50[19]分類模型進行對比實驗, 證明了該異常辨識方法的有效性.
本文首先提取出了原始的足尺環道傳感器加載數據, 結合數據特征并通過相關的可視化方法對數據類型進行了轉換. 將可視化后的數據作為原始數據集, 結合數據特征較簡單的特點選取了輕量級的卷積神經網絡模型GhostNet, 設計了一系列輸入參數并對其進行訓練、測試, 結果良好. 同時又使用傳統的ResNt50 模型進行測試并對比分析. 整體研究步驟如圖1 所示.

圖1 實驗技術路線
訓練好的網絡里的特征圖往往存在很多冗余信息,大部分特征長得很相似, 對于這些長得很相似的特征,我們可以通過簡單的線性變化或者濾波得到, 就沒必要通過復雜的卷積運算了, GhostNet 就是基于這種思想所設計的. 如圖2.
Ghost 模塊如圖2 所示, 可以看到, Ghost 模塊分成3 步:

圖2 Ghost 模塊
(1)首先將輸入的特征圖進行卷積, 但是與常規卷積中輸出的通道數為N不同, 首先通過對輸入進行卷積得到特征圖, 其輸出的通道數為N/2;
(2)隨后將特征圖的每個通道單獨進行某種“線性變換”;
(3)最后, 把第1 次卷積和第2 次卷積得到的特征圖拼接在一起, 得到輸出.
Ghost bottleneck (G-bneck)與residual block (殘差模塊)類似, 主要由兩個Ghost 模塊堆疊兩次, 第1 個模塊用于增加特征維度, 增大的比例稱為膨脹率, 而第2 個模塊則用于減少特征維度, 使其與輸入一致.
G-bneck 包含步長為1 和步長為2 版本, 對于步長為2, shortcut 路徑使用下采樣層, 并在Ghost 模塊中間插入步長為2 的縱深卷積. 為了加速, Ghost 模塊的原始卷積均采用點態卷積. G-bneck 結構圖如圖3.

圖3 G-bneck 結構
ResNet 提出了殘差學習的思想, 所謂殘差學習是指將輸入信息直接傳遞到輸出, 與逐層傳遞不同, 這樣的方式可以最大程度的保護信息的完整性, 整個網絡只需要學習輸入和輸出之間差異的一部分, 從而簡化了學習目標, 降低了學習難度. 該模型首先對輸入做了卷積操作,之后經過4 個殘差塊, 最后進行全連接操作以便進行分類任務, 網絡結構示意圖如圖4 所示.

圖4 ResNet50 整體結構圖
本文采用的實驗數據取自交通部足尺路面環道試驗場, 其中結構響應狀態采集系統由若干個相關的傳感器和數據采集單元組成, 能夠實時、全方位的采集到各類動態響應數據. 比如溫濕度傳感器、多點位移計、基底應變計等, 采集的數據能夠一定程度上反映路面結構性能的變化. 本文選取型號為L140 的土壓力計來分析其采集到的異常數據, 傳感器特征如圖5 所示, 其主要技術參數如表1, 其中, F.S.表示滿量程輸出.

圖5 Sisgeo L140 土壓力盒圖

表1 傳感器主要技術參數
路面埋設的傳感器在不停歇采集數據, 除了車輛負載所產生的加載數據外包含許多無用的噪聲, 因此第一步需要先將目標數據采用特定軟件截取出來. 此時得到的加載數據特征復雜難以直接進行處理分析,本文選擇將數值型數據轉換成圖像進行處理, 數據可視化工具如圖6 所示.

圖6 DynamicAnalysis 數據可視化工具
本文選取2019 年1 月到3 月足尺環道STR3路段編號為P151827 的土壓力計采集到的數據來進行處理并作相應的分析. 感知數據經過可視化處理后可分為以下兩種情況: 正常數據與異常受干擾數據, 如圖7 所示.

圖7 正常數據與異常數據
得到兩類共計2 211 張圖像, 其中第一類包括1 099張, 第二類包括1 112 張.
分別對GhostNet 模型和ResNet50 模型進行訓練,可得到在訓練集上的模型精確率和損失變化曲線如圖8 及圖9 所示.

圖8 GhostNet 模型訓練集acc 和loss 曲線圖

圖9 ResNet50 模型訓練集acc 和loss 曲線圖
由圖8 分析可知, 模型收斂速度快, 精度也較高,而從圖9 可知, ResNet50 網絡在第8 次迭代之后, 準確率與loss 值基本不再發生變化, 打印網絡參數可知靠后的網絡層各項參數也基本不再發生變化. 這表明模型已經“過度學習”了, 我們推測由于模型的復雜度與數據特點并不匹配從而導致訓練極易產生過擬合現象,同時模型參數初始化之后也需要重新設計.
在對模型參數進行優化并且使學習率和優化器都與GhostNet 相統一后, 繼續訓練模型, 分別選擇正常數據99 張, 異常數據112 張圖像作為驗證集并對其進行測試. 兩個網絡的測試結果用混淆矩陣表示, 分別如圖10, 圖11 所示.

圖10 GhostNet 模型驗證集結果混淆矩陣

圖11 ResNet50 模型驗證集結果混淆矩陣
結合驗證集混淆矩陣的結果, 計算模型評價量化指標, 如表2 所示.
我們選擇的輕量級的網絡模型GhostNet 的訓練及測試結果如圖11 及表2 所示, 異常數據的辨識準確率約為99%, 精度相比最開始選用的ResNet50 模型改善較明顯, 速度相比ResNet50 模型也有較大提升.

表2 異常數據辨識精度評價指標
通過上述方法我們能夠快速準確的在海量加載數據中完成對異常數據的辨識, 后續我們可以根據異常數據對應的時空信息我們可以對異常數據的來源進行具體的分析并定位, 對未來的傳感器故障檢測、路面破損研究也具備重大的現實意義. 部分異常數據對應的時空信息如表3 所示, 從表中可以知道異常數據發生的時空信息, 例如由表3 可知位于瀝青層下12 cm處的土壓力計在6 點25 分29 秒左右采集到的數據為異常數據.

表3 異常數據對應時空信息
本文結合數據可視化算法并利用GhostNet 網絡完成了對道路動態高頻感知數據的異常辨識問題, 主要結論如下:
1) 本文選取足尺環道STR3 路段傳感器編號為P151827 的土壓力計所采集的數據進行分析, 將加載過的動態高頻數據通過可視化的方式進行提取, 構建數據集.
2)采用ResNet50 網絡模型對可視化數據進行訓練和測試, 分析發現可能是由于網絡參數量過多和結構復雜等原因使檢測結果易發生過擬合現象, 經過調整學習率和優化器, 使之與GhostNet 模型參數基本保持一致之后, 檢測精度明顯提升, 但速度上仍然存在不足.
3)選取一個更輕量級的神經網絡模型GhostNet,對該網絡進行訓練并在驗證集上進行測試, 實現了對異常數據的辨識, 且檢測速度和檢測精度均有較大提升, 最終檢測精度能夠達到99%左右, 檢測速度也由原來的分鐘級提高為秒級.
本文提出的基于輕量級網絡GhostNet 的異常數據辨識模型, 能夠有效快速地監測道路海量動態高頻感知數據中的異常, 為道路傳感器故障監測、路面健康狀況研究提供有力的數據支持.