朱利明, 卓靜超, 邢世玲
(南京工業大學交通運輸工程學院,南京 210000)
橋梁結構健康監測(structural health monitoring,SHM)系統近年來已經成為了特大橋、大橋,甚至中小橋必不可少的一部分。SHM系統采集了大量監測數據,而對這些數據的分析預測是對后續結構評估和安全預警的重要一步。
橋梁SHM的監測數據是以時間序列的形式存在的,因此對監測數據的分析預測即對時間序列進行分析。唐浩等[1]對西安白蛇峪大橋SHM系統的應變監測數據建立了自回歸滑動平均(autoregressive moving average,ARMA)模型,預測誤差基本小于10%,具有很好的預測效果。曾發明等[2]采用了乘積季節求和自回歸移動平均(autoregressive integrated moving average,ARIMA)模型用準確地預測了橋梁拱座位移。在橋梁SHM領域,監測數據時間序列法分析預測大都還停留在經典時間序列分析理論的應用上,且多采用單一預測模型。由于外部或傳感器自身的原因難免會產生很強的非平穩隨機波動,并且存在模態混疊,此時采用經典時間序列分析理論進行分析預測就會產生比較大的誤差。帶自適應噪聲的完全集成經驗模態分解 (complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)是目前最新的一種經驗模態分解方法[3],可以自適應地按照不同頻帶將信號進行分解,非常適用于非平穩信號的分析處理。CEEMDAN方法由經驗模態分解 (empirical mode decomposition,EMD)[4]、集成經驗模態分解 (ensemble empirical mode decomposition,EEMD)[5]和互補集成經驗模態分解 (complementary ensemble empirical mode decomposition,CEEMD)[6]發展而來,有效解決了模態混疊的問題并減小了重構誤差,節約了計算時間。
針對經典時間序列分析理論在橋梁SHM監測數據分析預測上的不足,提出了一種基于CEEMDAN-NAR-ARIMA的組合預測模型,并通過上海市某斜拉橋SHM實測應變監測數據進行了驗證。
CEEMDAN是EMD方法的最新研究進展,其具體算法如下:
對原始信號x(t)添加服從標準正態分布的白噪聲β0w(t)(i),i=1,2,…,I,I為試驗次數。
(1)對每一個x(t)(i)=x(t)+β0w(t)(i),i=1,2,…,I都進行EMD分解,得到第一模態分量函數imf1及余量r1:

(1)
r1=x(t)-imf1
(2)
式(1)中,E為EMD分解運算符。
(2)對余量r1添加白噪聲β1E1[w(t)(i)]形成新信號,再進行EMD分解得到新信號的第一模態分量函數作為原信號的第二模態分量函數imf2:

i=1,2,…,I
(3)
(3)對于k=2,3,…,K,計算第k個余量:
rk=rk-1-imfk
(4)
(4)在每一個階段都加入白噪聲形成一個新信號,并計算該信號的第一模態分量作為原信號新的模態分量,則第k階模態分量函數:

i=1,2,…,I
(5)
(5)重復(3)、(4),直到余量不能被EMD進一步分解,或滿足IMF條件或少于三個局部極值,此時即找出了所有的imf分量。
將所有分量進行重構得到原始信號:

(6)
CEEMDAN在計算過程中,允許在每一個分解階段添加的白噪聲中選擇合適的信噪比(signal-noise ratio,SNR),所以計算過程是自適應的。
通過信號分解有可能得到大量的信號時間序列分量,這些分量的實際意義通常很難進行判別。為了解決這一問題,引入了Bandt等[7]提出的一種算法—排列熵 (permutation entropy,PE)算法。PE算法可以很好地反映一個一維時間序列的復雜程度,具有計算簡單、抗干擾能力強、對時間序列變化敏感、分辨率高的優點[8]。
PE算法的總體思路是計算時間序列的平均熵參數,熵值越大,時間序列的隨機性越強;反之,時間序列越規則。其算法的計算步驟如下:
(1)對一個一維時間序列{x(t),t=1,2,…,n}進行相空間重構,得到重構矩陣:

(7)
式(7)中,j=1,2,…,n-(m-1)τ;τ為延遲時間;m為重構維數。
(2)重構的行向量Yj=[x(j),x(j+τ),…,x(j+(m-1)τ)],j1,j2,…,jm為各個元素所在列的索引,將其元素根據數值的大小按照升序進行重新排序,如相鄰元素數值相等,則按照索引的前后順序進行排列,重構矩陣的每組行向量均可以得到一組符號序列S(r)=(j1,j2,…,jm),r=1,2,…,l。顯然符號序列S(r)排列數量l至多有m!種。
(3)計算每種符號序列S(r)出現的概率P1,P2,…,Pl,用Shannon熵的形式定義時間序列的排列熵Hp(m)為

(8)
(4)為了方便,通常將排列熵Hp(m)進行歸一化。從式(8)可以得出,當Pr=1/m!時,Hp(m)有最大值ln(m!),因此對Hp(m)進行歸一化:

(9)
歸一化排列熵Hp顯然在[0,1]范圍內,Hp反映了時間序列的復雜程度,其值越小說明時間序列越規則,反之則越隨機。將信號分解產生的大量信號時間序列分量利用PE算法計算出各個分量的熵值,可以定量判斷各個分量的隨機性程度,并以此為依據對各個分量進行分類,合并同類型的分量,來達到減少信號分量提高計算效率的目的。
ARIMA預測模型是時間序列分析最為經典的理論,可以對非平穩時間序列進行預測。ARIMA(p,d,q)表現形式為
Φ(B)dxt=Θ(B)εt
(10)

ARIMA預測模型的一般步驟為:時間序列的平穩性和純隨機性檢驗,模型識別,參數估計,模型檢驗和數據預測。其具體過程詳見文獻[9]。

圖2 基于CEEMDAN-NAR-ARIMA組合模型預測流程Fig.2 Prediction flow based on CEEMDAN- NAR-ARIMA combination model
非線性自回歸(nonlinear auto regressive,NAR)神經網絡模型是一種用于分析時間序列的動態神經網絡模型。之所以稱之為動態神經網絡是相較于靜態神經網絡而言的。一個神經網絡包含輸入層、中間層和輸出層,如果在傳遞過程中信息只是單向的從輸入層傳遞到輸出層,中間信息沒有任何反饋,則該網絡是靜態的,比如常見的BP神經網絡;如果在傳遞過程中,輸出信息作為輸入信息反饋到上一層中,則該網絡是動態的。動態神經網絡的這一性質,在時間系列分析中非常的適用。NAR動態神經網絡本質上就是靜態神經網絡結合輸出反饋,其網絡結構如圖1所示。

圖1 NAR動態神經網絡結構及工作流程Fig.1 NAR dynamic neural network structure and workflow
從圖1可以看出,NAR動態神經網絡由輸入層(input layer)、隱含滯后層(hidden layer with delays)、輸出層(output layer)構成,W為連接權值,b為閾值,這一過程可以表述為
y(t)=f[y(t-1),y(t-2),…,y(t-l)]
(11)
式(11)中,l為滯后階數。從式(11)中可以看出,NAR動態神經網絡是一個自回歸過程,輸出值取決于以往的值,而輸入值為前一次的輸出值。
綜合上述的理論,將SHM監測數據利用信號分析方法進行分解與處理,然后用不同的模型對分解的信號進行預測,最后將預測值疊加,得到組合模型的預測值。提出的基于CEEMDAN-NAR-ARIMA組合模型的應變監測數據分析預測流程如圖2所示。
本案例選取了上海市某斜拉橋2017年7月1~5日的跨中腹板應變健康監測數據樣本,共720期數據,每期間隔10 min。采用這些數據樣本進行應變監測數據的預測并驗證提出的組合模型的適用性。圖3為某斜拉橋跨中應變監測數據時序圖。

圖3 應變時序圖Fig.3 Strain sequence diagram
將應變監測數據看作為信號數據采用CEEMDAN方法對應變時間序列進行分解。圖4為分解的結果,得到7個imf分量和一個余量r,其按照頻率從高到低進行排列,通過觀察亦可發現其隨機程度也是按照從高到低排列的。

圖4 應變數據CEEMDAN分解Fig.4 CEEMDAN decomposition of strain data
經過CEEMDAN分解后得到的應變分量比較多,而且性質不夠明顯,只能夠定性判斷其隨機程度的高低,直接進行數據預測會增加計算難度和降低預測準確性。因此,使用PE方法計算出各個分量的熵值,對其進行分類重組。
分別計算每一個分量的熵值。根據經驗,PE計算參數重構維數m通常為3~7,延遲時間τ通常為1[10]。本例中,m=3,τ=1,PE計算結果如圖5所示,各分量PE分別為0.995、0.863、0.692、0.535、0.463、0.430、0.408、0。

圖5 各分量的PEFig.5 PE of each component
從圖5可以看出,隨著頻率的減小,各分量的PE也逐漸減小,即隨機程度越來越小。其中imf1分量隨機程度最大,和imf2、imf3、imf4一同,PE呈現線性下降的趨勢,因此,可以把這些分量歸為一組進行合并重組為c1;從圖5中可以看出imf5、imf6、imf7的PE呈現出一個較為平緩的平臺,其隨機程度較為類似,進行合并重組為c2;余量r的PE=0,從圖4也能看出余量r為一組線性的序列,是十分平穩的序列,所以可以把余量r單獨列為一組c3。進行PE重組后的情況如圖6所示。

圖6 經過PE重組后的新序列Fig.6 New sequence after PE recombination
從圖6中可以看出,重組后的分量已從原來的8個分量減少到了3個分量,大大減少了計算分析的數量。并且根據橋梁SHM的工程經驗,從圖6中還可以推測出各個分量所代表的實際物理含義。分量c1代表了隨機程度高的監測數據,可以近似地認為是車輛荷載、風荷載等一系列隨機荷載的應變響應集合;分量c2有著明顯的周期性,周期與日照一致,因此可以認為其代表日照變化導致的溫度應變響應;而分量c3為線性的時間序列,顯然可以認為其為季節性整體溫度變化產生的溫度應變響應。
從圖6中可以看出,分量c1的隨機程度最強,分量c2呈現出比較明顯的周期性,而分量c3則近似為線性。因此分別采用NAR動態神經網絡模型、ARIMA模型和線性回歸模型對分量c1、c2、c3進行50期長度的預測。
NAR動態神經網絡建模參數如下:數據劃分為70%訓練數據、15%測試數據、15%驗證數據;滯后階數為7階;隱含層神經元個數為13個;訓練方法為Levenberg-Marquardt算法;訓練次數為50次。ARIMA模型采用ARIMA(1,1,0)模型,自回歸階數p為1,差分次數d為1,移動平均階數q為0。
基于CEEMDAN-NAR-ARIMA組合模型應變預測結果和實測值對比如圖7所示。
為了驗證基于CEEMDAN-NAR-ARIMA的組合模型的有效性,還同時分別建立了單一ARIMA模型、單一NAR模型和基于CEEMDAN的單一ARIMA模型對應變健康監測數據進行預測。4種模型的預測結果如圖7所示。

圖7 各模型應變預測圖Fig.7 Strain prediction of each model
圖8為4種預測模型的預測效果對比圖。從中可以比較明顯地看出,單一ARIMA模型、單一NAR模型的預測效果較差,經過CEEMDAN處理后的2個預測模型的預測效果較好,其中組合模型的預測效果最佳。

圖8 4種預測模型應變預測圖Fig.8 Strain prediction of 4 models
為了進一步定量的判斷各個模型的預測效果,采用均方誤差(mean square error,MSE)、平均絕對百分比誤差(mean absolute percent error,MAPE)和可決系數(coefficient of determination,R2)三種統計學指標來評價模型的性能。MSE代表實測值與預測值點與點之間的誤差,可以比較不同預測模型的穩定性,是應用最廣的指標之一;MAPE不僅考慮預測值與真實值的誤差,還考慮了誤差與真實值之間的比例,是一個預測準確性的衡量指標;R2表示總離差平方和中可以由回歸平方和解釋的比例,代表回歸效果的好壞。MSE、MAPE越小,R2越大,說明模型的預測性能越好。
表1為4種模型統計學指標的對比表。從表中可以看出,基于CEEMDAN-NAR-ARIMA的組合模型預測效果最好,基于CEEMDAN的單一ARIMA模型次之,而ARIMA模型、NAR模型性能最差,其R2統計指標為0.12左右,說明50期長度的預測是沒有意義的。對比結果表明,在對橋梁SHM應變監測數據的預測中,經典的時間序列預測模型已經不能滿足預測精度的要求,而組合模型能夠更加精確地對非平穩的應變監測數據進行預測,具有明顯的優勢。

表1 6種預測模型的統計指標對比
基于EMD方法的最新成果CEEMDAN方法,并結合NAR動態神經網絡和經典時間序列分析理論的ARIMA模型組成組合了預測模型,應用于橋梁SHM應變監測數據的分析預測上,經過上海市某斜拉橋SHM系統實測應變數據驗證,得到如下結論。
(1)CEEMDAN方法可以有效地分解出橋梁的隨機荷載響應、周期性溫度響應和整體升降溫響應。
(2)通過PE算法可以有效地減少CEEMDAN方法分解出的imf分量,大大減小了計算量。
(3)將NAR動態神經網絡與經典時間序列ARIMA預測模型進行組合,相比單一模型,有效地提高了預測模型的準確性。