康 健,唐力偉,左憲章,李 浩,張西紅
(1.軍械工程學院,石家莊 050003;2.72889部隊,河南 新鄉 453636;3.63880部隊,河南 洛陽 471003)
傳感器網絡的發展受到包括能量供應、數據處理能力等諸多條件的限制和挑戰[1],這就決定了傳感器網絡難以傳輸大量的感知數據。如何有效地融合這些感知數據,去除冗余信息,減少網絡傳輸量,優化網絡性能,提高資源的利用率,從而延長網絡生命周期,一直是傳感器網絡研究的重要課題。
在傳感器網絡中,可根據傳感器節點采集的系統有限長度的運行記錄,建立能夠反映時間序列中所包含的動態依存關系的數學模型,并且對系統的未來行為進行預測。通過預測,減少不必要的數據傳輸,從而降低網絡能耗,延長網絡生命周期。在基于預測的傳感器網絡數據融合中,如何根據采集的數據類型進行數據樣本及預測融合算法的選擇是問題的關鍵所在。
Sharaf等人[2]提出了一種網內融合的機制TiNA(temporal coherency-aware in-network aggregation)。該機制對于監測數據波動較小的應用十分有效,能顯著地減少網絡中的數據傳輸量。然而,TiNA對于節點存儲空間的要求比較高。Santini和Romer提出了一種基于最小二乘濾波的雙重預測策略[3],在資源節點和匯集節點同時實施此策略。Borgne等人[4]進一步發展了這種思想,提出了時間序列預測的自適應模型選擇算法。該算法中,傳感器節點自適應地從多個備用模型中選擇性能最優的模型進行預測,取得了較好的效果。回春立和崔莉[5]提出了傳感器網絡中基于預測的時域數據融合技術。數據融合算法使用時間序列模型進行預測,模型的復雜度與網絡規模無關,因此數據融合算法具有較好的可擴展性。
上述方法均未考慮到傳感器網絡采集到的數據的非平穩性、非線性、隨機性以及突變情況。而灰色理論把一切隨機變量、隨機過程均看作灰色變量、灰色過程,具有處理隨機過程、突變的能力。核偏最小二乘法既吸取了核函數能夠擬合適應任意連續變化曲線的優點,又借鑒了偏最小二乘法能夠有效解決自變量集合高度相關的技術[6]。核偏最小二乘法不僅能夠有效實現自變量對因變量的整體預測,而且能夠提取各維自變量對因變量的單獨非線性作用特征,從而確定數據系統內部的復雜非線性結構關系,增強了模型的可解釋性。因此,本文提出了一種基于灰色Morlet小波核偏最小二乘的預測融合模型(GMWKPLS),綜合運用了灰色理論處理隨機過程、突變的能力以及核偏最小二乘法將非線性問題轉化為擬線性問題,從整體擬合和結構分析上均達到較高的精度的優勢,通過動態實時預測,減少數據傳輸量,從而降低網絡能耗,延長網絡的生命周期。
灰色預測模型是由灰色理論的微分方程所建立的。灰色系統理論運用基于關聯度收斂原理、生成數、灰導數、灰微分方程等觀點和方法建立了微分方程模型[7],微分方程的系數則描述了人們所希望辨識的系統內部的物理或化學過程的本質。
灰色模型首先對原始序列進行累加生成(或累減生成),將原始數據整理成規律性較強的生成序列再做研究。這種灰數的形成,就是從原始數據中去尋找其潛藏著的內在規律,這是一種現實規律,不是先驗規律。然后利用規律性較強的生成序列建立預測模型,最后將所得預測結果進行“累減還原”,得到原始序列的預測值。
核偏最小二乘的基本思想是將輸入通過非線性函數映射到高維特征空間,在特征空間再運用線性偏最小二乘算法,這樣特征空間的線性PLS就對應原輸入空間的非線性關系。
設有 p個自變量{x1,x2,…,xp}和 q個因變量{y1,y2,…,yq},樣本點 n個,構成自變量矩陣 X={x1,x2,…,xp}n×p與因變量矩陣 Y={y1,y2,…,yq}n×q。核偏最小二乘法首先將X進行核函數變換為K,然后分別在K和Y中提取成分 t1和 u1,t1和 u1分別是 k1,k2,…,kp和 y1,y2,…,yq的線性組合,并且 t1和 u1需滿足下列要求:
(1)t1和u1應盡可能多地攜帶它們各自數據矩陣中的變異信息;
(2)t1和u1的相關程度能夠達到最大。
在第一個成分t1和u1被提取后,核偏最小二乘法分別實施K對t1的回歸以及Y對t1的回歸,如果回歸方程已經達到滿意的精度,則算法終止;否則,將利用K被t1解釋后的殘余信息以及Y被t1解釋后的殘余信息進行第二輪的成分提取。如此循環,直到能達到一個較滿意的精度為止。若最終對K共提取了m個成分t1,t2,…,tm,偏最小二乘法將通過實施 Y 對 t1,t2,…,tm的回歸,然后再表達成Y關于原變量k1,k2,…,kp的回歸方程,至此核偏最小二乘建模完成。
核是定義在原始空間的一個雙變量函數,但它卻實現了某一高維空間的內積,提供了把線性學習機擴展到非線性學習機的手段。Mercer定理給出了一種判定核函數正定的條件,而現有的KPLS方法大都使用高斯RBF核函數,即k(x,z)=exp(-/σ2),實現具有非線性變換的偏最小二乘算法。本文基于小波分析技術,采用對數據變化趨勢刻畫能力較強的Morlet母小波來構造小波核函數,以提高其學習性能。在Mercer定理基礎上,首先給出判斷和構建核函數的定理 1 和定理 2[8-9]。
定理1 平移不變核函數k(x,z)=k(x-z)是一個允許的支持向量核函數,當且僅當傅里葉變換

成立。
定理2 若ψ(x)為母小波函數,伸縮因子為σ,平移因子分別記為 m 與 d,其中 m,d,x,z∈RN,xi,zi,σ,mi,di∈R,則下式給出的滿足平移不變性定理的張量積小波核是可允許的多維支持向量核函數

為構造一種平移不變小波核函數,不失一般性,可選擇Morlet母小波,即:

其中,N為輸入x的維數。
定理3 若給定Morlet母小波函數如(3)式所示,伸縮因子為 σ,其中 x,z∈RN,σ,xi,zi∈R,則下式所表示的小波核函數就是一種可允許的多維張量積的支持向量核函數

證明:
根據定理1和定理2,只需證下列不等式成立即可:

其中:

利用歐拉(Euler)公式ejx=cosx+jsinx以及

則小波核函數的傅里葉變換為:

又因為伸縮因子(尺度參數)σ≠0,且N≥1,所以F[k](ω)=≥0。證畢
定義:時間序列 T={x1,x2,…,xN},其中 xi為第 i時刻的數值,i=1,2,…,N。
對于給定的時間序列{x1,x2,…,xN},假設已知xi預測xi+1,則可以建立映射:

滿足:

其中,m稱為嵌入維數,即模型的階數。采用最終誤差預報準則(Final Prediction Error,FPE)評價模型的預測誤差,并根據誤差大小選取嵌入維數m。經過變換后,得到用于預測器學習的樣本:

灰色Morlet小波核偏最小二乘預測模型(GMWKPLS)的設計思想如下:首先利用灰色預測方法將原始序列進行一次累加生成,得到生成序列;然后利用Morlet核偏最小二乘法擬合非線性數據能力的優勢對生成序列建立預測模型;最后將預測結果進行累減還原得到預測值,并根據數據的動態增減策略,更新原始數據序列,進行循環運算。
預測模型建立的具體步驟如下:
步驟1:數據灰色處理。首先對采樣原始序列X(0)={x(0)(1),x(0)(2),…,x(0)(n)},x(0)(i)>0,i=1,2,…,n,進行一次累加得生成序列 X(1)={x(1)(1),x(1)(2),…,x(1)(n)},其中:2,…,n。根據上述預測器學習樣本建立的方法,將累加生成序列作為GMWKPLS的學習樣本X和Y。
步驟2:數據標準化和Morlet核變換處理。對生成序列數據做標準化處理,即對數據同時進行中心化——壓縮處理。然后對標準化處理后的自變量數據矩陣 E0=(E01,E02,…,E0p)n×p,進行 Morlet小波核函數變換,得變換后的核數據矩陣 K0=(K01,K02,…,K0p)n×p。記標準化處理后的因變量數據矩陣為F0=(F01,F02,…,F0q)n×q。標準化公式如下

步驟3:提取成分,建立預測方程。記t1、u1分別是K0、F0的第一個成分,求解 t1=K0w1,u1=F0c1。其中,w1、c1分別是K0的第一個軸和F0的第一個軸,并且是最大特征值對應的單位特征向量,即然后,分別求K0和 F0對 t1和u1的兩個回歸預測方程:

步驟4:循環提取成分。用殘差矩陣K1和F1取代K0和F0,然后求第二個軸w2和c2以及第二個成分t2、u2和相應的回歸預測方程。其中
步驟5:模型驗證。進行交叉有效驗證(Cross Validation),確定提取的成分數。一般采用舍一交叉驗證。如通過驗證,轉到步驟4提取下一個成分;否則,轉到步驟6。
步驟6:預測方程模型。如果K的提取的成分個數為A,則有:

由于 t1,…,tA均可由 K1,…,KA線性表示,所以式(10)可以還原成K的線性表達式,得到最終的多維輸入多維輸出預測模型:


其中,l=m+1,m+2,…,n。
步驟8:更新數據。使用滑動窗方法動態地增減X(0)={x(0)(1),x(0)(2),…,x(0)(n)}中的數據,對其進行更新,然后,從步驟1進行循環運算。
在齒輪箱故障診斷實驗臺上,測得齒輪箱主動齒輪(小齒輪)出現斷齒情況下的升速過程中的時域振動信號,如圖1所示。由信號的波形可以看出:其幅值隨著轉速的波動而變化,是一個明顯的非平穩過程。

圖1 齒輪箱斷齒工況升速過程中振動信號Fig.1 Vibration signals of gear tooth breakage in speed of rising
選取振動信號的前600個數據作為樣本數據,后300個數據作為預測數據。在GMWKPLS預測融合模型中,采用構造的Morlet小波核函數,其中,核函數參數σ =4,潛在特征參數為8。隨著預測融合的進行,對歷史數據進行了動態更新,依據最終誤差預報準則,采取單步預測策略。這樣做的主要目的是保證預測結果具有較高的精確性和可靠性。
為了對比預測精度和有效性,還使用灰色RBF核偏最小二乘模型(GRBFKPLS)和RBF核偏最小二乘模型(RBFKPLS)對原始數據進行預測融合,對比情況如圖2~圖7所示。其中,GRBFKPLS的核函數參數為σ =2.6,潛在特征參數為13;RBFKPLS的核函數參數為 σ =0.08,潛在特征參數為18。

圖2 GMWKPLS預測值與實際值Fig.2 The values of prediction and origin for GMWKPLS

圖3 GMWKPLS預測誤差Fig.3 Prediction error of GMWKPLS

圖4 GRBFKPLS預測值與實際值Fig.4 The values of prediction and origin for GRBFKPLS

圖5 GRBFKPLS預測誤差Fig.5 Prediction error of GRBFKPLS

圖6 RBFKPLS預測值與實際值Fig.6 The values of prediction and origin for RBFKPLS

圖7 RBFKPLS預測誤差Fig.7 Prediction error of RBFKPLS
從圖2~圖7中可以看出,采用GMWKPLS取得的預測效果比GRBFKPLS和RBFKPLS的都好。GMWKPLS的預測誤差最小,其次為GRBFKPLS,而RBFKPLS的預測誤差最大。GMWKPLS和GRBFKPLS的預測誤差比RBFKPLS的預測誤差小得多。GMWKPLS的預測誤差范圍在±0.15%以內,GRBFKPLS的預測誤差范圍在 ±1.5%以內,而 RBFKPLS的最大預測誤差超過10%。
其次,由于采用的是斷齒工況升速過程振動信號,開始所用數據不能表示后面數據大幅變動的特征現象,從而導致誤差曲線在1.3709 s~1.3787 s之間會有些振蕩。然而,隨著動態更新數據,一旦更新后的數據能夠表示信號的本質特征,誤差曲線中的振蕩就會消失,誤差曲線就會趨近于平穩狀態。
另外,通過進一步分析,在GMWKPLS中,預測誤差的大小與數值的突變程度近似成正比。而在GRBFKPLS和RBFKPLS中,這種規律卻不明顯,也就是說預測模型的可靠性不高,原因在于數據的隨機波動對預測模型的建立有一定的影響。
從平均絕對百分誤差(mean absolute percentage error,MAPE)、均方根誤差 (root mean squared error,RMSE)和均方根相對誤差(root mean squared relative error,RMSRE)3個方面對3種預測模型預測性能進行比較,見表1。均方根誤差可以比較預測器的逼近能力,而平均絕對百分誤差、均方根相對誤差用來評價模型的預測效果及計算的準確率。

表1 預測模型性能評價指標Tab.1 Performance evaluation of prediction model
從表1中可以看出,GMWKPLS的性能最優,其次為GRBFKPLS,而RBFKPLS的性能最差。與GRBFKPLS和 RBFKPLS相比,GMWKPLS和 MAPE、RMSE和RMSRE均小得多,相差一個或兩個數量級。這表明所建GMWKPLS預測模型具有較強的逼近能力、較高精確度及較好預測效果。究其原因,在GMWKPLS中,由于首先采用灰色預測中“累加生成”的方法,削弱原始數據序列中隨機擾動因素的影響,使離亂的原始數據中蘊涵的規律充分顯露出來,增強數據的規律性。其次,KPLS不僅能夠有效實現自變量對因變量的整體預測,而且能夠提取各維自變量對因變量的單獨非線性作用特征,從而確定數據系統內部的復雜非線性結構關系,增加了模型的可解釋性。最后,采用對數據變化趨勢刻畫能力較強的Morlet小波核函數,可以提高模型的學習性能。所以,綜合了灰色理論、KPLS和Morlet小波核的各自優勢的GMWKPLS預測模型表現出的預測性能最佳。
通過對預測模型性能評價指標的分析,驗證了本文所建模型的正確性和可靠性。
傳感器網絡預測融合的主要目的就是降低數據傳輸量,從而節省網絡能量,延長網絡的生命周期。每次運行GMWKPLS程序大約需執行22500條指令。在傳感器網絡中,發送1 bit的信息所消耗的能量等于執行2000條指令[10]。設定發送的數據包為 8 bytes(64 bits),耗能320 nJ,則可執行128000條指令,相當于執行大約6次GMWKPLS程序。表2為在預測誤差允許范圍內,GMWKPLS節能情況分析。

表2 預測模型節能情況Tab.2 Energy evaluation of prediction model
經過這些簡單的估算,可知不但計算耗能能從通信節能中得到補償,而且預測模型能顯著降低網絡耗能,節省網絡能量。
另外,在GMWKPLS預測融合模型中,因其預測精度高,并能進行動態預測,不但減少了數據發送的能量消耗,而且節省了部分采樣的能量消耗,從而延長網絡生命周期,具有廣闊的應用前景。
通過預測融合來減少傳感器網絡中的不必要的數據傳輸是傳感器網絡數據融合研究的主要方向。本文提出了一種GMWKPLS預測融合建模方法,它將灰色模型預測的思想融入了KPLS中,從原始數據中去尋找其潛藏著的內在規律,使其具有處理隨機過程、突變的能力;它通過構造Morlet小波核函數,保持了小波函數近似正交及多分辨分析的優點,能夠更好地展現輸入與輸出數據之間的非線性映射關系,實現整體預測功能,其建模能力優于GRBFKPLS和RBFKPLS方法。
通過對傳感器網絡采集到的振動信號進行動態預測,結果表明,GMWKPLS預測的振動幅值趨勢與實際曲線基本相符,預測誤差范圍在±0.15%以內。因此,采用該模型可以顯著減少數據傳輸量,從而降低網絡能耗,延長網絡的生命周期。GMWKPLS為傳感器網絡數據預測融合及提高預測融合性能提供了一種新途徑。
[1]Nakamura E F,Loureiro A F,Frery A C.Information fusion forwireles wensor networks:methods, models, and classifications[J].ACM Computing Surveys,2007,39(3):1-55.
[2]Sharaf M A,Beaver J,Labrinidis A,et al.TiNA:a scheme for temporal coherency aware in network aggregation[C]//Proceedings of the 3rd ACM International Workshop on Data Engineering for Wireless and Mobile Access.San Diego:ACM,2003:69-76.
[3]Santini S,Romer K.An adaptive strategy for quality-baseddata reduction in wireless sensor networks[C]//Proceedings of the 3rd International Conference on Networked Sensing Systems.TRF,Chicago,IL:ACM,2006:29–36.
[4]Le Borgne Y A,Santini S,Bontempi G.Adaptive model selection for time series prediction in wireless sensor networks[J].Signal Processing,2007,87(12):3010 -3020.
[5]回春立,崔 莉.無線傳感器網絡中基于預測的時域數據融合技術[J].計算機工程與應用,2007,43(21):121-125.
[6]孟 潔,王惠文,黃海軍,等.基于核函數變換的PLS回歸的非線性結構分析[J].系統工程,2004,22(10):93-97.
[7]Luo Y X,Zhang L T,Cai A H,et al.Grey GM(1,1)model with function-transfer method and application to energy consuming prediction [J].Kybernetes,2004,33(2):322-330.
[8]Zhang Li,Zhou Wei-da,Jiao Li- cheng.Wavelet support vector machine [J].IEEE Transactions on systems,man,and cybernetics,2004,34(1):34-39.
[9]李 軍,董海鷹.基于小波核偏最小二乘回歸方法的混沌系統建模研究[J].物理學報,2008,57(8):4756-4765.
[10]Raybunatban V,Schurgers C,Park S,et al.Energy-aware wireless microsensor networks[J].IEEE Signal Processing Magazine,2002,19(2):40-50.