王江榮,袁維紅,趙 睿,任泰明
(蘭州石化職業技術學院,甘肅蘭州730060)
B樣條函數在大壩變形數據分析中的應用
王江榮,袁維紅,趙 睿,任泰明
(蘭州石化職業技術學院,甘肅蘭州730060)
用參數回歸模型分析處理大壩變形數據時存在著變量之間的函數關系需要預先設定的問題,而對于一些波動性大、規律性和整體性較差的大壩變形數據,預選設定函數關系是困難的。為能較好地解決這類問題,建立了一種基于三次B樣條函數的非參數回歸模型。該模型是一種完全受觀測數據驅動的數學模型,具有建模簡單、適用強、精確度高和易于程序實現的特點。對出現的模型的系數采用遺傳算法求解。實例分析表明,基于三次B樣條函數的非參數模型具有較高的擬合預測精度,能夠較好地解決實際問題。
變形數據;非參數模型 ;B樣條函數;遺傳算法;插值預測
大壩變形數據處理模型大多采用了參數回歸模型[1-4],這類回歸模型存在著變量之間(變形值—時間)的函數關系需要預先設定的問題,如果設定的函數關系與實際情況吻合,則統計推斷精度會比較高;反之,模型的統計推斷就會出現較大偏差,擬合預測效果會非常差,甚至沒有什么實際意義。但在實際問題中,變形實測數據之間的變量關系往往難以確定,因此利用參數回歸模型處理這類數據難以取得理想效果。而非參數回歸模型是一種不依賴于總體樣本分布,僅受數據驅動以及不受變量分布約束的模型,和參數模型相比,這類模型是更符合實際問題的一種回歸模型。選擇什么樣的非參數模型是解決問題的關鍵。樣條函數,尤其是三次B樣條函數是一種非參數模型,具有良好的分段光滑性和全局逼近能力[5]。因此,本研究擬采用三次B樣條函數擬合變形數據,并采用外插值延拓方法對建模以外的變形數據進行預測。由于三次B樣條函數擬合存在著矩陣求逆的問題,當觀測數據越多時,矩陣的階就越高,求逆就越繁瑣。為了解決這個問題,本文采用遺傳算法( Genetic algorithms,GA )求解三次B樣條函數的擬合系數。
基于B樣條函數的非參數回歸模型是由B樣條基函數[6]通過線性組合而構成的,它可以任意逼近連續函數[7]。為便于研究,本文采用均勻(任意相鄰節點間距離相等)三次B樣條基函數構建非參數回歸模型。
1.1 均勻三次B樣條基函數
均勻三次B樣條基函數參考文獻[8]。即
(1)
式中,ti(i=0,1,2,…,n-1)為節點(它是時間t所屬區間的n等分點),常量h=ti+1-ti(i=0,1,2,…,n-1)。
由式(1)可知,Bi,3(t)的形狀僅與ti及h的選擇有關(形狀由節點和步長唯一確定),而其他的B樣條Bj,3(t)可由Bi,3(t)平移變換得到,即Bj,3(t)=Bi,3(t-(j-i)h)。
1.2 三次B樣條回歸模型
由式(1)可知,欲確定第i個三次(即4階)B樣條Bi,3(t),需要用ti,ti+1,ti+2,ti+3,ti+4共5個節點,稱區間[ti,ti+4]為Bi,3(t)的支撐區間。t0t1t2…tn+4為三次B樣條函數的節點序列(即數據擬合中共需n+1個三次B樣條基函數Bi,3(t))。用三次B樣條函數可以將非參數模型m(t)(m(t)是未知回歸函數)近似地表示為
(2)
式中,xi為觀測時間點;模型系數,Φ={θj|j=0,1,2,…,n},采用遺傳算法求解。
某大壩變形監測數據[9]見表1。在前32期數據中等間隔地取期數為3、7、11、15、19、23、27對應的7個數據為測試數據,其余25個數據為建模數據,后4期即33、34、35、36對應的數據用于外插預測檢驗數據。
前32期的觀測數據點如圖1所示。從圖1可以看出,數據點波動性較大,規律性和整體較差,故難以用參數模型(需事先選定)來擬合此類數據點,而選用基于B樣條函數的非參數模型能夠較好地解決此類問題。

表1 大壩變形監測數據

圖1 原始大壩切向位移監測數據
按表1中1~32期觀測數據點設定均勻控制節點L=[0,4,8,12,16,20,24,28,32,36,40]。按式(1)每5個節點確定一個三次B樣條基函數,共確定7個三次B樣條基函數,分別記作B0,3(t),B1,3(t),…,B6,3(t)(具體表達式及圖形在此略去),由此構建的非參數回歸模型為
(3)

下面采用遺傳算法估算模型系數Φ=[m0,θ0,θ1,θ2,…,θ6]。定義目標函數
(4)

在MATLAB工作窗口利用gatool命令打開遺傳算法的GUI,在Fitnessfunction窗口輸入@finess,在Numberofvariables窗口輸入待估參數個數8,在邊界約束Lower輸入-80*ones(1,8),在Upper輸入 80*ones(1,8),種群規模為50,迭代次設為1 000,其他參數選用缺省值,然后單擊Start按鈕執行遺傳算法。迭代400次后輸出的最優模型系數為:m0=51.387 9,θ0=-0.904 2,θ1=1.426 6,θ2=-0.145 9,θ3=-1.077 9,θ4=-1.698 4,θ5=-1.893 3,θ6=2.196 7。將這些估算值代入模型(3),得
(5)


表2 模型預測值比較

表3 均勻三次B樣條函數外插預測值

圖2 均勻三次B樣條函數的擬合預測曲線
作為對比,采用傅里葉函數建模(參數模型)如下
y=51.93+1.18cos(0.133 5t)-1.21sin(0.133 5t)-
1.123cos(0.133 5t)-0.871 9sin(0.133 5t)
(6)


圖3 傅里葉函數擬合效果
從表2可以看出,基于三次B樣條的非參數模型具有較高的預測精度(最大絕對誤差不超過0.1849,相對誤差最大不超過0.33%),預測效果好于Fourier函數模型,預測精度提高近一倍,預測結果值得信賴。由于三次B樣條曲線是連續變化的,所以可通過該模型得到觀測時間段內任意時間點的大壩變形值,這對研究大壩變形規律是非常有益的。利用前32期的擬合預測值對表1中后4期的變形值進行預測,計算過程采用MATLAB一維外插運算函數[10],即Y=interp1(),預測結果見表3。
從表3可看出,三次B樣條函數模型的預測精度高于傅里葉函數模型,最大絕對誤差不超過0.379 2,相對誤差最大不超過0.43%,能夠滿足工程需要。但是,需要指出的是,不管用哪種插值方法,當插值點位于已知數據集合外時,插值運算對該處函數值的估計都很可能與實際函數值相比會有較大的偏差,從這點上講,本文得出的預測結果是令人滿意的。
(1)當變形數據呈現出波動性大、整體性差且無規律狀態時,就難以選擇合適的參數模型作數據擬合預測,選擇不當時就會出現較大誤差。而非參數模型是一種僅受數據驅動的模型,更適合實際問題的解決。B樣條函數能夠任意逼近連續函數(大壩變形是連續變化的),利用B樣條函數構建的非參數模型具有較高的精確度,適合波動大、無規律數據建模。
(2)基于B樣條函數的非參數模型非常適合內插值預測,這對研究時間區間內的大壩變形規律具有重要的意義。其缺點是其外插預測能力較差,這是今后需要改進的地方。另外,B樣條函數擬合存在著矩陣求逆的問題,觀測數據越多,矩陣的階就越高,求逆就越繁瑣。為了解決這個問題,可采用遺傳算法求解B樣條擬合系數。
(3) B樣條基函數形狀僅與討論域(區間)上的節點(控制節點)有關,這些基函數的線性組合構成了的非參數回歸模型,該模型具有良好性的適用性、通用性,且容易通過程序實現,為解決大壩變形問題提供了一種新思路、新方法。
[1]王江榮. 高斯函數模型在變形監測數據處理中的應用[J]. 金屬礦山,2015(4):178-181.
[2]王江榮. Richards生長曲線模型在大壩變形監測數據處理中的應用[J]. 礦山測量,2015(5):59-61.
[3]王鳴,易武,鄧永煌. 基于自適應搜索權重的滑坡位移組合預測[J]. 水力發電,2016,42(2):26-28,37.
[4]魏迎奇,孫玉蓮. 大壩沉降變形的灰色預測分析研究[J]. 中國水利水電科學研究院學報,2010,8(1):25-29.
[5]馮玉瑜,曾芳玲,鄧建松. 樣條函數與逼近論[M]. 合肥:中國科學技術大學出版社,2013.
[6]溫偉斌. 基于B樣條插值的數值流形方法與時間積分方法的研究[D]. 重慶:重慶大學,2014.
[7]解其昌. 分位數回歸方法及其在金融市場風險價值預測中的應用[M]. 北京:中國農業科學技術出版社,2014.
[8]劉昕明. 兩類非參數分位數回歸模型的研究[D]. 北京:北京化工大學,2013.
[9]張安兵. 動態變形監測數據混沌特性分析及預測模型研究[D]. 北京:中國礦業大學,2009.
[10]王正林,龔純,何倩. 精通MATLAB科學計算[M]. 北京:電子工業出版社,2012.
(責任編輯 焦雪梅)
Application of B-Spline Function in Dam Deformation Data Analysis
WANG Jiangrong, YUAN Weihong, ZHAO Rui, REN Taiming
(Lanzhou Petrochemical College of Vocational Technology, Lanzhou 730060, Gansu, China)
There is a problem that the functional relationship between variables is necessary to be pre-set when processing dam deformation data by using parameter regression analysis. For the dam deformation data with large fluctuation, poor regularity and poor integrity, the pre-set of function relationship is difficult. In order to better solve this kind of problem, a nonparametric regression model based on Cubic B-spline function is established. The model is a mathematical model of complete observation data driven with the features of simple modeling, strong application, high accuracy and easy programming. The coefficient of model is solved by genetic algorithm. The empirical analysis shows that the new model has high prediction accuracy and can better solve practical problem.
deformation data; nonparametric model; B-Spline function; genetic algorithm; interpolation prediction
2016-03-17
蘭州市科學技術局計劃項目(蘭財建發[2015]85號);蘭州石化職業技術學院科技資助項目(院發〔2015〕69號);甘肅省科技廳計劃項目(1204GKCA004);甘肅省財政廳專項資金立項資助(甘財教[2013]116號)
王江榮(1966—),男,甘肅靜寧人,教授,碩士,主要從事數據挖掘、數值分析、控制理論與應用方面的研究.
TV698.1
A
0559-9342(2016)12-0115-04