沈哲輝 黃 騰 沈月千 鄭 浩
1 河海大學地球科學與工程學院,南京市佛城西路8號,211100
?
遺傳算法優化支持向量機在大壩變形預測中的應用
沈哲輝1黃騰1沈月千1鄭浩1
1河海大學地球科學與工程學院,南京市佛城西路8號,211100
建立大壩變形預測的支持向量機模型,并用遺傳算法對支持向量機模型的核函數參數、懲罰參數和損失參數進行優化。將同一優化方法不同支持向量機核函數、不同優化方法同種支持向量機核函數進行橫向對比,將BP神經網絡、自回歸AR(p)模型、多元回歸分析法和周期函數擬合法進行縱向對比。結果表明,該GA-SVM(RBF)模型不僅能較好地預測大壩的變形趨勢,而且能大幅提高預測精度。
大壩變形因子;支持向量機;遺傳算法;優化;預測
本文用遺傳算法(genetic algorithm,GA)[1]來優化支持向量機(support vector machines,SVM)[2-3]的參數,并建立了大壩變形預測的GA-SVM模型。通過實例,對比分析了本文算法、BP神經網絡、自回歸AR(p)模型、多元回歸分析法和周期函數擬合法。
支持向量機是一種以結構風險最小化原則為基礎的機器學習算法,通過解一個線性約束的二次規劃問題得到全局最優解,因而不存在局部極小值的問題,保證了收斂速度[4]。
本文采用徑向基RBF核函數(高斯核函數)。通過參數的選擇,其可以適用于任意分布的樣本,是目前支持向量機中應用最廣泛的一種核函數[5]。選擇合適的損失參數ε、懲罰參數C和核函數參數σ是支持向量機能成功為研究對象建模的關鍵。
為了驗證RBF核函數的優勢,本文采用多項式核函數建模進行對比。
2.1建立訓練樣本集
結合文獻[6-7],把水壓分量H(庫水位)、溫度分量T(觀測時的氣溫)、周期分量t1、t2、t3(為時間t的函數)、時效分量t、lnt等7個影響因子作為大壩變形的影響因素。
周期分量的表達式為:
(1)
大壩變形的SVM模型表達式為:
f=x(t,lnt,t1,t2,t3,T,H)
(2)
2.2GA優化SVM參數
采用GA優化SVM的3個參數,其優化過程如下。
1)適應度函數的選擇。適應度函數是個體對環境的適應能力的表達,其與目標函數有關。本文的目標函數選為均方誤差:
(3)
式中,R0為實測值,Rm為擬合值。
2)初始化GA參數。初始化最大進化代數、最大種群數量、選擇概率、交叉概率和變異概率等。
3)編碼。確定支持向量機3個參數的編碼區間,設置參數C的尋優區間為(0,100],設參數ε的尋優區間為[0,1],參數1/σ的尋優區間為[0,1 000]。對其進行二進制編碼,產生一組代表這3個參數的染色體,即為初始種群。
由滲透率試驗結果可知,煤樣含水量越大,液氮增透效果越好,為了探究液氮影響煤巖滲透率的形式,筆者從微觀角度進行了研究,由于篇幅有限,僅分析干燥與飽水煤樣進行液氮冷浸前后的掃描電鏡結果。所用掃描電鏡設備為JSM-6390LV,其放大倍數最高可達300 000。
4)遺傳算子操作。①選擇:是指在群體中選擇生命力強(適應度大)的個體,產生新的群體的過程。②交叉:是指兩隊相互配對的染色體按照某種方式進行部分基因座的交換,從而形成兩個新的個體,使種群不斷有新鮮個體產生,從而對搜索空間中的新區域進行搜索,防止陷入局部最優。③變異:將個體染色體編碼串中的某些基因座上的基因值用改基因座的其他等位基因來替換,從而形成一個新個體。它能保證遺傳算法的有效性,決定遺傳算法的局部搜索能力,維持群體的多樣性,防止出現早熟現象。④重插入:為了確保最適應個體在每一次傳播到下一代的數目保持不變,需要隨機重插入固定數量的新個體。
5)遺傳算法的終止。由于遺傳算法的隨機搜索性,找到一個明確的收斂性判別準則是困難的。本文算法終止條件采用預先設定的代數。
用GA對訓練集優化,得到最優的SVM 3個參數。再根據未來大壩的7個影響因子,訓練SVM模型預測未來大壩的變形。
以福建省某梯級水電站第三級大壩的表面水平位移引張線測點15在2008-01-01~2012-12-01期間每月1日的60期監測數據作為歷史數據進行建模,預測2013-01-01~2014-08-01的20期數據。
以大壩的長周期歷史變形數據進行建模。7個影響因子之一的時效分量t序列較長,例如2008-01-01作為第1天,那么2012-12-01編號則為1 431。若t直接參與建模,其相對于其他6個影響因子的數量級較大,導致模型過分擬合,預測能力下降。所以,對樣本數據進行歸一化處理[7]:
(4)
式中,ξ為原始樣本數據,ξmin、ξmax分別為樣本集中的最小值、最大值,ξ′為歸一化后的值。
當迭代代數為100時,MSE基本達到收斂,得到最優的懲罰參數C=4.981 6,損失參數ε=0.174 7,核函數參數倒數1/σ=0.077 2。
為驗證遺傳算法具有更好的優化能力,采用網格優化的方法對支持向量機(RBF核)參數進行優化。
將不同支持向量機核函數相同優化方法的對比和相同支持向量機核函數不同優化方法的對比一起并稱為橫向對比。GA-SVM(多項式核)法得到的最優的懲罰參數C=48.684 6,損失參數ε=0.425 3,核函數參數coef=14.740 9,q=6.765 1;網格-SVM得到的最優懲罰參數C=9.189 6,損失參數ε=0.148 2,核函數參數倒數1/σ=0.049 0。
將本文的GA-SVM(BRF)模型與BP神經網絡、自回歸AR(p)模型(其中AR(p)模型采用FPE準則定階,最終定階為p=4)、多元回歸分析法和周期函數擬合法[9](經計算得a=-0.110 6,b=-0.094 5,c=6.062 8)進行縱向對比。
橫向對比預測曲線見圖1。由圖1看出,各條SVM模型預測曲線都與原測數據變化一致,但顯然使用RBF核函數的SVM預測曲線更加貼合原測數據,說明高斯核函數優于多項式核函數;GA優化下的SVM預測曲線和網格優化下的SVM預測曲線比較接近,但從表1中可以算出,GA-SVM(RBF)預測相對誤差絕對值的平均值為2.30%,網格-SVM(RBF)預測相對誤差絕對值的平均值為2.36%,所以GA-SVM(RBF)是優于網格-SVM(RBF)的。

圖1 橫向對比預測曲線Fig.1 Horizontal contrasting prediction curve graph
縱向對比預測曲線見圖2。由圖2可以看出,GA-SVM(RBF)模型預測結果明顯更加貼合原始監測數據,GA-SVM和BP神經網絡預測趨勢和原測數據基本一致,但AR(p)、多元回歸分析法和周期函數擬合法幾乎未體現出趨勢性。所以對于大壩來說,通過其變形因子對變形量進行建模比用單一變形量建模更加合理。

圖2 縱向對比預測曲線Fig.2 Longitudinal contrasting prediction curve graph
由表1計算出GA-SVM(RBF)預測相對誤差絕對值的平均值為2.30%,BP神經網絡預測相對誤差絕對值的平均值為3.70%,AR(p)預測相對誤差絕對值的平均值為4.03%,多元回歸分析預測相對誤差絕對值的平均值為13.88%,周期函數擬合法預測相對誤差絕對值的平均值為3.59%。
綜合橫向對比和縱向對比,GA-SVM(RBF)模型不僅較好地預測了變形的趨勢,而且預測相對誤差也最小。可見,GA-SVM(RBF)模型是一種比較優秀的大壩變形數據建模預測方法。

表1 預測數據對比
1)根據大壩變形影響因子與大壩變形之間的關系,用支持向量機對歷史數據進行建模,并用具有較好的全局搜索能力以及良好的可擴展性等優點的遺傳算法優化支持向量機參數,得到最優的大壩預測支持向量機模型。此優化方法避免了憑經驗或試算法選取支持向量機的三參數,從而引起欠學習或過學習的現象。
2)在大壩變形預測領域,支持向量機采用的RBF核函數明顯優于多項式核函數。
3)在大壩變形預測領域,采用遺傳算法對支持向量機的三參數進行全局尋優,比傳統的網格尋優有優勢。
4)對于大壩長周期數據進行建模分析,對數據進行歸一化是極其必要的。
5)對于大壩來說,通過其變形因子對變形量進行建模比用單一變形量建模更加合理。
6)對比BP神經網絡、自回歸AR(p)模型、多元回歸分析法和周期函數擬合法,本文方法不僅更好地預測了變形趨勢,而且能大幅提高預測精度。
[1]雷英杰.MATLAB遺傳算法工具箱及應用[M]. 西安:西安電子科技大學出版社,2014(Lei Yingjie. MATLAB Genetic Algorithm Toolbox and Application[M].Xi’an: Xidian University Press, 2014)
[2]呂開云. 黃河小浪底水利樞紐大壩變形預測方法研究與分析[D]. 北京:中國礦業大學, 2012(Lü Kaiyun. Research and Analysis about the Deformation Forecasting Methods of Yellow River Xiaolangdi Water Hydropower Dam[D]. Beijing: China University of Mining and Technology, 2012)
[3]翟信德. 基于支持向量機的大壩變形預測研究[D]. 合肥:合肥工業大學, 2007(Zhai Xinde. Research on Dam Displacement Forecasting Model Based on Support Vector Machine[D]. Hefei: Hefei University of Technology, 2007)
[4]唐亮貴,程代杰.基于小波的支持向量機預測模型及應用[J]. 計算機科學,2006,33(3):202-204(Tang Lianggui,Cheng Daijie.A Forecasting Model via Support Vector Machines Based on Wavelets[J]. Computer Science, 2006, 33(3):202-204)
[5]姜慧研,王曉丹,周曉杰, 等.基于SVR的回轉窯燒成帶溫度軟測量方法的研究[J]. 系統仿真學報,2008,20(11):2 951-2 955(Jiang Huiyan,Wang Xiaodan,Zhou Xiaojie,et al.Study on Soft Sensor for Temperature of Burning Zone Based on SVR[J]. Journal of System Simulation, 2008, 20(11): 2 951-2 955)
[6]吳中如.水工建筑物安全監控理論及其應用[M]. 南京:河海大學出版,1990(Wu Zhongru. Safety Monitoring Theory & Its Application of Hydraulic Structures[M].Nanjing:Hohai University Press, 1990)
[7]陳偉. 遺傳算法與神經網絡在大壩安全監測中的應用研究[D]. 西安:長安大學, 2009( Chen Wei. Genetic Algorithms and Artificial Neural Networks Apply in Dam Security Monitoring[D]. Xi’an: Chang’an University, 2009)[8]朱偉,石超峰,李楠.基于遺傳算法優化支持向量機的再生混凝土抗壓強度預測模型[J]. 中外公路,2014,34(1):311-314(Zhu Wei,Shi Chaofeng,Li Nan.The Recycled Concrete Compressive Strength Prediction Model Based on Support Vector Machine Optimized by Genetic Algorithm[J]. Journal of China & Foreign Highway, 2014, 34(1):311-314)
[9]吳富梅,楊元喜.基于高階AR模型的陀螺隨機漂移模型[J]. 測繪學報,2007,36(4):389-394(Wu Fumei,Yang Yuanxi.Gyroscope Random Drift Model Based on the Higher-Order AR Model[J]. Acta Geodaetica et Cartographica Sinica, 2007, 36(4):389-394)
About the first author:SHEN Zhehui, postgraduate, majors in precision engineering measurement and data processing, E-mail:1280381222@qq.com.
Dam Deformation Monitoring Prediction on Support Vector Machine Optimized by Genetic Algorithm
SHENZhehui1HUANGTeng1SHENYueqian1ZHENGHao1
1School of Earth Sciences and Engineering, Hohai University, 8 West-Focheng Road, Nanjing 211100, China
A SVM model is established for predicting dam deformation, and optimizing the kernel function parameter, penalty parameter and loss function parameter through the genetic algorithm. We use this model to analyze the long period deformation monitoring data and make predications. In this paper, we compare horizontally different kernel functions of support vector machine using the same optimization method, and the same kernel function of support vector machine using different optimization methods. The results show that GA-SVM(RBF) not only can well predict the dam deformation trend, but also improves the prediction accuracy over contrasting BP neural networks, AR(p), multiple regression analysis and periodic function fitting longitudinally.
dam deformation factors;support vector machines;genetic algorithm;optimizing;prediction
College Postgraduate Research and Innovation Project of Jiangsu Province, No.KYLX15_0478.
2015-09-22
沈哲輝,碩士生,主要從事精密工程測量與數據處理研究,E-mail:1280381222@qq.com。
10.14075/j.jgg.2016.10.018
1671-5942(2016)010-0927-03
P258
A
項目來源:江蘇省普通高校研究生科研創新計劃(KYLX15_0478)。