劉敏,鄭上雄
(1.江門市勘測院有限公司,廣東 江門 529000; 2.江西理工大學,江西 贛州 341000)
改進支持向量機在大壩變形預測中的應用研究
劉敏1*,鄭上雄2
(1.江門市勘測院有限公司,廣東 江門 529000; 2.江西理工大學,江西 贛州 341000)
支持向量機算法進行建模的過程中,選取合適的核函數以及相關的參數組合是最重要的部分,參數選取的好壞將直接影響到預測結果的精度。本文采用基因表達式編程算法對支持向量機算法進行參數組選取,得到改進支持向量機算法并將其應用于具體工程實例之中。結果表明改進支持向量機大壩變形預測模型比傳統支持向量機大壩變形預測模型得出的預測結果的精度提高了近3倍,從而說明基于基因表達式編程的改進支持向量機的預測模型在大壩變形預測中具有良好的預測效果。
大壩變形;支持向量機;基因表達式編程;預測模型;精度
支持向量機(Support Vector Machine,簡稱SVM)算法在數據樣本范圍較小時,也能獲得滿意預測值,其主要思想是當經驗風險降低的時候,期望風險的主界值也能降低,在原有小范圍數據的基礎上,保證模型能獲得滿意的預測精度。在處理非線性問題上,由內積函數架構的非線性變換可把輸入空間轉換成一個高維空間,并在這個高維空間中尋找輸入與輸出變量之間的非線性關系[1]。大壩變形受到溫度、時效因子以及水位等因素影響,所以其變形值呈現出非線性的特性[2],將SVM算法于大壩沉降影響因子建立起數學模型能有效預測出大壩的變形情況。然而,SVM進行建模的過程中,選取合適的核函數以及相關的參數組合是最重要的部分,參數選取的好壞將直接影響到預測結果的精度,基于此本文采取用基因表達式編程算法[3](Gene Expression Programming, 簡稱GEP)進行對其進行參數選取,利用GEP強大的全局搜索能力尋找出支持向量機的最佳參數組合[4],建立經基因表達式編程優化的支持向量機大壩變形預測模型[5~9]。
SVM大壩變形模型建立受懲罰因子C、松弛變量ε以及核函數K(xi,xj)多個參數的影響,選取合適的參數是本文研究的核心。
2.1 懲罰因子C
懲罰因子C決定了本算法有多重視離群點的損失,定的C越大,則目標函數損失越大,而且C是非變量,它是事先被定好的數值,數值定好之后得到一個分類器,根據樣本數據測試,如果測試不及格,就換一個C值,如此循環尋優,直到找出符合條件的C值為止,但是這和優化本身不同,懲罰因子C始終是個定值。
2.2 松弛變量ε
松弛變量ε則代表相對應點的離群程度,其值越大,就代表點離的更遠。它能協調經驗風險和推廣性能兩者之間的關系,起到平衡作用。
2.3 核參數g
核參數g代表了核函數性能的優劣。若g過大,則模型泛化能力弱;若g過小,則模型相關性弱,所以選取適當的核參數也是本文的核心部分。
改進SVM建模的中心思想是:將參數組合群進行初始化,通過GEP算法對參數組合群進行基本的遺傳操作,計算每個個體組合的適應值,若達到計算精度,則進化結束;若沒有達到計算精度則繼續進行循環操作,直到尋找出最優參數組合[10]。
把監測點原始值分為兩組,第一組當作訓練樣本,第二組作為預測樣本。運用GEP算法選出的參數組,建立改進后SVM模型,通過改進SVM模型預測監測點的變形情況得到后期變形數據再與原來預測樣本數據作對比,最后進行精度比較。具體分為三大步:首先是通過GEP算法對參數組合群進行擇優篩選,以尋選得最優參數組;其次利用最優參數組應用于標準SVM算法中建立改進SVM大壩預測模型;最后將改進SVM大壩預測模型應用在實例中得出結果并進行精度分析,流程圖如1所示。

圖1 改進SVM預測模型建模流程圖
具體步驟如下:
(1)數據預處理。先將所獲得大壩原始觀測數據經小波變換處理,剔除噪聲及相關無用信號,使得原始數據更為平滑完整,便于后期的數據處理分析。
(2)數據樣本構造。將大壩原始觀測值分成兩組,其一為訓練樣本,另一組為預測樣本。其中,訓練樣本數據被用于進行建模,預測樣本數據被用于進行精度對比。
(3)確定參數組(C,g,ε)的約束范圍。
(4)設定GEP的控制參數。
(5)初始化參數組種群。參數組合群初始化是隨機的,所以想要從種群中找到最優解是比較困難的。然而只要反復的初始化種群直到產生最少一個合法個體,本算法即可開始。
(6)適應度評價。適應度就是來檢測個體能否適應外界環境的一個指標。個體表現好壞可以依據適應度函數計算出來。本文選取的適應度函數為:

式中,m為參數組合訓練個數,yi為對應的對應訓練數據集合的訓練數據,yj為利用表達式由訓練數據集合得到的yi的估計值。然后根據適應度函數解析GEP的基因編碼,計算每個參數組合的適應度值來評價種群,若滿足計算精度要求,則進化完成,否則繼續下一步。
(7)GEP算法參數設定。設定種群數目、基因數目、變異率、倒串率以及插串率重組率等參數。
(8)輸出SVM的參數最優解。通過輸入原始參數組合種群經GEP算法運算之后輸出最優參數組合即:
(Best-C,Best-g,Best-ε)。
(9)改進SVM模型的建立。通過GEP算法獲得最佳參數組合后,結合傳統SVM算法通過改變傳統SVM算法的參數值獲得改進SVM算法,通過改進SVM算法構建改進SVM大壩變形預測模型。
(10)用改進SVM大壩預測模型預測大壩變形量得出的預測結果與傳統大壩預測模型得出的預測值作對比分析。
本次大壩監測數據來源于對云南省某大壩升船機的真實監測采集數據,選取其中左上塔筒ZS-305監測點進行數據研究,通過改進SVM大壩變形預測模型計算出實驗結果如下:

兩種模型預測值與觀測值數據對比表(左上塔筒ZS-305監測點) 表1
對應的數據結果對比圖如2所示:
圖2 兩種模型預測值與觀測值數據對比圖(左上塔筒ZS-305監測點)
本文利用改進支持向量機大壩變形預測模型對大壩變形進行預測研究,得出以下結論:
(1)參數選擇上,如何選取最優參數組是本次研究的核心。本文通利用GEP算法強大的全局搜索能力尋找出支持向量機的最佳參數組合,建立了經基因表達式編程優化的支持向量機大壩變形預測模型。
(2)精度方面,比較基于兩種預測模型所得的預測結果,改進SVM預測模型所得預測結果的精度比傳統SVM預測模型所得預測結果提高了將近3倍,說明改進SVM大壩變形預測模型相對于傳統SVM大壩變形預測模型的預測精度更高[11]。
[1] 白鵬,張喜斌,張斌等. 支持向量機理論及工程應用實例[M]. 西安電子科技大學出版社: 2008,7~40.
[2] 高永剛,岳建平,石杏喜. 支持向量機在變形監測數據處理中的應用[J]. 水電自動化與大壩監測,2005(5):36~39.
[3] 元昌安,彭昱忠,覃曉等.基因表達式編程算法原理與應用[M]. 北京:科學出版社,2010.
[4] 王文棟,鐘智,元昌安. 基于GEP的支持向量機參數優化[J]. 廣西師范學院學報·自然科學版,2010(2):66~70.
[5] 王新洲,范千,許承權等. 基于小波變換和支持向量機的大壩變形預測[J]. 武漢大學學報·信息科學版,2008(5):469-471+507.
[6] 宋志宇,李俊杰. 最小二乘支持向量機在大壩變形預測中的應用[J]. 水電能源科學,2006(6):49-52+115-116.
[7] 任超,梁月吉,龐光鋒等. 基于灰色最小二乘支持向量機的大壩變形預測[J]. 大地測量與地球動力學,2015(4):608~612.
[8] 王騰軍,楊海彥,楊志強. 基于云模型的大壩變形監測數據分析研究[J]. 測繪通報,2012(2):23~25.
[9] 徐鋒,王崇倡,張飛. 粒子群-BP神經網絡模型在大壩變形監測中的應用[J]. 測繪科學,2012(4):181~183.
[10] 龔文引,蔡之華,劉亞東. 基因表達式程序設計在復雜函數自動建模中的應用[J]. 系統仿真學報,2006(6):1450-1454+1457.
[11] 李瀟. 灰色最小二乘支持向量機在滑坡變形預測中的應用[J]. 測繪通報,2010(6):44~46.
Application of Improved Support Vector Machine in Dam Deformation Prediction
Liu Min1,Zheng Shangxiong2
(1.Jiangmeng Investigation and Surveying Institute,Jiangmen 529000,China; 2.Jiangxi University of Science and Technology,Ganzhou 341000,China)
SVM modeling process, select the appropriate kernel function and the associated parameter combination is the most important part of the parameter selection will directly affect the accuracy of the prediction results. In this paper, gene expression programming algorithm support vector machine algorithm parameter set selection, get into improved support vector machine algorithm and its application to specific engineering examples. The results show that the improved accuracy of deformation prediction model of dam than the traditional support vector machine Support vector machine prediction model of dam deformation prediction results obtained increased nearly three-fold, so that prediction model described GEP improved support vector machine based on dam deformation prediction has a good prediction.
dam deformation;support vector machine;gene expression programming;prediction model;accuracy
1672-8262(2017)01-126-03
TU196
B
2016—09—19 作者簡介:劉敏(1990—),男,碩士,工程師,主要從事測繪工程技術工作。 基金項目:國家自然科學基金資助項目(41561091)