朱露露 盧敏 嚴劉偉



摘 要:基于支持向量機在處理小樣本數據中的優勢,本文選用支持向量機對水質進行評價,并選擇灰狼算法對支持向量機的兩個參數(核函數參數g和懲罰因子c)進行優化,選取實例數據,以分類的準確率為評價標準,建立GWO-SVM水質評價模型,然后將其結果與GA-SVM模型、標準SVM模型的評價結果相比較。結果顯示,GWO-SVM模型評價結果更好。
關鍵詞:水質評價;灰狼算法;支持向量機
中圖分類號:X824文獻標識碼:A文章編號:1003-5168(2020)35-0036-03
Abstract: Based on support vector machine (SVM) in the treatment of the advantages of small sample data, this paper selected the SVM to evaluate the water quality, and chose gray wolf algorithm to optimize the two parameters (kernel function parameter g and penalty factor c) of SVM, and selected the instance data, and used the classification accuracy as the evaluation standard to establish the GWO - SVM water quality evaluation model, and then compared the results with the evaluation results of the GA-SVM model and the standard SVM model. The results showed that the GWO-SVM model evaluation results were better.
Keywords: water quality evaluation;gray wolf algorithm;support vector machine
水環境質量評價的主要目的是對水體的質量和利用價值做出評定[1],評價結果可以反映當前水體的污染程度和質量[2]。
常見的水質評價方法有模糊數學評價法、人工神經網絡法、灰色評價法等[2]。但是,這些方法都有其不足之處。人工神經網絡法需要的樣本數據大,而且原理和計算復雜,灰色評價法存在均值化問題,模糊評價法僅適用于水質評價因子超標情況接近的情況[2-3]。支持向量機在處理小樣本數據方面有優勢,但由于支持向量機的參數選擇具有盲目性,所以本文選用灰狼算法來優化支持向量機模型,然后對水質進行評價,并與其他模型進行對比分析。
1 支持向量機
支持向量機的基本原理是:對于線性問題,通過尋找一個最優超平面,在分開兩類樣本的同時,使分類的間隔最大化;對于非線性問題,將樣本點從低維空間映射到高維空間,然后尋找一個超平面將不同的樣本數據分開,實現樣本的劃分,并且使樣本集到最優超平面的距離最大[4-11]。
假設樣本數據為[xi],[i]=1,2,3…[m],支持向量機的特征函數為:
式中,[ω]為權重矩陣;[b]為誤差。
本文選用的核函數是徑向基核函數(RBF),即
式中,[g]為核函數參數。
2 灰狼算法
支持向量機的參數選擇具有主觀性,參數的優化能夠提高算法的有效性。目前,支持向量機的參數優化方法有很多種,傳統的算法有網格搜索算法、交叉驗證法以及一些智能優化算法,如遺傳算法、人工蜂群算法、粒子群優化算法和蟻群算法等[12-17]。但這些智能算法依然存在一些缺陷,如在尋優過程中易過早收斂、會陷入局部極值等[7]。相較于其他算法,灰狼算法能提供更有競爭力的結果,在探索性和競爭性方面具有一定優勢。解宏偉等人[16]利用GWO-SVM算法對礦山邊坡變形進行預測,陳穎等人[17]將GWO-SVR算法應用在鎘元素含量的預測上,其預測精度都相對提高。
本文選用灰狼算法來優化支持向量機的兩個參數,即懲罰因子[c]和核函數參數[g],以提高模型的預測性能。整個狼群分為四個等級:α狼、β狼、δ狼和ω狼。
首先是包圍獵物,其數學模型如下:
以α狼、β狼、δ狼為最優解,ω狼根據α、β和δ狼更新自己的位置,即
確認位置后,狼群開始狩獵,即得到最優解。
3 實例分析
根據《地表水環境質量標準》(GB 3838—2002),依據水域的功能和保護目標,將地表水劃分成五類:Ⅰ類、Ⅱ類、Ⅲ類、Ⅳ類和Ⅴ類水。部分評價因子的取值范圍如表1所示。
本文選取了滇池流域觀音山斷面2013—2014年共104組水質數據進行評價分析,試驗數據來源于中國環境監測總站,將其中的84組數據作為訓練集、20組數據組為測試集,將水質指標pH、DO、高錳酸鹽指數、NH3-N作為輸入變量,水質評價結果作為輸出變量。本文分別建立GWO-SVM水質評價模型、GA-SVM水質評價模型和SVM水質評價模型進行對比分析,結果如圖1、圖2和圖3所示。
由表2可以看出,GWO-SVM模型的分類正確率是90%,GA-SVM模型的分類正確率是85%,SVM模型的分類正確率是75%。在三種方法中,GWO-SVM模型的評價效果最好,其次是GA-SVM模型。
4 結論
本文選取滇池流域觀音山斷面2013—2014年的水質數據進行評價分析,利用灰狼算法優化支持向量機的兩個參數,即懲罰因子[c]和核函數參數[g],然后建立GWO-SVM水質評價模型,并與GA-SVM水質評價模型、SVM水質評價模型進行對比分析。由評價結果對比分析可知,GWO-SVM模型的分類結果更好,準確率更高,可以為水質評估提供一種新方法和思路。
參考文獻:
[1]王維,紀枚,蘇亞楠.水質評價研究進展及水質評價方法綜述[J].科技情報開發與經濟,2012(13):129-131.
[2]李茜,張建輝,林蘭鈺,等.水環境質量評價方法綜述[J].現代農業科技,2011(19):285-287.
[3]郭美葉.基于SVM的洋河張家口段水質評價[J].水利科技與經濟,2018(1):8-12.
[4]Vapnik V.The Nature of Statistical Learning Theory[M].Heidelberg:Springer,1995:22-23.
[5]陳曦,仇蕾,黃澤元.最小二乘支持向量機在太湖流域水質評價中的應用[J].水生態學雜志,2013(6):16-21.
[6]聶篤憲,魏偉康,莊澤鴻,等.基于PSO和GA混合優化SVM的水質評價[J].水科學與工程技術,2019(3):1-4.
[7]李代華.基于改進布谷鳥搜索算法優化的SVM月徑流預測[J].中國農村水利水電,2020(8):171-176.
[8]王靜.基于混合數學模型的巢湖水質預測與評價[D].蘭州:蘭州大學,2018:18-19.
[9]姜雯,吳陳.基于改進粒子群算法的支持向量機遙感影像分類[J].江蘇科技大學學報(自然科學版),2020(5):66-72.
[10]晉健,劉育,王琴慧,等.基于小波去噪和FA-SVM的中長期徑流預報[J].人民長江,2020(9):67-72.
[11]陳慧.基于SVM算法的服務器性能分析與預測研究[D].南昌:南昌大學,2019:23-24.
[12]崔麗潔,程換新,劉軍亮,等.群智能優化算法優化支持向量機的方法及應用[J].電子測量技術,2019(7):44-48.
[13]Mirjalili S,Mirjalili S M,Lewis A.Grey wolf optimizer[J].Advances in Engineering Software,2014(3):46-61.
[14]張曉鳳,王秀英.灰狼優化算法研究綜述[J].計算機科學,2019(3):30-38.
[15]孔令剛,焦相萌,陳光武,等.基于Mallat小波分解與改進GWO-SVM的道岔故障診斷[J].鐵道科學與工程學報,2020(5):1070-1079.
[16]解洪偉,朱東麗.基于PCA-GWO-SVM的礦山邊坡變形預測[J].礦山測量,2020(1):63-66.
[17]陳穎,張燦,肖春艷,等.基于GWO-SVR的土壤鎘元素含量含水率校正預測模型研究[J].光學學報,2020(10):180-187.