孫步陽,呂獻林,張俊鵬
(中國電建集團河南省電力勘測設計院有限公司,鄭州 450007)
湖泊富營養化是湖泊發展的自然過程,隨著經濟的快速發展和城市化的加劇以及工農業廢棄物的排放等使湖泊水體逐步由貧營養狀態向富營養狀態變化的現象[1]。傳統的富營養化狀態評價主要包括樣點水樣采集、水質參數指標分析和富營養化狀態評價。傳統的湖泊水體富營養化評價方法只能評價樣點處的富營養化狀態,無法進行大面積水域的富營養化狀態評價[2,3]。
由于傳統多光譜傳感器分辨率較低,很難定量分析水質參數的吸收特征。隨著高光譜傳感器的出現,傳感器分辨率達到納米級,可以有效提高光譜特性的分辨力,極大地提高了傳感器監測精度[4,5]。因此,運用高光譜遙感技術合理評價大面積水域的富營養化狀態對水質環境監測和防治具有重要意義和理論價值。
極限學習機(Extreme learning machine,ELM)是一種單隱含層的前饋神經網絡。ELM 模型由輸入層、隱含層和輸出層組成,其結構如圖1 所示。

圖1 ELM 模型結構
假定有N個訓練樣本(Xi,Ti),Xi=[xi1,xi2,…,xin]T∈Rn,Ti=[ti1,ti2,…,tim]T∈Rm,其中輸入變量和輸出變量分別為n和m個。隱含層節點數為L的ELM 模型的輸出可表示為式(1)[6]:

式中,Wi=[wi1,wi2,…,win]T和βi分別為ELM 模型的輸入權重和輸出權重;bi為第i個隱含層節點的偏置;g(x)為激勵函數;Wi × Xj為Wi和Xj的內積。
ELM 模型訓練的目標就是使得式(2)的誤差最小。

由式(1)和式(2)可知,存在一組βi、Wi和bi滿足式(3):

式(3)的矩陣形式為:

式(4)中,H為隱含層節點的輸出矩陣;β為輸出權重矩陣。其中H矩陣、β矩陣和T矩陣如式(5)所示:



在ELM 模型的訓練過程中,保持Wi與bi不變,β的最小二乘解可以通過求解式(7)獲得:

式(7)的最小二乘解可表示為:

螢火蟲算法(Firefly algorithm,FA)是一種新型的智能優化算法[8,9],該算法中將螢火蟲的亮度(I)、吸引度(β)、螢火蟲之間的距離(rij)分別定義為:

式中,I0為最大亮度,β0為最大吸引度。對于螢火蟲i,其位置xi更新公式為:

式中,α和rand均為隨機數。
湖泊水質富營養化狀態評價本質上是一個多分類問題。針對ELM 模型性能受初始輸入權重Wi和隱含層偏置bi的影響,運用FA 算法對初始輸入權重Wi和隱含層偏置bi進行優化選擇,將分類準確率fT作為目標函數:

式中,Total和right分別為樣本總數量和正確分類的樣本數量。
采用FA-ELM 的湖泊水質富營養化狀態評價模型流程如圖2 所示。首先,將采集的湖泊水質富營養化狀態評價數據劃分為訓練數據和測試數據;之后,針對訓練數據集運用FA 優化ELM 的參數組合(W,b)建立基于FA-ELM 的湖泊水質富營養化狀態評價模型;最后,將FA 尋優獲取的最佳參數組合(W,b)代入ELM 進行測試。

圖2 基于FA-ELM 的湖泊水質富營養化狀態評價流程
巢湖是中國五大淡水湖之一,面積約787.4 km2,位于安徽省中部,是中國水污染防治的重點水體[10,11]。巢湖水質采樣點分布如圖3 所示。點位3、點位5 和點位6 為巢湖東部湖區,點位7、點位9 和點位10 為巢湖中部湖區,點位12 和點位13 為巢湖西部湖區,點位2 為雙橋河河口,點位4 為柘皋河河口,點位8 為兆河河口,點位11 為杭埠河河口,點位14、點位15、點位16 和點位17 分別為南淝河河口、塘西河河口、派河河口以及十五里河河口。

圖3 巢湖水質采樣點分布
為了驗證FA-ELM 算法的優越性,選擇200 組不同富營養化狀態高光譜圖像為研究對象,其中訓練集160 組,測試集40 組。圖4a、圖4b、圖4c 和圖4d 分別為重富營養、富營養、中營養和貧營養狀態下的高光譜圖像。

圖4 不同富營養化狀態高光譜圖像
分別運用不同算法對水質富營養化進行了評價。其中FA 算法參數設置為:螢火蟲數量N=10、最大迭代次數Tmax=50、初始吸引度β0=1、步長因子α=0.5,搜索區間[-1,1];ELM 參數設置為:隱含層節點數hiddennum=16。將FA-ELM 與PSO-ELM、GAELM、DE-ELM 和ELM 進行對比分析。算法通用參數設置為:種群規模10,最大迭代次數50,搜索區間[-1,1];粒子群算法(Particle swarm optimization algorithm,PSO)參數設置為:學習因子c1=c2=2;遺傳算法(Genetic algorithm,GA)參數設置為:交叉概率0.7,變異概率0.1;差分進化算法(Differential evolution algorithm,DE)參數設置為:交叉概率0.7,縮放因子0.5。由表1 知,FA-ELM 在訓練集和測試集上的分類準確率分別為99.38%和98.82%,優于PSOELM、GA-ELM、DE-ELM 和ELM;ELM 的水質富營養化評價準確率最低,分別為87.66%和86.47%。通過對比發現,算法FA-ELM 可以有效提高水質富營養化評價的準確率。由圖5 可知,FA-ELM 具有更快的收斂速度和更小的適應度誤差,效果較好。

圖5 收斂曲線對比

表1 水質評價結果
為提高湖泊水質富營養化狀態評價的精度,提出了一種基于高光譜遙感和FA-ELM 的湖泊水質富營養化狀態評價方法。研究結果表明,與PSOELM、GA-ELM、DE-ELM 和ELM 相比,FA-ELM 算法可以有效提高水質富營養化評價的準確率。FA算法通過優化ELM 模型初始輸入權值和隱含層偏置,可以有效提高ELM 模型的預測能力,因此將FA-ELM 應用于湖泊水質富營養化狀態評價具有一定的推廣價值和工程應用價值。