王 澤
(臨汾市水文水資源勘測分局,山西 臨汾 041000)
中國國土面積963萬km2,現有2 474個國家級地面站,國家級氣象站覆蓋率較低,且現有氣象站數據存在蒸發量缺測現象,正確認識水面蒸發量與氣象因子之間的關系,建立適用于中國地區的區域性水面蒸發計算模型,對水資源利用等都具有十分重要的現實意義[1-3]。目前也有學者結合BP(Back-Propagation)神經網絡等建立了蒸發量預測模型,但對不同氣象因子組合與蒸發量預測結果的影響極為缺乏[4-5]。
以山西省晉城市陽城氣象站2015—2016年日氣象數據為基礎,利用灰色關聯理論,計算各影響因子對水面蒸發量的灰色關聯度,選擇關聯度較高的影響因素進行組合,作為模型輸入變量組,建立了不同氣象因子組合下的蒸發量的BP預測模型,并以該站2017年日氣象數據對模型模擬結果進行驗證,分析模型的合理性。
選擇晉城市陽城站(站碼53 975)基礎氣象數據,數據來源中國氣象科學數據共享服務網,包括2016—2017年陽城站的逐日平均氣溫(TEM)、逐日平均風速(WIN)、逐日日照時數(SSD)、逐日平均相對濕度(RHU)、逐日20—20時累計降水量(PRE)及逐日蒸發量(EVP)數據。
灰色系統理論是學者鄧聚龍于1982年創立的預測理論,是一種解決貧信息、少數據問題的常用方法。原理是以樣本數據為依據,利用灰色關聯理論,求出灰色關聯度,以此描述因素間關系的強弱和次序。利用灰色關聯理論,確定各氣象因子對蒸發量作用的大小,合理確定蒸發量預測模型的輸入因子。
利用Matlab軟件設計模型的BP神經網絡結構。所選擇的訓練函數、輸入層激活函數、隱含層激活函數與輸出層激活函數分別為trainlm函數、sigmoid函數、tansig正切函數與purelin線性函數。設定的建模參數如表1所示。

表1 模型設定的訓練參數
計算時,依據公式(1)限定的最小初始隱含層節點數,構建網絡模型。

式中:z——中間隱含層神經元個數;
f——輸入層神經元個數;
k——輸出層神經元個數;
p——介于0~10的任意常數。
蒸發量BP神經網絡預測模型拓撲結構,如公式(2)所示:

式中:net——蒸發量BP預報模型結構;
newff——Matlab工具箱中的BP神經網絡函數;
minmax()——輸入變量的取值矩陣;
traininput——輸入變量;
[10,2]——10為中間隱含層個數,2為輸出隱含層的個數;
tansig——輸入層到隱含層的傳遞函數;
purelin——隱含層到輸出層的傳遞函數;
trainlm——灰色BP神經網絡預報模型的學習函數。
通過比較訓練結果,決定系數R2對模型的預測效果,R2越大預測結果越好。評判系數見公式(3):

式中:N——樣本數量;
θi——實測值;
利用灰色關聯理論計算得到影響蒸發量的5個參數對蒸發量的關聯度,如表1所示。一般關聯度大于等于0.8時,子序列與母序列關聯度很好[6]。本次研究選擇的參數的關聯度均在0.80以上,因此各氣象因子的選取是合理的。

表1 各氣象因子與蒸發因子關聯度
所選輸入因子,有逐日平均氣溫(TEM)、逐日平均風速(WIN)、逐日日照時數(SSD)、逐日平均相對濕度(RHU)、逐日20—20時累計降水量(PRE)及逐日蒸發量(EVP)。預報模型精度的提高,不僅依賴于數據挖掘技術的應用,還取決于輸入變量的選擇。為研究不同因子組合下的模型預測效果,分別構建不同數量因子組合下的預測模型,共計26組,對模型輸出結果進行檢驗,從而尋求最佳的模型輸入因子組合。以2015—2016年日系列氣象因子組合作為輸入變量,以2015—2016年日蒸發量作為輸出變量,構成模型訓練樣本,構建BP模型。取訓練效果最佳的BP神經網絡模型,以2017年相應的氣象因子組合,作為所建預測模型的測試樣本,得到模型的擬合結果。通過對26種因子組合樣本進行訓練,建立了26個蒸發量預測模型,各因子組合下的訓練效果,如表2所示。

表2 各因子組合下的模擬效果
由表2可知,各因子組合下的模型R2介于0.570與0.929之間,訓練差距較大,表明因子組合是影響蒸發量預測精度的關鍵因素。建立的BP蒸發量訓練模型精度最高(R2最大取為0.929)時,對應的因子組合為TEM+WIN+SSD+RHU+PRE;其次R2為0.920時,對應的因子組合為TEM+WIN+SSD+RHU;訓練模型精度最低(R2最小為0.570)時,對應的因子組合為RHU+PRE,最佳與最差訓練結果對比見圖1。
這表明,對晉城地區的蒸發量預測,取TEM+WIN+SSD+RHU+PRE組合,進行BP模型構建與訓練,模型模擬結果最為可靠,更為接近實際,TEM+WIN+SSD+SSD+RHU組合次之。取RHU+PRE組合其結果較差,不能為實際提供參考。

圖1 訓練結果對比圖
本文取TEM+WIN+SSD+RHU+PRE組合作為輸入因子訓練得到的BP神經網絡模型對晉城市2017年蒸發量進行預測,結果如圖2所示。

圖2 預測實測結果對比
得到預測值與實測值的R2為0.629,顯著性P為0.000,達到了顯著相關水平,以相對誤差在20%以內作為判定標準,該預測模型對蒸發練的預測共有231d,合格率為63.11%,可見該模型預測結果與實際情況較為一致。
基于灰色關聯與BP神經網絡,建立了26組由不同因子組合的晉城地區蒸發量預測模型,對模型精度進行對比分析后,得出氣象因子組合對模型訓練效果具有重大影響。在晉城地區模型模擬精度最高時,對應的因子組合為TEM+WIN+SSD+RHU+PRE,此時訓練模型R2值0.929。
本研究內容可為蒸發量預測提供新的思路:實踐中當資料無法滿足最佳因子組合時,可根據本研究所得的因子組合精度表,選取所能得到的現有因子資料,進行預測精度最高的因子組合,對該地區的蒸發量進行預測。一方面,有助于提高資料充足地區的蒸發量預測精度;另一方面,可以為資料缺乏地區的蒸發量預測提供參考。建議對不同地區的季節性蒸發量預測模型進行研究,尋找區域性最佳預測因子組合,為蒸發量預測提供更多依據。