鮑玲玲, 楊永剛, 劉建軍, 張衛華
(1.重慶市水利電力建筑勘測設計研究院, 重慶 400020; 2.西南大學 資源環境學院, 重慶 400715)
近年來,全球變暖逐漸加劇,洪災、旱災等極端氣候事件不斷發生,國內作物產量受頻繁水旱災害的嚴重影響[1-2]。為降低自然災害對作物產量的影響,需要制定精確預測作物需水量的方法,及時為灌溉決策提供依據[3-4]。作物系數法是確定作物需水量的主要方法之一,通過計算作物系數Kc與參考作物蒸散量(Reference crop evapotranspiration,ET0)的乘積,最終確定作物需水量,該方法已在新疆[5]、河北等[6]地得到了證明。ET0的準確估算是精確獲得作物需水量的關鍵,目前國際糧農組織FAO-56分冊推薦Penman-Monteith(P-M)公式為計算的標準方法[7-8],以輻射項和空氣動力學項為基本原理,綜合考慮了各種氣象因素,保證了公式的計算精度,但該公式需要的氣象資料較多,對于氣象數據難以獲得的區域難以使用,因此在一定程度上限制了P-M公式的應用[9-10],找到合適的區域ET0簡便估算方法成為了國內外研究的熱點。
目前估算ET0的方法分為經驗模型和人工智能模型2大類[11-12],人工智能模型近幾年得到了廣泛的應用[13]。魏俊等[14]以極限學習機模型為基礎,建立了西北地區ET0估算模型,精度高于Hargreaves-Samani,Chen,EI-Sebail和Bristow等經驗模型;徐穎等[15]基于極限學習機模型,計算了西北旱區ET0,確定了最優激活函數及參數組合輸入;馮禹等[16]基于遺傳算法優化BP神經網絡模型對川中丘陵區ET0進行了估算,模型精度明顯高于Priestley-Taylor模型、Makkink模型、Hargreaves模型和Mc Cloud模型。在同樣氣象數據輸入的前提下,人工智能模型精度均高于經驗模型,但針對人工智能模型而言,在不同區域究竟采用何種氣象數據輸入方式的研究較少。本研究將5種氣象數據進行排列組合,得出7種氣象數據輸入組合,分析不同組合下人工智能模型精度,對找到影響區域ET0關鍵因素,確定標準輸入組合方式具有十分重要的意義,同時對人工智能模型在ET0估算中的應用推廣十分必要。
作為國家重點生態功能區和農產品主產區,重慶受季風氣候影響,降雨年際年內變化幅度大,春旱、秋旱頻發,夏季受副熱帶高壓控制,雨旱同期,農作物常常遭受著洪旱災害的雙重威脅,嚴重影響了作物產量,重慶是我國重要的糧食生產基地,針對ET0最優估算模型的研究可為當地作物需水量確定和灌溉決策確定提供重要的指導依據,因此是十分必要的[17]。同時現有對人工智能模型的選擇較單一,未能對多種人工智能模型計算效果進行比較,由于不同人工智能模型在不同區域的精度不同,且所采用的最優氣象數據輸入組合同樣不同,同時尚未發現針對重慶地區ET0估算模型的研究。因此,本文基于重慶地區豐都、奉節、沙坪壩、萬州、酉陽共5個站點1991—2016年的逐日氣象數據,以支持向量機模型(SVM)、高斯指數模型(GEM)、隨機森林模型(RF)、極限學習機模型(ELM)和廣義回歸神經網絡模型(GRNN)5種人工智能模型為基礎,得出重慶地區不同氣象參數輸入組合ET0最優估算模型,為該地區灌溉決策制定提供依據。
重慶(105°17′—110°11′E,28°10′—32°13′N)地處長江上游,東臨湖南,西鄰四川,北接陜西,南到貴州,是西南地區重要的糧食生產基地。重慶為典型的亞熱帶季風氣候,年平均氣溫16~18℃,降水豐富,年均降水量超過1 000 mm,年日照時數1 000~1 400 h,屬于全國日照最低的地區之一。本文選擇重慶地區豐都、奉節、沙坪壩、萬州、酉陽共5個站點1991—2016年的逐日氣象數據,數據均來自于國家氣象中心,數據控制良好,氣象資料主要包括站點日最高氣溫(Tmax)、最低氣溫(Tmin)、日照時數(n)、相對濕度(RH)和2 m處風速(U2)。具體站點分布圖可見圖1。

圖1 重慶地區氣象站點分布
為得出計算重慶地區的ET0標準人工智能模型,本文以P-M模型為計算標準,分別選擇支持向量機模型、高斯指數模型、隨機森林模型、極限學習機模型和廣義回歸神經網絡模型共5種人工智能模型,其中支持向量機模型、隨機森林模型、極限學習機模型和廣義回歸神經網絡模型精度已在部分地區得到驗證,但在重慶地區的精度仍未見研究報道,同時高斯指數模型尚未應用于國內ET0估算當中,因此本文基于這5種模型對重慶地區ET0進行模擬,可較好地適應人工智能模型預測研究的前沿方向。
FAO-56分冊推薦的Penman-Monteith(P-M)公式為ET0計算的標準模型,其模型型式及參數意義見文獻[17],具體公式如下:

(1)
式中:ET0是由P-M方法計算得到的參考作物蒸散量數值(mm/d),Rn是作物表面的凈輻射[MJ/(m2·d)];T是2 m高處的日均氣溫(℃);G是土壤熱量通量密度[MJ/(m2·d)];U2是2 m高處的風速(m/s);es是飽和水汽壓差(kPa);ea是實際水汽壓差(kPa);Δ是蒸汽壓曲線的斜率(kPa/℃);γ是干濕計常數(kPa/℃)。
1999年Vapnik[18]首先提出了支持向量機模型(Support vector machine,SVM)。該模型以結構經驗最小化代替傳統的經驗最小化,克服了神經網絡的諸多不足,模型原理可用下式表示:
(2)
式中:xj,yi為輸入向量的縱坐標;κ(xi,xj)是由輸入向量xi轉換而來的高維特征向量;αi為輸入向量的權重;b為經驗系數。
Liu等[19]提出了高斯指數模型(Gaussian exponential model,GEM)。該模型分為3個程序,首先,通過K-means算法對原始樣本進行聚類學習。其次,基于最大似然估計進行參數估計,最后,根據最大后驗概率標準重新組合學習樣本。該模型可以定義為:
(i=1,2,…,n)
(3)
式中:Hi是峰值幅度;Ni是高峰時間位置;Wi是高斯波的半寬。
隨機森林(Random forest,RF)模型由Breiman提出。該模型在模型訓練期間引入隨機屬性選擇,該模型基于隨機性和差異提取數據,可以大大提高決策的準確性[20]。
極限學習機模型(Extreme learning machine,ELM)是單隱層前饋神經網絡學習算法,其學習速度比傳統神經網絡算法更快,主要包括輸入層、隱含層和輸出層3個部分,首先通過輸入層輸入所求變量,通過與隱含層之間的權重ωij,計算出輸出層權重βjk和輸出變量矩陣,得出最終結果[21]。
廣義回歸神經網絡模型(Generalized regression neural network,GRNN)由輸入層、模式層、求和層和輸出層等4層神經元組成[22]。
本文以5個氣象站點1991—2016年逐日氣象數據進行模型訓練與預測,氣象數據主要包括日最高氣溫(Tmax)、最低氣溫(Tmin)、日照時數(n)、相對濕度(RH)和2 m處風速(U2),以1991—2011年的數據訓練模型,以2012—2016年的數據驗證模型精度,采用不同的氣象參數輸入組合,驗證不同組合形式下不同模型的精度,具體組合形式見表1。

表1 不同模型參數輸入組合
以均方根誤差(RMSE),相對均方根誤差(RRMSE),確定系數(R2),平均絕對誤差(MAE)和效率系數(Ens)5種指標形成評價指標體系,用于評判不同模型的精度,具體公式如下:
(3)
(4)
(5)
(6)
(7)

由于評估指標過多,單個評估指標很難比較不同的模型。因此,引入GPI指數來全面評估模型仿真結果,通過計算不同模型GPI的數值,比較不同模型精度,其中GPI數值越高,表明該模型精度越高[23],具體公式如下:
(8)
式中:αj為常數,反映了不同指標對于最終精度的影響程度,其代表了指標性質與精度最優值之間的距離,因此對于負相關的誤差指標MAE,RRMSE和RMSE,αj取1,正相關的一致性指標Ens和R2,αj取-1,gj為不同指標的縮放值的中位數;yij為不同指標的尺度值。
分別計算不同站點共35種模型的精度指標,計算結果可見表2。由表中可以看出,不同模型在不同參數輸入下的精度存在差異。在豐都站,當以組合1為輸入組合時,GEM1模型精度最高,SVM1模型精度次之,RMSE分別為0.150,0.207 mm/d,RRMSE分別為6.67%和9.19%,R2分別為0.989,0.979,Ens分別為0.989,0.978,MAE分別為0.116,0.161 mm/d,2種模型的GPI指數分別為1.135,0.732,排名較高;在組合2的條件下,同樣是GEM2模型和SVM2模型表現出了較高的精度,而RF2模型精度最低,其RMSE為0.295 mm/d,RRMSE為13.13%,R2為0.957,Ens為0.956,MAE為0.227 mm/d,GPI指數為0.068;輸入組合3時,GEM3模型精度遠高于其余模型,其RMSE為0.278 mm/d,RRMSE為12.36%,R2為0.961,Ens為0.961,MAE為0.196 mm/d,GPI指數為0.244;當輸入組合4時,GEM4模型和SVM4模型精度較高,RF4模型精度最低;輸入組合5時,GEM5模型精度較高,其GPI指數為正,達到了0.260,其余模型精度較低,GPI指數均為負;輸入組合6的模型精度遠低于其余模型,精度最高的模型為GEM6模型,但GPI值僅為-2.548;輸入組合7時,GEM7精度最高,而GRNN7模型精度最低。

表2 ET0日值計算精度指標(以豐都為例)
在奉節站,當輸入組合1時,GEM1模型精度最高,RMSE為0.368 mm/d,RRMSE為12.51%,R2為0.937,Ens為0.935,MAE為0.291 mm/d,GPI指數為0.820,在所有模型中精度最高;當輸入組合2時,GEM2模型精度遠高于其余模型;在該站點,輸入其余組合時均表現為GEM模型精度最高。
在其余站點,當輸入不同的參數組合時,均表現為GEM模型精度遠高于相同組合輸入情況下的其余模型。
圖2為整個區域不同模型的計算精度對比。由圖中可以看出,在整個重慶地區,在相同組合下同樣表現為GEM模型精度最高,而GRNN模型和RF模型的精度較低。在相同模型下,輸入組合1時表現出的精度最高,表明輸入5種全氣象參數可保證模型計算精度,在4種氣象參數輸入的組合下,輸入組合2(Tmax,Tmin,n,U2)和組合4(Tmax,Tmin,n,RH)的精度明顯高于輸入組合3(Tmax,Tmin,U2,RH),這表明輻射項n是保證模型精度不可缺少的重要因素,而組合4的精度要高于組合2,這表明相對濕度RH對ET0變化的影響程度高于風速U2。輸入3種氣象參數時,組合5的精度要顯著高于組合6,表明Tmax和Tmin同樣是影響模型精度的關鍵因素。比較組合5和組合7的精度可知,有無輻射項n對模型精度的影響顯著,綜上分析,重慶地區5種氣象因素對ET0變化的影響程度由高到低依次為日照時數n、溫度項Tmax和Tmin、相對濕度RH、風速U2。

圖2 整個研究區域不同模型不同組合計算精度
圖3(以豐都為例)為不同模型計算ET0月值的年內分布趨勢對比。由圖中可以看出,不同模型計算結果與P-M模型計算結果變化趨勢基本一致,均呈現先增加后降低的變化趨勢,其中在輸入組合1時,不同模型ET0月值變化趨勢與P-M模型計算結果最為接近,在組合1中GEM模型與P-M模型計算結果的曲線圖擬合效果最好,GRNN模型和RF模型在各個站點的擬合效果較差;在組合2時,擬合效果較組合1有所降低,同樣表現為GEM2模型的擬合效果最高;在輸入組合3時,不同站點均表現為GEM3模型精度最高;組合4與組合2的模擬結果較一致,計算精度要顯著高于組合3;組合5和組合6輸入參數較少,而組合5的計算精度顯著高于組合6,組合7雖然僅輸入了Tmax和Tmin2種參數,但其精度要高于組合6。顯然在進行ET0月值模擬計算時,組合6輸入n,RH,U2等3種參數是不可取的。

圖3 不同模型豐都站ET0月值變化趨勢
為證明人工智能模型的優勢,本文計算了4種經驗模型的精度,并與相同參數輸入情況下精度最低的人工智能模型對比,結果見表3。由表3可知,雖然輸入Tmax,Tmin,n的SVM5模型和輸入Tmax,Tmin的SVM7模型的精度在人工智能模型中最低,但其精度仍高于相同輸入參數的經驗模型,因此,在缺少氣象資料情況下,建議在重慶地區采用人工智能模型計算ET0。

表3 人工智能模型與經驗模型精度對比
在相同輸入參數條件下的人工智能模型精度要明顯高于經驗模型,這與劉小華等[24]、魏俊等[14]、邢立文等[25]的研究結論基本一致。本文研究發現,GEM模型在所有模型中表現出了最高的精度,該模型可通過比較標準數據和模擬數據之間的關系,從而計算出高斯指數用于模型模擬,在一定程度上保證了模型精度。Lesser等[26]驗證了GEM模型與其余模型的計算精度,同樣指出該模型可保證模型效率和訓練速度,其精度最高。
本文研究表明,所有的應用模型能夠較好反映出ET0與大氣之間變化關系的復雜過程,這主要是由于人工智能算法能夠識別ET0與環境變量之間的非線性關系[27]。在不同站點中,GEM模型在不同輸入參數組合條件下,都表現出了最高的精度,同時該模型的預測模擬時間僅為15 s,遠低于其余模型(ELM為20 s,SVM模型為33S,GRNN模型為50 s,RF模型為65 s),作為一種較新的建模技術,GEM模型在預測日ET0方面表現出較高精度,這在以往的研究中從未得到證實,同時該模型的計算效率要高于其余模型,這表明該模型方法具有簡單的網絡結構和非調優機制。這一優勢可將該模型用于解決諸如干旱、降雨和徑流預測等實時預報問題中。
本文研究同時表明,ELM模型能夠普遍較好估算日ET0。SVM模型、GRNN模型和RF模型需要更長的時間來尋找各自的最優參數。與其余模型相比,ELM模型更有效地避免過擬合,并具有更高的趨近度[28]。同時,已有研究表明,ELM模型在運行過程中存在Sine函數、Radbas函數和Hardlim函數共3種激活函數,本文采用ELM模型默認的Sine激活函數進行計算,雖已有研究表明,Sine激活函數下的ELM模型精度最高,但在重慶地區尚未得到驗證。在今后的研究中,將對不同激活函數下的ELM模型精度進行比較,以期得到適用于重慶市ET0模擬的最優ELM模型激活函數。本文同時發現,影響重慶地區ET0變化的主要因素由高到低依次為日照時數n、溫度項Tmax和Tmin、相對濕度RH、風速U2。可基于無偏導數法計算該地區5種氣象因素對于的ET0敏感系數,從而驗證該結論[29]。計算出的敏感系數結果可見表4,由表4可以看出,日照時數、溫度項的敏感系數較高,相對濕度RH次之,風速的敏感系數最低,進一步驗證了本文結論。

表4 不同站點氣象因素對的ET0敏感系數
本文以1991—2011的數據進行訓練模型,估算了2012—2016年的ET0數據,得到了較高的精度,驗證了GEM模型的精確性。CMIP6數據給出了未來不同氣候情景下的氣象數據值,在今后的研究中,可以用CMIP6的氣象數據,對不同氣候情景下ET0進行估算,進一步驗證GEM模型的準確性。
(1) 不同站點不同氣象輸入組合條件下,GEM模型均表現出了較高的精度,其次是ELM模型,表明GEM模型可作為重慶地區ET0計算的標準模型使用。
(2) 對比人工智能模型與經驗模型的計算結果可知,在相同氣象參數輸入的情況下,人工智能模型計算精度要高于經驗模型。
(3) 由Tmax,Tmin,n,RH,U2共5種氣象參數的輸入情況可知,5種氣象參數對重慶地區ET0變化的影響程度由高到低依次為日照時數n、溫度項Tmax和Tmin、相對濕度RH、風速U2,日照時數n、溫度項Tmax和Tmin是保證重慶地區人工智能模型精度必不可少的因素。
(4) 在實際應用中,當區域氣象數據無法獲取完全時,僅靠獲取區域日照和溫度數據,即可基于GEM模型得到較高精度的ET0數據,可為計算區域作物需水量提供重要的參數支持。