張 海 榮,湯 正 陽,曹 輝
(1.三峽水利樞紐梯級調度通信中心,湖北 宜昌 443002; 2.智慧長江與水電科學湖北省重點實驗室,湖北 宜昌 443002)
精度較高的徑流預報是水工程調度、水資源高效利用的重要基礎。徑流預報從預報尺度區分,可以分為以日或者小時為尺度的短期預報和以月或者旬為尺度的中長期預報。隨著衛星遙感和數值天氣預報等技術的快速發展,短期降雨預報在預見期和預報精度上都有了長足進步[1-2],考慮水文循環特性的短期徑流方法層出不窮,短期徑流預報精度不斷提高。然而,由于大氣環流異常復雜,較長時間尺度的降雨等氣象因素預報效果欠佳,中長期徑流預報較長時期以內仍以數理統計方法為主,具體可分為時間序列方法和多元數理回歸方法等[3]。
近年來,隨著氣候觀測技術和機器學習技術的快速發展,較多學者嘗試將遙相關氣候因子和機器學習引入中長期徑流預報,并取得了不錯效果[4-5]。受海陸循環影響,陸地水循環過程可能會受到大氣環流指數、海平面氣溫、氣壓等遙相關氣候因子的影響,但影響流域水文循環的因子往往成百上千,且存在不同程度的時滯效應,如前5個月的太平洋區域平均海平面溫度與宜昌站的徑流存在較強相關關系[6]。如此眾多的輸入因子在輸入模型訓練之前必須進行一定的預報因子篩選,保證模型的計算精度與效率。
輸入因子的選擇是中長期徑流預報研究的重要內容。由于影響流域徑流的遙相關氣候因子往往與徑流存在高維的非線性關系,一般的統計方法難以挖掘其中的相關關系。同時,因子與因子之間的相關關系如何剔除,如某一個因子可由其他因子推導得出,那么此因子包含的信息就是冗余信息,應該予以剔除。在眾多輸入因子篩選方法中,有學者以互信息為基礎,通過度量輸入變量與預報對象之間的相關關系,提出偏互信息方法,可有效剔除新加入因子對預報對象相關性的增量,有效避免了冗余變量的選入[7]。
在中長期徑流預報模型研究方面,人工神經網絡等模型發展迅速,其中包括BP(Back Propagation)神經網絡[8]、自組織映射(Self-organizing Map,SOM)神經網絡[9]、Hopfield神經網絡[10]、徑向基函數(Radial Basis Function,RBF)神經網絡[11]、廣義回歸神經網絡(General Regression Neural Network,GRNN)[12]等模型,均取得了較好的預報精度[13-17]。長短時記憶(Long Short- Term Memory,LSTM)網絡是循環神經網絡中一種帶有門控的網絡,能夠考慮到數據的時序性特點,學習到數據之間的長期依賴關系,在處理時間序列數據的預測方面具有獨特的優勢,在時間序列預測領域使用廣泛[18-20]。
隨著電力市場改革的不斷推進、水電站長中短期精細化調度要求的不斷提高,長江流域中長期徑流預報的重要性不斷凸顯,有眾多學者采用多元線性回歸[21]、人工神經網絡[22]、貝葉斯經驗統計[23]等方法探索了長江流域徑流預報方法,但對業務預報中,如何有效應用遙相關氣候因子、降雨信息等多源數據制定合理的預報方案,缺乏進一步的對比研究。基于此,本文以長江上游流域宜昌站為主要研究對象,在歷史降雨徑流數據的基礎上,引入130個遙相關氣候因子,基于偏互信息篩選輸入因子,應用LSTM神經網絡模型建模,對宜昌站的月徑流預報方案進行比選。
本文以長江上游主要控制站點宜昌站徑流為主要研究對象。長江干流自江源至湖北省宜昌段為長江上游,包括江源段、通天河段、金沙江段和川江段。長江干流上游河段長4 504 km,流域面積約100萬km2。長江流域的多年平均徑流量中上游來水量占47.0%,其中金沙江水系占16.1%,岷沱江占10.9%,嘉陵江占7.4%,烏江占5.7%,長江上游干流占6.9%。
研究采用1981~2019年宜昌站的還原月徑流量,以及石鼓以上、雅礱江、石鼓-宜賓段、岷沱江、嘉陵江、烏江、宜賓-重慶段、重慶-宜昌段等8個子流域或區間的面平均累計月降雨作為基礎數據。徑流數據來源于長江水利委員會水文局歷史整編資料,降雨數據來源于湖北省氣象局整編資料。
研究采用的氣候因子從國家氣候中心(https:∥cmdp.ncc-cma.net/Monitoring/cn_index_ 130.php)下載,包括北半球副高面積指數、北非副高面積指數、北非-大西洋-北美副高面積指數等88項大氣環流指數,NINO 1+2區海表溫度距平指數、NINO 3區海表溫度距平指數、NINO 4區海表溫度距平指數等26項海溫指數,冷空氣次數、西太平洋編號臺風數、登陸中國臺風數等16項其他指數,一共130個遙相關氣候因子。
互信息(Mutual Information,MI)表示一個隨機變量中包含另一個隨機變量的信息量,可用于度量隨機變量間的所有相關關系,包括線性相關關系和非線性相關關系。令X和Y為兩個隨機變量,其互信息可定義為
(1)
式中:fX(x)和fY(y)分別為隨機變量X和Y的邊緣概率密度函數;fX,Y(x,y)為X、Y的聯合概率密度函數。若X、Y相互獨立,聯合概率密度函數等于邊緣概率密度函數和的乘積,式(1) 中對數函數內的值恒為1,MI值等于0;相反,隨機變量X和Y的相關性越強,MI值越大。
用互信息方法挑選影響徑流的遙相關因子難以避免冗余信息,為此采用偏互信息法(Partial Mutual Information,PMI),剔除無關變量以精簡模型輸入。離散型偏互信息的定義為
(2)
(3)
式中:E為期望值;x為備選輸入變量;y為預報對象;z為已選入的預報變量集合;x′為排除z影響x的殘差;y′為排除z影響y的殘差。其中,針對偏互信息中變量的邊緣概率密度函數和聯合概率密度函數估計,采取高斯函數作為核函數估計樣本概率密度:
(4)
(5)
以 Hampel 顯著性檢驗作為偏互信息的顯著性檢驗標準確定選擇邊界,計算式為
(6)
LSTM是從循環神經網絡(Rerrent Neural Network,RNN)衍生而來。在求解時間相關的輸入信號時,傳統的人工神經網絡由于其正向連接結構特性使其僅處理當前輸入,而不能使用先前信息。RNN 是一個循環網絡,它將隱藏神經元在前一個時間步的狀態作為下一個時間步的附加輸入。LSTM 則在RNN基礎上具有刪除或添加一些信息的能力。這個過程稱為門的結構控制。LSTM 用一個記憶單元和3個門代替了隱藏層中的普通神經元:輸入門、遺忘門和輸出門。LSTM可以根據新的輸入有選擇地更新記憶細胞狀態,忘記不相關的內容,或者分別根據輸入、遺忘和輸出門的狀態有選擇地輸出一部分記憶細胞狀態作為新的隱藏神經元狀態。通過這種方式,LSTM 能夠學習長時間跨度的時間序列。當前時間步ht的神經元狀態計算如下[19-20]:
ft=σ(Wf·[ht-1,xt]+bf)
(7)
it=σ(Wi·[ht-1,xt]+bi)
(8)
(9)
ot=σ(Wo·[ht-1,xt]+bo)
(10)
(11)
ht=ot⊙tanh(Ct)
(12)
式中:ft,it分別為t時刻的兩個控制門,ft為t時刻刪除的舊消息,it為t時刻添加的新消息;Ct為t時刻的網絡狀態,Ct′為t時刻網絡的更新信息;ht為t時刻LSTM隱藏層狀態;xt為t時刻的預報因子;yt為t時刻的預報對象;σ為sigmoid函數;Wf為遺忘門權重矩陣;bf為遺忘門偏斜向量;Wi為輸入門權重矩陣;bi為輸入門偏斜向量;WC為狀態更新的權重矩陣;bC為狀態更新的偏斜向量;Wo為輸出門權重矩陣;bo為輸出門偏斜向量;ot為模型輸出。
為充分對比宜昌站徑流與遙相關氣候因子、前期降雨和徑流的關系,設計以下3種研究方案。
(1) 方案1:歷史遙相關氣候因子。由于遙相關氣候因子與徑流存在一定的滯后性,因此以1 a(12個月)為滯后時期,分別比選130個遙相關氣候因子與長江上游徑流預報的相關關系,形成1 560(130×12)個遙相關備選輸入因子。特別說明,由于宜昌站徑流存在較強的周期特性,在歷史遙相關因子的分析中,并未將宜昌站歷史徑流放入備選因子,僅單獨挖掘遙相關因子與宜昌站徑流的相關關系。
(2) 方案2:歷史降雨徑流因子。參考遙相關因子的處理辦法,對石鼓以上、雅礱江、石鼓-宜賓段、岷沱江、嘉陵江、烏江、宜賓-重慶段、重慶-宜昌段等8個子流域或區間的面平均累計月降雨,和宜昌站歷史徑流共計9個因子,以1 a(12個月)為時滯形成108(9×12)個降雨徑流備選因子。
(3) 方案3:考慮徑流及當月降雨。參考方案2,在此基礎上增加石鼓以上、雅礱江、石鼓-宜賓段、岷沱江、嘉陵江、烏江、宜賓-重慶段、重慶-宜昌段等8個子流域或區間的預報當月降雨,共計116(108+8)個降雨徑流備選因子。
偏互信息篩選因子的方法分為2步。第1步,對每個因子對應的時滯作為輸入變量集合,如{石鼓以上前1月降雨,石鼓以上前2月降雨,…,石鼓以上前12月降雨},采用偏互信息法篩選石鼓以上降雨與宜昌站徑流相關性顯著的時滯。第2步,將第1步選出的輸入因子重新組成集合,再次運用偏互信息法挑選與宜昌站徑流相關性高的變量,形成最終的輸入變量。
通過對上述3種方案進行偏互信息篩選,得到各種方案的輸入因子如表1所列。

表1 不同方案輸入因子選擇結果Tab.1 Selection results of input factors for different schemes
從歷史遙相關因子的結果篩選可知,長江上游來水與半年前的西太平洋副高、厄爾尼諾NINO 1+2區海表溫度距平指數關系密切。這也與麥紫君等[6]的研究成果類似,而本研究更進一步印證了西太平洋副高系統對長江流域的徑流影響。從歷史降雨與徑流的相關關系來看,宜昌站徑流與去年同期宜昌站徑流、上一月的岷沱江、烏江和雅礱江降雨關系密切,同時,模擬當月的嘉陵江、宜賓-重慶段降雨與宜昌站徑流相關性較強。
利用LSTM模型,分別采用不同方案的輸入因子,對宜昌站徑流進行預報。其中,70%數據用作訓練,30%數據用作檢驗。訓練期以及檢驗期精度如表2 所列。

表2 不同方案預報精度結果Tab.2 Forecast accuracy of different schemes
從表2的結果可知,應用遙相關氣候因子進行中長期徑流預報具有一定的可行性,在未加入前期徑流的情況下,檢驗期確定性系數為72%,且理論上單獨使用遙相關氣象因子進行預報,可以具有5個月的預見期。在應用歷史降雨徑流因子的預報中,由于去年同期和上月宜昌站徑流的引入,檢驗期預報精度可以達到84%。進一步,若引入徑流預報當月的實測降雨,檢驗期預報精度可達到93%,證明了宜昌站徑流與當月降雨的強相關性,在中長期徑流預報中應用定量預報降雨對于提升預報精度效果顯著。
3種方案的實測與模擬徑流值如圖1~3所示。3種方案對徑流的周期性,以及低流量過程都有很好的預報效果。方案1應用遙相關因子的中長期徑流預報中,在訓練期對于大流量過程刻畫段準確,但在檢驗期,存在預報較大的情況。方案2中,對訓練期內大流量過程存在預報偏小的問題,但對檢驗期的大流量過程刻畫較準確。在方案3中,由于引入了模擬當月預報降雨,訓練期和檢驗期的大流量過程模擬效果都較為優秀。對比方案1和方案2,可以得出遙相關氣候因子相比于降雨信息,對中長期的極值預報具有更高的指導性,例如1998年的長江流域大洪水,厄爾尼諾便是其重要原因,而遙相關因子正好可以有效刻畫這一現象。
本文以長江上游流域宜昌站為主要研究對象,在歷史降雨徑流數據的基礎上,引入130個遙相關氣候因子,基于偏互信息篩選輸入因子,應用LSTM神經網絡模型建模,對宜昌站的月徑流預報方案進行比選。研究表明:長江上游來水與半年前的西太平洋副高關系密切,NINO 1+2區海表溫度距平指數也與宜昌站徑流存在較強的相關性。在遙相關氣候因子之外,宜昌站徑流與去年同期宜昌徑流、上一月的岷沱江、烏江和雅礱江降雨關系密切,若能加入預報當月的嘉陵江、宜賓-重慶段降雨,將大幅提升宜昌站的中長期預報精度。