芮孝芳
(河海大學水文水資源學院,江蘇 南京 210098)
20世紀90年代,天氣預報的準確率較低,一位基層水文站的工作人員每天根據廣播電臺播送的天氣預報作預報:如果廣播報明天是晴天,他就報明天是陰雨天;反之,如果廣播報明天是陰雨天,他就報明天是晴天。1年后發現廣播發布的天氣預報與他發布的天氣預報準確率均在50%左右。這個故事雖帶有幽默色彩,也可能比較片面,但基本上反映了當時降水預報的狀況,當時降水預報的精度不及洪水預報精度。近30年過去了,人們發現降水預報的精度有了明顯的提高,這主要得益于氣象觀測技術的提升和觀測數據的進一步精細,以及數值天氣預報理論和方法的日趨成熟。但洪水預報的進步卻不甚明顯,例如,已經盛行了近半個世紀的流域水文模型對洪水預報的貢獻就不如大氣模式對數值天氣預報的貢獻。水文預報再也不能“坐井觀天”了,應先從水文預報中“跳”出來,從天氣預報的長足進步中吸取經驗,審視不足,然后再作改進。
筆者嘗試通過對預報的科學依據、預報方法和預見期、初始場和邊值場、數據同化和數據融合等問題的論述,尋找洪水預報精度與數值天氣預報精度的差距原因,試圖為洪水預報的發展注入新動力。
天氣變化是天氣形勢變化和氣象要素變化的總稱[1]。天氣形勢是指高壓、低壓、槽脊、鋒面、對流等天氣系統的生成、移動、發展和消亡。氣象要素是指描述氣溫、濕度、風、云、降水、霧霾等天氣現象的物理量。天氣形勢變化導致了氣象要素變化。根據一定范圍內現時或過往的天氣形勢對一地的未來天氣形勢及氣象要素做出預先告知,或者根據與天氣形勢或氣象要素有成因關系的先兆因子對未來的天氣形勢或氣象要素做出預先告知,稱為天氣預報。天氣形勢預報是氣象要素預報的基礎,降水預報是天氣預報中最重要的預報之一。
水文變化雖然也可區分為水文情勢變化和水文要素變化[2],但由于水文要素一般只是定量描述水文情勢的物理量,不像天氣形勢與氣象要素那樣具有物理意義上的因果關系。因此,水文情勢變化、水文要素變化和水文變化一般是同義的。例如:水情就是指水位、流量等的變化,沙情就是指含沙量、輸沙率等的變化,墑情就是指土壤含水率的變化,冰情就是指冰厚、流凌等的變化,質情(水質狀況)就是指污染物濃度、水質等級等的變化。氣象要素的變化,以及下墊面和人類活動的作用是導致這些變化的原因。根據現時或前期出現的水文要素、氣象條件、下墊面狀況和人類活動,對其未來做出預先告知,或者根據與水文要素有成因關系的先兆因子,對其作出預先告知,稱為水文預報。洪水預報無疑是水文預報中最重要的預報之一。
預報必須遵循預報對象所服從的科學規律,這些科學規律可以是普適性的物理定律,也可以是該領域的本構關系。
天氣預報依據的科學規律主要是大氣運動規律和大氣熱量及攜帶物質的輸移、擴散、轉化規律。大氣是連續介質,因此利用連續性方程、動力方程、熱力學方程、氣體狀態方程、水汽方程、擴散方程等的耦合就能描寫天氣系統的氣壓變化、溫度變化、凝結和蒸發、降水形成、PM2.5濃度變化等。
水文預報依據的科學規律比較多元[2]。河流、湖泊、水庫中發生的水流屬于連續介質運動,可用St.Venant方程組來描寫其運動規律。飽和土壤和非飽和土壤中的水流,屬于多孔介質中運動的水流,應用滲流力學的連續性方程和飽和或非飽和Darcy定律來描寫其運動規律。坡面上形成的凈雨滴向河道的匯集似乎既不屬于連續介質水流,也不屬于多孔介質水流,就單個凈雨滴而言,其運動受牛頓力學定律的支配,但無窮多個凈雨滴從坡面各處向河道匯集的“集體表現”就不服從牛頓力學定律了,這時或許應借助于統計力學理論和方法來處理。如果凈雨滴在匯集過程中還有相互作用,那么問題的復雜性必將增加。
一個有意義、有價值的預報必須滿足一定的預報精度,且具有一定的預見期。一個方法若沒有預見期就不能稱為預報方法;一個方法若預報精度不能滿足一定要求,即使預見期較長也毫無價值,采信了這樣的預報就可能造成重大損失。
天氣預報已有很長的發展歷史。大氣科學家將曾經使用過的天氣預報方法大體歸納成三類:一是天氣圖預報法,二是數值天氣預報法,三是統計預報法。天氣圖預報法是最早出現也是最基礎的天氣預報方法。該方法以根據氣象觀測資料繪制的天氣圖為基本預報工具,通過分析不同時刻大氣各層天氣圖所顯示的天氣系統,判斷其生成、移動、發展、消亡以及相互之間的關系,然后做出天氣形勢和氣象要素預報。數值天氣預報法是從1904年發展起來的物理基礎更堅實的天氣預報方法。該方法以流體力學和動力氣象學為理論基礎[3],通過建立由連續性方程、運動方程、氣體狀態方程、熱力學方程、水汽方程、擴散方程等與初始條件和邊界條件構成的數學物理方程來定解問題,再利用數值法進行求解。數值天氣預報法得到的是空間網格節點上的氣象要素的時間變化。統計預報法是以歷史氣象資料為基礎,建立預報要素與先兆影響因子之間的因果關系從而作天氣預報的方法。這種因果關系有函數關系和相關關系之分,在天氣預報中,由于影響預報要素的先兆因子幾乎無法完全掌握,因此所建立的都是統計相關關系,統計預報方法因此而得名。
水文預報的出現比天氣預報晚?,F階段水文預報方法[4]主要有河段洪水預報方法、流域洪水預報方法、水庫洪水預報方法、枯水預報方法、墑情預報方法、冰情預報方法等,這些預報方法都是針對水文要素的方法。還有一類水文預報針對水文特征值,例如年徑流量預報、年最大流量預報、年最枯流量預報等。河段洪水預報依據河道洪水波運動規律,常用方法有相應水位(流量)法、流量演算法、St.Venant方程組解法等。流域洪水預報依據流域降雨徑流形成原理,常用方法有降雨徑流相關圖-單位線法、降雨徑流相關圖-峰量關系法、流域水文模型法等。水庫洪水預報依據水庫洪水波運動規律,常用方法有調洪演算法、St.Venant方程組解法等。枯水預報依據流域蓄水量的消退規律,常用方法有退水曲線法、相鄰時段徑流量相關法等。墑情預報依據土壤含量的增消機理,常用方法有水量平衡法、流域水文模型法等。冰情預報依據水體熱量收支關系,常用方法有熱量平衡法、水溫模型法等。對于水文特征值的預報,在當前的科學水平下一般有兩種考慮:一是將水文特征值的年際變化視作平穩時刻序列,主要采用自相關來構建預報方法;二是分析影響水文特征值的先兆因子,通過建立多因子相關回歸關系構建預報方法。

圖1 動態變化外推預報問題

圖2 因果關系預報問題
水文預報方法與天氣預報方法似乎有所不同,但仔細剖析后可以發現,兩者在解決各自的預報問題時所采用的科學思維是相同的,都是將預報問題視作動態變化外推問題,即視作初、邊值問題或前后狀態關系問題(圖1,圖中ft為預報對象的初始值;ft+τ為預報對象的預報值),或者視作變量之間因果關系問題,即視作變量之間函數關系問題或相關關系問題(圖2,圖中it為先兆影響因子)。有些天氣過程和水文過程屬于動力學過程,可以表達成空間和時間的函數,一旦得到了這個函數,就可以據此做出預報。獲得這個函數的方法不同,就產生了不同的預報方法。若該函數由觀測得到,則可用經驗外推建立預報方法,天氣圖法、相應水位(流量)法等就屬于這類方法。若這個函數由描寫現象動態變化規律的數學物理方程定解問題求得,則可以根據初值和邊值外推建立預報方法,數值天氣預報法、St.Venant方程組解法、調洪演算法、流域水文模型法等就屬于這類方法。有些天氣過程和水文過程雖無法明確為動力學過程,但可以找出它們與有關先兆因子之間的因果關系,一旦建立了這種因果關系,就可以用作預報。所掌握的先兆因子是否全面,不僅決定了因果關系的性質,而且體現了預報方法的區別。若能夠掌握所有的先兆影響因子,則得到的因果關系為函數關系;若只能掌握其中一些主要的先兆影響因子,則得到的因果關系為相關關系。在現行屬于因果關系的預報方法中,真正屬于函數關系的預報方法幾乎沒有。天氣預報中的統計預報法和水文預報中的回歸相關預報法,都是建立在變量間存在相關性因果關系基礎上的預報方法,例如平穩時間序列自回歸相關法、多因子回歸相關法、峰量關系法等。
張學文[5]主張用信息科學的思維來詮釋預報方法,這是一種有益的嘗試。根據張學文[5]的理解,可以將初、邊值以及先兆的影響因子等視作預報的信息源,這些信息源經過預報方法的變換、傳遞就變成所需預報的信息。也就是說,若立足于信息科學看預報,則預報就是一個信息變換和傳遞的問題。因此,無論天氣預報還是水文預報都必須十分重視信息源的完整、詳細、精確、可靠,以及信息處理理論和方法的正確。這就使人們明白了一個重要的道理:能夠獲得比信息源精度高的預報方法是不可能出現的,因為信息在變換、傳遞過程中只可能耗散,不可能增生。在流域水文模型的研究和應用中,筆者常常發現:實際上能提供的資料即信息源不僅有不同程度的缺失,而且不夠精細,甚至質量不高,但卻能得到令人滿意的模擬結果。這種有違信息科學原理的結論應當引起水文學家的關注。
關于預見期,由于可作為初、邊值問題的預報針對的是一個從形成到發展再到消亡的自然現象,前一個過程結束了,后一個過程跟隨而來,因此,根據其中一個過程形成之初的狀態預報其未來狀態,最長的預見期只可能是該現象從形成到發展再到消亡經歷的時間。如果再長,那么將要出現的狀態就與前一個過程的初、邊值無物理意義上的聯系了。例如,若一個降水天氣系統從形成到發展再到消亡為一周時間,則根據這個降水系統形成時的初、邊值預測其未來,預見期最長就是一周[1]。又如,若在一場具有一定時空分布的降雨落地后再作流域洪水預報,則這場降雨在當時流域下墊面條件作用下形成的洪水歷經了流域匯流時間后才能到達流域出口。因此,流域洪水預報的預見期最長也只能是流域匯流時間[2,6]。而對于作為因果關系的預報問題,預見期顯然與先兆因子出現時間有關。但先兆影響因子出現時間提前越長,這種相關關系將會越弱。因此,為使預報精度能滿足一定要求,所選擇的先兆因子的提前時間必然會受到限制,這個時間就應該是作為因果關系預報問題的可能的最長預見期。
預報總是要從某一時間開始,對于可作為初、邊值問題的預報,這個開始時間的狀態就是待預報現象的初值,從初值開始,該現象將按一定規律變化,據此就可對其未來出現的狀態做出預報,這就是初值問題。自然現象總是發生在一定空間范圍內的,在這個空間里現象將如何變化,與這個空間的邊界狀態有關,這就產生了邊值問題。因此,初值和邊值的精確確定就成為作為初、邊值問題預報的重要問題[7]。

表1 大氣模式(型)與流域水文模型主要特征的比較
天氣形勢和氣象要素變化總是發生在一定空間范圍內且隨時間變化,觀察它的變化必須從某一時刻開始,在這個時刻,因天氣形勢和氣象要素總是呈現一定的空間分布,故初值必表現為一定的空間分布,稱為初始場,這個初始場的空間范圍應當有邊界,邊界上的狀態(邊值)改變即擾動,也會影響這個空間范圍內天氣形勢和氣象要素的變化。水文情勢和水文要素變化總是發生在各自水體中且隨時間變化,觀察它的變化同樣要從某一時刻開始。對于河段洪水預報,這個時刻的水位和流量均沿河長變化,因此,初值表現為初始河段水面線或初始流量沿河長分布,而邊值則是河段上、下斷面的水位或流量隨時間變化,以及從兩岸進入或排出的流量過程。對于流域洪水預報,這個時刻的下墊面狀態,包括流域包氣帶含水量、土壤結構、植物覆蓋、地形地貌、水文地質、土地利用等,都是呈空間分布的,因此,初值也表現為空間分布,即為初始場。對于閉合流域,周邊與外界無水量交換;流域表面通過降水和蒸散發與大氣發生交換。包氣帶底部若為不透水基巖,則包氣帶與基巖不發生水量交換;若為地下水面,則包氣帶產生的地下水徑流將進入地下含水層,這就是流域洪水預報方法的邊值場。總之,對于作為初、邊值問題的預報方法,初值呈空間分布,邊值是時間的函數。
氣象學家Lorenz[8]早在1963年就發現初始場對天氣預報精度的重要影響,他指出:在天氣預報中,初始場的微小變動將可能引起預報結果的極大差異,這就好像“巴西一只蝴蝶扇了一下翅膀,在美國紐約將引起風暴”??茖W界將此稱為“蝴蝶效應”。水文預報是否存在“蝴蝶效應”,至今未見報道,筆者認為,這是一個需要深入研究的問題,但在使用流域水文模型作洪水預報時,初始場問題將會導致異參同效問題[9-10],因為它的存在將使人們對所率定出的模型參數的正確性難以作出判斷。
值得慶幸的是,數值天氣預報雖然存在“蝴蝶效應”,但也許不會存在異參同效問題,因為大氣是連續介質,地球大氣圈的空氣性質幾乎是均一的,控制大氣運動的流體力學和動力氣象學都是比較成熟的學科,由此建立的用作數值天氣預報的大氣模式(型),例如正壓原始方程模式、斜壓原始程模式等,既不是概念性模型,更不是“黑箱子”模型,而是物理意義清晰的模型,這些模式(型)中所包含的參數幾乎全球相同,不必通過實測氣象資料來率定。
為了深入理解上述所作分析,將大氣模式(型)和流域水文模型作一比較,如表1所示。
無論是天氣預報,還是水文預報,對于那些作為初、邊值問題的預報方法,一般都必須劃分時間步長,一個步長接著一個步長進行計算,滾動地給出預報值,直至一個過程的結束。因此,在進行第一個時間步長計算時初值或初始場必須由觀測資料給出,第二個時間步長之后的初值或初始場雖然可根據前一個時間步長的計算結果即預報值來代替,但為使所給初值或初始場能符合實際,保證預報值精度,一般應根據實時觀測資料進行修正。由此不難理解觀測資料對提高預報精度的重要性。
氣象學家認為客觀存在的大氣狀態總是表現為氣象要素的空間分布是“和諧”的[11]。例如實際出現的氣壓場不會發生某一位置的氣壓值與鄰近氣壓值懸殊的情況。因此,氣象要素觀測值空間分布“和諧”應是一個規律,任何背離正常的高頻或低頻氣象要素的存在都是與“和諧”不相符的。但由于觀測儀器、觀測方法等的不同,不同來源的氣象觀測資料具有不同的精度,這就可能產生一個事實上不“和諧”的問題。因此,氣象學家指出,在涉及初值或初始場的天氣預報方法中,給出的初值或初始場必須是“和諧”的。
在水文預報中,筆者認為,不僅初值或初始場要“和諧”,邊值或邊值場也要“和諧”。例如:對于流域水文模型預報方法,流域包氣帶含水量的初始場與預報精度密切有關是不言而喻的,而作為邊值場的降雨空間分布與預報精度的關系更是十分緊密。但實際情況往往是,由不同儀器和方法觀測得到的流域包氣帶含水量的初始場并不“和諧”,得到的降雨空間分布也不“和諧”。這些不和諧問題,若得不到正確處理,流域水文模型預報方法即使模型結構和參數合理,也不可能獲得合理、可信的預報結果[12]。
為了處理上述不和諧問題,氣象學家率先在數值天氣預報中提出了數據同化的重要概念和方法[13]。天氣預報和水文預報中的數據同化是指將對同一現象由不同來源、不同方法、不同時空分辨率觀測得到的不同精度的數據引入用作數值天氣預報的大氣模式(型)或用作水文預報的流域水文模型,通過數學理論和方法,在模式或模型解與實際觀測結果之間尋找最優擬合,這樣的擬合結果可繼續為數值天氣預報或流域水文預報提供初始場,一個時間步長、一個時間步長地不斷迭代下去,達到模式或模型的結果不斷向觀測值接近的目的。因此,在天氣預報和水文預報中,數據同化實際上是一個最優控制問題,它是通過一定的算法來實現的。數據同化算法可分為順序數據同化算法和連續數據同化算法兩類。前者又稱為濾波算法,包括預測和更新兩個處理過程;后者需要定義一個同化窗口,利用這個窗口內的所有觀測數據與模式或模型的狀態值進行優化估計,通過迭代不斷調整模式或模型的初始場或邊界場,使模式或模型的結果能夠擬合觀測資料。
筆者認為,由于數據同化是通過一定的數學方法來實現利用不同來源、不同方法、不同時空分辨率、不同精度的數據,達到模式或模型的結果盡可能擬合觀測資料的目的。因此,欲使數據同化有好的效果,模式或模型必須盡可能沒有誤差。這對數值天氣預報的大氣模式是提高精度的舉措,但對于水文預報的流域水文模型卻難以實現,因為流域水文模型本身就有結構誤差,又有異參同效問題的干擾[14]。在利用流域水文模型作洪水預報時僅致力于通過實時校正使模型結果與實測值“和諧”,而未涉及初始場和邊值場的數據同化問題,顯得不夠縝密。氣象學家將數據同化的重點放在初始場的確定上是值得借鑒的。對流域水文模型預報,不僅要對初始場,而且要對邊值場進行數據同化。
上述數據同化僅以模式或模型結果與觀測值達到接近為目的,還不能判定同化后的觀測資料一定就是現象時空分布的真實描寫。為此,應當引進“數據融合”的概念。數據融合是由圖像融合的概念發展而來。用特定的算法將兩幅或多幅圖像綜合成一幅新圖像稱為圖像融合。將這一概念引入數據處理就成為數據融合。對來自不同種類信息源的數據,通過特定的手段、方法和工具集進行處理,以提高質量的技術,稱為數據融合。這體現了從浩瀚的數據源中去偽存真、去粗取精,找出精準觀測結果的思想。
最初,氣象觀測資料主要靠氣象臺站定點觀測和放飛氣球進行高空動點觀測,這些觀測方式得到的觀測值的時空分布十分稀疏,而且占地球表面2/3的海洋上空幾乎無法進行觀測。隨著航海、航空科技的進步,出現了利用飛機和艦船流動地進行高空和海洋氣象觀測的技術。利用雷達、衛星遙感、無人機遙感等技術獲得氣象觀測資料也越來越普遍。這樣就出現了同一時刻、不同位置的同一氣象要素的觀測值具有多種來源的情況,雖然它們的觀測原理和方法不同,觀測精度也不一致,但若將它們融合起來,也許能給出較為客觀、準確的初始場。水文觀測資料也有數據融合問題,尤其是降雨觀測資料和流域包氣帶含水量觀測資料都可能是多來源的,若能通過數據融合,獲得更可靠的降雨空間分布和流域包氣帶含水量空間分布,則對提高洪水預報精度顯然有重要意義。
數據融合有數據層融合、決策層融合和特征層融合之分。數據層融合就是直接對采集到的原始數據進行融合。在用不同方法對同一要素觀測獲得多源數據后,先對其中之一完成預處理、特征提取、識別或判斷等,建立對觀測要素的初步結論,再通過關聯處理獲得聯合推斷結果,稱為決策層融合。特征層融合則是屬于數據層融合和決策層融合之間的中間層次的融合,這類數據融合是先對多源數據進行特征提取,然后再對這些特征進行綜合分析和處理。這里所指的特征是一些表征所觀測要素的邊緣、方向、速度等的指標值。與數據同化一樣,現階段所謂數據融合也是通過一定的算法來實現的。
數據同化偏向作為數學問題來處理,而數據融合則偏向作為物理問題來處理。但它們目前實際采用的算法幾乎相同。筆者認為,數據同化和數據融合是一個問題的兩種不同的解決思路,兩者的目的都是期望盡可能克服由于信息缺失、信息量不足和信息質量參差不齊給預報帶來的不利影響。為達此目的,數據同化采用的思路是通過對多源資料的分析整合,使得用這樣的初始場和邊值場能獲得盡可能與實測值相同的模擬結果,而數據融合采取的思路是通過對多源資料的去偽存真,棄粗取精,使輸入模式或模型的初始場和邊值場盡可能是真實的、精確的。
降水預報是天氣預報中最重要的預報之一,洪水預報無疑是水文預報中最為重要的預報。暴雨是導致洪水的根本性原因,洪水預報必然是降水預報的延續。唯有將洪水預報與降水預報銜接起來,才能有效地增長洪水預報的預見期。在降水預報方法中,數值天氣預報方法近30年來有了長足的進步,而用流域水文模型作洪水預報,其不盡人意之處比用數值天氣預報方法作降水預報明顯得多:
其一,對作為數值天氣預報方法理論基礎的大氣模式(型)的構建,氣象學家重視其物理性和精確性,而流域水文模型的研制卻存在依據的物理機制比較粗糙的問題,目前較為流行的流域水文模型幾乎都是概念性的。這種概念性和“黑箱子”流域水文模型也許能滿足規劃設計要求,但作為洪水預報方法就有明顯的不足。
其二,氣象學家認識到,用天氣模式(型)作數值天氣預報,必須十分重視初始場的精度,只有這樣才能有效地避免“蝴蝶效應”的干擾。水文學家對用流域水文模型作洪水預報也依賴初始場的認識不夠;對邊界場影響洪水預報精度雖有一定認識,但改進的措施不力。
其三,大氣模式(型)中包含的參數幾乎都可以用物理方法確定,確定模式參數是求解正問題,一般不會出現異參同效問題,而流域水文模型中包含的參數大多必須依賴實測降雨、徑流資料率定,確定參數是求解反問題,異參同效現象明顯,是一個棘手問題。
其四,氣象觀測技術的提升迅速,信息源豐富,這就為數值天氣預報采用數據同化、數據融合、大數據等技術,以提高初始場的精度,進而提高預報精度提供了有利條件。相比之下,水文觀測技術明顯落后,信息源也偏少,有一些必需的信息至今仍是空白,從而限制了以上技術在提高洪水預報精度中的作用。
“他山之石,可以攻玉”。筆者認為,數值天氣預報的成功經驗是值得洪水預報學習、借鑒的。