賈朋群 趙大軍
天氣和氣候預報:面臨一個新拐點?
——《哲學學報A》關于天氣和氣候預報的隨機模擬專輯帶來的啟示
賈朋群 趙大軍
目前的天氣和氣候模式顯示了很多令人吃驚的預報技巧,例如,從提前數天的臺風路徑預報到提前幾個月預報厄爾尼諾現象的出現等。但是,模式模擬和預報的誤差隨著預報時效而增加,并非源自我們對天氣和氣候演變所遵循規律認知程度的下降。對大氣運動規律的認知,早在100多年前就由一組偏微分方程幾近完美地進行了描述。模式誤差的增加實際上更多地和模式用數值方法求解上述方程組時,由于大氣非線性和多尺度的本質,近似解的偏差隨著數值積分的進行而不斷增加聯系在一起。其中,采用參數化處理次網格過程或方程組中無法解析的項,以及后者與模式可解析的動力框架部分之間的相互聯系和作用的計算實現的不足,無疑是誤差最重要的來源。
一些學者從大氣運動的隨機性出發,試圖在理論上獲得突破,即明確隨機過程在多大程度上充滿和規范著大氣運動,同時要在模式的每一步積分運算中將這樣的隨機內容體現出來。2013年這些學者在牛津大學召開的“天氣和氣候預報的隨機模擬和計算研討會”上進行了對話和頭腦風暴,會議上誕生和逐步清晰化的一些新理念和新思想,蘊含在2014年6月出版的皇家學會《哲學學報A》“天氣和氣候預報的隨機模擬和節能計算”專輯(圖1),可能會引發天氣氣候模擬界進一步的思考。
本文依據研討會相關內容(研討會網頁,https://www.maths.ox.ac.uk/)及專輯導語和主要文章,試圖解讀未來模式發展中的“隨機”要素。
“一些學者從大氣運動的隨機性出發,試圖在理論上獲得突破,即明確隨機過程在多大程度上充滿和規范著大氣運動,同時要在模式的每一步積分運算中將這樣的隨機內容體現出來。”
動力氣象學,雖然其誕生要追溯到20世紀初皮耶克尼斯提出“天氣預報問題是一組物理方程的初值問題”的構想,同時給出了基于經典物理學的大氣運動方程組。然而,早期氣象學家苦于這個包含了至少7個變量的方程組太復雜,以及氣象數據的匱乏和缺少有效計算方法,在隨后的近20年時間里,方程組被束之高閣。盡管如此,皮耶克尼斯創造性地給出的這組控制大氣運動的偏微分方程,仍然意義重大。
真正嘗試運用皮氏方程組進行大氣運動規律分析,或者簡言之進行天氣預報的,是20世紀20年代的理查孫。正是理查孫,在人類計算還停留在手工和借助計算尺等簡單工具時代,將皮氏偏微分方程組離散化到可計算的網格上。在這一過程中,存在一些用公式表達的,卻無法用格點解析出來的量,皮氏模仿分子粘性和擴散,借助提出的“渦旋粘度”和“渦旋擴散”等概念進行了參數化。而分子粘性和擴散的理念,與當時業已成熟的流體動力學理論,例如,布西內斯克假定和普朗特的混合長理論等半經驗理論一脈相承。
理查孫試圖手工計算求解偏微分方程組并做出天氣預報失敗后又過了20多年,在20世紀40年代電子計算機出現曙光之時,查尼等人成功地讓方程組促成了數值天氣預報的真正誕生,不同特色的天氣和氣候模式也隨后不斷出現。盡管目前的各類模式,要比前輩們當初的計算復雜得多,但是,理查孫最早提出的兩個理念依然是基礎:一是所謂“經典數值假定(canonical numerical ansatz)”,即動力核心;二是基于動力核心截斷尺度變量和一些自由參數構成的參數化公式。

圖1 《皇家學會哲學學報A》專輯
上述普適的公式和概念,雖然從數值預報操作層面上歷經從準地轉到非靜力等各種近似,使得方程組從簡單到復雜遞進,這樣的遞進卻始終沒有離開前述基礎理念,或者說仍然建立在這樣理念基礎之上。如果說改變,那就是隨著模式性能的大幅度提高,其復雜性和時
空分辨率等的提高,讓模式運轉的計算成本一路飆升(圖2)。一方面,因為一些中尺度過程能夠被模式捕捉到,從而進入動力核心的內容在逐步增加;另一方面,動力核心無法解析的、在模式中用參數化方式表示其總體效果的過程,也因為理論進展、觀測試驗補充的數據和經驗等,其誤差在逐步減少。
實施天氣和氣候數值預報模式運行的硬件平臺,隨著計算機技術誕生以來的3次飛躍,從矢量計算到大規模平行計算,再到多核心計算時代,在計算能力獲得跳躍的同時,其能耗也在迅速增加(圖3)。這一方面使得繼續通過減少網格間距換取參數化不準確性下降的代價更加昂貴——例如目前氣象界議論的即將誕生的百億億次計算能力(exascale computational capability),其能源消耗也將達到100兆瓦,大約是一個10萬人的城鎮的用電量;另一方面,即使在2020年前后我們能夠運行百億億次計算機,模式對模擬云變化這類小尺度過程也無能為力。
面對預報急迫的需求和僅依靠計算平臺升級可能面臨難以承擔的能源成本的格局,新的改進預報思路和創新性的計算范式開始浮現。這樣的計算范式的基礎,是基于觀測到的很多氣候變量具有的冪律結構(power-law structure),該結構表明并不存在自然的途徑描述某個變量是“大”還是“小”,也就是說,在數值模式中將可解析和不可解析的變量區分開來并不存在一個絕對的基礎。基于這樣的考量,在對一個無法解析過程的參數化計算中,加入本質上是隨機的一個表示,使得這樣的劃分在數值模式中減少了人為性。以此為出發點,發展隨機參數化則又涉及一些更加深入的問題:例如,作為尺度的函數的動力核心中的變量的真實信息內容到底是什么?動力核心在截斷尺度附近變量的信息內容不能被任意給出,這是因為這些內容受到無法解析的參數化包的隨機性的巨大影響。當尺度較大的時候,隨機性的影響將減小,實際信息內容將增加——但是減少的速度又有多快?目前我們知道,在三維淺冪律譜系統中,信息內容隨尺度的增加可能是緩慢的。

圖2 天氣氣候模式的計算量由預報時效/集合規模、模式復雜性、數據同化過程和分辨率等因素共同決定

圖3 高性能計算技術的3次突破(a)和2010年世界500強超級計算機的能耗(b)
原則上,對依賴于尺度的信息內容的認知和下一代天氣和氣候模式的設計有極為密切的關系。因為目前以及未來可能的超級計算機具有高耗電特點,未來的模式需要盡可能高效。對依賴尺度的信息內容的認知將有利于優化計算的精
度,即在天氣和氣候模式中,變量表征為尺度的函數。對依賴尺度的信息的認知,還有助于確定是否需要完全由動力核心的數值計算完全決定預報。通過簡化傳統假定,包括動力核心中所有方程用雙字節確定論計算,以及所有變量用雙精度浮點實數表示等,一個新的基于變量精度和準確性隨尺度變化的概念的計算范式浮出水面。這樣的理念如果成功,天氣氣候模式在更貼近實際的同時,計算方案中一直被復雜化的勢頭也將做出相反的調整,對隨機過程深入的認識和在模式中應用,很可能帶領人們在模擬實踐中,從復雜回歸簡單。
毫無疑問,在預報模式借鑒更多隨機或概率思想方面,天氣模式走得更早,也更遠些。其中,集合預報模式在世界上最主要的預報中心成為主流業務預報手段就是明證。但是,集合預報從根本上來說,其隨機要素主要體現給出具有誤差概率分布的初始場,以及最后基于單模式或多個模式的結果,給出預報的統計規律。然而,集合預報只是較好地解決了誤差與預報不確定性之間的聯系,而其每一次運算依然是傳統數值預報的范式,并非是真正引入大氣中固有隨機過程及其與其他可解析過程相互作用之路。
帕爾默是對大氣可預報性進行過深入研究的氣象學者之一,作為2013年牛津大學會議的召集人和《皇家學會哲學學報A》專輯的3位特約編輯之一,他基于對大氣運動中隨機過程及其與可預報性的認識,從非線性隨機過程的角度,提出了一個能夠快速實現云解析天氣氣候模擬的解決方案。
在帕爾默的方案中,受到相對淺的大氣幾百千米及更小尺度能量冪律譜的啟發,通過模糊化動力核心和次網格參數化之間的慣常邊界,指出基于隨機—動力系統的天氣和氣候模擬計算方案,要優于確定性模擬計算。此外,由于動力核心中高波譜要素在時間積分中,具有本質上的隨機性,因此,如果所有計算不問尺度大小都完全用確定方式進行,并且所有變量都用最大數值精度(即實際運算中用雙精度浮點數)表示,將有過度計算的嫌疑。在百億億次計算時代即將來臨的時候,帕爾默的方案在實際的計算中,最高精度的變量僅限于被解析的動力部分,而隨機參數化和引入的隨機性等,則用近似計算完成(圖4)。這樣的處理,既讓更多的計算資源著重于核心的動力計算,實現能源和計算均高效,又引入了云解析天氣和氣候模擬的隨機處理理念,在這部分更少占用計算資源的計算中,卻使得隨機過程在模擬中具有更加重要的意義和作用。
圖5更加具體地描述和說明了云解析隨機模擬方案,其中不直接利用確定性公式來表征次網格尺度過程,而是利用簡化的動力系統來表征,其在總體上與確定性動力系統保持一致,同時又能夠提供足夠的隨機特征。從機器計算的角度來看,利用隨機學概念來表征這種不可預報性要容易的多,機器處理隨機系統的統計特征要比確定性系統的統計特征要更可信。也許最好的方法是將隨機動力學和確定性動力框架結合起來,此時在處理次網格尺度平流時要比總體平均的處理方式要強。這是一種使動力框架和參數化處理之間的界限模糊化的處理方式,更有可能帶來讓還不夠完美的模式模塊之間更加和諧和統一的新思路。
在帕爾默的上述方案中,他進一步提出使用定義在恰當尺度格點上(比動力核心的定義格點要小得多)的隨機對流單體自動機(cellular automata)來表征模式不可分辨的對流云系統。這種隨機對流單體的發展是否可控,其發展的概率由格點尺度變量決定。具體某一個對流單體的生命史隨機決定,但是當臨近的對流單體是發展的,其自身的生命史相應增長。如此可使有組織的對流系統比分散獨立的對流系統有更長的生命史。這些有組織的對流系統可向模式可解析格點傳輸能量。對于這些對流單體而言,利用墨西哥帽小波變換方法可以通過格點尺度的風將活躍的對流單體從一個網格平流到另一個網格。通過這種方法,次網格尺度的動力特性可以很容易地被編碼在方案中,基于這一概念,一個可供業務運行的隨機對流方案已經初步形成。

圖4 隨機參數化方案示意圖。在球諧系數的三角形截斷中,上面的實心圓點表示計算中用高精度表示的模式的主要尺度變量,下面的圓圈則表示針對次網格尺度以及引入的隨機過程,采用低精度計算的部分
另一種基于網格的對流云系統非相互影響的隨機方法,是利用泊松概率分布來表示次網格尺度的對流系統,即非相互作用要素間的簡單統計關系。也有學者更是通過綜
合積云、層云以及深對流云發展了隨機多類云網格模式,從而將這種方法推廣,各類云之間的轉換是通過馬爾可夫鏈過程確定。還有人另辟蹊徑,認為次網格過程可以利用具有明確物理意義,但是低計算精度的方程來計算。研究者從電腦游戲動畫師使用的技術中得到靈感,利用“適當”的流體方程組來模擬流體流動,即用相對簡化的方法來防止能量不守恒,以此確保模擬看起來足夠逼真。
專輯中次網格尺度隨機動力學模式的另一個范例,是歐洲中期天氣預報中心的隨機全傾向擾動參數化方案(SPPT)。在SPPT中,確定性的參數化傾向P被(1+e)P所取代,其中e表示球面空間中馬爾科夫鏈過程中的某個物理量場,具有特定的時空自相關系數。這種乘法因子形式的噪聲結果與前面提到的粗網格收支研究大體一致。SPPT方案已被證明可以提高中期概率預報和季節概率預報技巧,同時降低天氣尺度系統的背景誤差。

圖5 隨機模擬方案概念圖:(a) 在可解析和無法解析尺度之間存在嚴格的尺度分離,以示意確定性參數化的概念;(b) 在可解析和無法解析尺度之間沒有尺度分離,以示意隨機參數化的概念,這更接近實際的情況
從1963年洛倫茲揭示了大氣混沌現象開始,到1976年世界上第一個隨機氣候模式的出現,已經宣告1905年愛因斯坦開創的隨機動力學在氣象學領域已經有了回聲。
哲學家維特根斯坦曾經講過:“我的語言的界限意味著我的世界的界限”。梳理氣象學家的天氣、氣候模式中的“語言”,我們可以大致領悟氣象科學到目前依然是確定預報主導,對應的是牛頓經典物理學的語言。然而,從1963年洛倫茲揭示了大氣混沌現象開始,到1976年世界上第一個隨機氣候模式的出現,已經宣告1905年愛因斯坦開創的隨機動力學在氣象學領域已經有了回聲。
氣象科學發展到現在,很多已知的天氣現象,或者是對其探測、或者是對其成因的認識,往往是不充分的或者二者之間并不對稱(圖6)。面對這樣的復雜科學問題,統計的理念和方法幫助氣象學者不斷獲得認識上的改進和實質上的進步。當前,業內人士并不陌生的隨機概念,借助相關學科“自組織”系統模型,又有可能被我所用,而且不僅僅是在初始值或結果統計中借用,而是深入到天氣氣候模式內部,用非高精度的隨機計算,描述次網格和本質上是隨機的大氣及邊界層過程,從而與大氣中存在的多種隨機擾動因子實現某種意義上的協同。這樣做的啟示是在說明, 大氣過程是確定的, 也是隨機的,而模擬大氣運動的模式,在確定和隨機(參數化)之間的界限,在隨機理念滲透和模式分辨率提高的雙方向的努力下,走向模糊并可以進一步打通(圖7)。
無論是2014年的專輯,還是2013年牛津大學的研討會上,氣象模擬學者在討論預報的科學問題同時,也在討論計算技術問題。在牛津大學,第一次出現了一邊是天氣和氣候模擬學者,另一邊是計算機科學家,坐在一起探討天氣和氣候預報中的不精確和隨機計算的作用等深刻問題。這樣的場景很容易讓我們想起20世紀40—50年代,發生在普林斯頓高級研究院數值天氣預報伴隨世界上第一臺電子計算機的研制而獲得成功的歷史。那時,馮·諾依曼等計算數學家甚至加入了氣象隊伍,直視氣象預報模式的運轉。正是那樣的跨學科攻關,帶來了現代氣象科學實質上的進步,氣象科學也成為最先利用計算機推動
學科建設,并通過應用于各種模式的開發,提高天氣氣候預報水平,讓社會受益的樣板學科。
本文介紹的主要來自歐洲國家的在天氣氣候模式中,加入更多“隨機”要素從而獲得更好的預報效果,或者退一步講,在預報能力持平的情況下大大節省計算資源,從而在相同的計算消耗下獲得更好的預報。這樣的思想,某種意義上放大了在集合預報中就出現的氣象預報中的“統計”思維。氣象中的統計或概率思維實際上更接近自然本質,但是在科學層面上也面臨很多挑戰。2014年7月,美國著名的Science雜志宣布,該雜志所收到的所有統計類論文,在同行評議過程中增加一個額外的統計驗證環節①雜志在具體操作時,與美國統計協會共同成立了一個7人專家評審小組,將編輯或審閱人標記為統計類文章,邀請外部統計學者進行附加審核。。世界上其他一些科技期刊,例如Nature在2013年4月,也推出類似的做法,起因就是大多數依據統計和數據分析方法獲得的研究發現,因為無法再現,從而有可能掩蓋了在數據分析中本質性的錯誤。由此我們可以想象和質疑,專輯文章預示的更多“隨機”要素進入預報模式,其預報的未來天氣氣候,會不會因為具有太多的“隨機”性而讓我們無所適從。
實際上,集合預報中的很多做法,已經為我們提供了有益的避免產品層面上過多“隨機”因素的思想和做法,而借鑒數據同化中的“窗口”,一些隨機過程可能依據的類似“白噪聲”的規律也可以提示我們不斷改進對隨機過程的描述和在模式中實現。此外,隨著數值預報歷史資料累計得到的“大數據”,能夠提供給我們天氣氣候在一些形勢“轉化期”中的相似性,也有可能引導我們更加審慎、也更加有把握地面對“××年一遇”的天氣氣候的預報問題。

圖6 不同天氣現象的探測認知程度和其在氣候模式中形成原因的認知程度,上部的虛線表示認知的“無邊界”

圖7 天氣氣候模式中動力和參數化處理過程之間的界限的模糊
(作者單位:賈朋群,中國氣象局氣象干部培訓學院;趙大軍,中國氣象局)
深入閱讀
André J-C, Aloisio G, Biercamp J, et al. 2014. High-performance computing for climate modeling. Bull Amer Meteor Soc, 95: ES97–ES100.
Palmer T, Düben P, McNamara H. 2014. Stochastic modelling and energyefficient computing for weather and climate prediction. Phil Trans R Soc A, 372: 20140118.
Reeves, Robert W. 2014. Edward Lorenz revisiting the limits of predictability and their implications: an interview from 2007. Bull Amer Meteor Soc, 95: 681–687.
Wuebbles D, Meehl G, Hayhoe K, et al. 2014. CMIP5 climate model analyses: climate extremes in the United States. Bull Amer Meteor Soc, 95: 571–583.
陳超輝, 李祟銀, 譚言科, 等. 2013. 隨機強迫對集合預報效果的影響研究. 氣象學報, 71 (3): 505-516.
宣捷. 2000. 大氣擴散的物理模擬. 北京:氣象出版社.
周秀驥. 2005. 大氣隨機動力學與可預報性. 氣象學報, 63(5): 806-811.
Advances in Meteorological Science and Technology2014年4期