郭海峰 劉瑞琪 陳 浩 廖春花
1.湖南省氣象服務中心,湖南 長沙 410118
2.氣象防災減災湖南省重點實驗室,湖南 長沙 410118
3.國網湖南省電力公司,長沙 410014
氣象數值預報是在當代大氣科學理論成果、當代計算機技術與大氣遙感技術基礎上建立起來的現代氣象預報技術,是氣象預報向定量、定時、定點方向發展的一種方式,從而滿足國家與社會各種需求的科學途徑,對國家經濟建設與社會發展有重要意義[1-2]。
經過近一個世紀的發展,數值天氣預報取得了巨大的進步,預報準確率有了很大提高,并且由傳統的單一確定性預報向集合數值預報方向發展。如今集合數值預報應用的領域不斷拓寬, 從最初的全球中期集合預報延伸到有限區短期天氣預報、月季年短期氣候預測、臺風(颶風) 路徑預報、中小尺度極端天氣預報等方面[3]。同時, 在洪水預報、空氣質量預報等專業預報領域也開展了集合數值預報的應用研究[4-5]。
Boosting 是提高預測學習系統預測能力的有效工具,也是組合學習中最具代表性的方法[6-10]。 其代表算法可分為Boost—by majority 和AdaBoost 兩個系列。Boosting 操縱訓練例子以生成一系列互補型的專家模型,從而建立通過投票結合的預測器集合,然后通過AdaBoost 算法來計算各個專家占有的權重,通過迭代修正各專家權重的方式讓預測結果無限接近實況值。這些專家相當于各個數值預報模式,因此該方法在多模式集成預報方面有很好的性能。為了更好地發揮精細化氣象格點預報業務產品的作用,依托本地天氣預報數據庫(LWFD)、全國綜合氣象信息共享系統(CIMISS)等系統,為專業氣象預報人員提供基于數值預報結論的學習素材預報平臺,設計建立應用AdaBoost 提升Boosting 算法的專業氣象集合預報系統(以下簡稱“專業氣象集合預報系統”),實現各數值預報模式和集合后的精細化格點、要素的流域、交通、旅游等專業氣象預報的實時顯示、調閱、查詢、訂正以及質量檢驗功能,并保證作為業務系統的安全可靠,性能穩定,功能擴充。
專業集合預報系統應用AdaBoost 算法提升Boosting算法的性能,將歐洲中期天氣預報中心(以下簡稱EC)、日本氣象廳(以下簡稱JAM)、華東區域氣象中心(以下簡稱華東模式)、華南區域氣象中心(以下簡稱華南模式)、全國智能網格(以下簡稱智能網格)5 種數值預報的模式預報結果,根據各自的預報準確性給予不同的權重進行集合,提高預報準確率。專業氣象預報員可選擇任意時次、任意范圍或任意行政區劃來對集合結果進行訂正,訂正時只需修改所選范圍內的最大值和最小值,系統會自動根據比例匹配到各個格點值,同時自動修改與之關聯時次的格點值。簡單易操作,并且能進行實時檢驗評分,可以實時查看單模式、多模式集合以及預報員訂正后的預報結果,有利于預報員訂正預報數據、檢驗預報結果、提高預報質量。
專業集合預報系統包括數據處理、預報產品制作和后臺管理3 個部分,數據處理實現預報產品數據的整合、處理和入庫;預報產品制作實現EC、JAM、華東模式、華南模式、智能網格5 種預報模式預報的集合、查詢、修正、產品制作生成和評分管理;后臺管理實現站點和用戶信息的增加、刪除和編輯功能,系統業務功能如圖1 所示。

圖1 專業氣象集合預報系統業務功能圖
數據信息采集主要是通過構建動態的基礎數據信息采集工作機制、采集地理信息數據、社會經濟信息數據、氣象服務產品、業務產品等資料。 支持文件、XML、數據庫、FTP(文件抓取協議)、HTTP(超文本抓取協議)等多種接口方式的數據采集。根據采集規則、數據類型、采集周期,自動采集到數據后,按規則存儲到基礎數據庫或文件服務器上,實現按規則和類別自動化采集相應數據的目的。
服務信息采集主要是針對來自預報系統的預報結果和各類報文進行采集和加工。通過讀取國家氣象局的指導產品,主要是發布的預報結果和報文,分析預報結果、解析報文,形成產品的制作內容。
反饋信息采集主要是針對來自上級發布渠道的反饋信息和本地發布結果數據,以及預警發布效果信息的匯總和預統計。對氣象部門內部的各類觀測資料和數據進行采集和分類,將觀測和測報業務中常見現象進行自我統計和預處理存儲并入庫。
專業集合預報系統通過AdaBoost 方法進行數據迭代,模式占有的權重算法流程如圖2 所示。

圖2 集合預報實現流程
Boosting 方法是一種用來提高弱分類算法準確度的方法,這種方法通過構造一個預測函數系列,然后以一定的方式將他們組合成一個預測函數,流程如圖3 所示。通過對樣本集的操作獲得樣本子集,然后用弱分類算法在樣本子集上訓練生成一系列的基分類器。用來提高其他弱分類算法的識別率。主要為兩個部分,更新采樣權重值D 和計算分類器權重α,前者使得原來分錯的樣本再下一個分類器中能夠有較大的概率出現,從而提高原來分錯樣本之后分對的概率;后者根據分類器的表現,賦予不同弱分類器不同權值,最后得到一個加權的強分類器。不斷地迭代更新能使得最終的結果無限接近最優分類。

圖3 Boosting 的流程圖
通過以上組合行算法,將EC、JAM、華東模式、華南模式、智能網格以及湖南省智能網格單要素進行集合預報模擬,最終輸出結果如表1,該算法能夠準確地對各單個模式權重及權重系數進行智能化調整,使得最終的集合預報結果誤差率最大僅為7.1%。

表1 組合行算法集合預報例
通過與LWFD 的對接,實現預報底稿下載和修正過后的預報數據上傳,數值支持Micaps 第4 類和grib2格式。實現數據分屏展示,分屏顯示格點預報、站點預報、預報氣溫變化、降水量、天氣現象等信息。支持格點預報編輯,具有單個格點修改、繪制落區進行填值、等值線形狀、撤銷、重置、本地數據導入、關鍵點數值修改反饋至格點。對預報結果可進行一致性檢驗,如:最高氣溫值不能低于最低氣溫值,格點預報氣溫值不能高于站點的最高氣溫值也不能低于站點的最低氣溫值。格點編輯超出范圍時,應該在格點預報上以醒目的顏色顯示站點最高或最低氣溫值。格點溫度預報修改訂正功能如圖4 所示。

圖4 格點溫度預報修改訂正功能
提供 EC、JAM、華東模式、華南模式、智能網格5 種預報模式的實時預報評分功能。 在指定時間,以要素實況數據及要素預報數據為基礎,對各類要素產品進行檢驗。
2.4.1 降水預報檢驗方法
逐日檢驗只評定是否正確和是否屬“空、漏”報,并保存每日預報與實況資料。月、季、年檢驗依據當月、季、年的預報正確總次數、空報總次數、漏報總次數,分別計算一般性降雨、暴雨以上和晴雨預報的TS(預兆評分threat score)、空報率、漏報率。
式中PO 為空報率、FAR 為漏報率、NA 為預報正確站(次)數、NB 為空報站(次)數、NC 為漏報站(次)數。
2.4.2 氣溫預報檢驗方法
逐日檢驗計算絕對預報誤差,分別將氣溫預報誤差≤2℃、3℃的百分率記為氣溫預報偏差≤2℃正確、氣溫預報誤差≤3℃正確,并保存每日預報與實況資料。月、季、年檢驗依據當月、季、年的每日預報與實況資料計算預報準確率,平均絕對誤差采用月、季、年的平均值。
其中,N 為站點總數,Fi為第i站(次)預報氣溫,Oi為第i站(次)實況氣溫,Nr可分別表示為≤2℃、3℃時預報正確的站(次)數,Nf為預報的總站(次)數。氣溫預報準確率的實際含義是氣溫預報誤差≤2℃、3℃的百分率。
此外,當用Nr可分別表示為氣溫預報誤差>5℃、10℃預報的站(次)數,應用預報準確率公式可以評定氣溫預報誤差>5℃、氣溫預報誤差>10℃的百分比。
專業集合預報系統支持GIS 色斑圖等形式的展示和導出[11-12]。基于湖南大型水庫流域、高速公路、電網線路、旅游景點等GIS 底圖的降水、氣溫、平均相對濕度、大霧、電線覆冰、道路結冰色斑圖繪制和自動生成。標題可選擇模版,也可修改,圖例和落款自動生成,圖形可保存輸出。各類圖形產品為流域面雨量預報等專業氣象服務提供產品制作支撐,如圖5 所示。

圖5 流域面雨量預報產品制作
在軟硬件的設計實現上要考慮系統長期運行的穩定性和可靠性。軟件在運行期間,針對任何一個重要操作,都具有判斷錯誤的能力,必要時可以進行恢復性操作,否則就發出報警消息,以便于人工干預。
上線試運行測試通過后,基礎數據平臺系統將進入長期業務運行狀態。無論是計算機硬件系統還是軟件系統都具有較高的可靠性和故障后快速恢復的能力。
應用軟件開發應嚴格遵循軟件工程國標、軍標的開發、測試和集成規范,制定合理的數據處理、預報預警服務產品生成規范,加強對多種觀測資料在預報預警業務中的應用,強化對災害天際的實時監視能力和對災情的分析評估能力。
在支撐平臺可靠性的保證下,關鍵高可用業務系統在3 min 內恢復運行狀態。 服務器端系統應滿足7×24 h 運行穩定可靠,服務器端系統每年累計故障時間不能超過8 h。
專業集合預報系統較為以往的平均方式、方差計算方式等集合預報算法進行了改進,采用提升Boosting與AdaBoost 進行計算,建立投票方式的預測結果及權重系數,多方面提高集合預報準確性。系統在預報準確率評分方面,采用國家局LAPS 個點實況對于各個模式進行格點評分,較為以往插值站點評分來說,評分更為精準,利用率也更為廣泛。系統對于專業服務對象采用靈活錄入方式,可以根據點、面、行政區域等方式,靈活選擇各種模式預報結論,結合服務對象,快速制作各類專業預報。整個系統均響應國家局分布式環境[13]方式。所有數據不留存原始數據,把原始數據來源統一為分布式環境,大大提升了各個模式預報獲取速度,服務響應速度,節省空間占用。
后期可增加動態底圖服務產品,用戶通過導入底圖,選擇服務產品生成方式等多樣化的組合,從而制作圖文類服務產品,提高專業服務質量。建立各個模式的準確率與評分大數據,通過分析得出每種模式的歷年準確率,季度準確率,時段準確率,結合算法,可進一步提升集合預報的準確性。增加行政區劃分級用戶管理,可將系統擴展至市縣級,從省級系統到市縣級系統進行延伸,以支撐全省各級的專業氣象服務業務。