張偉 全志偉


摘 要:通過對多普勒天氣雷達數據進行預處理,生成大量的雷達回波圖像,并構造了雷達回波序列圖像庫,為機器學習提供訓練樣本集。基于機器學習算法時空預測神經網絡(PredRNN++)建立雷達估測降水識別模型,實現0~3 h雷達回波預測。結果表明:將時空預測神經網絡方法應用于雷達回波識別,可突破傳統1 h預報預警時效,與傳統的深度學習算法相比效果較好。
關鍵詞:機器學習;雷達;估測降水
中圖分類號:P412.25 文獻標識碼:A 文章編號:1003-5168(2021)26-0026-03
Research on Radar Precipitation Estimation Technology
Based on Machine Learning Algorithm
ZHANG Wei QUAN Zhiwei
(Lanzhou Central Meteorological Observatory, Lanzhou Gansu 730000)
Abstract: By preprocessing doppler weather radar data, a large number of radar echo images are generated, and a radar echo sequence image library is constructed to provide training sample set for machine learning, the recognition model of radar precipitation estimation is established based on machine learning Algorithm time-space prediction neural network (PredRNN++) to realize 0~3 h radar echo prediction. The results show that the method of time-space prediction neural network applied to radar echo recognition can break through the traditional time-effect of 1 h prediction and has better effect than the traditional depth-learning Algorithm.
Keywords: machine learning;radar;precipitation estimation
隨著研究的深入,很多氣象學者發現降水元素之間的關系大多是非線性的,于是越來越多的研究者開始嘗試用神經網絡的方法進行降水外推預報。國內針對基于神經網絡的降水預報研究起步較晚。朱玲等結合人工智能技術在氣象領域的未來發展,列舉了機器學習、語言處理、計算機視覺方面的真實案例[1];傅德勝等以多普勒雷達降水回波資料為數據基礎,建立雷達定量估測降水模型[2];張文海等基于多普勒雷達三維拼圖資料,利用機器學習技術開發了一種冰雹識別和臨近預報的人工智能算法[3];李海峰運用10種基于傳統機器學習的雷暴大風識別方法,通過提取雷達組合反射率等特征,對雷暴大風區域進行識別[4];關鵬洲等以多普勒雷達數據為基礎,改進了傳統機器學習模型及近年來興起的深度學習算法[5]。
但神經網絡由于參數過多使網絡結構復雜,存在易陷入局部極小點和收斂速度慢等缺點。在基于神經網絡的降雨預報研究中,有些學者把研究重點放在對神經網絡的改進和優化上。林開平發現神經網絡方法在實際天氣預報業務中存在人工神經網絡的泛化性問題[6]。SHI等[7]提出ConvLSTM,以更好地獲取空間特征,并在ConvLSTM的基礎上又提出了一個新模型——軌跡GRU(TrajGRU)。與ConvLSTM不同,TrajGRU會主動學習時空的遞歸連接結構。有研究提出了ST-LSTM結構,使得上一時刻高層的信息能被更加充分地利用;有研究提出了PredRNN+,使網絡可以更快速地回想起遙遠時刻的信息;有研究提出了通過傳遞誤差來預測的網絡Prednet和rgcLSTM,但是如果不能持續提供真值,這類模型很難進行長序列的預測[8-10]。考慮各模型的特點,本文嘗試改進目前效果最好的PredRNN++來解決此類問題。
1 研究內容及技術路線
1.1 研究內容及目標
以基于機器學習算法的雷達估測降水技術為研究目標,結合雷達組合反射率與長短期記憶人工神經網絡(Long-Short Term Memory,LSTM)的機器學習系統構建要素,發展一種基于雷達組合反射率和機器學習技術的對流單體識別。
1.2 技術路線與流程
1.2.1 深度學習。學習過程由5個關鍵步驟組成:①對多普勒天氣雷達2年8個月夏季雷達回波組合反射率篩選、去噪;②通過切割、卷積等方式降低圖像尺寸;③通過PredRNN++網絡深度學習前向計算,得出未來3 h回波圖;④通過轉置卷積、拼接等方式還原圖像尺寸;⑤無監督學習反向傳播誤差,更新深度學習模型參數。
1.2.2 模型介紹。循環神經網絡(Recurrent Neural Network,RNN)是一種用于處理序列數據的神經網絡。與一般的神經網絡相比,循環神經網絡能夠處理序列變化的數據。LSTM內部主要有3個階段:一是忘記階段,對上一個節點傳進來的輸入進行選擇性忘記;二是選擇記憶階段,將這個階段的輸入有選擇性地進行記憶;三是輸出階段,決定哪些數據將會被當成當前狀態的輸出。
LSTM作為一種特殊的RNN,主要是為了解決長序列訓練過程中的梯度消失和梯度爆炸問題。簡單來說,相比普通的RNN,其結構已被證明對序列到序列問題有較好的表現。該模型提出了一種門控結構,可以使信息選擇性通過。它由一個全連接層和一個sigmoid函數組成。門矩陣由當前時刻輸入xt和上一時刻隱藏層輸出ht-1決定,值的大小在0和1之間。門控制有多少信息可以通過,0代表“所有的都不能通過”,而1代表“所有的都可以通過”。LSTM共有3個門,分別是輸入門、遺忘門、輸出門。遺忘門控制丟棄多少上一時刻的細胞狀態;輸入門控制多少新的信息會進入當前細胞狀態;輸出門決定細胞狀態的哪些部分需要輸出。近些年,有許多基于LSTM或其變體GRU的方法被提出來解決時空預測問題。
PredRNN++由多層CausalLSTM組成。CausalLSTM中包含2個記憶,時間記憶C沿水平方向更新,空間記憶M沿z字方向更新。CausalLSTM在input-to-state and state-to-state transitions過程中也使用了卷積來代替全連接操作。輸入門、遺忘門依賴于x、h、c,這兩個門控制信息在時間記憶C上的流動,除此之外,輸入門、遺忘門還能夠控制信息在空間記憶M上的流動。CausaLSTM采用了級聯機制,c將被和x、M、l-1拼接來計算輸入門、遺忘門。最終,輸出ht可以通過拼接CT、MT輸出門ot得到。
2 預測結果展示
通過深度學習得到的應用模型近300 MB,應用時使用圖形處理器(Graphics Processing Unit,GPU)可達到1 s預測結果,不帶GPU約10 s即可。挑選其中兩組測試值進行展示,其中gt為真值,pd為預測值。0~1 h預測值具有較高的相似度,隨著預測時間的增加,預測值變得較為模糊(見圖1)。
3 檢驗評估
通過臨界成功指數(Critical Success Index,CSI)指標定量評估,CSI代表POD和FAR的綜合效應,POD代表事件發生的總次數中發出警告次數的占比,FAR代表發出警告的次數中事件未發生次數的占比。設定閾值為20 dBZ,當回波強度大于閾值時記為yes,低于閾值時記為no。圖2為當閾值為20 dBZ時的CSI指數。
4 結語
通過機器學習算法深度學習原理和時空預測神經網絡(PredRNN++),完成了雷達組合反射率識別降水模型,實現了0~3 h雷達回波預測。結果表明:時空預測神經網絡(PredRNN++)技術應用于雷達回波識別,可突破傳統1 h預報預警時效,與傳統的機器學習算法相比效果更好。
參考文獻:
[1]朱玲,關心玥.人工智能在氣象領域的應用述評[J].廣東氣象,2019(1):35-39.
[2]傅德勝,肖晨,譚暢,等.RBF神經網絡在雷達定量估測降水中的應用研究[J].氣象科學,2015(2):199-203.
[3]張文海,李磊.人工智能在冰雹識別及臨近預報中的初步應用[J].氣象學報,2019(2):282-291.
[4]李海峰.基于雷達回波的雷暴大風識別算法研究[D].哈爾濱:哈爾濱工業大學,2018:36.
[5]關鵬洲,王夢毫,李倩.基于集成學習和深度學習的短期降雨預測模型[C]//2017年(第五屆)全國大學生統計建模大賽獲獎論文選,2017.
[6]林開平.人工神經網絡的泛化性能與降水預報的應用研究[D].南京:南京信息工程大學,2007:45.
[7]SHI X J,GAO Z H,LAUSEN L,et al.Deep learning for precipitation nowcasting: a benchmark and a new model[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems,2017.
[8]劉雅云.基于機器學習的降水數據分析算法的研究[D].南京:南京信息工程大學,2018:61.
[9]周蕓.基于機器學習的多源氣象觀測與研究[D].南京:南京信息工程大學,2020:61.
[10]沈皓俊.基于機器學習的中國夏季降水預測預報[D].北京:清華大學,2019:64.
1296501186394