張 軍,吳朋莉,石陸魁,史 進,潘 斌
(1.河北工業大學 人工智能與數據科學學院,天津 300401;2.河北省大數據計算重點實驗室(河北工業大學),天津 300401;3.南開大學 統計與數據科學學院,天津 300071)
溫度是氣候與生態研究的重要氣象要素,并且可以評估多種氣象災害[1]。如今,隨著氣象設備的完善,氣象觀測站點數量逐漸增加,對各個氣象觀測站點間的氣溫資料進行聯合分析有助于改進溫度預測,但是,如何構建站點間的聯系是一個巨大的挑戰。
目前,溫度的預測方法主要分為數值方法和數據驅動方法。數值方法根據物理條件和過程,利用數學模型描述溫度的變化,例如,高峰等[2]利用由北京氣候中心研發的氣候系統模式BCC-CSM1.1(Beijing Climate Center Climate System Model 1.1)進行溫度預測;數據驅動方法則以海量數據為基礎,經過訓練生成最終的模型,例如,支持向量算法[3]、隨機森林算法[4-5]、決策樹[6]和不同機器學習結合算法[7-9]已經在全球溫度預測中得到廣泛的應用。
最近,基于機器學習和人工智能技術的數據驅動方法在氣象預測方面表現出巨大潛力,尤其是處理時間序列的經典網絡——循環神經網絡也已被應用于溫度預測并且預測結果得到了改善。Liu 等[10]分析了多深度海洋溫度變化的時間依賴性,基于歷史觀測數據的時間依賴性,進行參數矩陣融合,提出一種海洋溫度時間序列預測方法;Xiao 等[11]提出長短記憶與自適應提升集成網絡LSTM-AdaBoost(Long Short-Term Memory and AdaBoost),利用自適應提升算法預測能力強、不易過擬合的特點,將它與長短期記憶(Long Short-Term Memory,LSTM)網絡結合進行溫度預測;……