吳永濤,陳金車,徐延欣,柴俊偉,張 鑫
(1.甘肅省張掖市氣象局,甘肅 張掖 734000;2.蘭州大學大氣科學學院,甘肅 蘭州 730000;3.甘肅省張掖市肅南裕固族自治縣氣象局,甘肅 張掖 734400;4.蘭州理工大學電氣工程與信息工程學院,甘肅 蘭州 730050)
氣溫預報是天氣預報業務中不可或缺的一部分,作為預報中基本氣象要素之一,氣溫變化既與天空狀況、天氣現象、下墊面、風等因子有關,又受到海拔高度、緯度等要素影響[1]。氣溫對于霜凍、干旱等災害性天氣的發生有著密切的關系,同時氣溫變化在城市冬季供暖、交通運輸以及電力負荷等方面都起到重要的作用[2-5]。近年來,由于全球氣候變化的影響,極端天氣現象的發生頻率越來越高,如高溫、嚴寒、短時強降水等[6],這些極端天氣現象給民眾帶來了極大的困擾,人們對天氣預報也提出了新的挑戰和要求,特別是對極端氣溫,其預報是否準確及時,將直接影響人們的生產生活。隨著科學技術的迅猛發展以及社會經濟水平的不斷提高,現有的氣溫預報已經無法滿足社會發展需求。雖然在現代天氣預報業務中,溫度預報是最基礎的一項預報內容,但是對于更準確、更精細化的溫度預報仍然是氣象人員重點研究的內容。其預報水平的提高,一方面依賴于數值模式預報產品釋用和各種客觀預報方法的集成發展,另一方面預報員的經驗和主觀分析能力對溫度預報的訂正也發揮著重要作用。
最近幾十年來,社會和科技的進步促使氣溫預報得到了快速的發展,其預報方法不斷改進,特別是如今的數值預報、集合預報等方法的應用,使得氣溫預報的準確性大大提高,預報質量尤其突出的是24 h 最高、最低氣溫預報,已基本取得預期結果。多年來,許多氣象學者在數值預報產品基礎上做了大量研究,卡爾曼濾波、MOS、完全預報(PP)法、支持向量機(SVM)以及相似預報法等方法在科研和業務應用中得到了完善和發展[7]。熊世為等[8]基于ECMWF 細網格輸出產品,以優化的BP-MOS 模型預測最高最低氣溫并進行對比分析,結果表明優化的BP-MOS模型預測效果良好;智協飛和黃聞[9]對基于卡爾曼濾波的氣溫和降水的多模式集成預報進行研究,研究表明卡爾曼濾波方法預報效果優于消除偏差集合平均(BREM)和單模式預報,但對于地面氣溫,預報效果有一定的差異性。
張掖市位于甘肅省西部,河西走廊中段,其氣候特點是夏季短而酷熱,冬季長而嚴寒,干旱少雨,且降水分布不均,晝夜溫差大,風能、太陽能資源豐富。張掖盛產小麥、玉米、水稻、油菜、胡麻等農作物,為全國重點建設的12 個商品糧基地之一。其境內有張掖丹霞等豐富的旅游資源。因此,通過研究溫度預報來提高預報準確率,以期為張掖市旅游資源和太陽能資源利用、農業生產過程調整提供參考。
張掖市的氣象數據來源于甘肅省氣象局氣象信息中心,包括了場面氣壓、海平面氣壓、3 h 變壓、24 h變壓、最高氣壓、最低氣壓;氣溫、最高氣溫、最低氣溫、24 h 變溫、露點溫度、相對濕度、水汽壓;2 min 平均風速、2 min 平均風向,10 min 平均風速、10 min 平均風向;0 cm 地溫、80 cm 地溫、320 cm 地溫和能見度的逐小時數據。時間段為北京時間2019 年6 月1 日0:00—2019 年6 月30 日03:00,采用鄰域平均法將缺失的氣象數據補齊。
SVM 是一種應用廣泛的機器學習算法,該算法既可以用于分類,又可以用于回歸。ATE-T Bell 實驗室研究小組于1963 年首次提出了支持向量機的理論方法。但在當時,沒有得到重視,這使得SVM 的進一步發展受到了阻礙。到了20 世紀90 年代,神經網絡等機器學習算法的研究遇到了局部極小點以及過學習與欠學習等一些重大的問題,這些原因使得SVM 得到了迅速發展與完善的機會,并且在許多科學問題中體現出了優勢,目前已經在氣象與環境等領域里廣泛應用。杭月荷和孫鑫[10]應用支持向量機回歸方法(SVR),選取內蒙古2015—2018 年自動氣象站和歐洲中期天氣預報中心(簡稱EC)數值預報歷史資料,建立逐時次、逐站點的鄉鎮最高、最低氣溫預報模型并進行檢驗,結果顯示SVM 模型相較于EC 模式預報準確率大幅提升,其次在鄉鎮高低溫預報上,該模型優于內蒙古指導產品。但是該模型的建立是基于內蒙古鄉鎮氣象資料,其檢驗效果是否適用于其他地區還需要進一步的推廣驗證。
構建預報模型時,以張掖市2019 年6 月1 日0:00—2019 年6 月30 日03:00 的氣象數據為基礎,選取了前500 條數據用來訓練模型,后200 條數據用來進行測試,共計700 條數據?;谥С窒蛄繖C的溫度預報模型構建過程如圖1 所示。

圖1 基于支持向量機的溫度預報模型構建流程
用場面氣壓、海平面氣壓、3 h 變壓、24 h 變壓、最高氣壓、最低氣壓、氣溫、最高氣溫、最低氣溫、24 h 變溫、露點溫度、相對濕度、水汽壓、2 min 平均風速、2 min平均風向、10 min 平均風速、10 min 平均風向、0 cm 地溫、80 cm 地溫、320 cm 地溫和能見度共計21 個變量的數據作為輸入變量,下一時刻的氣溫、最高氣溫、最低氣溫、24 h 變溫、露點溫度和0 cm 地溫6 個變量,分別作為輸出變量分別構建張掖市的溫度預報模型。
用平均絕對誤差(MAE)、均方根誤差(RMSE)、確定系數(R2)和準確率(P)來檢驗張掖市溫度的預報效果,它們的計算方法如公式(1)~(4)所示。其中,Y 為預報值,O 為實際觀測值,k 為試報個數。

圖2a-f 分別表示氣溫、最高氣溫、最低氣溫、24 h 變溫、露點溫度和0 cm 地溫6 種常見溫度指標預測值與實際觀測值隨時間的變化。從圖2 中可以看出,氣溫、最高氣溫、最低氣溫、24 h 變溫、露點溫度和0 cm 地溫預測值的曲線都能很好地反映真實值的變化趨勢和大小,預測值和實際觀測值十分接近。

圖2 張掖市溫度的預報值和實際觀測值對比
張掖市溫度預報結果的誤差分布見表1,氣溫、最高氣溫、最低氣溫、24 h 變溫、露點溫度和0 cm 地溫預報結果的誤差都較小,預報準確率都超過了90%。其中最低氣溫的預報準確率最高,為97.85%,露點溫度和0 cm 地溫的預報準確率最低,為91.39%和91.41%。支持向量機對張掖市溫度預報有較強的預報能力,誤差較小。

表1 張掖市溫度預報結果的誤差檢驗
利用支持向量機對張掖市6 種常見溫度指標進行了預報,并對預報結果進行了誤差檢驗,評價該預報模型對張掖市溫度的預報性能。
(1)對于張掖市溫度的預報而言,支持向量機預報結果的預報值與實際觀測值之間有良好的線性對應關系,因此,將支持向量機回歸模型應用于張掖市溫度的預報中是可行的。
(2)最低氣溫的預報準確率最高,為97.85%;最高氣溫緊隨其后,露點溫度和0 cm 地溫的預報準確率最低,這可能與預報因子的選取有關。