王 興, 呂晶晶, 王璐瑤, 王 暉, 詹少偉
(1.南京信息工程大學大氣科學與環境氣象國家級實驗教學示范中心, 南京 210044;2.南京信息工程大學大氣科學學院, 南京 210044; 3.南京信大氣象科學技術研究院, 南京 210044)
強對流天氣是一種因大氣強烈的垂直運動而產生的天氣現象,往往具有很強的破壞力,常伴隨雷暴、短時強降水、大風和冰雹等災害性天氣。在過去的20年間,全球因氣象災害造成的經濟損失高達數萬億美元[1]。僅2019年,全國因各類自然災害共造成1.3億人次受災,98.4萬間房屋倒塌或損壞,農作物受災面積19 256.9×103hm2(1 hm2=104m2),直接經濟損失3 270.9億元[2]。施瓦茨等[3]指出,天氣在80% 的世界經濟活動中起到關鍵性作用。
短時強降水和對流性大風是典型的強對流天氣,其對交通運輸、農業生產、建筑保護和城市排水等造成極大危害。天氣雷達是對其進行監測和預測的電子設備,借助雷達探測資料能夠直觀地觀察天氣演變過程,結合專業理論和方法能夠分析出風暴發生的空間位置、移動速度和發展趨勢,以及大風或降水的強度等大量有價值的天氣信息。利用雷達進行災害性天氣的識別是短臨預報業務中重要的技術手段,經過數十年的發展已積累了很多卓有成效的理論和方法。雷暴識別跟蹤分析與預報算法 (thunderstorm identification tracking analysis and nowcasting, TITAN) 和相關跟蹤雷達回波算法(tracking radar echoes by correlation, TREC) 是該領域應用最廣且影響最深遠的兩種方法,它們都是通過對雷達回波或衛星圖像所表征的風暴形態的幾何推理以及相鄰時刻風暴中心的相關性分析,實現對強對流天氣的識別與追蹤。在這些方法的基礎上相繼產生了很多新的研究成果,提升了識別的準確性和可靠性。曹偉華等[4]將上述兩種移動矢量進行融合,兼顧了TREC在提取大尺度風暴總體移動趨勢方面的特長與TITAN在刻畫小尺度風暴運動細節上的優勢,融合后的外推移動矢量對提高降水落區和降水強度的預報起到積極作用。黃旋旋等[5]在傳統TREC基礎上通過增加相鄰時刻雷達基本反射率強度連續約束檢驗和矢量全變分修正,提高了雷達回波移動矢量場的連續性,進而提升了臺風降水預報的精度。Muoz等[6]結合光流技術,采用多組閾值對風暴進行識別,改善了TITAN無法準確識別小尺度且快速移動的風暴質心的問題,提高了短時強降水預報的準確性。
針對災害性天氣的識別,除了基于上述兩種方法外,氣象學者們還嘗試結合多種極端天氣指數進行分析。Yang等[7]利用雷達基本反射率信息和霰分布等物理量參數構建雷暴識別模型,并對南京地區17個天氣過程共計312次雷暴雨進行檢驗試驗,結果表明,該方法識別的成功率為85.3%。Wang等[8]采用光流技術對風暴質心垂直方向的運動趨勢進行分析,結合對風暴質心中層徑向速度場中“正負速度對”的識別,實現垂直輻散大風的特征識別,并實現對強對流天氣的提前預警。趙暢等[9]利用新一代雙偏振雷達,將多個雙偏振參量引入雷達定量降水估測模型,結合地面自動氣象站的觀測進行檢驗,結果表明,強降水中心的降水估計量與實際觀測結果較接近。馮晉勤等[10]以雷達資料作為輸入數據,采用Fisher判別方法構建冰雹、雷雨大風和強雷暴天氣的預警預報方程,實現多種災害性天氣的自動判別。竇冰杰[11]利用雷達反射率及徑向速度數據構建三維輻合面,對強對流的一項特征指標“中層徑向輻合”進行判別,進而實現大風預測。王萍等[12]針對“中層徑向輻合”易被低估和遺漏問題,利用“徑向矩形映射”將放射狀分布的雷達數據轉變為格點數據,并提出基于輻合線走向的輻合強度訂正方法,提高了對“中層徑向輻合”識別的準確率,進而也提高了對雷雨大風預報的準確率,實驗結果表明,其預報準確率達到94.87%。
隨著通用圖形處理器(general-purpose computing on graphics processing units, GPGPU)的普及和深度學習技術的發展,利用深度神經網絡進行各類圖像目標物識別的技術已廣泛應用于安監、醫療、交通和工業生產等領域[13-16]。利用深度學習等人工智能技術解決氣象問題是近年來很多研究人員致力的一個重要方向。李銀勇等[17]通過集成經驗模態分解(ensemble empirical mode decomposition, EEMD)將大氣電場分解為晴天天氣和雷暴天氣兩類不同時間尺度變化分量,再對包含雷電信號的高頻模態分量進行二階差分計算,實現雷暴天氣的識別預警。楊磊等[18]提出一種基于EEMD和廣義回歸神經網絡的短期風速變權組合預測模型,用于風電場風速預測,實驗結果表明,該模型比單一模型以及傳統組合模型具有更高的預測精度。張遠汀等[19]將分類回歸樹(classification and regression tree,CART)與神經網絡結合,構建溫度、濕度和積雪深度等物理量之間的關系模型,實現對雨雪冰凍天氣的預測。Kim等[20]提出一種以卷積神經網絡(convolutional neural networks, CNN)為基礎構建的深度學習模型,對衛星圖像中過沖云頂(overshooting top,OT)特征進行檢測,其識別命中率(probability of detection,POD)為79.68%,誤報率(false alarm ratio,FAR)為9.78%,較傳統圖像識別算法具有更好的識別效果。
將深度學習技術應用到對雷雨大風等強對流天氣的智能識別也是近年來一些氣象工作者努力的目標。但由于強對流天氣的生消發展速度快、局地性強、空間尺度小,使得其在雷達回波圖像上所表現的一些典型特征并不總是存在,而一些關鍵性特征又難以客觀量化,這使得不論采用圖像模式識別還是機器學習識別,都難以有效實施應用。
目前中國最常用的多普勒天氣雷達基數據主要包括3種產品,分別為基本反射率因子、平均徑向速度和速度譜寬。其中,基本反射率因子的大小反映了探測區域內部降水粒子的尺度和密度分布情況,在回波圖像上常稱作回波強度。一般情況下,回波強度越高,發生強對流天氣的概率也越大。平均徑向速度則反映了降水粒子接近或遠離雷達中心點的移動情況。利用雷達基數據可繪制出回波圖像和徑向速度圖像以及多種衍生產品圖像,再運用圖像識別算法或結合氣象學的一些物理參量,能夠有效識別出颮線、強降水和雷暴等災害性天氣[21-22]。但有關如何進一步提高強對流天氣識別和預報的準確性,以更好地滿足人們生活和社會產生的需求,仍有幾方面技術難題需要攻克。
(1)識別算法的可靠程度受局地氣象條件影響較大[23]。現有的各種強對流天氣或災害性天氣識別算法多是基于某一地區進行研究和檢驗,所構建的算法模型普適能力較差。
(2)雷雨大風天氣的識別能力日趨成熟,但提前預警能力相對較弱[24]。雷雨大風是強對流天氣系統中生消發展極為復雜的一員,因其空間尺度小,變化速度快,尤其是在風暴形成初期和消亡階段,對其形態特征的準確識別極為困難,進而也影響到提前預報預警的能力。
(3)實時氣象觀測數據量巨大,業務人員主觀研讀分析海量資料越發難以實施。隨著氣象信息化程度的不斷提升,每天數以10 GB甚至100 GB的數據量已然超出氣象工作者主觀研讀的能力,因此,亟需借助計算機智能識別相關技術,實現對強對流天氣的快速識別和精準預報。
為了克服上述困難,提出一種以深度神經網絡為模型,以雷達回波圖像為主要輸入,利用光流技術生成回波移動光流圖像作為輔助輸入,通過數據集增強、代價函數優化和模型泛化性能優化等步驟,實現對強對流天氣智能識別的方法。
深度神經網絡是機器學習領域的一種技術,它通過多次組合低層特征形成更加抽象的高層次屬性或特征,經過迭代訓練數據集,調整網絡參數,降低統計誤差,進而自學習出一組用以發現數據分布特征或規律的超參數集合。其中,卷積神經網絡(CNN)是深度神經網絡中應用最廣的一種單元結構,CNN在應對大型圖像處理方面有著出色的表現,目前已被應用到圖像分類、識別和物體檢測等諸多領域。
與傳統基于雷達圖像特征識別的技術相比,運用CNN進行強對流天氣智能識別的最大優勢在于它不需要針對不同地區、不同季節的雷達圖像分別梳理總結出一套發生規律或特征。只要輸入神經網絡的樣本數量足夠多,且樣本的時間分布和地理空間分布相對均衡,再結合一些模型優化技術,即能通過CNN構建的網絡模型完成對雷達圖像所表征的天氣現象的準確識別。方法的總體技術路線如圖1所示。

圖1 總體技術路線Fig.1 Overall technical roadmap
目標是要構建一個以CNN為基礎的深度神經網絡模型,通過大量樣本“數據對”的迭代訓練,尋求雷達回波圖像和回波移動光流圖像與“是否發生了強對流天氣現象”之間的一組函數映射關系。雷達回波圖像可通過專業軟件繪制輸出,回波移動光流圖像采用基于Lucas-Kanade的局部約束法計算得到。而判定“是否發生了強對流天氣”的標簽則通過地面氣象觀測資料中的小時降水量和最大風速以一定的規則計算得到,這些規則將在下文給出。
深度神經網絡模型將預處理后的雷達圖像與地面氣象站的氣象資料通過經緯度信息結合起來,生成用來訓練和測試的數據集。實施過程主要包括數據集的構建、強對流天氣識別模型的構建、數據集增強優化、代價函數優化,以及模型泛化性能優化等。檢驗過程通過客觀量化的評價指標,統計每種優化技術產生的效果,并對結果加以分析。
數據集的構建主要是生成兩種雷達圖像(雷達回波圖像和回波移動光流圖像)與強對流天氣發生與否的標簽這兩者間的“數據對”。其中,雷達回波圖像常見有兩種表現形式,一種是在一系列固定仰角上掃描一圓周得到的采樣,即平面位置顯示 (plane position indicator, PPI)方式掃描;另一種是將PPI數據通過空間插值算法計算出某一等高面上的回波采樣,即等高平面位置顯示(constant altitude plan position indictor, CAPPI) 方式掃描。在業務上,CAPPI回波圖像更適用于對中層輻合輻散和強對流的分析。為了避免因插值計算造成的回波強度失真對模型訓練結果的不利影響,本算法采用PPI方式掃描的回波圖像作為模型的一部分輸入。
光流是圖形圖像領域的一個基本概念,它能夠刻畫連續圖像之間的運動特征。光流的概念最早由Gibson等提出,又由Horn、Lucas等一些學者先后提出圖像光流的具體計算方法,為光流相關研究奠定了重要理論基礎。近年來,光流技術已被應用到運動目標檢測、機器人路徑規劃和天氣外推預報等諸多領域[25-27]。回波移動光流圖像是本算法模型的另一部分輸入。由于回波圖像中表征風暴中心的高值回波區域具有“非剛體”特征,其形態隨風暴的生消發展持續變化,無法滿足Horn-Schunck全局光流平滑的假設,因此,本算法采用了基于Lucas-Kanade的局部約束法來構建光流場。數據集中一組雷達回波圖像和回波移動光流圖像如圖2所示。

圖2 本文算法使用的雷達圖像示例Fig.2 Examples of radar images used in this algorithm
圖2中3幅圖像分為T時刻的回波圖像、T+6 min時刻的回波圖像以及T時刻的回波移動光流圖像。由于本算法采用的是VCP21方式的雷達體掃,體掃周期為6 min,因此,圖2(b)采用的是T+6 min的數據。圖2(c) 是由圖2(a) 和圖2(b) 采用基于Lucas-Kanade的光流算法計算得到,為了在圖像上清楚地標識光流信息,圖2(c) 光流箭頭進行了稀疏處理。
短時強降水和大風是最典型的強對流天氣,本算法采用這兩種易于被地面氣象站觀測到的天氣現象作為判定強對流天氣發生與否的標簽。其中,降水量通過地面氣象站(包括加密自動氣象站)記錄的分鐘降水量信息累加得到近1 h的降水量。大風的風速則根據地面氣象站記錄的瞬時風速或極大風速,通過求取近1 h的最大風速得到。具體判定規則如下:①1 h的降水量達到或超過20 mm判定為發生短時強降水;②1 h最大風速達到或超過17.2 m/s判定為發生大風;③由于雷達探測到強對流天氣特征的時間往往早于地面觀測到短時強降水或大風,因此,以地面氣象站觀測時間為基準,往前推2 h的時間范圍內,分析這期間是否存在雷達基本反射率數值達到或超過50 dBZ的情況。當僅滿足條件①和③時,標記為發生了短時強降水;當僅滿足條件②和③時,標記為發生了大風;當上述3項條件同時滿足,標記為發生了強對流天氣;其他情況下,均標記為無強對流天氣。強對流天氣發生與否的標簽定義為表1所示的4類事件。

表1 事件定義Table 1 Event definition
由于雷達和地面氣象站數據均包含地理經緯度信息,因此,可通過數學方法實現兩種數據在空間上的一致性轉換。又由于引發強對流的風暴質心的垂直高度一般不超過16 km,而雷達徑向上各個探測點的高度隨著與雷達位置的遠離而不斷增高,通常距離雷達中心點60 km外的高仰角探測點的垂直高度已超過16 km。因此,對所有圖像統一截取以雷達所在位置為中心點,長寬均為120像素的圖像作為本方法模型的輸入。此外,由于VCP21體掃方式下9個仰角中,最高仰角的信息量較少,對強對流天氣識別的意義不大。因此,輸入的回波圖像剔除了最高1個仰角的信息,只采用8個仰角面的回波圖像。
與某一仰角回波圖像相對應的回波移動光流圖像是由前一探測周期,同一仰角的回波圖像與當前回波圖像,通過光流法計算得到的光流場生成。上述8個仰角的回波圖像分別對應1個回波移動光流圖像。綜上所述,本算法輸入到深度神經網絡的數據是一個120×120×(8×2) 的三維向量。
CNN是一類包含卷積計算且具有深度結構的前饋神經網絡,是深度學習的核心算法之一。CNN具有很強的特征學習能力,它對圖像的縮放、平衡和傾斜等目標物形變具有良好的適應性。VGGNet是牛津大學計算機視覺小組(Oxford Visual Geometry Group)和Google DeepMind公司共同研發的一種深度卷積神經網絡模型。該模型曾獲得ILSVRC 2014年比賽的亞軍和定位項目的冠軍[28],在圖像特征提取和圖像識別領域具有非常優異的表現。
本算法借鑒了VGGNet的結構,搭建適用于強對流天氣智能識別的網絡模型,模型結構如圖3所示。

圖3 強對流天氣智能識別的神經網絡結構Fig.3 Neural network structure for intelligent recognition of strong convective weather
圖3中,輸入是一個長寬均為120像素,由16幅圖像(8幅回波圖像和8幅回波移動光流圖像)構成的三維向量。經過10次卷積和3次池化,以120×120×64為例,前2項表示圖像的大小,64表示卷積核的數量。圖3中各層的作用與圖例中名稱的含義相一致。卷積層和全連接層所采用的激活函數均為ReLU函數。除了圖3所示的各個神經元層外,在輸入層后還增加了批規范化層(batch normalization),用于提升該模型訓練的魯棒性。
從數理角度來看,利用卷積神經網絡進行強對流天氣的雷達圖像特征分類識別,其基本思想是利用結構風險最小化原則,通過大量樣本數據的訓練和迭代,以尋求期望風險上界的最小值。由于結構風險能較好地權衡訓練誤差和模型的復雜度,因此采用以卷積神經網絡為代表的深度學習模型理論上具有較好的泛化能力。但由于強對流天氣在一年中并不總是發生,標識為發生強對流的標簽相較于數據集中所有標簽,占比很少,屬于小概率事件。如果采用傳統的訓練數據集分類方法,很可能會出現“不均衡數據”問題,導致深度學習模型的訓練結果偏向于大概率事件,即沒有強對流天氣發生,大大增加了漏報的概率,降低了識別的準確性。
為了克服上述問題,本模型通過對低概率訓練樣本進行多重采樣,實現數據集的增強優化。具體方法為將可能存在強對流天氣特征的回波圖像通過平移、旋轉、變形和增加噪聲等方式,生成多個新的訓練樣本,使得數據樣本中發生強對流天氣的占比有所增加,進而降低數據不均衡對模型訓練產生的不利影響。圖4所示為數據集增強的一個示例,其中,圖4(a)所示為雷達回波圖像原圖,該圖長寬均為120像素,圖像中心位置對應雷達中心點,不同顏色代表不同的回波強度,強度的大小與圖4右側的圖例相對應。圖4(b)~圖4(f)分別是由圖4(a) 經順時針旋轉、逆時針旋轉、放大、縮小和放大旋轉生成。

圖4 數據增強示例Fig.4 Examples of data enhancement
由于雷達圖像上各個像素點的經緯度坐標可計算得到,同時,地面氣象站的經緯度信息已知,因此,上述圖像形變后,地面氣象站的空間位置也隨圖像形變做出調整,以確保雷達圖像與強對流天氣發生與否的標簽在地理位置上始終保持一致。
機器學習中的代價函數 (cost function) 又稱損失函數 (loss function),它是將隨機事件或與其有關隨機變量的取值映射為非負實數以表示該隨機事件的“風險”或“損失”的函數[29]。損失函數往往與學習準則和優化問題相關聯,并且常通過最小化代價函數來求解或評估模型的優劣。為了進一步改善數據集的不平衡問題,本模型提出在代價函數中引入類別權重,賦予實際發生了強對流,但模型未識別出強對流這種情況更大的懲罰值。改進后的代價函數為

(1)
式(1)中:yi為強對流天氣的示性函數;ti為CNN模型對應于強對流天氣的輸出,表示該區域被識別為強對流天氣的概率;m為一次訓練過程樣本的數量;w為判定權重項,即懲罰值。該值越大模型會將更多的雷達圖像判定為存在強對流天氣,進而造成更高的誤報率,但相應地,識別的成功率也會提升。很顯然,w的取值將對模型識別結果產生重要影響,具體取值將在實驗與結果分析部分進行論證。
由于強對流天氣的發生具有一定的季節特征,而數據集中各個“數據對”是按氣象資料的時間先后順序組織的。為提升模型的泛化性能,進一步采用無重復抽樣的K折交叉驗證技術[30],使得神經網絡在訓練時每個“數據對”只有一次被劃入訓練集的機會。所謂K折,是將原有數據集拆分成K份,其中K-1份作為訓練集,剩下的一份作為驗證集。具體步驟如下:
(1)如圖5所示,將原有數據集隨機地拆分為K份。

圖5 K折交叉驗證示例Fig.5 Example of K-fold cross-validation
(2)挑選任意一份作為驗證集,剩余均作為訓練集,用于CNN模型的訓練。通過該訓練集訓練后得到一個帶有網絡參數的模型,用此模型在驗證集上進行測試,并保存模型的評價指標Ei。
(3)重復第2步K次以確保所有子集都有且僅有一次機會作為驗證集。
(4)將各組評價指標的均值作為模型精度的估計,并將其作為當前K折交叉驗證下CNN網絡模型的綜合評價指標,公式為

(2)
通常,對于原數據集的拆分采取的是均分方式,為了更好地均衡強對流天氣實際發生在數據集中的分布,可以采取進一步的策略使每組內的有無發生強對流天氣的占比跟總體數據集中占比近似一致。
K折交叉驗證的優勢在于:一方面,可從有限的數據集中獲得盡可能多的有效信息,避免陷入局部的極值,并尋求最優參數;另一方面,多個模型可以用于模型集成,提升模型識別的準確率和穩定性。
為了檢驗上述方法識別強對流天氣的效果,實驗準備了2019年3—8月安徽省多部雷達探測數據和地面氣象觀測資料作為數據集。該雷達體掃周期為6 min,經極坐標轉換和空間插值計算,生成1 km×1 km 分辨率的網絡化數據。地面氣象站記錄的周期為1 min,記錄了降水量、風向和風速等氣象要素信息。采用2.2節所述方法構建數據集,生成若干組由雷達探測資料(回波圖像和回波移動光流圖像)與強對流天氣發生與否的標簽構成的“數據對”。
通過分析所構建的數據集,發現晴好天氣的占比超過80%,而強對流天氣占比不足2%,盡管模型將采用數據集增強等優化技術,但數據集的嚴重“失衡”依然會影響模型訓練的結果。因此,采用數據增強技術將數據集中存在強對流天氣的樣本數擴展了20倍,晴好天氣且無高值回波的樣本數做了適當縮減,保持總樣本數與調整前相近。最終得到發生強對流天氣的樣本數近20 000組,未發生的近62 000組。
采用氣象上常用的命中率(POD)、誤報率(FAR)兩項指標來定量評估強對流天氣識別的效果。其中,POD表示采用本文算法識別到強對流天氣,并且實際發生了強對流天氣的數量占實際發生強對流天氣總數的比例。FAR表示采用本文算法識別到強對流天氣,但實際未發生強對流天氣的數量占本算法識別為強對流天氣的總數的比例。計算方法為

(3)
首先,采用3.1節和2.4節所述方法擴充數據集中發生強對流天氣的“數據對”的占比,降低數據不均衡問題對模型訓練的不利影響。
然后,按照2.5節所述方法,定義7個懲罰項參數w={1.0,1.5,2.0,2.5,3.0,3.5,4.0} 分別用于檢驗。
接著,按照2.6節所述方法,采用K折交叉驗證,將數據集拆分為5、10、20份,分別進行模型的迭代訓練。
最后,采用2.3節所述網絡模型,將數據集應用于該模型進行訓練和檢驗。為了檢驗數據增強優化和代價函數優化的效果,實驗實施和結果分析時,首先列出了不做相關優化的統計結果。
本模型最后一層采用softmax函數輸出值域為[0, 1] 的概率值γ。在二分類問題中,常以γ=0.5作為區分類別的臨界值,這里采用多組γ值,分別檢測模型識別的效果。首先統計不做任何優化的深度神經網絡模型識別強對流天氣的效果。直接將3.1節所述的數據集拆分成5份,其中4份用于模型的訓練,剩下1份用于檢驗。統計出4種事件和POD、FAR的值如表2所示。
從表2的10次檢驗結果可以看出,γ=0.45時該模型對強對流天氣識別的命中率(POD)最高,但同時誤報率(FAR)也相對最高。隨著γ取值的增加,POD和FAR均逐步下降,且不同的γ取值對POD的影響大于對FAR的影響。由于整個數據集中發生強對流天氣的樣本數占比很低(不足2%),在識別出強對流天氣的同時,不可避免會發生誤報,而“未發生強對流天氣”很大的基數導致誤報數量相較于“發生了強對流天氣”的數量大很多,超出了一個數量級,因此在統計上表現出極高的誤報率(FAR)。

表2 未做優化的檢驗結果Table 2 Unoptimized test results
接著,采用數據集增強處理后的訓練集再做相同檢驗,統計出4種事件和POD、FAR的值,如表3所示。

表3 數據集增強后的檢驗結果Table 3 Test results after data set enhancement
從表3可以看出,增強后的數據集大幅提高了“發生了強對流天氣”樣本的占比,識別命中率升了7%~12%,并且,誤報率有了顯著下降,從優化前的90%下降到50%左右。γ取值的不同對POD和FAR的影響,其規律與優化前基本一致,總體來看,γ=0.5仍是相對較優的用于判定是否發生強對流天氣的臨界值。以表3中γ=0.5的POD和FAR指標為基準,進一步評估各項優化產生的效果。
進一步采用2.5節所述的代價函數優化方法,檢驗式(1)中不同取值的懲罰值w對識別效果產生的影響。從圖6可以看出,隨著懲罰值w取值的增加,POD指標逐步提升,但提升幅度趨緩,當w增加到3.5后,POD不再有明顯提升,保持在85.1%。同時,FAR指標也有所升高,升高幅度小于POD的升幅,且同樣在w增加到3.5后不再有明顯變化,保持在57.3%。

圖6 代價函數優化效果統計Fig.6 Cost function optimization statistics
圖7給出了K折交叉檢驗優化對對識別效果產生的影響,并使用w=1.0和w=3.0作為對標。

圖7 K折交叉檢驗優化效果統計Fig.7 K-fold cross-validation optimization effect statistics
可以看出,采用K折交叉檢驗對于POD指標的提升是非常顯著的,在w=1.0,K=10時,POD最高達到96.3%。而當K取更大的值時(K=20),并不能帶來更高的識別命中率。K折交叉檢驗對FAR指標的影響,相較POD而言影響較小。此外,實驗過程中還發現,設置較大的w值,在模型訓練的初期,誤差收斂的速度相對更快,而到了模型訓練的后期,這一速度優勢并不能帶來識別準確率的顯著提高。
為了進一步找出FAR指標“居高不下”的原因,對數據集的部分個例樣本進行了深入分析,結果發現,很多有臺風發生的時段,地面氣象站都觀測到短時強降水和大風,而此時的雷達回波并不強。
如圖8所示,圖8(a)中紅色區域表示臺風天氣的數據加入訓練集后模型識別出強降水和大風天氣的高概率落區,白點為標識為存在強對流天氣的地面氣象站站點。圖8(b)為同一時刻的雷達回波圖像。可以看出,大量的地面氣象站因觀測到短時強降水和大風,按照2.2節所述規則,被標識為“發生了強對流天氣”,而此時的雷達回波雖然覆蓋區域很廣,但回波強度普遍不高,并非真正的強對流天氣。正由于存在大量被錯誤標定的“數據對”輸入模型,使得很多弱回波特征被模型判定為“發生了強對流天氣”,這在很大程度上增加了誤報的機率。

圖8 臺風天氣對模型識別率的影響Fig.8 Influence of typhoon weather on model recognition rate
提出一種基于深度神經網絡技術的強對流天氣智能識別方法,該方法能夠將以往由氣象工作者主觀研讀雷達資料來分析強對流天氣的過程自動化、定量化,提高了對強對流天氣識別相關業務的可靠性和時效性。實驗結果表明,采用上述方法優化后的深度神經網絡模型對強對流天氣識別的命中率可達96.3%,誤報率低于60%。
由于大風和短時強降水的成因不僅是強對流天氣,還可能受到臺風的影響,而單純由強對流天氣引發的大風和短時強降水又很難逐一界定。如果在構建數據集時,能通過某些技術手段區分出臺風等非強對流天氣引發的強降水和大風,提高數據集中標簽的準確性,勢必在一定程度上提高模型對強對流天氣識別的準確率,尤其是能降低識別的誤報率。