999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

三種機(jī)器學(xué)習(xí)方法在廣東雷暴大風(fēng)自動識別的應(yīng)用效果評估

2023-10-27 06:34:12蘭宇羅聰伍志方唐思瑜吳林程興國陳蝶聰
熱帶氣象學(xué)報 2023年2期
關(guān)鍵詞:特征模型

蘭宇,羅聰,伍志方,唐思瑜,吳林,程興國,陳蝶聰

(1. 廣東省氣象臺(南海海洋氣象預(yù)報中心),廣東 廣州 510641;2. 中國氣象局龍卷風(fēng)重點(diǎn)開放實(shí)驗(yàn)室,廣東 廣州 510641;3. 華南理工大學(xué),廣東 廣州 510641;4. 廣東省生態(tài)氣象中心,廣東 廣州 510641)

1 引言

雷暴大風(fēng)是強(qiáng)烈的大氣對流現(xiàn)象,常造成較大范圍的嚴(yán)重影響[1]。廣東一年四季都可發(fā)生雷暴大風(fēng)。粵北、兩廣交界的山區(qū)及沿海一帶均是雷暴大風(fēng)多發(fā)區(qū),尤其人口稠密的珠江三角洲地區(qū)是受影響極重的區(qū)域。雷暴大風(fēng)具有生消快、移速快、易致災(zāi)等特點(diǎn),對人類威脅極大。因此深入研究雷暴大風(fēng)的識別預(yù)報和提升短臨預(yù)警能力是十分緊要的。

新一代天氣雷達(dá)觀測是雷暴大風(fēng)監(jiān)測和臨近預(yù)警的主要手段,對雷暴大風(fēng)的臨近預(yù)報預(yù)警主要基于雷達(dá)回波特征。俞小鼎等[2-3]指出低層大風(fēng)區(qū)(≥13 m/s)、弓形回波、近地層輻散、中氣旋對雷暴大風(fēng)具有較好的指示作用。伍志方等[4]研究發(fā)現(xiàn)80%的雷暴大風(fēng)包括下?lián)舯┝髟诙嗥绽账俣葓D上表現(xiàn)為大風(fēng)區(qū)型和近地層輻散型,還有較少比例的中氣旋型大風(fēng)。此外,雷暴大風(fēng)在反射率因子強(qiáng)度及高度、回波移速、垂直累積液態(tài)水含量等特征與強(qiáng)降水的雷達(dá)特征差異明顯[5-6]。

近年來,機(jī)器學(xué)習(xí)方法在分類識別、雷達(dá)回波外推等氣象領(lǐng)域取得了很好的應(yīng)用效果,其中傳統(tǒng)機(jī)器學(xué)習(xí)方法在人工選取特征的基礎(chǔ)上,能在數(shù)據(jù)量較小的場景下建立模型。早在2014 年,李國翠等[7]通過統(tǒng)計多個雷達(dá)特征指標(biāo),利用模糊邏輯算法建立了基于多因子的雷暴大風(fēng)自動識別算法,周康輝等[8]在此基礎(chǔ)上通過增加閃電、衛(wèi)星資料來有效識別雷暴大風(fēng)。此外,國內(nèi)外學(xué)者也相繼使用決策樹、支持向量機(jī)等傳統(tǒng)機(jī)器學(xué)習(xí)方法開展冰雹和雷暴大風(fēng)的自動識別研究[9-11]。

隨著觀測資料不斷豐富、計算機(jī)性能持續(xù)優(yōu)化,以深度學(xué)習(xí)為代表的人工智能方法在氣象上應(yīng)用逐漸增多。深度學(xué)習(xí)省略了傳統(tǒng)機(jī)器學(xué)習(xí)方法中人為選取特征的過程,基于海量數(shù)據(jù)基礎(chǔ)上,通過多隱層的層次結(jié)構(gòu)式神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,深度挖掘特征,從而構(gòu)建出性能好的學(xué)習(xí)模型。香港科技大學(xué)的學(xué)者率先提出卷積長短期記憶單元網(wǎng)絡(luò)算法(ConvLSTM)優(yōu)于普通的光流法外推預(yù)報[12],Wang 等[13-15]先 后 提 出 PredRNN、PredRNN++、MIM 等算法用于臨近預(yù)報均有較好效果。陳元昭等[16]研究發(fā)現(xiàn)基于生成對抗網(wǎng)絡(luò)的臨近預(yù)報方法對于中等強(qiáng)度回波預(yù)報效果較好,顧建峰等[17]運(yùn)用Traj-GRU建立強(qiáng)對流雷達(dá)回波預(yù)報模型,并利用U-net建立了雷暴大風(fēng)和冰雹的智能識別模型。由此看來,目前在氣象領(lǐng)域中,深度學(xué)習(xí)方法多應(yīng)用于短臨外推預(yù)報,雷暴大風(fēng)智能識別方面研究尚較少,華南地區(qū)相應(yīng)研究有待進(jìn)一步深入開展。

因此,本文分別選取傳統(tǒng)機(jī)器學(xué)習(xí)方法(決策樹)和深度學(xué)習(xí)方法(CNN 和YOLO)等3 種方法,利用廣東省地面自動站所觀測的雷暴大風(fēng)記錄及相對應(yīng)的雷達(dá)拼圖數(shù)據(jù),分別建立3種雷暴大風(fēng)自動識別模型,并針對3 種模型開展檢驗(yàn)評估,以對比傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法在廣東雷暴大風(fēng)識別上的應(yīng)用效果,確立最優(yōu)識別模型并最終實(shí)現(xiàn)識別算法的業(yè)務(wù)化運(yùn)行,為建設(shè)廣東雷暴大風(fēng)實(shí)時監(jiān)測體系、提高預(yù)警預(yù)報的準(zhǔn)確率、提升預(yù)警提前量提供技術(shù)和產(chǎn)品支撐。

2 數(shù)據(jù)與方法

2.1 數(shù)據(jù)資料

選取廣東省2012—2020年全年雷暴大風(fēng)天氣過程中自動氣象站5 min加密瞬時風(fēng)觀測數(shù)據(jù),及對應(yīng)的廣東省反射率因子、組合反射率因子、回波頂高、垂直累積液態(tài)水含量等雷達(dá)拼圖數(shù)據(jù),拼圖數(shù)據(jù)為廣東省氣象局業(yè)務(wù)化應(yīng)用拼圖,已經(jīng)過雜波抑制、孤立噪聲過濾、中值濾波和雙線性插值填補(bǔ)等數(shù)據(jù)質(zhì)量控制,數(shù)據(jù)來源于廣東省11 部S 波段天氣雷達(dá)數(shù)據(jù)。拼圖數(shù)據(jù)空間分辨率為1 km×1 km,格點(diǎn)數(shù)為1 050×880,時間分辨率6 min,垂直方向共21層。

雷暴大風(fēng)自動站觀測實(shí)況的篩選條件為:自動站觀測瞬時風(fēng)速≥17.2 m/s(下文中大風(fēng)均代表風(fēng)力達(dá)到8 級以上),同時周圍10 km 范圍內(nèi)存在雷電活動及反射率因子大于30 dBZ,并剔除了站點(diǎn)海拔高于200 m、海上浮標(biāo)站及強(qiáng)冷空氣過程、臺風(fēng)直接影響等引起的大風(fēng)記錄。由于相比一般性天氣而言,雷暴大風(fēng)觀測記錄較少,在廣東全省范圍內(nèi)屬小概率事件,雷暴大風(fēng)正、負(fù)樣本比例需適宜,以避免出現(xiàn)樣本失衡和數(shù)據(jù)偏差,兼顧模型運(yùn)行所耗計算資源、訓(xùn)練效率和識別效果,最終挑選了17 470個大風(fēng)正樣本和34 950個無大風(fēng)負(fù)樣本,正、負(fù)樣本比例為1∶2。(注:一次雷暴大風(fēng)觀測記錄(即符合雷暴大風(fēng)判定條件的觀測數(shù)據(jù))記為一個正樣本,反之則作為負(fù)樣本。)

2.2 標(biāo)簽集制作

讀取雷暴大風(fēng)觀測數(shù)據(jù)中的經(jīng)緯度,將其轉(zhuǎn)換成以拼圖左上角為起始點(diǎn),右下角為結(jié)束點(diǎn)的圖像坐標(biāo)系(圖1)中的坐標(biāo),考慮到自動站觀測范圍代表性,制作標(biāo)簽時設(shè)定雷暴大風(fēng)影響范圍為16 km,在此條件下,獲得如(Xt,Yt,16,16)的標(biāo)簽,其中(Xt,Yt)為該雷暴大風(fēng)記錄點(diǎn)在新坐標(biāo)系中的橫縱坐標(biāo),(16,16)為雷暴大風(fēng)的矩形影響范圍;將與出現(xiàn)雷暴大風(fēng)對應(yīng)時刻(或相鄰最近時刻)的各類拼圖數(shù)據(jù)轉(zhuǎn)換為圖像產(chǎn)品并標(biāo)記為class,最終得到用于機(jī)器學(xué)習(xí)模型的標(biāo)簽集(class,Xt,Yt,16,16),按照一定比例隨機(jī)選取將標(biāo)簽集分為訓(xùn)練集、驗(yàn)證集和測試集。

圖1 用于機(jī)器學(xué)習(xí)的雷暴大風(fēng)標(biāo)簽集制作

2.3 訓(xùn)練與檢驗(yàn)

本文共采用2012—2019 年共52 420 個數(shù)據(jù)集,并按照7∶2∶1 比例劃分為訓(xùn)練集、驗(yàn)證集和測試集用于算法建模,其中訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于模型參數(shù)調(diào)整和優(yōu)化,測試集不參與特征選取、參數(shù)調(diào)整等訓(xùn)練,只用于測試模型對雷暴大風(fēng)的識別能力。通過訓(xùn)練、驗(yàn)證和調(diào)參不斷循環(huán)使識別模型達(dá)到最優(yōu)識別效果后,模型參數(shù)方案即最終確立不再更改,后續(xù)的檢驗(yàn)評估均沿用此方案。鑒于雷暴大風(fēng)的小概率事件特性,而日常預(yù)報預(yù)警業(yè)務(wù)中針對其高致災(zāi)性常采用寧空勿漏的防御策略,因此在本文中訓(xùn)練和評價模型能力同時采用了命中率POD、虛警率FAR 以及臨界成功指數(shù)CSI 作為訓(xùn)練和評價指標(biāo)進(jìn)行定量檢驗(yàn)[18],旨在避免漏報的情形下盡量減少空報,提高命中。

本文中,命中并非時間和空間嚴(yán)格點(diǎn)對點(diǎn),而是根據(jù)自動站觀測間隔,T時刻算法識別到大風(fēng)落在[T-5 min,T+5 min]時間窗內(nèi)、真實(shí)實(shí)況大風(fēng)標(biāo)簽16 km×16 km 范圍內(nèi)即記為命中,算法識別到大風(fēng)但未落在相應(yīng)范圍內(nèi)或無大風(fēng)實(shí)況則記為空報,存在大風(fēng)實(shí)況而無識別結(jié)果相對應(yīng)則記為大風(fēng)漏報。命中率POD、虛警率FAR、臨界成功指數(shù)CSI的計算公式如下:

說明:NA 為命中數(shù),NB 為空報數(shù),NC 為漏報數(shù)。

3 模型介紹

3.1 決策樹模型

3.1.1 決策樹模型結(jié)構(gòu)

決策樹(Decision Tree)是一種基本的分類與回歸方法,決策樹模型呈樹形結(jié)構(gòu),在分類中表示基于特征對實(shí)例進(jìn)行分類的過程[19]。其主要優(yōu)點(diǎn)是:模型具有可讀性,分類速度快。學(xué)習(xí)時利用訓(xùn)練數(shù)據(jù),根據(jù)損失函數(shù)最小化原則建立決策樹模型。決策樹學(xué)習(xí)通常包括三個步驟:特征選擇、決策樹的生成、決策樹的修剪(圖2)。

圖2 決策樹模型結(jié)構(gòu)示意圖

決策樹由結(jié)點(diǎn)和有向邊組成,決策樹模型構(gòu)建過程:先構(gòu)建根結(jié)點(diǎn),將所有訓(xùn)練數(shù)據(jù)都放在根結(jié)點(diǎn)。選擇一個最優(yōu)特征,按照這一特征將訓(xùn)練數(shù)據(jù)集分割成子集,使得各個子集有一個在當(dāng)前條件下最好的分類。如果這些子集已經(jīng)能夠被基本正確分類,那么構(gòu)建葉結(jié)點(diǎn),并將這些子集分配到對應(yīng)的葉結(jié)點(diǎn)中去;如果還有子集不能夠被基本正確分類,那么對這些子集選擇最優(yōu)特征,繼續(xù)對其進(jìn)行分割,構(gòu)建相應(yīng)的結(jié)點(diǎn)。如此遞歸下去,直至所有訓(xùn)練數(shù)據(jù)子集被基本正確分類或者沒有合適的特征為止。最后每個子集都被分到葉結(jié)點(diǎn)上,即都有了明確的類,從而生成了一棵決策樹。

3.1.2 特征因子選取

通過結(jié)合以往的雷暴大風(fēng)特征研究以及預(yù)報員日常值班中經(jīng)驗(yàn)總結(jié),歸納總結(jié)了以下對雷暴大風(fēng)識別預(yù)警具有指示意義的特征因子,用于建立決策樹模型。

(1) 組合反射率因子強(qiáng)度。該因子是雷達(dá)一個體掃中不同高度反射率因子的最大值。有研究發(fā)現(xiàn)回波中心強(qiáng)度低于55 dBZ 時,出現(xiàn)大風(fēng)的概率很小[20];周康輝等[8]通過統(tǒng)計也發(fā)現(xiàn),雷暴大風(fēng)的反射率因子強(qiáng)度主要分布均超過30 dBZ,峰值分布于53 dBZ。因此,反射率因子強(qiáng)度對于雷暴大風(fēng)具有很高指示意義。

(2) 反射率因子強(qiáng)度梯度。通常雷暴大風(fēng)出現(xiàn)在雷達(dá)回波強(qiáng)且伴有強(qiáng)梯度的區(qū)域,尤其當(dāng)回波形態(tài)上具有典型帶狀、弓狀或者鉤狀特征時,地面大風(fēng)多出現(xiàn)在強(qiáng)度梯度大值區(qū)域[21-22]。

(3) 垂直累積液態(tài)水含量(后文統(tǒng)稱VIL)。該因子表示的是將反射率因子數(shù)據(jù)轉(zhuǎn)換成等價的液態(tài)水值,并且假定反射率因子是完全由液態(tài)水反射得到的。有研究對雷暴大風(fēng)出現(xiàn)前的VIL 進(jìn)行統(tǒng)計發(fā)現(xiàn),VIL值達(dá)到30 kg/m2是地面災(zāi)害大風(fēng)出現(xiàn)的閾值,VIL值達(dá)到或超過40 kg/m2可以作為地面災(zāi)害大風(fēng)的一個預(yù)報指標(biāo);且VIL 值快速下降也常表征雷暴大風(fēng)的出現(xiàn)[23]。

(4) 回波頂高。已有學(xué)者在多個雷暴大風(fēng)個例的回波特征研究中發(fā)現(xiàn)雷暴大風(fēng)通常與較高回波頂高相對應(yīng)[24]。李國翠等[7]統(tǒng)計結(jié)果表明雷暴大風(fēng)與回波頂高具有較好的正相關(guān)關(guān)系,可以用作雷暴大風(fēng)識別的一個特征因子。

(5) 50 dBZ 高度。華南短時強(qiáng)降水多暖云降水,其回波中心高度常常位于0 ℃層高度附近或以下,而產(chǎn)生雷暴大風(fēng)的雷暴體對流往往發(fā)展更為旺盛,強(qiáng)回波垂直伸展高度可達(dá)-20 ℃層以上,在華南地區(qū)-20 ℃層常高于7 km[25]。與此同時,當(dāng)反射率因子強(qiáng)度低于50 dBZ 時雷暴大風(fēng)出現(xiàn)概率較低,因此,可選取50 dBZ 回波出現(xiàn)的高度作為雷暴大風(fēng)的特征因子用于識別[26]。

考慮到雷達(dá)特征因子與地面雷暴大風(fēng)的出現(xiàn)時刻并非完全嚴(yán)格對應(yīng),且部分雷達(dá)特征隨時間推移的強(qiáng)度、位置變化更能表征雷暴大風(fēng),因此除提取上述因子T時刻特征值外,還提取了ΔT(T-6 min,T+6 min)在12 min 內(nèi)的變化值共10 個因子用于模型建立。

3.2 CNN模型

卷積神經(jīng)網(wǎng)絡(luò)(CNN),是一種包含卷積計算且具有深度結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一,可以進(jìn)行監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),是分類識別主流模型之一[27],在本文中應(yīng)用此模型進(jìn)行監(jiān)督學(xué)習(xí)。CNN的原理為通過一個特定的濾波器,不斷與圖片做卷積來提取特征,從局部特征到總體特征,從而實(shí)現(xiàn)圖像識別的功能。其整體結(jié)構(gòu)包含3 種層(layer)。第一層為卷積層(CONV),由濾波器和激活函數(shù)構(gòu)成,涉及到濾波器數(shù)量、大小、補(bǔ)償?shù)瘸瑓?shù)。第二層為池化層(POOL),亦稱下采樣或欠采樣,其功能為特征降維,壓縮數(shù)據(jù)和參數(shù)數(shù)量,減少過擬合同時提高模型的容錯率。第三層為全連接層(FC),亦稱輸出層,全連接層為多個神經(jīng)元單元排列連接組成,其功能為觀察上一層的輸出并確定所提取的特征與目標(biāo)分類的吻合度,并得到模型識別輸出[28],模型結(jié)構(gòu)如圖3所示。

圖3 CNN卷積神經(jīng)網(wǎng)絡(luò)層級結(jié)構(gòu)示意圖

3.3 YOLO模型

YOLO(You only look once)是一種目標(biāo)檢測模型,用來在一張圖片中尋找某些特定目標(biāo)物體,不需要預(yù)先提取候選區(qū)域,通過一個網(wǎng)絡(luò)就可以輸出目標(biāo)類別、置信度和坐標(biāo)位置[29]。YOLOv3是YOLO 算法中的第三版,相比于之前的算法,識別精度有所提升[30]。YOLOv3 是一個龐大且豐富的深度卷積神經(jīng)網(wǎng)絡(luò)模型,一共有53 個全連接卷積層,因此又稱為Darknet-53[31](圖4)。

圖4 YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)圖

模型首先將輸入圖片統(tǒng)一縮放至416×416 像素,將照片分割為N個大小相等的網(wǎng)格,并對每個網(wǎng)格中的物體進(jìn)行識別。包括識別物的中心位置(x,y)、識別的置信度及識別物的類別。置信度即為模型識別物體為目標(biāo)物的自信程度,置信度越高,意味著模型檢測越嚴(yán)格,對于識別結(jié)果也越自信。YOLO 模型可以輸出不同置信度下目標(biāo)識別結(jié)果,本文中所有YOLO 模型的輸出結(jié)果均是置信度為0.7時的識別結(jié)果。

相較于YOLO的v1、v2版本,YOLOv3版擁有3 個特征尺度,即可以同時使用3 個特征層分別進(jìn)行卷積和預(yù)測識別,這意味著模型可以允許同時輸入3 張不同高度的雷達(dá)回波進(jìn)行識別。為了使YOLOv3 更好描述雷暴大風(fēng)的空間結(jié)構(gòu)特征,本文在實(shí)際模型訓(xùn)練時,對原版YOLOv3(后文統(tǒng)一簡稱YOLO)的網(wǎng)絡(luò)進(jìn)行改進(jìn),將其特征尺度層擴(kuò)展到11 層,即允許同時將11 層不同高度的雷達(dá)拼圖作為輸入層,從而可以更詳細(xì)地反演雷暴大風(fēng)的空間結(jié)構(gòu)特征供模型提取和學(xué)習(xí)。本文即將1~9 km 高度(高度分別分為1、2、3、4、5、6、7、7.5、8、8.5、9 km)共11 層的雷達(dá)拼圖作為輸入層,用于模型檢測識別對YOLOv3 進(jìn)行訓(xùn)練優(yōu)化,形成YOLOv3版雷暴大風(fēng)識別模型。

4 模型算法檢驗(yàn)分析

4.1 三種模型算法的檢驗(yàn)對比分析

4.1.1 批量檢驗(yàn)分析

為驗(yàn)證三種模型算法的識別效果,利用測試集(共5 242 個樣本)分別對3 個模型進(jìn)行批量識別測試,測試結(jié)果如表1 所示。結(jié)果表明:決策樹模型的命中率高于CNN,略低于YOLO,但虛警率偏高,為3個模型中最高達(dá)到0.57,即空報偏多,導(dǎo)致CSI低于CNN 和YOLO;3 個模型中YOLO 的表現(xiàn)最為優(yōu)異,POD 和CSI分別為0.994、0.685,均為最高,且CSI 明顯高于其他兩個模型,表明YOLO 模型相較于另外兩種模型有更好的識別能力。

表1 三種模型識別效果批量測試對比

4.1.2 颮線個例檢驗(yàn)分析

2016年4月12日夜間受高空槽配合低渦切變線、低空西南急流影響,華南地區(qū)出現(xiàn)了一次大范圍颮線過程,伴隨著雷暴大風(fēng)、短時強(qiáng)降水等強(qiáng)對流天氣,對流回波于12日20時(北京時間,下同)開始自廣西境內(nèi)逐漸東移南壓,東移過程中回波逐漸高度組織化,13 日03 時左右東移至兩廣交界時發(fā)展為東北西南走向的颮線,進(jìn)入廣東境內(nèi)后回波發(fā)展旺盛,移速加快達(dá)到100 km/h以上,并逐漸形成弓狀,弓形回波主要影響肇慶、佛山、廣州、東莞一帶,造成上述地區(qū)10級以上雷暴大風(fēng)天氣,大風(fēng)主要出現(xiàn)在弓形回波附近,弓狀回波凸起經(jīng)過的區(qū)域多個站次監(jiān)測到12 級以上大風(fēng),經(jīng)篩選4月13 日04—06 時共取得符合標(biāo)準(zhǔn)的大風(fēng)觀測記錄214個。

將4月13日04—06時相應(yīng)的雷達(dá)回波作為輸入層同時運(yùn)行3個模型進(jìn)行識別,并對識別結(jié)果進(jìn)行檢驗(yàn)評估(表2)。整體來看個例檢驗(yàn)結(jié)果與批量測試結(jié)果類似,3個模型中YOLO對于此次颮線過程大風(fēng)的識別效果最好,POD 和CSI 均最高,F(xiàn)AR 最低,分別為0.981、0.667 和0.325,且YOLO模型的CSI 較其他兩個模型提升較明顯;決策樹的POD 略高于CNN,但CSI 更低,這主要因?yàn)闆Q策樹模型的識別偏差來源于更多的空報。

表2 2016年4月13日颮線型雷暴大風(fēng)天氣過程識別評估結(jié)果

4.1.3 混合對流個例檢驗(yàn)分析

2019年3月2—3日,華南地區(qū)有高空槽過境,配合低層850 hPa的切變線和西南急流,廣東自北向南自西向東出現(xiàn)了一次雷暴大風(fēng)、伴隨著短時強(qiáng)降水等強(qiáng)對流的天氣過程。2 日夜間(2 日23 時—3 日02 時)系統(tǒng)主要影響廣東北部的韶關(guān)、清遠(yuǎn)等地區(qū),對流回波在移動過程逐漸密實(shí)呈現(xiàn)塊狀,反射率因子最強(qiáng)達(dá)60 dBZ,移入韶關(guān)中部后組織為線狀對流并呈弓形,移速加快,引起韶關(guān)地區(qū)降水有所減弱但雷暴大風(fēng)明顯增強(qiáng),整個過程中韶關(guān)、清遠(yuǎn)出現(xiàn)了8~9級雷暴大風(fēng),其中韶關(guān)乳源國家氣象站觀測到27.2 m/s(10 級)的大風(fēng),經(jīng)篩選3月2 日23 時—3 日02 時共取得大風(fēng)觀測記錄28個。

將3 個模型對此次過程的識別結(jié)果進(jìn)行檢驗(yàn)評估(表3)。對比來看,3 個模型在本次過程中的表現(xiàn)與4.1.2 節(jié)的個例(簡稱個例一)類似,YOLO模型識別效果最好,POD 和CSI 均最高,且其漏報數(shù)為0;決策樹同樣表現(xiàn)出比CNN 模型更高的POD 和更低的CSI。值得注意的是,相較于個例一的颮線過程,此次過程中3個模型均表現(xiàn)出更高的空報,造成空報增加的原因主要有兩個:一方面相比于本次由多單體風(fēng)暴引起的大風(fēng)和強(qiáng)降水混合過程,個例一為典型弓形颮線過程,具有更鮮明的雷暴大風(fēng)特征,更易于捕捉識別;另一方面,個例一發(fā)生在全廣東氣象自動站分布最密集的珠三角,而本次過程發(fā)生在北部高海拔山區(qū),氣象自動站分布相對稀疏,且部分氣象站觀測記錄因海拔高達(dá)300~400 m 以上而被剔除,使得實(shí)際出現(xiàn)了大風(fēng)但未被觀測到或因海拔太高不符合標(biāo)準(zhǔn)被剔除的情況出現(xiàn)。

表3 2019年3月2日雷暴大風(fēng)、強(qiáng)降水混合天氣過程識別評估結(jié)果

4.2 YOLO模型算法檢驗(yàn)分析

通過對3 個模型識別能力測試對比發(fā)現(xiàn),YOLO 模型識別能力最好,確立為最優(yōu)模型。進(jìn)而選取廣東省2020 年3—8 月的雷暴大風(fēng)過程,依據(jù)天氣形勢劃分為局地性雷暴大風(fēng)過程、系統(tǒng)性雷暴大風(fēng)過程兩類分別對該最優(yōu)模型進(jìn)行檢驗(yàn)評估,本文定義局地性雷暴大風(fēng)為無明顯天氣系統(tǒng)存在的弱天氣尺度強(qiáng)迫條件下產(chǎn)生的天氣過程,如副高邊緣不穩(wěn)定區(qū)、夏季午后中尺度輻合線觸發(fā)熱對流等。系統(tǒng)性過程則為高低空有天氣系統(tǒng)配合、存在較強(qiáng)天氣尺度強(qiáng)迫的強(qiáng)垂直不穩(wěn)定條件下產(chǎn)生的天氣過程,如高空槽、切變線過境影響等。

檢驗(yàn)同樣采用POD、FAR和CSI等3個指標(biāo)進(jìn)行評估,其中用于檢驗(yàn)的自動站實(shí)況觀測記錄采用前文2.1 節(jié)所述的篩選條件得到。基于后續(xù)將算法投入業(yè)務(wù)化使用的需求,本文增加了最長達(dá)30 天連續(xù)時間段內(nèi)任意天氣的識別檢驗(yàn),以測試該模型算法業(yè)務(wù)化識別能力。

4.2.1 分類個例分析

4.2.1.1 局地性雷暴大風(fēng)過程識別分析

2020年7月14日菲律賓以東洋面有熱帶擾動發(fā)展并西移進(jìn)入南海,此時500 hPa副熱帶高壓偏強(qiáng)偏北,廣東東部位于副熱帶高壓南部邊緣不穩(wěn)定區(qū)內(nèi),午后熱力作用和地面輻合線觸發(fā)引起了局地強(qiáng)雷暴發(fā)展,多個雷暴單體于福建南部生成并逐漸向西南移動,初始回波較松散,移動過程中逐漸加強(qiáng)合并為多單體風(fēng)暴,回波漸呈現(xiàn)為密實(shí)塊狀,反射率因子最強(qiáng)達(dá)60 dBZ。受此影響,粵東地區(qū)夜間20—21 時出現(xiàn)了8~9 級雷暴大風(fēng),最大達(dá)10 級(26.7 m/s),此次過程自動站共錄得大風(fēng)20站次。

對于此次局地性過程YOLO 算法識別效果較好(圖5),過程出現(xiàn)的所有8級以上大風(fēng)均能識別,無一漏報;但同時存在2 站次空報,其中有一個站次識別結(jié)果對應(yīng)了瞬時風(fēng)6 級風(fēng)實(shí)況,其POD、FAR和CSI分別為1.000、0.091和0.909。

圖5 2020年7月14日20—21時實(shí)況大風(fēng)與算法識別結(jié)果分布情況

4.2.1.2 系統(tǒng)性雷暴大風(fēng)過程識別分析

受高空槽、低空切變線和低空急流共同影響,2020年6月5—9日華南地區(qū)出現(xiàn)了一次“龍舟水”過程,雨勢強(qiáng)烈并伴隨8~9 級雷暴大風(fēng)。9 日13時前后強(qiáng)對流回波主體位于廣東西北部一帶,南部有零散對流單體發(fā)展,反射率因子強(qiáng)度40~50 dBZ,隨著東北移,其南部回波明顯加強(qiáng)并逐漸組織為短弓形線狀強(qiáng)回波,反射率因子最強(qiáng)達(dá)60 dBZ,弓形回波主要影響珠三角的西部和北部。受此影響,15—17 時珠三角多個市縣錄得8~9 級瞬時大風(fēng),此次過程經(jīng)篩選共取得大風(fēng)17 站次。YOLO 模型算法對于此次過程出現(xiàn)的所有大風(fēng)均成功識別,無漏報情況(圖6),但相比于7 月14 日過程的識別結(jié)果,本次過程的虛警站次有所增加,共有7 站次的虛警,究其原因主要為兩方面:一方面本過程發(fā)生在華南“龍舟水”期間,伴隨著局地小時雨量50~60 mm 的短時強(qiáng)降水,雷達(dá)特征更加復(fù)雜,識別難度相對更高;另一方面,虛警識別主要出現(xiàn)在清遠(yuǎn)和廣州交界的山區(qū),自動站分布相對稀疏,海拔也較高,部分觀測站點(diǎn)海拔達(dá)800 m以上。

圖6 2020年6月9日15—17時實(shí)況大風(fēng)與算法識別結(jié)果分布情況

4.2.2 分類批量檢驗(yàn)

4.2.2.1 局地性過程批量檢驗(yàn)

選取廣東省2020 年7 月5 次局地性雷暴大風(fēng)過程共71 個大風(fēng)樣本進(jìn)行識別檢驗(yàn),5 次天氣過程均由于處在副熱帶高壓邊緣不穩(wěn)定區(qū),配合低層南風(fēng)和充足的不穩(wěn)定能量而引起。將上述過程相應(yīng)高度的雷達(dá)回波拼圖輸入識別模型,得到相應(yīng)的識別結(jié)果并對其進(jìn)行檢驗(yàn)評估,結(jié)果表明:YOLO 算法對于局地性雷暴大風(fēng)過程的大風(fēng)識別命中率為0.958,相較于測試集結(jié)果略有下降(表4)。

表4 基于YOLO的識別模型對于局地性天氣過程識別能力的評估

4.2.2.2 系統(tǒng)性過程批量檢驗(yàn)

選取廣東省2020 年3 月和6 月共5 次系統(tǒng)性天氣過程,其中包含2 次颮線過程,共148 個大風(fēng)樣本進(jìn)行識別檢驗(yàn)。5 次天氣過程主要由高空槽過境配合低層切變線影響廣東地區(qū)而出現(xiàn)了雷暴大風(fēng)天氣。檢驗(yàn)評估表明:相比局地性過程,識別算法對于系統(tǒng)性雷暴大風(fēng)過程的識別效果略有提升,命中率達(dá)0.986,虛警率亦有下降,CSI 較局地性過程提高了0.06(表4);對比測試集的檢驗(yàn)結(jié)果,該模型算法的識別能力略有下降,說明本算法模型仍存在一定過擬合現(xiàn)象。

4.2.3 YOLO模型算法的業(yè)務(wù)應(yīng)用評估

基于識別算法業(yè)務(wù)化的需要,選取2020 年5月全月(廣東前汛期)和8月全月(廣東后汛期)兩個長連續(xù)時間段進(jìn)行自動識別檢驗(yàn),兩個時間段涵蓋了前汛期和后汛期兩類環(huán)流形勢下、不同環(huán)境條件引起的弱降水過程、強(qiáng)降水、雷暴大風(fēng)和冰雹等強(qiáng)對流天氣過程,共1 520個大風(fēng)樣本。

檢驗(yàn)結(jié)果表明:基于YOLO 模型的識別算法在長達(dá)30天連續(xù)時段內(nèi)任意天氣條件下的雷暴大風(fēng)識別能力仍較高,其POD 和CSI分別為0.939 和0.601,尤其漏報比率低,具備投入業(yè)務(wù)化使用的條件(表5)。

表5 基于YOLO的識別模型在連續(xù)時段內(nèi)識別能力的評估

4.3 識別算法實(shí)時運(yùn)行效果評估

基于YOLO 模型的識別算法已于2021 年1 月接入實(shí)時雷達(dá)數(shù)據(jù),并投入業(yè)務(wù)化試運(yùn)行,可根據(jù)實(shí)時拼圖每6 min 穩(wěn)定更新識別結(jié)果。經(jīng)收集篩選2021年全年符合條件的雷暴大風(fēng)觀測記錄共有1 603 個,其中8~9 級有1 558 個,10 級及以上有45個。結(jié)合算法運(yùn)行全年的識別結(jié)果進(jìn)行評估分析(表6),在全年實(shí)時運(yùn)行條件下,識別算法對于任意天氣形勢下產(chǎn)生的雷暴大風(fēng)識別命中率仍超過90%,CSI 為0.629,與2020 年5 月和8 月全月運(yùn)行的結(jié)果相比,識別效果略有波動,但波動較小,其中命中率略有下降,同時虛警率也下降,而CSI有所提升。

表6 2021年全年雷暴大風(fēng)過程識別效果評估結(jié)果

5 結(jié)論與討論

本文基于2012—2019年廣東省的雷達(dá)拼圖和加密自動氣象站極大風(fēng)觀測數(shù)據(jù),分別利用決策樹、CNN 和YOLO 三種模型建立了雷暴大風(fēng)自動識別算法,并利用相應(yīng)測試集對三者的識別能力進(jìn)行測試對比。測試結(jié)果表明:深度學(xué)習(xí)方法CNN 和YOLO 的POD、CSI 等指標(biāo)均高于傳統(tǒng)機(jī)器學(xué)習(xí)方法決策樹模型,決策樹模型存在空報較多情況。其中YOLO 識別能力最佳,其POD、FAR和CSI分別為0.994、0.308和0.685,為最優(yōu)模型。

同時,針對YOLO 對不同天氣類型下的雷暴大風(fēng)識別能力測試及業(yè)務(wù)化的需求,分別選取了2020 年3—8 月不同類型天氣過程以及連續(xù)時段任意天氣進(jìn)行識別檢驗(yàn)分析,得到以下結(jié)論。

(1) 基于YOLO 模型的識別算法無論對局地性還是系統(tǒng)性雷暴大風(fēng)過程的POD 均高于0.95,CSI 達(dá)到0.6 以上,F(xiàn)AR 低于0.4,表明該識別算法對于不同類型的雷暴大風(fēng)均有較高的捕捉識別能力,且對于系統(tǒng)性雷暴大風(fēng)的識別效果略優(yōu)于局地性過程的。

(2) 基于YOLO 模型的識別算法在廣東前汛期、后汛期形勢連續(xù)30 天時間段內(nèi)任意天氣條件下,對雷暴大風(fēng)的識別POD、FAR 和CSI 分別為0.939、0.374、0.601,表明該識別算法具備業(yè)務(wù)化條件。廣東省氣象臺于2021 年1 月部署將該識別算法接入實(shí)時雷達(dá)數(shù)據(jù),每6 min穩(wěn)定生成廣東省全省范圍、1 km×1 km分辨率的識別產(chǎn)品。

(3) 需要注意的是,該算法雖命中率高,但仍存在一定的空報。這與廣東省自動站分布不均勻有一定關(guān)系,粵北和粵西的山區(qū)自動站分布相對稀疏,卻是雷暴大風(fēng)的頻發(fā)區(qū),存在由于雷暴單體尺度小處于觀測空白區(qū)而未被監(jiān)測到的情況;同時檢驗(yàn)中發(fā)現(xiàn)部分空報與6 級、7 級風(fēng)觀測實(shí)況對應(yīng),回看實(shí)況回波亦可見強(qiáng)反射率因子、強(qiáng)回波伸展高、高VIL等雷暴大風(fēng)指示性特征。

(4) 相較于深度學(xué)習(xí)模型方法,本文中基于人為選取雷達(dá)特征的傳統(tǒng)機(jī)器學(xué)習(xí)方法-決策樹模型的識別算法表現(xiàn)出更多的漏報和明顯的空報。這是因?yàn)閭鹘y(tǒng)機(jī)器學(xué)習(xí)方法非常依賴于人為選取的特征因子,需要通過更深入研究獲取到更全面的雷暴大風(fēng)雷達(dá)特征,從而對算法進(jìn)行補(bǔ)漏消空。

此外,近地層輻散、大風(fēng)速核、中層徑向輻合等徑向速度特征與雷暴大風(fēng)密切相關(guān),對于雷暴大風(fēng)的監(jiān)測識別具有明顯優(yōu)勢,但利用單站雷達(dá)的徑向速度產(chǎn)品來實(shí)現(xiàn)廣東全省范圍內(nèi)上述速度特征的自動識別難度較大,有待于在后續(xù)的工作中進(jìn)一步深入研究。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學(xué)特征認(rèn)識
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
如何表達(dá)“特征”
不忠誠的四個特征
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 日日拍夜夜操| 成人福利在线免费观看| 91网红精品在线观看| 国产亚洲精品91| 国产日韩欧美精品区性色| 丰满的少妇人妻无码区| 天天综合网在线| 日韩无码视频播放| 亚洲一区国色天香| 9丨情侣偷在线精品国产| 九色综合伊人久久富二代| 91视频国产高清| 国产v欧美v日韩v综合精品| 99精品这里只有精品高清视频| 天天色天天综合网| 秋霞午夜国产精品成人片| 美女啪啪无遮挡| 成人亚洲天堂| 国产青青操| 日韩欧美91| 呦视频在线一区二区三区| 国产97公开成人免费视频| 国产精品真实对白精彩久久| 伊人无码视屏| 蜜芽国产尤物av尤物在线看| 日韩二区三区| 一级香蕉视频在线观看| 国产欧美日韩在线一区| 91免费国产高清观看| 美女国内精品自产拍在线播放| 高清免费毛片| 日本欧美一二三区色视频| 国产视频欧美| 国产精品19p| 久久综合色视频| 亚洲aaa视频| 麻豆精品国产自产在线| 久久婷婷综合色一区二区| 性做久久久久久久免费看| 97影院午夜在线观看视频| 精品一区二区三区无码视频无码| 夜夜操天天摸| 制服丝袜亚洲| av在线5g无码天天| 青青极品在线| 美女被操91视频| 波多野结衣一二三| 日韩精品高清自在线| 日韩少妇激情一区二区| 亚洲精品亚洲人成在线| 人与鲁专区| 欧美日韩国产精品va| 免费国产不卡午夜福在线观看| 亚洲91在线精品| 国产精品亚洲综合久久小说| 中文字幕波多野不卡一区| 狠狠亚洲婷婷综合色香| 久久综合丝袜长腿丝袜| 亚洲精品无码不卡在线播放| 日韩国产无码一区| 欧美另类一区| 99精品国产自在现线观看| 国产欧美专区在线观看| 国产美女视频黄a视频全免费网站| 国产高清在线观看| 中文无码伦av中文字幕| 1024国产在线| 中文字幕欧美日韩| 成人福利免费在线观看| 国产精品成人一区二区不卡| 日韩精品无码不卡无码| 欧美 亚洲 日韩 国产| 国产小视频a在线观看| 91成人免费观看| 在线观看免费AV网| 精品国产www| 亚洲aaa视频| 欧美精品二区| 亚洲h视频在线| 蜜桃视频一区| 99偷拍视频精品一区二区| 91免费观看视频|