999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學(xué)習(xí)的韶關(guān)地區(qū)短期日平均氣溫研究

2022-12-06 07:23:06羅燁泓
陜西氣象 2022年6期
關(guān)鍵詞:效果模型

羅 威,羅燁泓,王 威

(1.興寧市氣象局,廣東興寧 514500;2.韶關(guān)市氣象局,廣東韶關(guān) 512028;3.深圳市氣象局,廣東深圳 518000)

自工業(yè)革命以來,人類活動所導(dǎo)致的大氣二氧化碳排放量劇增,更多的熱量被截留在大氣層內(nèi),致使地球氣溫增高。受此影響,全球平均表面溫度自工業(yè)革命以來表現(xiàn)出顯著的上升趨勢。全球變暖會引起冰雪融化、凍土消融、海平面上升、極端天氣頻發(fā)等,其嚴重威脅了全球自然生態(tài)系統(tǒng),乃至人類的生存[1-6]。為此,開展針對全球氣溫的精細化預(yù)報研究具有重要現(xiàn)實意義。

近年來,監(jiān)督類機器學(xué)習(xí)(樹模型、支持向量機、神經(jīng)網(wǎng)絡(luò)等)和深度學(xué)習(xí)算法等各類機器學(xué)習(xí)算法已在氣象短臨[1]、中短期[2]乃至長期預(yù)報[3]等領(lǐng)域發(fā)揮了積極的重要作用,其在相關(guān)領(lǐng)域中的表現(xiàn)要顯著優(yōu)于統(tǒng)計和主觀經(jīng)驗等傳統(tǒng)方法。相較于其他方法而言,監(jiān)督類機器學(xué)習(xí)算法能夠更有效綜合應(yīng)用來自觀測、數(shù)值模式等多源數(shù)據(jù),據(jù)此可更有效地提取大氣的非線性演化特征,進而提升數(shù)值模式的天氣預(yù)報效果。然而,受地形、模式參數(shù)化方案等不確定性因素的共同影響,目前數(shù)值預(yù)報模式對氣溫的預(yù)報尚存在一定的偏差,尤其對于中小城市、偏遠以及具有復(fù)雜地形的地區(qū)而言,預(yù)報方法通常僅依賴于數(shù)值模式,且缺乏有效的補充與優(yōu)化方法。韶關(guān)地區(qū)地處南嶺山脈南麓,屬于亞熱帶季風(fēng)氣候區(qū),夏無酷暑,冬無嚴寒,雨量充沛,日照溫和,氣候條件優(yōu)越,生態(tài)與旅游資源豐富,并且是廣東省重要的糧食蔬菜供應(yīng)地、農(nóng)業(yè)大市。因此,針對韶關(guān)地區(qū)等中小城市氣溫預(yù)報業(yè)務(wù)算法的開發(fā)對推動氣象業(yè)務(wù)的精細化預(yù)報具有重要意義。為此,僅利用1965—2017年韶關(guān)地區(qū)8個站點的日平均氣溫觀測資料,構(gòu)建了基于歷史數(shù)據(jù)驅(qū)動與機器學(xué)習(xí)方法的短期氣溫預(yù)報模型,以期為中小城市乃至偏遠地區(qū)的氣溫業(yè)務(wù)預(yù)報的改進提供參考,為當?shù)厣鷳B(tài)環(huán)境的改善、社會經(jīng)濟的發(fā)展提供科學(xué)決策依據(jù)。

1 資料和方法

1.1 資料介紹

基于1965—2017年韶關(guān)地區(qū)8個臺站(南雄、曲江、樂昌、仁化、乳源、始興、翁源和新豐)的日平均氣溫,求取上述8個站點日平均氣溫的平均值。臺站的基本信息見表1。

表1 韶關(guān)地區(qū)各個臺站基本信息

1.2 方法介紹

本文用于短期氣溫預(yù)報的算法分別有傳統(tǒng)回歸方法——逐步多元線性回歸法和機器學(xué)習(xí)方法——LightGBM(light gradient boosting machine)和BP-NN(back propagation neural network)。短期日平均氣溫預(yù)報的流程主要可概括如下:(1)將連續(xù)nd的日平均氣溫(T1,T2, ……,Tn)作為自變量,將第n+1,n+2,n+3天所分別對應(yīng)的日平均氣溫Tn+1,Tn+2,Tn+3作為因變量來構(gòu)建預(yù)報Tn+1,Tn+2,Tn+3的模型。(2)n是決定Tn+1,Tn+2,Tn+3預(yù)報精度的重要參數(shù),因此在1~365 d的范圍內(nèi)對n進行遍歷,最終確定了n=7時可使T8,T9,T10的預(yù)報效果達到最優(yōu)。即將過去連續(xù)7 d的日平均氣溫(T1,T2, ……,T7)作為自變量,以未來3 d日平均氣溫(T8,T9,T10)作為因變量,來構(gòu)建相應(yīng)的日平均氣溫預(yù)報模型。

1.2.1 逐步多元線性回歸 逐步多元線性回歸[4]是基于最優(yōu)的自變量來構(gòu)建回歸模型,其較好地解決了傳統(tǒng)多元線性回歸法中所存在的共線性問題[5],從而有利于回歸模型獲得更加精確的計算效果。目前,多元逐步線性回歸法已被廣泛應(yīng)用于氣象領(lǐng)域,其詳細流程可詳見文獻[4]。

1.2.2 LightGBM(light gradient boosting machine)算法 LightGBM[6]是微軟在2017年提出的基于GBDT的算法。相較于傳統(tǒng)樹模型而言,LightGBM預(yù)報精度更高、模型泛化性更強、計算效率更快,適用于大規(guī)模數(shù)據(jù)集的并行計算。LightGBM算法的原理參照文獻[6]。

1.2.3 BP-NN(back propagation neural network)算法 BP-NN算法的原理參照文獻[7]。為避免權(quán)重參數(shù)過多而引起過擬合,本文的BP-NN僅5層,由1層輸入層、3層隱藏層、1層輸出層組成,其中隱藏層的特征維度為100。為了增強BP-NN的訓(xùn)練/預(yù)報效果,采用如下優(yōu)化機制。(1)Kaiming初始化方案[8];(2)Relu激活層[9];(3)L2正則化方案[10],權(quán)重衰減系數(shù)為0.000 1;(4)Adam優(yōu)化算法;(5)余弦退火的學(xué)習(xí)率衰減策略:學(xué)習(xí)率隨訓(xùn)練迭代次數(shù)的增大而呈現(xiàn)余弦的周期形態(tài)變化,變化的周期為100次迭代,學(xué)習(xí)率最大值為0.001,最小值為0.000 01;(6)均方誤差(mean square error, MSE)的損失函數(shù);(7)自變量與因變量均采用最大最小值歸一化。

2 結(jié)果與分析

2.1 Tn+1, Tn+2, Tn+3與T1~n之間的相關(guān)性

表2為Tn+1,Tn+2,Tn+3與T1~n(n=7)之間的相關(guān)性,從表2可見,隨著自變量與因變量之間時間間隔的增大,其對應(yīng)的相關(guān)性逐漸降低,但總體仍十分顯著。因此,其顯著的相關(guān)性為以歷史日平均氣溫作為自變量來預(yù)報未來短期內(nèi)的日平均氣溫奠定了基礎(chǔ)。

表2 未來日平均氣溫與歷史日平均氣溫之間的相關(guān)性

2.2 三種短期日平均氣溫預(yù)報模型的構(gòu)建

取1965—2014年的日平均氣溫作為逐步多元線性回歸法建模數(shù)據(jù)集,并作為LightGBM與BP-NN模型的訓(xùn)練集,2015—2016年的作為兩種機器學(xué)習(xí)模型的驗證集,2017年的則作為上述三種模型適用性分析的測試集。其中訓(xùn)練集用于訓(xùn)練構(gòu)建上述三種模型,驗證集用于監(jiān)控機器學(xué)習(xí)模型的訓(xùn)練情況。當LightGBM與BP-NN超過100次的訓(xùn)練迭代而驗證集誤差不再下降時則停止訓(xùn)練,以防過擬合。兩種模型均訓(xùn)練迭代1 000次,訓(xùn)練結(jié)束后保存驗證集誤差最低的模型。

2.2.1 基于逐步多元線性回歸的模型 日平均氣溫之間顯著的相關(guān)性(表2)極易帶來共線性問題,進而導(dǎo)致普通線性回歸方法存在計算的不穩(wěn)定性問題。為此,本文采用了逐步線性回歸方法來構(gòu)建短期日平均氣溫預(yù)報模型。

通常情況下,可認為方差膨脹因子≤10時不存在明顯的共線性[5]。據(jù)此,預(yù)報未來1~3 d短期日平均氣溫的多元逐步線性回歸方程如下。

T8=0.656+0.967T7,

(1)

T9=1.024+0.757T7+0.192T2,

(2)

T10=1.551+0.645T7+0.278T3。

(3)

通過逐步多元線性回歸分析發(fā)現(xiàn),在滿足方差膨脹因子≤10的條件下,T8的自變量因子僅為T7,也表明T1~6與T7之間存在顯著的共線性;T9的自變量因子為T7和T2,其對應(yīng)的方差膨脹因子均為3.545;T10的自變量因子則為T7和T3,其對應(yīng)的方差膨脹因子均為3.876。可見時間間隔更久遠的氣溫反而可能是未來氣溫的重要影響因子。建模數(shù)據(jù)集的擬合結(jié)果表明,式(1)、式(2)和式(3)的計算值與實測值之間的擬合相關(guān)系數(shù)分別為0.97、0.93、0.90,擬合平均絕對誤差(mean absolute error, MAE)分別為1.32、2.04、2.42 ℃。

2.2.2 基于LightGBM的模型 利用LightGBM算法計算的訓(xùn)練集T8,T9,T10與實測值之間的擬合R分別為0.98、0.95、0.93,MAE則分別為1.09、1.68、2.00 ℃。

2.2.3 基于BP-NN的模型 利用BP-NN算法計算的訓(xùn)練集T8,T9,T10與實測值之間的擬合R分別為0.97、0.93、0.91,MAE分別為1.22、1.94、2.30 ℃。

2.3 三種模型的適用性

從2.2節(jié)針對三種短期日平均氣溫預(yù)報模型的建模結(jié)果可知,LightGBM的預(yù)報效果最優(yōu),BP-NN次之,逐步多元線性回歸最差。將上述三種算法應(yīng)用于2017年的測試集,就各自在短期日平均氣溫預(yù)報中的適用性展開系統(tǒng)分析。

首先分別繪制了上述三種算法日平均氣溫預(yù)報值與實測值之間的時間序列圖(圖1)。從圖1可知,針對T8的預(yù)報效果而言,逐步多元線性回歸、LightGBM、BP-NN的預(yù)報值與實測值之間的R分別為0.97、0.98、0.97,MAE分別為1.25、1.17、1.22 ℃;T9的R分別為0.93、0.94、0.93,MAE則分別為1.88、1.76、1.87 ℃;T10的R分別為0.89、0.93、0.91,MAE則分別為2.22、1.96、2.12 ℃。可見三種算法在測試集上的預(yù)報效果與訓(xùn)練集表現(xiàn)基本一致,具有優(yōu)良的泛化性,其中LightGBM的預(yù)報效果最優(yōu),BP-NN次之,逐步多元線性回歸最差。

圖1 三種模型日平均氣溫預(yù)報值與實測值的時間序列(a 逐步多元線性回歸;b LightGBM;c BP-NN)

在實際的氣溫預(yù)報業(yè)務(wù)中,當氣溫的預(yù)報誤差小于2 ℃時可認為預(yù)報正確。為此,分別統(tǒng)計了三種算法日平均氣溫預(yù)報值的準確率及其與實測值之間的MAE(表3)。從表3可知,就T8的預(yù)報結(jié)果而言,三者預(yù)報準確率可分別高達83.29%、84.38%、82.73%,MAE為1.25、1.17、2.22 ℃;就T9而言,三種模型的差異性明顯體現(xiàn),三者預(yù)報準確率分別為64.38%、69.86%、63.56%,MAE為1.88、1.76、1.87 ℃;就T10而言,三者預(yù)報準確率分別為56.44%、61.37%、59.18%,MAE為2.22、1.96、2.12 ℃。

表3 三種模型日平均氣溫的預(yù)報結(jié)果評價指標

綜上可見,相較于逐步多元線性回歸法和BP-NN而言,LightGBM不僅在相關(guān)系數(shù)以及精確度上更占優(yōu)勢,并且具有更高的預(yù)報正確率。尤其隨著預(yù)報時效的增大,LightGBM具有更優(yōu)的預(yù)報效果,而BP-NN與逐步線性回歸法的預(yù)報效果則均急劇下降,說明LightGBM具有最優(yōu)的預(yù)報穩(wěn)定性。推測樣本數(shù)量較少可能是三種模型預(yù)報效果存在顯著差異的最主要原因。傳統(tǒng)的機器學(xué)習(xí)模型,如LightGBM、Xgboost、Catboost等更適用于百萬級以下的樣本量。

明確模型預(yù)報誤差的時間分布情況對于提高氣溫的預(yù)報精度具有重要意義。為此,繪制了三種模型日平均氣溫預(yù)報值與實測值之間絕對誤差(absolute error, AE)的時間序列圖(圖2)。從圖2可見,相同預(yù)報時效,三種模型所表現(xiàn)的AE波動形態(tài)基本一致。但總體而言,LightGBM的AE及其波動幅度最小,其預(yù)報未來3 d氣溫絕對誤差的標準差(standard deviation,STD)分別為1.09、1.53、1.65 ℃;BP-NN次之,STD分別為1.15、1.66、1.97 ℃;逐步線性回歸最大,STD則分別為1.23、1.73、2.00 ℃。此外,逐步多元線性回歸以及BP-NN的AE及其波動幅度均隨著預(yù)報時效的增大而顯著增大,但LightGBM則相對最為穩(wěn)定。另外從圖2不難看出,三種模型AE的大值區(qū)基本位于0~100日以及240~365日,即處于冬春季以及秋冬季。結(jié)合圖1可推測,該時期氣溫較大的波動性會加大機器學(xué)習(xí)模型的訓(xùn)練難度,進而導(dǎo)致AE的總體偏大。

圖2 三種模型針對未來1~3 d日平均氣溫預(yù)報的絕對誤差(AE)時間序列

綜合上述分析可知,LightGBM和BP-NN機器學(xué)習(xí)方法在預(yù)報準確性,擬合效果(R)以及穩(wěn)定性(AE)方面均要優(yōu)于逐步多元線性回歸法。

3 結(jié)論和討論

(1)通過對過去1~365 d的日平均氣溫進行遍歷測試,確定將過去連續(xù)7 d的日平均氣溫分別作為逐步多元線性回歸、LightGBM以及BP-NN算法的自變量可最準確地預(yù)報出未來1~3 d的日平均氣溫,據(jù)此構(gòu)建了短期氣溫預(yù)報模型。該最優(yōu)自變量的確定方法是以結(jié)果為導(dǎo)向,其中所表征的科學(xué)背景仍有待進一步探索。

(2)從預(yù)報準確率(絕對誤差小于2 ℃的天數(shù)占比),相關(guān)系數(shù)和絕對誤差來看,三種模型均能較準確地預(yù)報出未來1~3 d的短期日平均氣溫,其中LightGBM最優(yōu),BP-NN次之,逐步多元線性回歸最差。以LightGBM為代表的傳統(tǒng)機器學(xué)習(xí)模型適用于非圖像領(lǐng)域百萬級左右的數(shù)據(jù)集,而對于雷達回波外推以及空間降尺度等圖像領(lǐng)域, 則要以神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)方法更為適用。

(3)數(shù)據(jù)的質(zhì)量決定了預(yù)報效果的上限,而模型只是協(xié)助逼近該上限。因此,增加更多的觀測與模式預(yù)報資料,通過采用特征工程等方法,將有助于進一步提升算法的預(yù)報性能。

猜你喜歡
效果模型
一半模型
按摩效果確有理論依據(jù)
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
迅速制造慢門虛化效果
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
3D打印中的模型分割與打包
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
3D—DSA與3D—CTA成像在顱內(nèi)動脈瘤早期診斷中的應(yīng)用效果比較
主站蜘蛛池模板: 国产成人精品三级| 五月天香蕉视频国产亚| 99久久精品国产麻豆婷婷| a毛片基地免费大全| 亚洲婷婷六月| 国产精品专区第一页在线观看| 久久网综合| 在线观看精品国产入口| 精品亚洲国产成人AV| 国产精品密蕾丝视频| 国模私拍一区二区| 国产91成人| 国产亚洲精品91| 亚洲三级影院| 亚洲精品成人福利在线电影| 国产精品30p| 免费精品一区二区h| 国产激情在线视频| 好久久免费视频高清| 在线观看国产精品一区| 伊人久久婷婷五月综合97色| a毛片免费看| 国产va在线| 国产人成午夜免费看| 国产精品久久国产精麻豆99网站| 丝袜久久剧情精品国产| 欧美亚洲一区二区三区在线| 国产麻豆福利av在线播放| 亚洲精品欧美日本中文字幕| 日韩中文精品亚洲第三区| 免费A级毛片无码免费视频| 色成人综合| 亚洲国产成人久久精品软件| 亚洲日本在线免费观看| 无码区日韩专区免费系列| 毛片免费在线视频| 欧美va亚洲va香蕉在线| 一级香蕉视频在线观看| 精品国产免费观看| 欧美日韩在线亚洲国产人| 国产女人在线观看| 毛片在线区| 99尹人香蕉国产免费天天拍| 亚洲资源站av无码网址| 九月婷婷亚洲综合在线| 蝌蚪国产精品视频第一页| 无码国产伊人| 国产视频欧美| 国产在线拍偷自揄拍精品| 国产精品对白刺激| 精品一区二区三区无码视频无码| 国产男女免费完整版视频| 91偷拍一区| 在线视频精品一区| 欧美日韩精品综合在线一区| 欧美日韩亚洲综合在线观看| 免费一级毛片在线观看| 国精品91人妻无码一区二区三区| 午夜在线不卡| 毛片网站观看| 国产成人综合亚洲网址| 国产丝袜啪啪| 内射人妻无套中出无码| 青青极品在线| 国产精品女在线观看| 四虎成人精品| 99手机在线视频| 国产精品女在线观看| 天天色综网| 国产精品手机在线播放| 无码丝袜人妻| 国模视频一区二区| 99热这里只有精品免费| 97亚洲色综久久精品| 熟妇人妻无乱码中文字幕真矢织江| 欧美激情成人网| 国产乱子伦无码精品小说| 亚洲成人播放| 婷婷午夜天| 无码AV日韩一二三区| 91在线精品免费免费播放| 亚洲日韩欧美在线观看|