999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Prophet-XGBoost模型的GNSS高程時間序列預測

2022-08-30 05:55:18魯鐵定
大地測量與地球動力學 2022年9期
關鍵詞:模型

魯鐵定 李 禎

1 東華理工大學測繪工程學院,南昌市廣蘭大道418號,330013

近20 a來,全球IGS基準站不斷積累的時間序列數(shù)據(jù)為大地測量和地球動力學研究提供了寶貴的數(shù)據(jù)基礎[1-3]。這些數(shù)據(jù)可有效反映由地球物理效應引起的長期變化趨勢和非線性變化[4],因此對GNSS坐標時間序列進行分析有助于地殼板塊運動監(jiān)測[5]、大壩或橋梁變形監(jiān)測[6-7]、全球或區(qū)域坐標系維護[8-9]等領域的發(fā)展。通過分析GNSS坐標時間序列,可以預測連續(xù)時間點坐標,為判斷運動趨勢提供重要依據(jù)。研究發(fā)現(xiàn),GNSS坐標時間序列中高程方向的噪聲分量通常大于水平方向,且噪聲組合模型豐富,因此構(gòu)建高精度的GNSS高程時間序列預測模型具有較大困難[10-12]。

目前,已有許多學者在GNSS高程坐標時間序列預測研究中基于機器學習、深度學習等算法構(gòu)建相應的預測模型,并針對GNSS高程坐標時間序列的信號特征進行高精度的預測研究工作[11]。但是相關研究仍存在一定不足:1)模型預測精度容易受到異常值以及缺失值影響,抗干擾能力較弱,導致使用模型時對數(shù)據(jù)質(zhì)量具有較高的要求。2)模型單次預測精度無法保證隨著預測時間跨度的增長持續(xù)保持在較高水平上,在進行長期預測時需要進行滾動預測以保持模型精度,從而會增大模型的運行載荷。3)在相同參數(shù)設置和數(shù)據(jù)集下,部分模型的預測結(jié)果存在差異,并且無法進行動態(tài)調(diào)整。

針對這些問題,本文提出一種Prophet-XGBoost組合預測模型用于GNSS高程時間序列預測,并通過SOPAC公布的實測高程數(shù)據(jù)對本文方法的適用性和有效性進行檢驗。首先檢驗XGBoost模型和Prophet模型在GNSS時間序列中的適應度;再基于單模型在長期預測中表現(xiàn)出的特點,針對XGBoost模型對于趨勢項部分預測能力較弱和Prophet模型對于非線性部分預測能力較弱的問題,構(gòu)建Prophet-XGBoost組合預測模型;最后通過ALGO、ALRT和BRST基準站U分量坐標時間序列數(shù)據(jù)對模型預測精度進行檢驗。

1 模型原理與評價指標

1.1 XGBoost模型

XGBoost作為一種集成學習算法,可通過構(gòu)建多個CART樹對數(shù)據(jù)集進行預測,然后集成多個樹模型的預測結(jié)果,從而輸出最終預測數(shù)據(jù)。與同屬于樹模型算法的GBDT算法相比,XGBoost算法更為高效,并且在算法方面也進行過改進。XGBoost使用二階泰勒展開式逼近目標函數(shù)的泛化誤差部分,可有效簡化目標函數(shù)的計算;XGBoost還可通過在目標函數(shù)中加入正則項來降低模型預測的波動性以及改善模型過擬合現(xiàn)象[13]。

(1)

式中,fk表示決策樹,fk(xi)表示第k棵樹賦予第i個觀測值的分數(shù)。同時,使用函數(shù)fk時,下述正則化目標函數(shù)應被最小化:

(2)

式中,l為損失函數(shù)。為防止模型過于復雜,在模型中設置懲罰項Ω:

(3)

式中,γ可控制懲罰項中枝葉數(shù)量T,λ可控制懲罰項中枝葉重量w。設置Ω(fk)項不僅可以簡化算法生成模型,同時可以防止模型過擬合。

XGBoost算法采用迭代法最小化目標函數(shù)。模型通過增加fj項在第j次迭代后得到減小的目標函數(shù):

(4)

式(4)可以通過泰勒展開進行簡化,并且可以推導出決策樹從給定節(jié)點分裂后的損失減少公式:

Lsplit=

(5)

式中,I為當前節(jié)點中可用觀測數(shù)據(jù)的一個子集,IL和IR分別為分裂后左右節(jié)點中可用觀測數(shù)據(jù)的一個子集。函數(shù)gi和hi可表示為:

(6)

(7)

從推導Lsplit公式中可找到任意給定節(jié)點的最佳分裂,該函數(shù)只依賴于損失函數(shù)和正則化參數(shù)γ。同時,基于式(5),XGBoost算法可以優(yōu)化任何損失函數(shù),并且提供一階和二階梯度。

1.2 Prophet模型

Prophet模型是一種基于加性模型的時間序列預測模型,由趨勢項、周期項和假日項組成[14-15],表達式為:

y(t)=g(t)+s(t)+h(t)+εt

(8)

式中,g(t)為趨勢項;s(t)為周期項;h(t)為假日項,該項在GNSS時間序列中通常不存在,因此建模過程中不予考慮;εt為殘差項,即模型未能預測到的隨機趨勢。

在Prophet模型中,趨勢項包含邏輯回歸函數(shù)和分段線性函數(shù)兩個重要函數(shù)。根據(jù)GNSS高程時間序列的趨勢變化特點,選用邏輯回歸函數(shù)來計算趨勢項。同時,Prophet模型使用傅里葉級數(shù)表示時間序列的周期性:

(9)

式中,P為時間序列周期,P=365.25時為年周期項,P=7時為周周期項。因此,Prophet模型在進行GNSS日坐標時間序列分解時會分別輸出年周期項和周周期項。

1.3 精度評價指標

使用平均絕對誤差(MAE)和均方根誤差(RMSE)作為模型預測精度的評價指標:

(10)

(11)

通過引入Pearson相關系數(shù)判斷預測時間序列和原始時間序列之間的相關性。Pearson相關系數(shù)將時間序列視為變量,從而計算兩個時間序列之間的相關性,其計算公式為:

(12)

2 數(shù)據(jù)與模型構(gòu)建

2.1 實驗數(shù)據(jù)

為驗證Prophet-XGBoost模型的有效性,選取IGS基準站實測數(shù)據(jù)作為數(shù)據(jù)集。選用ALGO、ALRT和BRST站2010~2015年U分量日坐標時間序列作為實驗數(shù)據(jù),該數(shù)據(jù)來源于SOPAC(scripps orbit and permanent array center)。數(shù)據(jù)基本情況如表1(單位mm)所示。

表1 數(shù)據(jù)基本情況

2.2 模型適用性檢驗

為檢驗XGBoost模型和Prophet模型對于GNSS坐標時間序列預測的適用性,引入經(jīng)典時間序列預測模型ARIMA模型作為對比。選用ALGO站數(shù)據(jù)作為實驗數(shù)據(jù),分別用ARIMA模型、XGBoost模型和Prophet模型對數(shù)據(jù)集進行預測,將預測值與原始數(shù)據(jù)值進行對比,得到相應的MAE值和RMSE值。

該實驗數(shù)據(jù)集中2010~2014年數(shù)據(jù)為訓練集,2015年數(shù)據(jù)為驗證集,共包含2 149個日坐標數(shù)據(jù),缺失數(shù)據(jù)天數(shù)為42,數(shù)據(jù)完整率為98.08%,訓練中最大連續(xù)缺失數(shù)據(jù)時間跨度為7 d。

由表1和四分位距值(interquartile range,IQR)計算可知,該實驗數(shù)據(jù)集中含有少量異常值。因此,該數(shù)據(jù)訓練集中包含異常值、缺失值、連續(xù)缺失值等條件,可以更好地檢驗模型對于GNSS實測數(shù)據(jù)預測的適用性。各模型精度見表2(單位mm)。

表2 不同模型精度對比

由表2可知,相較于ARIMA模型,XGBoost模型和Prophet模型在MAE和RMSE兩個精度評價指標上均有優(yōu)勢。基于3個模型的預測原理可知,在長時間跨度的GNSS坐標時間序列預測研究中,ARIMA模型精度更容易受到預測時間長度的影響,而XGBoost模型和Prophet模型的預測精度隨預測跨度變化而變化的幅度較小,且XGBoost模型的算法實現(xiàn)更為簡便,具有更高的預測效率。因此,XGBoost模型和Prophet模型均可應用于GNSS坐標時間序列預測,并在實測數(shù)據(jù)實驗中具有適用性。圖1為ALGO站Prophet模型預測結(jié)果,其中離散點為原始時間序列值,曲線為擬合預測值。

圖1 ALGO站Prophet模型預測結(jié)果Fig.1 Prediction results of Prophet modelof ALGO station

2.3 Prophet-XGBoost模型構(gòu)建

基于XGBoost模型和Prophet模型在GNSS坐標時間序列預測中表現(xiàn)出的模型特性,構(gòu)建Prophet-XGBoost組合預測模型,以更好地發(fā)揮兩個模型的預測優(yōu)勢,削弱模型對于GNSS時間序列部分分解項預測能力不足的影響,進而實現(xiàn)更高精度的GNSS坐標時間序列預測。圖2為Prophet-XGBoost模型構(gòu)建流程。

圖2 Prophet-XGBoost模型構(gòu)建流程Fig.2 Construction process of Prophet-XGBoost model

Prophet-XGBoost模型實現(xiàn)流程如下:

1)通過Prophet模型對GNSS坐標時間序列U方向數(shù)據(jù)進行分解,將時間序列分解為趨勢項、周期項和殘差項,其中周期項由年周期項和周周期項等權(quán)相加構(gòu)成。圖3為ALGO站Prophet模型分解結(jié)果。

圖3 ALGO站Prophet模型分解結(jié)果Fig.3 Decomposition results of Prophet modelof ALGO station

2)通過Prophet模型對分解出的趨勢項和周期項進行擬合,然后使用XGBoost模型對擬合時間序列進行預測,得到預測值yfit。圖4為ALGO站XGBoost模型擬合時間序列預測結(jié)果。

圖4 ALGO站XGBoost模型擬合時間序列預測結(jié)果Fig.4 Prediction results of fitting time series ofXGBoost model of ALGO station

3)使用XGBoost模型對Prophet模型分解時間序列過程中遺留的殘差項進行預測,得到預測值yresidual。

4)將兩個預測結(jié)果等權(quán)相加,得到預測值ypred:

ypred=yfit+yresidual

(13)

2.4 實驗結(jié)果分析

本文選用ALGO、ALRT、BRST三個IGS站U分量GNSS坐標時間序列作為實驗數(shù)據(jù),分別采用XGBoost模型、Prophet模型和Prophet-XGBoost模型進行預測。其中,ALGO和ALRT站緯度差異較大,ALGO和BRST站經(jīng)度差異較大。預測精度對比結(jié)果如表3所示。

表3 預測精度對比

由表3可知,相較于XGBoost模型和Prophet模型,ALGO站Prophet-XGBoost模型的MAE值分別降低7.4%和11.5%,RMSE值分別降低16.6%和3.5%;ALRT站Prophet-XGBoost模型的MAE值分別降低7.1%和20.5%,RMSE值分別降低7.2%和6.5%;BRST站Prophet-XGBoost模型的MAE值分別降低10.5%和9.2%,RMSE值分別降低5.6%和3.5%。相較于Prophet模型,組合模型的RMSE值降低幅度較小,這是因為Prophet-XGBoost模型進行預測時的擬合數(shù)據(jù)是由Prophet模型擬合所得。對Prophet-XGBoost模型預測結(jié)果和原始數(shù)據(jù)值進行相關性檢驗,通過引入Pearson相關系數(shù)計算ALGO、ALRT和BRST三個站的ρ值分別為0.53、0.64和0.49,其中ALGO和BRST兩個站預測結(jié)果和原始數(shù)據(jù)呈中等相關,ALRT站預測結(jié)果和原始數(shù)據(jù)呈強相關。

以ALGO站為例,對比分析XGBoost模型、Prophet模型和Prophet-XGBoost模型預測結(jié)果誤差分布。圖5為各模型預測結(jié)果絕對誤差分布情況。

圖5 各模型預測結(jié)果絕對誤差分布Fig.5 Distribution of absolute error of predictionresults of each model

由圖5可知,Prophet-XGBoost組合模型的較高精度預測結(jié)果占比最高,即相較于Prophet和XGBoost單模型預測結(jié)果,組合模型準確率得到提升。圖6為模型預測結(jié)果誤差對比。

圖6 模型預測結(jié)果誤差對比Fig.6 Error comparison of prediction resultsof each model

由圖6可知,相較于XGBoost模型,Prophet-XGBoost組合模型的誤差變化幅度和凸點值更??;Prophet模型和Prophet-XGBoost組合模型的誤差變化趨勢較為一致,但Prophet-XGBoost組合模型誤差更小。結(jié)合圖4結(jié)果可知,Prophet模型對于時間序列的趨勢變化較為敏感。

3 結(jié) 語

本文基于XGBoost模型和Prophet模型提出一種GNSS高程時間序列預測組合模型Prophet-XGBoost。在數(shù)據(jù)處理階段,利用Prophet模型對時間序列進行分解,將時間序列分解成3個主要組成部分,有利于XGBoost模型在預測時提取時間序列中不同組成部分的特征,減弱預測模型提取特征時受到其他組成部分的影響。得益于此,XGBoost模型可以進行更高精度的GNSS坐標時間序列預測工作,也可彌補兩個模型在單模型預測時存在的問題。此外,在計算預測結(jié)果時,也可依據(jù)XGBoost模型提供的特征分數(shù)進行定權(quán)相加。

XGBoost模型和Prophet模型在實驗過程中也存在需要改進之處:XGBoost模型對于GNSS坐標時間序列的趨勢變化不夠敏感以及Prophet模型對于GNSS坐標時間序列非線性部分預測能力較弱。同時考慮到XGBoost模型的特征項構(gòu)建具有很大靈活性,研究人員可以使用非GNSS坐標時間序列數(shù)據(jù)輔助進行特征構(gòu)造,如水文載荷對GNSS坐標時間序列U方向振幅具有較為顯著的影響[17]。因此,在以后研究中可以將水文載荷等因素納入特征構(gòu)造條件中,從而通過更多的特征子集進行模型構(gòu)建和預測?;谠撎匦?,Prophet-XGBoost模型可以作為通用預測模型,將其推廣到其他研究領域,如海平面時間序列預測、天氣預報和發(fā)病率預測,可極大增強該模型的適用性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产v欧美v日韩v综合精品| 69国产精品视频免费| 免费毛片网站在线观看| 国产精品美女自慰喷水| 巨熟乳波霸若妻中文观看免费| 久久精品66| 亚洲综合久久一本伊一区| 日韩a在线观看免费观看| 亚洲中文无码h在线观看 | 在线观看亚洲天堂| 欧美亚洲一二三区| 精品久久香蕉国产线看观看gif| 亚洲AV成人一区二区三区AV| 国产在线观看人成激情视频| 成人免费午间影院在线观看| 国产欧美另类| 成人福利在线免费观看| 一级毛片在线播放免费观看| 日本国产精品一区久久久| 久久99国产综合精品1| 日本午夜三级| 在线亚洲小视频| 午夜激情福利视频| 亚洲熟妇AV日韩熟妇在线| 国产女人喷水视频| 国产亚洲精久久久久久久91| 欧美在线伊人| 亚洲高清中文字幕| 国产乱人激情H在线观看| 手机在线免费不卡一区二| 免费日韩在线视频| 国产主播喷水| 蜜芽一区二区国产精品| 日韩小视频在线观看| 亚洲欧美色中文字幕| 曰韩人妻一区二区三区| 亚洲性一区| 中文字幕有乳无码| 成年午夜精品久久精品| 中国国产高清免费AV片| 国产精品成人不卡在线观看| AV无码国产在线看岛国岛| 狠狠久久综合伊人不卡| 97人人做人人爽香蕉精品| 狠狠久久综合伊人不卡| 精品一区国产精品| 色综合久久久久8天国| 中文字幕第1页在线播| 国产福利观看| 国产激情无码一区二区三区免费| 77777亚洲午夜久久多人| 国产好痛疼轻点好爽的视频| 精品一区二区三区四区五区| 无码aaa视频| 欧美a在线看| www.日韩三级| 国产91全国探花系列在线播放| 凹凸精品免费精品视频| 色婷婷综合在线| 久久黄色一级视频| 99精品在线视频观看| 麻豆a级片| 午夜视频在线观看区二区| 乱人伦视频中文字幕在线| 国产国拍精品视频免费看| 国产精品一区在线麻豆| 日韩乱码免费一区二区三区| 亚洲午夜综合网| 91青青草视频在线观看的| 日韩精品毛片| 一级香蕉视频在线观看| 国产91av在线| 国产丝袜丝视频在线观看| 日韩激情成人| 日韩精品成人网页视频在线 | 嫩草在线视频| a毛片在线| 天堂成人在线视频| 一级毛片a女人刺激视频免费| 在线观看无码a∨| 久久6免费视频| 依依成人精品无v国产|