張博 向旭 賈俊龍 張學洪 李春奇 彭君



摘要: 針對天然氣管道周圍滑坡災害預測中的數(shù)據(jù)缺失和特征數(shù)量少的問題,采用基于LightGBM框架實現(xiàn)的梯度提升決策樹算法,通過插值法補齊缺失數(shù)據(jù),利用歷史特征數(shù)據(jù)生成近期特征和遠期特征,得到影響斜坡演變過程各因素的重要性排序及算法最優(yōu)參數(shù)集合,實現(xiàn)對天然氣管道周圍滑坡災害的有效預測. 結(jié)果表明,在對天然氣管道周圍滑坡災害進行預測中,該方法相比XGBoost模型具有更高的準確率,同時處理速度也更快,證明了LightGBM算法在滑坡災害預測方面應用的可行性和有效性.
關(guān)鍵詞: LightGBM框架; 滑坡; 預警預報; 機器學習; 人工智能
中圖分類號: TP391.41? 文獻標志碼: A ?文章編號: 1671-5489(2023)02-0338-09
Landslide Disaster Prediction Method AroundNatural Gas Pipeline Based on LightGBM
ZHANG Bo1,XIANG Xu2,JIA Junlong2,ZHANG Xuehong1,LI Chunqi3,PENG Jun2
(1. Pipe China Group Sichuan East Natural Gas Transmission Company,Wuhan 430079,China;
2. College of Software,Jilin University,Changchun 130012,China;3. Sinopec Tianranqi Company,Beijing 100029,China)
收稿日期: 2022-05-20.
第一作者簡介: 張 博(1986—),男,漢族,碩士,高級工程師,從事智能化油氣儲運的研究,E-mail: zhangxh@pipechina.com.cn.
通信作者簡介: 彭 君(1981—),男,漢族,博士,講師,從事人工智能、 機器學習、 軟件開發(fā)方法和軟件體系結(jié)構(gòu)的研究,E-mail: pengjun@jlu.edu.cn.
基金項目: 國家自然科學基金青年科學基金(批準號: 61502196)、 吉林省自然科學基金(批準號: 20200201
290JC)和川氣東送工程基金(批準號: 35150573-19-ZC0607-0004).
Abstract: Aiming at? the problems of missing data and small number of features in landslide disaster prediction around natural gas pipelines,
the gradient boosting decision tree algorithm based on LightGBM framework was adopted to? supplement missing data by interpolation, and short-term and long-term features
were? generated by using the historical feature data to obtain the importance ranking of various factors affecting the slope evolution
process and the optimal parameter set of the algorithm,so as to realize the effective prediction of landslide disasters around natural gas pipelines. The results show that
this method has higher accuracy and faster processing speed than XGBoost model? in the prediction of landslide disasters around the pipeline,which proves that
LightGBM algorithm is feasible and effective in landslide disaster prediction.
Keywords: LightGBM framework; landslide; early-warning and forecast; machine learning; artificial intelligence
地質(zhì)災害預測預警需要進行地質(zhì)災害易發(fā)性評估,即計算已有的監(jiān)測數(shù)據(jù)下地質(zhì)災害發(fā)生的可能性. 地質(zhì)災害易發(fā)性評估的主要研究方法有定性和定量兩種[1]. 其中定性是由專家根據(jù)自己的知識給可能引發(fā)災害的因素設(shè)置不同的權(quán)重,從而實現(xiàn)易發(fā)性評估. 但專家的數(shù)量有限,且各專家知識水平、 研究深度各不相同,給評估結(jié)果增加了不確定性. 定量方法中,常用的機器學習模型,如支持向量機(SVM)和神經(jīng)網(wǎng)絡(luò)等已被廣泛應用于地質(zhì)災害易發(fā)性評估中. 目前,SVM應用于地震滑坡方面[2]以及神經(jīng)網(wǎng)絡(luò)模型用于泥石流災害預測[3]的研究已有許多成果. 除上述模型外,深度學習模型在相關(guān)領(lǐng)域也有實際應用[4],但由于數(shù)據(jù)集缺失、 算法設(shè)計缺陷、 網(wǎng)絡(luò)結(jié)構(gòu)等問題,其結(jié)果并未超越已有的機器學習模型. 近年來,在滑坡易發(fā)區(qū)和降雨誘發(fā)滑坡泥石流預警預報的研究也取得了較大進展,機器學習算法在區(qū)域滑坡危險性評價中逐步獲得廣泛應用[5]: 神經(jīng)模糊[6]、 增強回歸樹[7]、 核邏輯回歸[8]等多種模型算法被應用于滑坡危險性評價中,并取得了較好的結(jié)果.目前已有的基于深度學習神經(jīng)網(wǎng)絡(luò)的滑坡預測方法有長短期記憶神經(jīng)網(wǎng)絡(luò)(long short term memory,LSTM)、 后向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)等. 許石羅[9]利用LSTM對滑坡易發(fā)性進行了研究,但由于部分特征數(shù)據(jù)存在大面積缺失的情況,使得LSTM模型無法發(fā)揮其優(yōu)勢[10]. 此外,對于數(shù)據(jù)集容量大的情況,并行處理數(shù)據(jù)弱勢的LSTM模型訓練速度緩慢,預測效果也未能達到預期. 近年來,基于梯度提升決策樹(gradient boosting decision tree,GBDT)的算法得到快速發(fā)展[11-12],且相關(guān)算法,如XGBoost和LightGBM(light gradient boosting machine)等在滑坡預測領(lǐng)域的應用也取得了較好成果[13-14],因此本文基于LightGBM實現(xiàn)天然氣管道周圍滑坡預測.
1 預備知識
LightGBM可實現(xiàn)一個輕量級的梯度提升算法,是基于GBDT模型的改進框架[15]. GBDT是機器學習中的經(jīng)典模型,算法思想是使用弱分類器,即決策樹迭代訓練,從而得到最優(yōu)模型[16]. 該模型能在擁有較優(yōu)訓練效果的同時避免過擬合,泛化能力較好. Chen等[17]提出了基于GBDT的改進模型XGBoost,該改進模型功能強大,但仍存在一些缺點,如計算量巨大的精確貪心算法及效率較低的Level-wise生長方式[18-19]. 針對這些缺點,LightGBM通過直方圖算法、 帶深度限制的Leaf-wise算法、 并行優(yōu)化等進行了進一步優(yōu)化. LightGBM作為GBDT模型的優(yōu)化實現(xiàn),繼承了XGBoost集成學習能力的同時采用高效的并行訓練設(shè)計,因此有更快的訓練速度、 更低的內(nèi)存消耗和更好的準確率.
1.1 直方圖算法
直方圖算法的基本思想是先將連續(xù)的浮點特征值離散化成k個整數(shù),再構(gòu)造一個寬度為k的直方圖. 遍歷數(shù)據(jù)時,先將離散化后的值作為索引在直方圖中累積統(tǒng)計量,遍歷一次數(shù)據(jù)后直方圖所需的統(tǒng)計量即足夠,然后根據(jù)直方圖的離散值,遍歷尋找最優(yōu)分割點.對比XGBoost采用的預排序算法,直方圖算法在減少內(nèi)存消耗上有較大優(yōu)勢. 預排序算法需對所有特征按數(shù)值進行排序,雖然能準確找到數(shù)據(jù)分隔點,但因為需要存儲排序的結(jié)果,所以會占更多的內(nèi)存,而直方圖算法則只需要保存特征離散化后的值,該值一般使用8位整型存儲,內(nèi)存消耗也可降低為之前的1/8. 此外,預排序算法每遍歷一個特征值就需要計算一次分裂的增益,而LightGBM使用的直方圖算法則只需要計算k次(k為每個特征分箱的個數(shù)),每個特征的分箱個數(shù)與每個特征的特征值個數(shù)相比要少很多,因此在時間復雜度上LightGBM算法也優(yōu)于XGBoost算法.LightGBM在直方圖上的另一個優(yōu)化是直方圖作差加速. 葉節(jié)點的直方圖可由其父親節(jié)點的直方圖與其兄弟節(jié)點直方圖進行作差得到,從而減少了計算的時間成本,使計算速度加倍提升. 具體操作時,LightGBM在面對直方圖較大的葉節(jié)點難以計算的情況下,可先計算直方圖較小的葉節(jié)點,再通過作差得到直方圖較大的葉節(jié)點.
1.2 帶深度限制的Leaf-wise算法
與XGBoost采用的Level-wise決策樹生長策略相比,LightGBM使用的帶深度限制的Leaf-wise算法在效率上有更大優(yōu)勢. 其策略是每次都從當前所有葉子中找出分裂增益最大的一個,再由這個葉子分裂,不斷重復,而Level-wise對同一層的葉子不會進行區(qū)分. 所以與Level-wise相比,在分裂次數(shù)相同時,Leaf-wise的誤差更少,因而精度更高.
1.3 并行優(yōu)化
LightGBM支持特征并行和數(shù)據(jù)并行. 在特征并行算法中通過在本地保存全部數(shù)據(jù)避免對數(shù)據(jù)切分結(jié)果的通信,在數(shù)據(jù)并行中使用分散規(guī)約將直方圖合并的任務分攤至不同的機器,以降低通信和計算,并利用直方圖作差進一步減少一半的通信量. 基于投票的數(shù)據(jù)則進一步優(yōu)化數(shù)據(jù)并行中的通信代價,使其變?yōu)槌?shù)級別,加速效果極好.
2 模型訓練
2.1 數(shù)據(jù)預處理
本文采用的數(shù)據(jù)為中石化川氣東送項目提供的湖北省恩施市巴東縣野三關(guān)鎮(zhèn)譚家村不穩(wěn)定斜坡監(jiān)測站、 四川省達州市開江縣普安鎮(zhèn)水口廟村CKJ026-6號滑坡監(jiān)測站、 湖北省恩施市建始縣高坪鎮(zhèn)EJS63-3樁處不穩(wěn)定斜坡監(jiān)測站等記錄的斜坡相關(guān)數(shù)據(jù),數(shù)據(jù)中特征種類包括表面位移、 深部位移、 雨量、 應變等. 不同監(jiān)測站提供的數(shù)據(jù)中特征不同,各監(jiān)測站數(shù)據(jù)及其狀態(tài)列于表1.
對于數(shù)據(jù)集的選擇,將恩施市巴東縣野三關(guān)鎮(zhèn)譚家村不穩(wěn)定斜坡監(jiān)測站記錄的由2019年4月25日0時起至2019年10月31日0時的滑坡演變數(shù)據(jù)作為數(shù)據(jù)集1; 將恩施市屯堡鄉(xiāng)落葉壩村不穩(wěn)定斜坡監(jiān)測站記錄的從2020年3月26日0時至2021年3月31日0時的滑坡演變數(shù)據(jù)作為數(shù)據(jù)集2; 將恩施市巴東縣野三關(guān)鎮(zhèn)譚家村不穩(wěn)定斜坡監(jiān)測站記錄的由2021年4月28日0時起至2021年11月11日0時的滑坡演變數(shù)據(jù)作為數(shù)據(jù)集3. 在進行預測時,使用監(jiān)測站各監(jiān)測記錄的前80%歷史數(shù)據(jù)作為輸入數(shù)據(jù),后20%數(shù)據(jù)作為輸出數(shù)據(jù).
針對數(shù)據(jù)集數(shù)據(jù)量較大,同時有大面積特征缺失的問題,使用插值法進行插值,擬合數(shù)據(jù)變化趨勢并補齊缺失數(shù)據(jù),為后續(xù)模型訓練提供更多數(shù)據(jù). 在多種插值方法,如線性插值、 Lagrange插值、 樣條插值等中,選擇在大容量數(shù)據(jù)集上有更好插值效果的樣條插值,因為樣條插值,特別是三次樣條插值具有較好的數(shù)學特征,且用三次曲線擬合數(shù)據(jù)時,效果比線性插值等方法更平滑,從而更接近實際情況. 但實際操作中,也出現(xiàn)了擬合結(jié)果不符合實際情況的現(xiàn)象,如數(shù)據(jù)集3中,2021年6月9日至2021年6月25日之間的深部位移缺失,此時若使用“cubic”樣條插值進行補齊,則補齊后的數(shù)據(jù)將會出現(xiàn)一條明顯的下凹曲線,顯然這并不符合深部位移的整體變化趨勢,針對該問題,采用線性插值補齊缺失值效果更優(yōu). 插值前后及線性插值與cubic插值對比結(jié)果分別如圖1和圖2所示.
由圖1和圖2可見,cubic插值法并不符合實際情況,深部位移在缺失的時間段內(nèi)不可能出現(xiàn)如此劇烈的下跌,線性插值法雖然曲線不太平滑,但符合深部位移數(shù)據(jù)的總體演變趨勢,故對模型訓練有幫助.
針對數(shù)據(jù)集中特征數(shù)過少導致模型訓練準確率較低的問題,本文進行特征選擇,通過歷史特征數(shù)據(jù)計算近期特征、 遠期特征. 具體操作為對已有的每個特征計算每3 d平均值、 每3 d最大值、 每5 d平均值、 每5 d最大值,將計算結(jié)果作為特征加入數(shù)據(jù)集,從而增加特征數(shù)量,提升模型訓練效果.
LightGBM作為基于決策樹的模型,也繼承了決策樹的一些缺點. 數(shù)據(jù)集中多數(shù)特征在數(shù)值上都呈上升趨勢,不斷遞增,而樹的結(jié)構(gòu)導致其并不能準確預測一個始終上升的數(shù)據(jù),針對該問題,本文增加“歷史增幅”特征,將相鄰日期的數(shù)據(jù)做差,使得到的結(jié)果在一定范圍內(nèi)變化,從而避免其不斷增加,使預測效果得到優(yōu)化.
2.3 參數(shù)設(shè)置
模型原始數(shù)據(jù)設(shè)置測試集與訓練集的比例為2∶8. 對模型參數(shù)做初始設(shè)置,目標函數(shù)設(shè)為Regression進行回歸,葉子節(jié)點數(shù)設(shè)為50,學習率設(shè)為0.01,建樹特征選擇比例設(shè)為0.9,建樹樣本采樣比例設(shè)為0.8,迭代執(zhí)行Bagging的循環(huán)設(shè)為5. 原始數(shù)據(jù)設(shè)置下的模型訓練后,數(shù)據(jù)集1在驗證集上的預測結(jié)果如圖3所示.
2.4 參數(shù)調(diào)優(yōu)
由于參數(shù)的選擇對模型的預測結(jié)果有較大影響,故繼續(xù)對若干參數(shù)進行調(diào)優(yōu),調(diào)優(yōu)過程如下. 先對學習率進行調(diào)優(yōu),對比結(jié)果列于表2. 由表2可見,當學習率為0.02時,驗證集損失最小,故最佳學習率為0.02,設(shè)置學習率繼續(xù)進行參數(shù)優(yōu)化,對葉節(jié)點數(shù)進行調(diào)優(yōu),結(jié)果列于表3.
由表3可見,葉子節(jié)點數(shù)由50變?yōu)槠渌担?jié)點數(shù)為100時驗證集損失變大外,其余預測精度均無變化,因而葉子節(jié)點數(shù)對結(jié)果影響較小,故設(shè)置葉子節(jié)點數(shù)為50,繼續(xù)參數(shù)優(yōu)化,對建樹特征選擇比例進行調(diào)優(yōu),結(jié)果列于表4. 由表4可見,建樹特征選擇比例由0.9變?yōu)槠渌禃r,驗證集損失變大,故設(shè)置建
樹特征選擇比例為0.9,繼續(xù)參數(shù)優(yōu)化,對建樹樣本采樣比例進行調(diào)優(yōu),結(jié)果列于表5. 由表5可見,建樹樣本采樣比例由0.8變?yōu)槠渌禃r,驗證集損失變大,故設(shè)置建樹樣本采樣比例為0.8,
繼續(xù)參數(shù)優(yōu)化,對迭代執(zhí)行Baggin的循環(huán)次數(shù)進行調(diào)優(yōu),結(jié)果列于表6.
由表6可見,迭代執(zhí)行Bagging的循環(huán)次數(shù)由5變?yōu)槠渌禃r,驗證集損失變大,故設(shè)置迭代執(zhí)行Bagging的循環(huán)為5,參數(shù)優(yōu)化完成. 模型優(yōu)化后各參數(shù)設(shè)置如下: 測試集與訓練集的比例為2∶8,葉子節(jié)點數(shù)設(shè)為50,學習率設(shè)為0.02,建樹特征選擇比例設(shè)為0.9,建樹樣本采樣比例設(shè)為0.8,迭代執(zhí)行Bagging的循環(huán)設(shè)為5.
3 實驗結(jié)果
3.1 LightGBM與XGBoost訓練結(jié)果的對比
本文采用由一個數(shù)據(jù)集訓練后的模型預測另一個數(shù)據(jù)集,即將一個數(shù)據(jù)集作為訓練集,另一個數(shù)據(jù)集作為驗證集的方法考察模型的預測精度. 盡管訓練的數(shù)據(jù)集與驗證數(shù)據(jù)集的曲線變化趨勢并不相同,但模型仍能從訓練集中學習到表面位移的變化規(guī)律與趨勢,從而預測驗證數(shù)據(jù)集上的曲線變化,通過在不同數(shù)據(jù)集上分別訓練和預測,驗證模型的魯棒性和泛化效果. 在LightGBM與XGBoost模型上分別訓練和預測,以均方誤差(MSE)和均方根誤差(RMSE)作為評價標準,將兩種模型預測精度進行對比,結(jié)果分別列于表7和表8. 其中數(shù)據(jù)集1to2的含義是將數(shù)據(jù)集1作為訓練集,數(shù)據(jù)集2作為驗證集,進行預測并計算預測精度. 其他數(shù)據(jù)集含義類似.
由表7和表8可見,模型預測結(jié)果的均方誤差MSE,在兩個數(shù)據(jù)集2to1和2to3上XGBoost略優(yōu)于LightGBM,其余結(jié)果LightGBM均遠優(yōu)于XGBoost; 模型預測結(jié)果的RMSE,在數(shù)據(jù)集1的驗證集上XGBoost性能略優(yōu)于LightGBM,其余結(jié)果LightGBM均優(yōu)于XGBoost.
3.2 LightGBM模型訓練結(jié)果分析
RMSE隨迭代次數(shù)的變化如圖4所示. 由圖4可見,經(jīng)過1 600次迭代,訓練集的RMSE不斷優(yōu)化降低,最終穩(wěn)定在0.104 8,而驗證集的RMSE也不斷降低,最終達到0.204 2.
利用LightGBM庫可輸出各特征的重要性,結(jié)果如圖5所示. 由圖5可見,影響滑坡的關(guān)鍵因素有表面位移、 表面位移3 d內(nèi)的平均值、雨量、 雨量5 d內(nèi)的平均值和雨量7 d內(nèi)的平均值. 表面位移特征的重要度為711,遠超其他特征,說明其對滑坡有重要影響,因而可針對滑坡表面位移進行預測,通過滑坡表面位移的變化確定滑坡災害發(fā)生的概率. 對滑坡表面位移的預測結(jié)果如圖6所示. 由圖6可見,雖然訓練后的模型對驗證集的預測結(jié)果在數(shù)值上有一定偏差,但預測曲線與實際數(shù)據(jù)曲線的變化趨勢基本相同,在末尾的曲線與實際曲線基本吻合,證明模型有一定的學習能力,有實際應用價值.
綜上所述,本文使用LightGBM機器學習模型對滑坡災害進行了預測,結(jié)果表明,與XGBoost和一些傳統(tǒng)的GBDT相比,該方法具有更小的時間空間開銷、 更好的預測準確度,取得了較優(yōu)的MSE和RMSE. 同時,利用LightGBM庫中對模型特征重要度的排序函數(shù),找出了對滑坡影響最大的特征是表面位移和雨量.
參考文獻
[1] 曹穎. 單體滑坡災害風險評價與預警預報 [D]. 武漢: 中國地質(zhì)大學,2016. (CAO Y. Risk Assessment and Early Warning of Individual L
andslide [D]. Wuhan: China University of Geosciences,2016.)
[2] CHONG C X,DAI F C,XU X W,et al. GIS-Based Support Vector Machine Modeling of Earthquake-Triggered Landslide Susceptibility i
n the Jianjiang Riverwatershed,China [J]. Geomorphology,2012,145/146: 70-80.
[3] 林齊根,劉燕儀,劉連友,等. 支持向量機與Newmark模型結(jié)合的地震滑坡易發(fā)性評估研究 [J]. 地球信息科學學報,2017,19(12): 1623-1633. (LIN Q
G,LIU Y Y,LIU L Y,et al. Earthquake-Triggered Landslide Susceptibility Assessment Based on Support Vector Machine Combined with Newmark Displacement Mod
el? [J]. Journal of Geo-Information Science,2017,19(12): 1623-1633.)
[4] CHANG T C,CHAO R J. Application of Back-Propagation Networks in Debris Flow Prediction [J]. Engineering Geology,2006,85(3): 270-280.
[5] DIEU T B,BISWAJEET P,OWE L,et al. Lands
lide Susceptibility Mapping at Hoa Binh Provice (Vietnam) Using an Adaptive Neuro-Fuzzy Inference System and GIS [J]. Computers & Geosciences,2012,45: 199-211.
[6] CHEN W,HAMID R P,ZHAO Z. A GIS-Based Comparative Study of Dempster-Shafer,Logistic Regression and Artificial Neura
l Network Models for Landslide Susceptibility Mapping [J]. Geocarto International,2017,32(4): 367-385.
[7] CHEN W,POURGHASEMI H R,KORNEJADY A,et al. Landslide Spa
tialmodelling: Introducing New Ensembles of ANN,MaxEnt,and SVM Machine Learning Techniques [J]. Geoderma,2018,305: 314-327.
[8] 朱清華. 基于RF和SVM模型的灞橋區(qū)地質(zhì)災害易發(fā)性評價 [D]. 西安: 西安科技大學,2019. (ZHU Q H. Geological Hazard Susceptibility Asses
sment in Baqiao District Based on RF and SVM Model [D]. Xian: Xian University of Science and Technology,2019.)
[9] 許石羅. 基于多源遙感影像的動態(tài)滑坡災害空間預測模型研究 [D]. 武漢: 中國地質(zhì)大學
,2018. (XU S L. Study on Dynamic Landslide Susceptibility Mapping Based on Multi-source Remote Sensing Imagery [D]. Wuhan: China University of Geosciences,2018.)
[10] 張培玲,李小真,崔帥華. 基于改進小波閾值-CEEMDAN算法的ECG信號去噪研究 [J]. 計算機工程與科學,2020,42(11): 2067-2072. (ZHANG P L,L
I X Z,CUI S H. An Improved Wavelet Threshold-CEEMDAN Algorithm for ECG Signal Denoising [J]. Computer Engineering & Science,2020,42(11): 2067-2072.)
[11] 尹超英,邵春福,黃兆國,等. 基于梯度提升決策樹的多尺度建成環(huán)境對小汽車擁有的影響 [J]. 吉林大學學報(工學版),2022,52(3): 572-577.
(YIN C Y,SHAO C F,HUANG Z G,et al. Investigating Influences of Multi-scale Built Environment on Car Ownership Behavior Based on Gradient Boosting Decision Trees [J].
Journal of Jilin University (Engineering and Technology Edition),2022,52(3): 572-577.)
[12] 生紅瑩,趙偉國,陳揚,等. 基于深度數(shù)據(jù)挖掘的電力系統(tǒng)短期負荷預測 [J]. 吉林大學學報(信息科學版),2023,41(1): 131-137.
(SHENG H Y,ZHAO W G,CHEN Y,et al. Short-Term Load Forecasting of Power System Based on Deep Data Mining [J]. Journal of Jilin University
(Information Science Edition),2023,41(1): 131-137.)
[13] 常碩,張彥春. 基于袋外預測和擴展空間的隨機森林改進算法 [J]. 計算機工程,2022,48(3): 1-9. (CHANG S,ZHANG Y C. Improved Random
Forest Algorithm Based on Out-of-Bag Prediction and Extended Space [J]. Computer Engineering,2022,48(3): 1-9.)
[14] 甘紅楠,張凱. 參數(shù)自適應下基于近鄰圖的近似最近鄰搜索 [J]. 計算機工程,2022,48(9): 28-36. (GAN H N,ZHANG K.
Approximate Nearest Neighbor Search Based on Neighbor Graphs with Parameter Adaptation [J]. Computer Engineering,2022,48(9): 28-36.)
[15] KE G L,MENG Q,THOMAS F,et al. Lightgbm: A Hig
hly Efficient Gradient Boosting Decision Tree [C]//Advances in Neural Information Processing Systems. Red Hook,NY: Curran Associates Inc,2017: 3149-3157.
[16] FRIEDMAN J H. Greedy Function Approximation: A Gradient Boosting Machine [J]. Anals of Statistics,2001,29(5): 1189-1232.
[17] CHEN T Q,CARLOS G. XGBoost: A Scalable Tree Boosting System [C]//ACM SIGKDD International Conference on Knowledge Discover
y and Data Mining. New York: Association for Computing Machinery,2016: 785-794.
[18] 朱圳,張引發(fā),劉立芳,等. 改進加權(quán)方法的告警關(guān)聯(lián)分析算法 [J]. 吉林大學學報(信息科學版),2023,41(1): 57-66. (ZHU Z,ZHANG Y F,LIU L F,et al.
Analysis Algorithm of Alarm Correlation Based on Improved Weighting Method [J]. Journal of Jilin University (Information Science Edition),2023,41(1): 57-66.)
[19] 裴莉莉,孫朝云,韓雨希,等. 基于SSC與XGBoost的高速公路異常收費數(shù)據(jù)修復算法 [J]. 吉林大學學報(工學版),2022,52(10): 2325-2332. (PEI L L,SUN Z Y,HAN Y X,et al.
Algorithm for Repairing Abnormal Toll Data of Expressway Based on SSC and XGBoost [J]. Journal of Jilin University (Engineering and Technology Edition),2022,52(10): 2325-2332.)
(責任編輯: 韓 嘯)