孫許可
(中國(guó)人民武裝警察部隊(duì)士官學(xué)校,浙江 杭州 311400)
新冠肺炎(COVID-19)疫情已成為國(guó)際關(guān)注的突發(fā)公共衛(wèi)生事件,COVID-19 呼吸系統(tǒng)疾病的病毒株是一種名為嚴(yán)重急性呼吸系統(tǒng)綜合征冠狀病毒2(又稱(chēng)SARS-CoV-2)引起的。這種冠狀病毒病具有極強(qiáng)的傳染性。自最初確認(rèn)以來(lái),盡管受到嚴(yán)格控制,但仍已成為全球流行病,對(duì)世界衛(wèi)生和經(jīng)濟(jì)發(fā)展構(gòu)成了巨大的威脅和挑戰(zhàn)。目前,該疾病已蔓延至全球100 多個(gè)國(guó)家。
至2020年6月16日,全球共報(bào)告8 044 683 例COVID-19 病例,死亡437 131 例,治愈3 883 243 例,總病死率為5.43%,其中,美國(guó)、巴西、俄羅斯、印度和英國(guó)是世界上感染人數(shù)最多的5 個(gè)國(guó)家。COVID-19 表現(xiàn)出非線性和復(fù)雜的性質(zhì),除了涉及傳播的眾多已知和未知變量外,不同地緣政治區(qū)域的人口行為的復(fù)雜性和遏制策略的差異極大地增加了模型的不確定性。
因此,建立基于XGBoost 的疫情預(yù)測(cè)模型,使用Jupyter 軟件進(jìn)行學(xué)習(xí)和訓(xùn)練,對(duì)2020年1月23日到3月1日全國(guó)和湖北的累積確診病例數(shù)、累積死亡病例數(shù)、累積治愈病例數(shù)、累積正在治療病例數(shù)進(jìn)行分析、建模,進(jìn)一步洞悉新冠肺炎疫情發(fā)展規(guī)律,為防控新冠疫情提供參考。
該算法的建模思路:給出一個(gè)泛化的目標(biāo)函數(shù)的定義,在每一輪的迭代中找到一個(gè)合適的回歸樹(shù)去擬合上次預(yù)測(cè)的殘差,最小化目標(biāo)函數(shù),使估算值逼近真實(shí)值,如圖1所示。

圖1 XGBoost 原理
例如,數(shù)據(jù)([Δ,Δ,],SOH),([Δ,Δ,],SOH)…([Δ UΔ T,],SOH),=1,2,…,。其中Δ U,Δ T,,SOH分別表示第i 組數(shù)據(jù)對(duì)應(yīng)的電壓差、溫度差、平均電壓以及健康狀態(tài)。
在本文中,我們定義樹(shù)f(x)如下:

其中,表示每棵樹(shù)的結(jié)構(gòu),它將使葉子節(jié)點(diǎn)與每個(gè)樣本一一對(duì)應(yīng),是樹(shù)中葉子節(jié)點(diǎn)的個(gè)數(shù)?!?br>