






摘" 要:2019年12月突發一起重大公共事件,新型冠狀病毒以驚人速度傳播開來。此傳染病已成為全球性公共衛生問題,世界各國不僅要了解本地情況,還應對其他國家的擴散情況進行掌握。該文選取2022年7月1日至2022年9月30日的韓國累計確診數據,建立了ARIMA(0,2,2)模型,并對2022年10月1日至2022年10月5日韓國累計確診人數進行預測。結果表明,利用該模型預測的結果與實際結果基本吻合。該文結果對此次重大公共事件的預測和防控提供理論支持。
關鍵詞:重大公共事件;時間序列分析;ARIMA模型;發展現狀;預測
中圖分類號:R563.1" " " 文獻標志碼:A" " " " " 文章編號:2095-2945(2023)11-0006-04
Abstract: A major public incident broke out in December 2019, and Covid-19 virus spread at an alarming rate. This infectious disease has become a global public health problem. Countries around the world should not only understand the local situation, but also grasp the spread of other countries. In this paper, based on the cumulative confirmed data of Korea from July 1 to September 30, 2022, an ARIMA model is established, and the cumulative number of confirmed cases in Korea from October 1 to October 5, 2022 is predicted. The results show that the predicted results are basically consistent with the actual results. The results of this paper provide theoretical support for the prediction, prevention and control of this major public event.
Keywords: major public events; time series analysis; ARIMA model; development status; prediction
2019年12月,正當中國人民喜迎新春之際,湖北省武漢市接連查出多起新型冠狀病毒感染(以下簡稱“新冠感染”)病例,該病毒具有傳染速度快且發病率高的特性。隨后,在中國對此開展防控治療時,其他各國也陸續出現確診案例。該傳染病迅速演變成全球范圍內的公共衛生問題,新型冠狀病毒感染在各國的擴散階段不同,擴散趨勢也有顯著不同[1]。因此,世界各國不僅要研究本國當前情況,還要抓緊了解其他地區的情況,實現信息共享,對病毒傳播情況有更加全面地了解才能在預防與控制中占據上風。
本文采用模型分析法,運用RStudio對韓國累計確診數據進行時間序列分析。首先根據數據繪制時序圖、自相關圖,以此判斷數據的平穩性。由于獲取的韓國累計確診數據具有非平穩性的特點,對非平穩序列[2]進行差分處理,序列平穩后選取合適的ARIMA模型進行擬合,并檢驗模型的有效性,檢驗通過后進行趨勢預測、趨勢圖繪制,從而了解國外在此次重大公共衛生事件中病毒擴散的趨勢。我國便能及時掌握國外新冠感染發展程度,應對將來可能出現的危機與挑戰。
1" 方法
1.1" 數據來源
韓國病例數據來源是新型冠狀病毒感染全球疫情實時播報,從中選取出2022年7月1日至2022年9月30日韓國的累計確診數據。
1.2" 研究方法
時間序列分析是將一組不同時間上的數據按照時間先后順序記錄下來,通過研究序列的統計規律來分析生活中的難題,也可將這些規律與信息用于預測。根據序列的統計特征可分為平穩時間序列和非平穩時間序列。在進行時間序列分析時,簡便的ARIMA模型總是備受青睞,其也是最常見的使用方法之一。ARIMA模型簡單,只依靠內生的變量,但需注意的是該模型依賴平穩序列,當序列為非平穩時無法提取到規律,需進行差分使其平穩化。ARIMA模型相當于AR模型與MA模型的組合,包括p、d、q3個參數,p是構造的模型中使用的時序數據自身的滯后數,d是差分階數,q是構造的模型中使用的預測誤差的滯后數,進一步可看出該模型無須依賴其他的外生變量,當q為0時,ARIMA模型變為AR模型,p為0時,ARIMA模型變為MA模型[3]。ARIMA(p,d,q)模型,結構如下
Φ(B)?犖d xt=Θ(B)εtE(εt)=0,Var=σ2,E(εt εs)=0,s≠tE(xs εt)=0,?坌slt;t,
式中:?犖d=(1-B)d、Φ(B)=1-?準1B-,…,-?準pBp代表自回歸系數多項式;Θ(B)=1-θ1B-,…,-θqBq代表移動平滑系數多項式;xt代表非平穩序列;εt代表零均值白噪聲序列。
1.3" 建模過程
1)數據平穩化:根據時序圖觀察序列的平穩性,當序列呈現周期性變動或有劇烈波動趨勢時,為非平穩序列。隨后用自相關圖做進一步輔助識別,平穩序列的自相關系數呈現迅速衰減趨勢,非平穩序列中自相關系數則是逐漸降到0,在0處波動一段時間后,自相關系數又變為負。當序列非平穩時做差分處理,使其平穩化[4]。
2)白噪聲檢驗:對經過差分后得到的平穩序列進行純隨機性檢驗,在各階延遲下,p值小于α(0.05),則認為序列是非純隨機的,包含著可提取的動態規律[5]。
3)通過自相關圖和偏自相關圖找出合適模型,當存在多個合適的模型時,由AIC準則判定最合適的模型,AIC的值越小,模型擬合越好。
4)模型檢驗:模型檢驗包括2部分。第一部分是模型的顯著性檢驗,查看模型篩選的信息是否充分[6]。擬合效果越好,序列中樣本的相關信息獲取越充分,此時殘差序列項為純隨機序列;第二部分是參數的顯著性檢驗,用于檢驗模型中每一個參數是否顯著非0,不顯著非0的參數視為不合格,可以舍棄[7]。
5)模型預測:模型通過檢驗后展開預測。
2" 對重大公共事件下韓國現狀分析及預測
2.1" 平穩性檢驗
圖1是韓國累計確診序列的時序圖,從圖中可發現明顯的上升趨勢,呈現出非平穩序列的特征,通過自相關圖進一步輔助識別,如圖2所示。累計確診序列在很長的延遲時間里,自相關系數從正數遞減到0后,又持續是負數,因此序列是非平穩序列[1]。圖3中序列經二階差分后一直在一個固定的范圍內隨機波動,變得平穩。接下來對數據進行純隨機性檢驗,確認該序列是否有繼續研究的價值。
2.2" 白噪聲檢驗
通過RStudio對3個觀察值序列進行白噪聲檢驗,檢驗結果顯示,在6階、12階延遲下,p值均小于顯著性水平α(0.05),有很大把握認為韓國累計治愈序列是非純隨機的,即為非白噪聲序列,存在研究價值。
2.3" 建立模型
圖4、圖5是差分處理后的自相關圖和偏自相關圖。由圖4、5可知,自相關系數2階截尾,偏自相關系數衰減過程非常緩慢,偏自相關系數拖尾。因此確定ARIMA(p,2,q)模型中參數p為0,q為2,因此選取ARIMA(0,2,2)為最優模型,ARIMA(0,2,2)的AIC=2 083.9。擬合模型的口徑為
xt=εt-0.396 5εt-1-0.276 1εt-2,
Var(εt)=619 333 966。
2.4" 模型檢驗
進行模型檢驗,結果見表1。6階延遲下模型殘差通過了檢驗,可認為ARIMA(0,2,2)模型擬合恰當。從表2可以看出,韓國累計確診序列中2個參數均顯著非0,ARIMA(0,2,2)模型2個系數都通過了t檢驗,擬合效果很好。
2.5" 模型預測
本文通過RStudio對韓國此次重大公共事件中的累計確診數據進行時間序列分析,展開預測。圖6是累計確診序列的趨勢預測圖,預測了2022年10月1日后的發展趨勢,在2022年10月1日到2022年10月5日韓國的累計確診序列呈現平穩上升趨勢,確診人數的增速并未放緩,在未來一段時間內感染者人數仍會繼續上升,事態發展與防控的形勢不容樂觀。韓國此次事件的累計確診序列預測結果與實際結果見表3,兩者對比進一步展現出模型預測有效程度,預測結果接近真實值,保障了預測的準確性。
3" 結束語
自2019年檢測出第一個確診病例后,大部分國家迅速被籠罩在新冠感染的陰霾之下,這場傳染病奪去了無數人的生命,造成的經濟損失也不可估量,深入研究并盡快解決此次重大公共衛生傳染病問題成為迫切要求。本文從新冠感染全球疫情實時播報中選取2022年7月1日至2022年9月30日韓國累計確診數據,建立了ARIMA(0,2,2)模型,該模型對序列進行擬合得到了顯著的效果。最后,利用模型預測2022年10月1日到10月5日韓國累計確診人數,韓國確診人數依然持續上升,事態控制效果不明顯,傳染病發展和防控形勢嚴峻。預測結果與真實值吻合,預測的韓國累計確診病例數據總體呈現上升趨勢,與真實數據的整體變化趨勢也大致相同,保障了預測力度,而隨時間推移,預測力度呈遞減趨勢。通過對韓國現階段的形勢進行追蹤,可以掌握本次重大公共衛生傳染病發展的情況,深入了解該傳染病的傳播特點,為我國提供有效參考,在本國實際情況基礎之上進行精準施策,如制定嚴格、準確和及時的防控措施等,從而遏制傳染病的發展。
參考文獻:
[1] 白云,錢箴,孫玉瑩,等.基于綜合集成預測方法的新冠肺炎疫情預測[J].系統工程理論與實踐,2022,42(6):1678-1693.
[2] 裴韜,王席,宋辭,等.COVID-19疫情時空分析與建模研究進展[J].地球信息科學學報,2021,23(2):188-210.
[3] 王燕.時間序列分析——基于R[M].北京:中國人民大學出版社,2015.
[4] 徐娟年,馬冉,趙中睿,等.山東省新型冠狀病毒肺炎疫情流行趨勢初步預測[J].重慶師范大學學報(自然科學版),2020,37(2):101-106.
[5] ILSU C, HO L D, KUK K Y. Effects of timely control intervention on the spread of middle east respiratory syndrome coronavirus infection[J].Osong Public Health and Research Perspectives,2017,8(6):373-376.
[6] 黃志輝,黃波,汪炯驊.人口流動對新冠肺炎傳播影響的時空分析——以美國為例[J].地理與地理信息科學,2022,38(5):65-71.
[7] 萬時雨,劉玨,劉民.新型冠狀病毒基本再生數研究進展[J].科學通報,2020,65(22):2334-2341.