邵升清,夏桂梅
(太原科技大學(xué) 應(yīng)用科學(xué)學(xué)院,山西 太原 030024)
隨著新冠疫情的大暴發(fā),傳染病問題再一次出現(xiàn)在公眾的視野里,傳染病的預(yù)防問題也受到人們的高度重視.目前,傳染病發(fā)病率的預(yù)測方法多種多樣,而且得到了廣泛的應(yīng)用.常用的預(yù)測模型有時間序列模型ARIMA[1]、馬爾科夫鏈模型[2]、灰色模型GM(1,1)[3]和趨勢外推模型等[4].隨著社會的進(jìn)步和計算機(jī)的發(fā)展,相關(guān)理論研究也不斷完善,出現(xiàn)了利用機(jī)器學(xué)習(xí)的預(yù)測模型,有支持向量機(jī)預(yù)測[5]、人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測[6]、分割K-最鄰近算法預(yù)測[7]等方法.
本文根據(jù)已有的病毒性肝炎的發(fā)病率數(shù)據(jù),從統(tǒng)計學(xué)角度進(jìn)行研究,比較不同樣本容量下ARIMA(p,d,q)模型和GM(1,1)模型對傳染病的預(yù)測效果,并選擇最佳模型預(yù)測短期內(nèi)病毒性肝炎的發(fā)病率及發(fā)展趨勢,為制定防治措施提供理論依據(jù).
樣本1 我國1990-2019年的病毒性肝炎發(fā)病率的數(shù)據(jù),樣本容量n=30.數(shù)據(jù)均來源于《中國統(tǒng)計年鑒》.
(i)ARIMA(p,d,q)模型
時間序列{Xt}的自回歸滑動平均模型[8]定義
Xt=φ0+φ1Xt-1+φ2Xt-2+…+φpXt-p+εt-θ1εt-1-θ2εt-2-…-θqεt-q,
(1)
將差分運算與ARMA(p,q)模型結(jié)合后,構(gòu)成ARIMA(p,d,q)模型,其中d為差分階數(shù),B為延遲算子.則ARIMA(p,1,q)的結(jié)構(gòu)為
φ(B)(1-B)Xt=θ(B)εt.
(2)
ARIMA(p,d,q)的結(jié)構(gòu)為
(3)
(ii)GM(1,1)模型

(4)
稱式(4)為GM(1,1)模型,求解得到
(5)
其中,a和b可通過式(6)用最小二乘估計得到
(6)

對累加序列{Yt}累減還原,則原序列的預(yù)測值為
(7)
2.1.1 原始序列的平穩(wěn)性檢驗
通常,通過觀察時間序列圖的曲線來確定對每個變量數(shù)據(jù)進(jìn)行ADF檢驗時使用檢驗方程哪一個[10].觀察時序圖圖……