張 麗 相曉妹 張水平△ 宋 暉 董 敏 米白冰 黨少農△
【提 要】 目的 探討ARIMA乘積季節模型、Holt-Winters季節模型、多層感知器模型在出生缺陷發生趨勢預測中的可行性。方法 本文采用2009年10月至2016年9月西安市婦幼保健院出生缺陷監測及圍產兒數據進行研究。選擇2009年10月至2015年8月出生缺陷月發生率時間序列進行模型擬合,應用2015年9月至2016年9月出生缺陷月發生率對模型進行評價。 結果 三種模型均通過了檢驗。ARIMA(0,0,1)(0,1,1)12模型預測平均絕對誤差和相對誤差分別為11.64和0.11。Holt-Winters加法模型預測平均絕對誤差和相對誤差分別為14.21和0.14。Holt-Winters乘法模型預測平均絕對誤差和相對誤差分別為16.64和0.16。多層感知器模型預測平均絕對誤差和相對誤差分別為20.58和0.20,通過比較模型預測能力,最優模型為ARIMA(0,0,1)(0,1,1)12。結論 ARIMA乘積季節模型更加靈活,結果可能較優。同時,隨著預測時間的延長,模型預測的準確性降低。
出生缺陷是胚胎或胎兒發育過程中結構、功能或代謝異常,是嬰幼兒死亡及致殘的主要原因[1]。隨著兒童傳染病的顯著控制,出生缺陷已成為影響兒童健康的重要因素,其流行狀況受到遺傳、社會環境和生活方式等多種因素的影響[2],在預測中難以綜合考慮。目前,疾病預測方法眾多,如灰色模型、神經網絡模型、時間序列模型等。其中,時間序列預測是基于對象歷史數據變化規律,用該變量以往資料建立模型并外推的方法,時間是替代了各種影響因素的綜合效應[3]。目前ARIMA模型主要用于傳染病預測,在婦幼衛生中主要用于孕產婦及嬰幼兒死亡預測[4],出生缺陷預測較少見[5],可能由于出生缺陷病因復雜等原因,模型適用性值得考慮。本研究選取ARIMA乘積季節模型、Holt-Winters季節模型和多層感知器模型,對出生缺陷發生趨勢展開動態預測,探討三種模型在出生缺陷發生趨勢預測中的可行性,并比較其擬合能力。
出生缺陷及圍產兒數據來源于西安市婦幼保健院,以2009年10月至2016年9月西安市所有產科醫院住院分娩的孕滿28周至產后7天內的圍產兒(包括活產、死胎、死產、治療性引產及7天內死亡的新生兒)為監測對象。
按《中國出生缺陷監測方案》要求,采用以醫院為基礎的監測方案。監測年度按“3+1” 模式(當年前3季度數據加前一年第4季度數據作為該年全年數據)進行統計,采用全國統一的《出生缺陷兒登記卡》和《圍產兒數季報表》收集數據,監測缺陷類型以體表先天畸形和先天性心臟病為主,分類標準參考國際疾病分類(ICD-10)。
本研究應用ARIMA乘積季節模型、Holt-Winters季節模型和多層感知器模型對西安市出生缺陷月發生率趨勢開展動態預測,探討三種模型在出生缺陷發生趨勢預測中的可行性。
(1)ARIMA乘積季節模型
ARIMA乘積季節模型,即ARIMA(p,d,q)(P,D,Q)s模型,能綜合考慮季節、趨勢、隨機干擾等成分,各參數意義如下:非季節回歸階數p、非季節差分階數d、非季節移動平均階數q、季節自回歸階數P、季節差分階數D、季節移動平均階數Q、季節長度s[6]。建立該模型可歸納為4個步驟。①數據平穩化:對序列平穩性判斷及非平穩序列平穩化。若序列不平穩,選擇合適的差分提取原序列中周期性和趨勢變動等信息,以此確定d和D。②模型識別:考察差分后序列的自相關和偏自相關圖,確定模型階數p和q,參數P和Q超過2階的情況少見,可從低到高逐個嘗試。季節長度s可由疾病背景分析得到。③參數估計與模型檢驗:采用Box-Ljung統計量檢驗殘差是否為白噪聲序列,若差異有統計學意義,則殘差非白噪聲序列,說明殘差中還存在有用信息未被提取,需對原模型進行改進,轉向步驟②,重新選擇模型擬合。白噪聲檢驗P<0.05差異有統計學意義。若兩個或兩個以上模型通過檢驗,通過BIC等擬合優度指標選擇最優模型,BIC越小模型擬合程度越好。④模型評價:利用最優模型預測,并用實際數據進行驗證,評價模型是否恰當。
(2)Holt-Winters季節模型
Holt-Winters季節模型是較高級的指數平滑方法,可同時修正時間序列的季節性和傾向性,并能將隨機波動的影響適當過濾掉,特別適于含趨勢和季節變化的時間序列。Holt-Winters季節模型在每個周期中采用一個水平分量、一個趨勢分量及一個季節分量三個權重來更新分量。水平和趨勢分量初始值通過對時間進行線性回歸得到。季節分量初始值使用去除趨勢后數據的虛擬變量回歸得到。當水平分量和季節分量相乘時,為乘法模型,當二者相加時,為加法模型[7]。
(3)多層感知器人工神經網絡模型
多層感知器模型(MLP)是應用最多的人工神經網絡,由輸入層、隱含層和輸出層構成,即信號從輸入層輸入,經隱含層傳給輸出層,由輸出層得到輸出信號[8]。MLP最常用誤差反向傳播算法,其過程由信號正向傳播與誤差反向傳播組成。正向傳播時,輸入樣本從輸入層傳入,經各隱含層處理后,傳向輸出層。若輸出層實際輸出與期望輸出不符,則轉入誤差反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱含層向輸入層逐層反傳,并將誤差分攤給所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元權重值的依據。這種信號正向傳播與誤差反向傳播的各層權值調整過程,周而復始,對權值不斷修正,使模型實際輸出更接近期望輸出。

(1)數據平穩化
對2009年10月至2015年8月出生缺陷發生率做時序圖,呈上漲趨勢,提示為非平穩序列。對原始序列進行1階12步季節差分提取其季節和趨勢影響,得到一個近似平穩的序列,基本符合ARIMA模型對平穩性的要求。對差分后序列進行ADF單根性檢驗,結果顯示P<0.05,說明差分后為平穩時間序列。
(2)模型識別
根據差分變換次數及出生缺陷季節等因素,初步確定以12個月為周期的ARIMA(p,0,q)(P,1,Q)12模型。四個待定參數p、q和Q、P的確定,采用從低階至高階逐個嘗試,比較模型擬合優度等參數確定。本研究在確定d=0,D=1后,測試了待定參數p、q和Q、P分別取0,1,2的所有模型,共81個。
(3)參數估計及模型診斷
在嘗試的81個模型中,共39個模型通過了白噪聲檢驗。參考模型擬合優度指標BIC等,得到最優模型為ARIMA(0,0,1)(0,1,1)12,其參數估計結果見表1。對其殘差值進行驗證,自相關和偏自相關系數基本在可信區間范圍內(圖1)。

表1 最優模型ARIMA(0,0,1)(0,1,1)12 參數估計結果

注:ACF為自相關,PACF為偏自相關
利用時間序列預測功能中的指數平滑法,以2009年10月至2015年8月出生缺陷月發生率數據為基礎,分別擬合Holt-Winters季節加法和乘法模型,對兩個模型殘差分別作ACF和PACF圖(圖2),結果顯示殘差自相關和偏自相關系數基本在可信限內,同時Ljing-box統計量差異無統計學意義,可認為殘差序列為白噪聲序列,兩模型成立。Holt-Winters季節加法和乘法模型R2分別為0.504和0.377。

注:ACF為自相關,PACF為偏自相關
本研究MLP參數中以雙曲正切函數為連接函數,其余為默認選項,模型結構見圖3。模型殘差圖顯示殘差在0兩側分布均勻,認為模型擬合成功。將構建的模型導出,運用該模型預測2015年9月至2016年9月出生缺陷發生水平。

注:隱藏層激活函數:雙曲正切;輸出層激活函數:恒等式
圖3MLP神經網絡模型結構
利用3種模型對西安市2015年9月至2016年9月出生缺陷發生率進行預測(表2)。ARIMA(0,0,1)
(0,1,1)12乘積季節模型絕對誤差和相對誤差范圍分別是1.89~27.26和0.02~0.29,平均絕對和相對誤差為11.64和0.11。Holt-Winters加法模型絕對誤差和相對誤差范圍分別是2.02~31.30和0.02~0.35,平均絕對誤差和相對誤差分別為14.21和0.14。Holt-Winters乘法模型絕對誤差和相對誤差范圍分別是4.75~32.95和0.04~0.34,平均絕對誤差和相對誤差分別為16.64和0.16。MLP模型絕對誤差和相對誤差范圍分別是4.77~42.87和0.04~0.48,平均絕對誤差和相對誤差為分別20.58和0.20。通過比較絕對、相對誤差范圍,平均絕對、相對誤差,最優模型為ARIMA(0,0,1)(0,1,1)12模型。該模型2015年9月至2016年2月預測的相對誤差在15%內,且波動較小,提示預測相對準確;2016年3月至2016年9月預測波動較大,提示預測結果準確性相對降低。

表2 2015年9月至2016年9月西安市出生缺陷發生率預測結果(1/萬)
本研究選取ARIMA模型、Holt-Winters模型及MLP模型建模,通過比較ARIMA(0,0,1)(0,1,1)12模型、Holt-Winters加法模型、Holt-Winters乘法模型和MLP模型平均相對誤差,對模型預測結果進行評價,三個模型的優劣順序是:ARIMA(0,0,1)(0,1,1)12模型> Holt-Winters加法模型> Holt-Winters乘法模型>MLP模型。
時間序列預測模型是基于對象歷史數據變化規律,用變量以往統計資料建立模型并外推的預測方法,時間是替代了各種影響因素的綜合效應,其中,ARIMA模型主要用于傳染病預測,用于出生缺陷較少見。本研究應用西安市出生缺陷數據擬合的ARIMA模型通過了檢驗,說明在出生缺陷時間趨勢預測中ARIMA模型值得考慮[5]。ARIMA模型預測準確性較Holt-Winters模型略高,其原因可能是ARIMA模型可調整參數,能充分提取序列長期趨勢、周期性、隨機波動等信息,且能判斷這些因素間確切作用關系[9]。而Holt-Winters模型僅能提取序列確定性信息,對隨機波動信息浪費嚴重[10]。在本研究中,ARIMA季節模型預測近期結果較準確,而遠期預測結果準確性降低,提示隨著時間推移,預測準確性降低。因此,在實際應用中,應及時掌握和更新出生缺陷發病數據庫,隨著數據動態變化,及時補充更新數據進行模型再次擬合,才能對出生缺陷防控提供一定指導。
相比ARIMA模型,Holt-Winters模型也有其優點。Holt-Winters模型操作較簡便,重要參數經系統多次比較,自動產出最優參數,故當序列中確定性信息比較強勁時,選擇Holt-Winters模型預測也會得到不錯的預測結果。因出生缺陷發生率受多種因素影響,有時利用傳統線性數學模型難以進行理想擬合。近年作為非線性建模方法的人工神經網絡,具自組織、自學習、非線性逼近能力和容錯能力強的優點,可嘗試用于出生缺陷的預測[11]。本研究中MLP在近期預測誤差均在15%以內,遠期預測誤差均大于15%,提示在出生缺陷發生的近期預測中多層感知器模型值得考慮。
出生缺陷預測以往多使用灰色模型,因其所需數據量少,不受數據分布影響,且預測精度較高。李玲等應用灰色模型預測山東省圍產兒出生缺陷發生率,平均相對誤差為7.2%[12]。劉曉東等應用灰色模型預測中國出生缺陷發生率平均誤差率為1.8%[13]。孫金杰等應用灰色模型模擬預測某省出生缺陷發生率平均誤差為6.98%[14]。當序列數據變化較急劇時,灰色模型構造的參數值可能會產生較大的滯后誤差,模型偏差較大,灰色模型對出生缺陷的預測誤差似有較大的地域或人群波動,可能與之有關,后續我們也將進一步評估灰色模型在西安出生缺陷預測中的應用價值。ARIMA模型預測西安市出生缺陷發生率的平均誤差率為11%,較灰色模型略高,可能與本研究預測周期較長有一定關系,但在可接受范圍內。WANG JF等應用支持向量機預測陜西省神經管畸形發生水平,預測對象是神經管畸形在抽樣村的發生等級,訓練數據集和測試數據集預測精確度分別為71.50%和68.57%[15]。另外基于危險因素,使用神經網絡模型預測個體水平上出生缺陷是否發生也是值得考慮的問題[16]。
本研究從實踐出發,尋找預測誤差在可接受范圍內且實際操作更為簡便的出生缺陷預測模型,通過比較預測誤差和建模過程,Holt-Winters模型及MLP模型預測誤差較大,預測精度相對較低,而ARIMA模型在出生缺陷的應用中有一定的預測價值。