劉蕓男,彭榮榮,楊冬燕,趙明烽,王含柔,楊小麗
1. 重慶醫科大學公共衛生與管理學院,醫學與社會發展研究中心,健康領域社會風險預測治理協同創新中心,重慶 400016;2. 重慶市血液 中心業務部,重慶 400015
血液作為一種挽救生命的特殊資源,在臨床治療中發揮了極其重要的作用。自《中華人民共和國獻血法》頒布以來,我國已建立起較為完善的血液制品保障體系,但血液供應量常無法滿足臨床用血需求,導致出現較大的用血缺口,甚至會發生“血荒”現象[1]。研究[2]顯示,臨床血液的供需矛盾在省級血液中心覆蓋的高端醫療資源集中地區尤為突出。因此,本研究采用時間序列分析中的差分整合移動平均自回歸模型(autoregressive integrated moving average model, 簡稱ARIMA 模型) 對2006—2016 年重慶市血液中心覆蓋區域的臨床紅細胞(red blood cell,RBC)用量進行分析并建模,探尋臨床紅細胞需求量的變化規律并進行科學預測,以期為無償獻血的招募、血液采集工作的開展及血液庫存的科學化管理提供客觀依據。
獲取2006—2016 年重慶市血液中心各血型紅細胞成分血制品的出庫數據。成分血制品種類包括輻照懸浮紅細胞、輻照懸浮少白細胞紅細胞、去白細胞懸浮紅細胞等。臨床紅細胞用量以單位U 計算,1 U 紅細胞類制品由200 mL 全血分離制備。
1.2.1 ARIMA 模型建立 基于重慶市血液中心臨床紅細胞使用的季節性特點,本研究采用ARIMA(p,d,q)(P,D,Q)s建立ABO 血型臨床紅細胞需求預測模型。ARIMA 模型是時間序列分析中最重要的模型之一,其通過使用相應的數學模型描述預測對象隨時間推移形成的數據序列,并基于此選擇合適的預測模型。根據原始時間序列是否平穩以及回歸中所含部分的不同,可分為自回歸模型(autoregressive model,AR)即AR(p)、移動平均模型(moving average model,MA)即MA(q)、自回歸移動平均模型(autoregressive and moving average model,ARMA)即ARMA(p,q) 以及ARIMA(p,d,q) 模型。當時間序列存在季節性變動趨勢時,應構建季節性ARIMA 模型,即ARIMA(p,d,q)(P,D,Q)s。其中,p、d、q 分別為自回歸階數、差分階數和移動平均階數,P、D、Q 分別為季節性自回歸階數、季節性差分階數和季節性移動平均階數,s 為季節周期[3]。
1.2.2 序列平穩化處理 根據2006 年1 月—2016 年6 月重慶市血液中心ABO 血型的紅細胞臨床用量數據,繪制各血型的臨床紅細胞時間序列圖,并觀察序列的平穩性。對不平穩的時間序列數據進行數據轉化和差分處理,使序列滿足零均值且方差不隨時間變化,以實現序列平穩化,并根據差分次數確定d 和D 值。
1.2.3 模型識別 本研究獲取的臨床紅細胞用量呈現明顯的波動變化及季節性變化特征,故選用季節乘積模型,即ARIMA(p,d,q)(P,D,Q)s。待序列實現平穩后,觀察差分后序列的自相關函數(autocorrelation function,ACF)圖和偏自相關函數(partial autocorrelation function,PACF)圖的截尾或拖尾的情況確定模型參數p、q、P 及Q 的值,初步建立一個或多個可用于檢驗的ARIMA 備選模型。
1.2.4 模型參數估計與假設檢驗 采用非線性最小二乘法對備選模型進行參數估計。在參數有統計學意義的基礎上,對模型殘差以Ljung-Box Q 統計量及P 值進行白噪聲檢驗,P>0.05 表示殘差為白噪聲,差異無統計學意義。而后,通過標準化的貝葉斯準則(Bayesian information criterion,BIC)比較模型優劣,即標準化BIC 值越小、模型擬合優度越高,挑選最優模型[4]。
1.2.5 模型預測 以重慶市血液中心2016 年7 月—12月的臨床ABO 血型紅細胞的實際用量數據與最優模型所預測的臨床紅細胞需求量進行比較,計算平均相對誤差(mean relative error,MRE),評價最優模型的預測精 準度。
采用Excel 軟件進行數據錄入,SPSS 19.0 軟件進行時間序列分析。本研究具體建模步驟以A 型血紅細胞 為例。
本研究針對重慶市血液中心2006 年1 月—2016 年6 月 的A 型血紅細胞臨床用量數據繪制時間序列圖,結果 (圖1)發現其臨床用量總體呈上升趨勢,波動幅度較大;且每年的臨床用量呈現季節性上升及下降的趨勢。繼而表明,該序列為包含以年為單位的季節性趨勢的非平穩序列,需進行平穩處理。

圖1 A 型血紅細胞原始數據的時間序列圖Fig 1 Time series diagram of raw data of blood group A RBCs
隨后,經一次差分和一次季節性差分后繪制時間序列圖發現,觀測值均圍繞零值上下隨機波動(圖2),說明該序列實現了平穩。同理,對B 型、O 型及AB 型血紅細胞的臨床用量繪制時間序列圖,獲得了與A 型序列變化特征大致相同的結果,故均采取了一次差分及一次季節差分進行處理,實現序列平穩。

圖2 A 型血紅細胞差分和季節性差分后的時間序列圖Fig 2 Time series diagram of difference data of blood group A RBCs after the order difference and the seasonal order difference
2.2.1 A 型血紅細胞臨床需求量預測模型的識別 序列經過一次差分和一次季節性差分后實現平穩,因此d=D=1、季節周期s=12。觀察一次差分和一次季節性差分后的ACF圖和PACF 圖,結果(圖3)顯示ACF 圖呈拖尾特征、PACF 圖呈3 階截尾,故q=0、p=3;在ACF 圖中,延遲數目為12 時自相關系數顯著不為0,而在PACF 圖中,偏自相關系數則是在延遲數目12 附近顯著不為0,因此Q=1、P=1 或0。最終,建立A 型血紅細胞臨床需求量備選模型為ARIMA(3,1,0)(1,1,1)12和ARIMA(3,1,0)(0,1,1)12。

圖3 A 型紅細胞一次差分及一次季節性差分后的ACF 圖和PACF 圖Fig 3 ACF plot and PACF plot of blood group A RBCs after the first order difference and the first seasonal order difference
2.2.2 B 型、O 型和AB 型血紅細胞臨床需求量預測模型的識別 同理,根據各血型紅細胞用量序列的差分后的ACF 圖及PACF 圖,建立其余血型的備選模型,即B 型為ARIMA(3,1,0)(0,1,1)12和ARIMA(3,1,0)(1,1,1)12,O 型為ARIMA(3,1,0)(0,1,1)12和ARIMA(3,1,0)(1,1,1)12,AB 型為ARIMA(3,1,0)(0,1,1)12和ARIMA(3,1,0)(1,1,1)12。
2.3.1 A 型血紅細胞模型的參數估計及假設檢驗 分別對模型的參數、殘差進行顯著性檢驗和白噪聲檢驗后,結果(表1)顯示,盡管模型ARIMA(3,1,0)(1,1,1)12與ARIMA(3,1,0)(0,1,1)12的BIC 值較小,但該2 個模型中存在模型參數無統計學意義的情況(即為不顯著,均P>0.05),故剔除該2 個備選模型。經再嘗試建模后發現,模型ARIMA(3,1,0)(1,1,0)12的各個參數更為顯著,其平穩的R2=0.588,標準化BIC 值為12.598,殘差的ACF 和PACF 均在95%CI 內;Ljung-Box Q 值為15.215,P=0.364,表明殘差序列為白噪聲。因此,綜合上述判斷該模型為最優模型,適用于A 型血紅細胞臨床需求量的 預測。

表1 A 型血紅細胞模型的參數估計Tab 1 Parameter estimation of ARIMA models for blood group A RBCs
2.3.2 B 型血紅細胞模型的參數估計及假設檢驗 同理,結果(表2)顯示模型ARIMA(3,1,0)(0,1,1)12標準化BIC值最小,其平穩的R2=0.700,殘差的ACF 和PACF 均在95%CI 內;Ljung-Box Q 值為12.457,P=0.491,即殘差序列為白噪聲。因此,該模型為B 型血紅細胞臨床需求量預測的最優模型。

表2 B 型血紅細胞模型的參數估計Tab 2 Parameter estimation of ARIMA models for blood group B RBCs
2.3.3 O 型血紅細胞模型的參數估計及假設檢驗 同理, 結果( 表3) 顯示模型ARIMA(3,1,0)(0,1,1)12和ARIMA(3,1,0)(1,1,1)12均未通過白噪聲檢驗(均P<0.05),因此需重新對該模型進行識別。通過殘差分析與擬合優度比較綜合判斷,篩選出最優模型為ARIMA(3,1,0)(1,0,1)12,標準化BIC 值為12.553,平穩的R2=0.581,殘差的ACF 和PACF 均在95%CI 內;Ljung-Box Q 值為12.628,P=0.061,即殘差序列為白噪聲。繼而表明,該模型為O型血紅細胞臨床需求量預測的最優模型。

表3 O 型血紅細胞模型的參數估計Tab 3 Parameter estimation of ARIMA models for blood group O RBCs
2.3.4 AB 型血紅細胞模型的參數估計及假設檢驗 同理,結果(表4)顯示模型ARIMA(3,1,0)(0,1,1)12標準化BIC 值最小,其平穩的R2=0.684,殘差的ACF 和PACF均在95%CI 內;Ljung-Box Q 值為13.621,P=0.478,即殘差序列為白噪聲。因此,該模型為AB 型血紅細胞臨床需求量預測的最優模型。

表4 AB 型血紅細胞模型的參數估計Tab 4 Parameter estimation of ARIMA models for blood group AB RBCs
應用ABO 各血型所建立的模型分別對2016 年7 月—12 月臨床紅細胞需求量進行預測。模型擬合預測時間序列圖(圖4)顯示(以A 型血紅細胞為例),2016 年7 月 —12 月各模型臨床需求量實際值均在預測值95%CI 內;且在2006 年1 月—2016 年6 月,模型的擬合值與實際值的動態趨勢大致相同。以各血型紅細胞臨床需求量的預測值與實際值的平均相對誤差來評價模型的預測效果,結果(表5)顯示A 型、B 型、O 型和AB 型血紅細胞模型MRE 均小于10%(分別為6.78%、2.46%、6.34%和9.23%)。目前,已有大量研究[5-7]表明,模型的MRE 小于10%,則說明其預測效果好且精度高。

圖4 2006—2016 年A 型血紅細胞模型擬合臨床用量及預測臨床需求量結果Fig 4 Results of the clinical usage fitting and clinical demand prediction of blood group A RBCs from 2006 to 2016

表5 ABO 血型臨床紅細胞需求預測模型對2016 年7 月—12 月需求預測結果Tab 5 Results of demand prediction of ABO blood groups of RBCs from July to Decemeber 2016
在重慶,采血模式常以街頭采血為主。但由于夏季持續高溫,街頭流動人口大幅減少,血液的采集量會受到較大影響,致使血液緊缺的現象時有發生;加之目前重慶市尚未建立血液聯動與調配機制,因此確保血液庫存數量充足以及循環有序意義重大。在血液制品中,紅細胞成分血是臨床應用最多的血液成分[8],但保存期限較短(僅21 ~35 d)。近年來,隨著“健康中國”戰略的實施、二孩政策的推行以及社會人口老齡化的加劇,臨床用血剛性需求不斷增長,而加之互助獻血及獻血補償金的取消,使得臨床用血缺口不斷加大,因此科學把握及預測臨床紅細胞用量需求,合理保障血液庫存具有十分重要的現實 意義。
目前,重慶市血液中心對臨床紅細胞需求的預測主要依據采供血機構相關人員通過既往經驗的粗略估計,此方法存在主觀性、隨意性等諸多局限;同時,血液采集受到天氣、人流量、環境等諸多因素的影響,在未對臨床用血需求進行合理及準確把握的情況下進行無償獻血招募采集可能造成供應與需求之間的不匹配,繼而導致紅細胞過期報廢或供應不足等現象的發生。研究[9-10]顯示,ARIMA 模型能將多種因素的綜合效應蘊含于時間變量中,通過反復的識別和修正達到滿意的預測效果。國內的部分研究[11-15]已證實,時間序列分析中的ARIMA 模型可對臨床紅細胞需求量進行預測,可行性較高且優于其他時間序列模型。因此,本研究利用ARIMA 模型對2006 年1 月—2016 年6 月重慶市血液中心臨床紅細胞用量數據進行評估,建立相關模型并進行識別、診斷,最終獲得ABO 各血型紅細胞用量的最優模型;隨后,使用上述模型預測2016 年7 月 —12 月ABO 各血型紅細胞的需求量。結果顯示,各模型2006 年1 月—2016 年6 月的擬合值與實際值的動態趨勢大致相同,2016 年7 月—12 月各模型臨床需求量實際值均在預測值95%CI 內,A 型、B 型、O 型和AB 型紅細胞模型MRE 分別為6.78%、2.46%、6.34%和9.23%;繼而說明各模型的預測精度較高,擬合度較好,適用于重慶市血液中心未來臨床紅細胞需求量的預測。
鑒于各血型血液不可交叉使用的特性,本研究分別對A 型、B 型、O 型及AB 型共4 種血型紅細胞用量建立了需求預測模型,旨在滿足臨床治療所需的同時避免結構性缺血及資源浪費的發生。根據ARIMA 模型預測結果,采供血機構可在庫存緊張或某一血型庫存缺少時,合理制定并開展無償獻血招募計劃,并著重加強對該類血型的采集;而在庫存充足時,該機構可優化各類血型血液制品的使用,優先出庫臨期血液制品,同時還需科學建立區域性血液調配機制以避免血液資源的浪費,最終實現血液庫存的動態管理。
參·考·文·獻
[1] 李晨昕, 滕五曉. 北京市醫療用血短缺的成因及發展趨勢預測[J]. 醫學與社會, 2019, 32(3): 6-9, 13.
[2] 趙磊, 李伍升, 李建斌. 供給側改革背景下以需求為導向的促進采供血創新發展研究[J]. 中國衛生經濟, 2018, 37(5): 36-38.
[3] Luo L, Luo L, Zhang X, et al. Hospital daily outpatient visits forecasting using a combinatorial model based on ARIMA and SES models[J]. BMC Health Serv Res, 2017, 17(1): 469.
[4] 黃國, 朱宇平, 黃煥鶯. 季節性ARIMA 模型在江門市手足口病疫情預測中的應用[J]. 中國衛生統計, 2019, 36(1): 65-67.
[5] 葉柱江, 劉赴平. 時間序列自回歸移動平均模型在臨床紅細胞用量預測中的應用[J]. 中國輸血雜志, 2013, 26(2): 131-134.
[6] 馬曉梅, 徐學琴, 閆國立, 等. 基于ARIMA 模型預測梅毒月發病率的價值[J]. 西安交通大學學報(醫學版), 2018, 39(1): 131-134, 152.
[7] 張麗, 相曉妹, 張水平, 等. 三種預測模型在出生缺陷發生趨勢預測中的可行性研究[J]. 中國衛生統計, 2018, 35(2): 228-231.
[8] 胡曉燕, 王苑, 朱鑫方, 等. 3 228 例臨床用血調查分析及對策探討[J]. 中國輸血雜志, 2015, 28(8): 942-944.
[9] 沈忠周, 王雅文, 馬帥, 等. ARIMA 模型在預測我國乙肝月報告發病數中的應用[J]. 中華疾病控制雜志, 2018, 22(3): 298-301, 307.
[10] Zheng YL, Zhang LP, Zhang XL, et al. Forecast model analysis for the morbidity of tuberculosis in Xinjiang, China[J]. PLoS One, 2015, 10(3): e0116832.
[11] 陳迎春, 王曉霞, 徐曉慶, 等. 自回歸求和移動平均模型對臨床供血量的分析預測[J]. 中國輸血雜志, 2017, 30(10): 1174-1178.
[12] 孫國棟, 李俊霞, 陳慧, 等. 基于時間序列模型的邯鄲地區臨床用紅細胞分析及預測的初步研究[J]. 中國輸血雜志, 2015, 28(11): 1361-1363.
[13] 黃國, 朱宇平, 黃煥鶯. 季節性ARIMA 模型在江門市手足口病疫情預測中的應用[J]. 中國衛生統計, 2019, 36(1): 65-67.
[14] Fanoodi B, Malmir B, Jahantigh FF. Reducing demand uncertainty in the platelet supply chain through artificial neural networks and ARIMA models[J]. Comput Biol Med, 2019, 113: 103415.
[15] Pereira A. Performance of time-series methods in forecasting the demand for red blood cell transfusion[J]. Transfusion, 2004, 44(5): 739-746.