王延年申艷蕊張 旭李全忠賈曉燦方明旺孫長青△
自適應血糖預測模型在低血糖預警中的應用*
王延年1申艷蕊1張 旭1李全忠2賈曉燦3方明旺3孫長青3△
目的基于CGMS提出了一種血糖預測模型和低血糖預警技術。方法利用CGMS采集糖尿病患者的血糖數據,使用卡爾曼濾波對采集的數據進行濾波,減少噪聲干擾;然后依據血糖信號的非平穩性特征,運用自回歸模型(AR)建立血糖預測模型,模型參數由自適應遺忘因子最小二乘法確定,以適應患者的個體差異及自身狀態的變化。結果通過50例血糖數據的臨床驗證,預測模型能動態捕捉血糖變化,預測未來30分鐘的血糖值;且能夠利用建立的自適應血糖預測模型進行低血糖預警,均方根誤差(RMSE)、血糖預測誤差的平方和(SSGPE)分別為6.423、4.409。結論自適應血糖預測模型能有效預測低血糖,具有較好的推廣應用價值。
血糖預測 低血糖警報 非平穩性特征 平滑處理 自適應系統
糖尿病已成為當今社會危害人類健康的重要疾病之一。控制血糖雖然能夠預防或延緩并發癥的發生,但發生低血糖的風險也隨之增加。低血糖會引起腦細胞損傷,甚至昏迷和死亡,因此,及時預測低血糖,尤其是無癥狀性低血糖,在糖尿病治療中十分重要[1]。
CGMS是一種通過葡萄糖感應器監測皮下組織間液的葡萄糖濃度而反映血糖水平的監測技術,借助于埋在臍周皮下的探頭監測葡萄糖濃度,24小時儲存288個葡萄糖值,可持續監測72小時,能揭示常規血糖測定方法所未能顯示的血糖變化及波動趨勢,更為全面、詳細地顯示人體內血糖波動的特征。國內外學者基于動態血糖監測系統(continous glucose monitoring system,CGMS)進行了血糖預測的研究,提出了低血糖預警模型。如:基于神經網絡的預測模型[2]和基于自回歸模型(AR)的血糖預測。
本文擬通過對CGMS采集的血糖數據的時間序列進行分析,根據血糖數據的非平穩特征,采用自適應遺忘因子最小二乘AR模型建立血糖預測模型及低血糖預警技術,為擬定治療方案提供準確依據。
1.資料來源
本文的實驗數據來自河南省人民醫院,使用CGMS采集了964例糖尿病患者的血糖數據,獲取其血糖的波動曲線;實驗過程中,詳細記錄飲食、睡眠、運動、藥物的時間。對采集的血糖數據進行了篩選,原則是:血糖波動曲線連續;有低血糖現象。去除出現斷點的血糖數據105例和未發生低血糖現象的809例,獲取有效實驗數據50例。
2.研究方法
為建立血糖預測模型及低血糖預警技術,本文擬進行以下三方面工作:(1)血糖數據預處理,利用卡爾曼濾波對CGMS的血糖數據序列進行平滑處理,減少噪聲干擾;(2)基于血糖數據的非平穩特征,利用AR算法建立血糖預測模型,參數根據自適應遺忘因子最小二乘法確定;(3)在自適應預測模型基礎上進行低血糖預警。
(1)系統建模
血糖信號具有非平穩性和個體差異性特征。Giurcaneanu CD等[6]針對非平穩信號,研究了遺忘因子最小二乘AR模型的階數選擇、參數估計,為本文進行非平穩血糖信號的預測提供了理論依據。
AR模型通過時間序列變量的自身歷史觀測值反映相關因素對預測的影響,不受模型變量相互獨立的假設條件約束。本文擬采用一種基于自適應遺忘因子最小二乘AR模型預測未來血糖的變化趨勢。其模型可表示為:

式中α1,t…αk,t為模型參數,k為階數,εt是均值為零、方差為σ2的高斯白噪聲。模型的關鍵是獲得階數k和參數序列α1,t…αk,t。
k可以根據改進的AIC準則(最小信息準則)來確定,即尋求模型在不同階數下改進AIC的最小值。此時改進的AIC對應的階數即為建模的階數;參數序列α1,t…αk,t利用遺忘因子λ最小二乘法準則得到[6]。
預測模型應能反映各種因素對患者血糖代謝的影響,本文擬在每個采樣步遞歸調整模型的參數α。此外,為能適應血糖變化的情況,模型中的遺忘因子擬采用開關變量即自適應遺忘因子。
血糖代謝機制處于穩態條件時,常量遺忘因子(λ)最小二乘法能夠提供精確的模型跟蹤;然而,吃飯、運動等因素會引起血糖濃度大幅度波動,此時需要快速的模型跟蹤,因而采取較小的λ值以減少歷史數據對血糖預測值的影響。另一方面,當代謝機制回到穩態時,較小λ值又會導致目前觀測值尤其是其中的誤差影響血糖值的預測,因此本文開關量λ在空腹時采用較大值;在吃飯、運動時采用較小值(變化檢測)。擬采用的自適應算法如方程(2)所示。

血糖預測首先AIC準則確定模型即公式(1)的階數,然后利用自適應遺忘因子最小二乘法確定每個時間步的模型參數α1,t…αk,t,最后用模型預測血糖。
(2)低血糖警報算法
臨床經驗表明,低血糖大多發生在睡眠期間或運動后,前者是由于碳水化合物的攝入不足,后者是由于消耗過多能量。預警系統必須在這些時候能敏感地預測潛在的低血糖。
本文擬在血糖預測模型基礎上建立低血糖早期預警算法,流程圖如圖1所示。算法首先檢查當前的血糖濃度數據,如果低于低血糖閾值(70mg/dl),立即觸發低血糖警報;本研究詳細記錄患者睡眠、運動的時間點,依據患者是否處于睡眠或運動的狀態,設定不同的閾值(100mg/dl、80mg/dl和90mg/dl、70mg/dl)。其中閾值100mg/dl和90mg/dl是為了檢測CGMS設備工作是否正常。如果是睡眠或運動狀態,增加閾值(因為這些狀態下血糖濃度可能會突然大幅度減少),為處理潛在的低血糖事件提供更多的時間。如果血糖值高于設定的閾值,模型預測未來m步的血糖值,當m步的預測值低于閾值時,生成低血糖預警[5]。
(3)數據預處理
由于受設備穩定性和外部因素的影響,CGMS采集的數據會存在干擾,需要進行平滑濾波處理。卡爾曼濾波具有計算量小、實時性高、效果好等優點。Facchinetti等[6]的研究表明,卡爾曼濾波器可以較好地去除CGMS數據信號中的噪聲。本文擬采用卡爾曼濾波對血糖數據進行平滑處理。卡爾曼濾波器的調諧參數Q和R可以改善平滑性,但是平滑的數據與實際值相比會出現一個滯后。Q/R值越大,數據平滑性越小;Q/R值越小,數據越平滑,但滯后越嚴重。這種反比關系解釋了雖然SSGPE、RMSE比較小,但是導致一些漏報從而減少警報系統的靈敏度。為了取得一個滿意的效果,本文Q/R為10-5[5]。

圖1 低血糖早期警報系統流程圖
(4)模型評價
血糖預測模型的性能用以下兩個指標來衡量:
均方根誤差(RMSE)表示預測誤差:

血糖預測誤差的平方和(SSGPE):

一個低血糖事件定義為連續的血糖濃度低于設定的閾值,而不是數據序列的單獨數據點。如果超過兩個連續時間步的血糖濃度低于70mg/dl,則屬于兩個不同的低血糖事件。利用血糖預測模型,在采樣步t預測之后m步的血糖水平是否低于設定的低血糖閾值,如果低于則觸發早期低血糖警報,表示患者在t+m時將出現低血糖。如果t+m時的實測值高于閾值,則認為低血糖警報是誤警,即假陽性(FP);如果低于該閾值,則是真陽性(TP)。如果t時間步沒有發出警報(即沒有預測到低血糖),但在t+m時間步時實際血糖值卻低于閾值,這種情況下稱為假陰性(FN)。
采用Epidata 3.1軟件對50例糖尿病血糖數據進行整理分析;通過Matlab7.0軟件構建自適應血糖預測模型及低血糖預測算法。本文經比較分析,血糖預測模型階數k=3不僅有較高的建模精度,而且能取得較好的預測效果。然后通過自適應遺忘因子最小二乘法確定每個時間步的模型參數。最后用模型即公式(1)預測未來m步的血糖值。
本文利用某2型糖尿病患者的臨床實測數據對預測模型進行了驗證。采集患者72小時(12∶10 am開始)共864個血糖數據,驗證結果如圖2所示,提前6步(30m in)進行血糖預測和低血糖預警;并對預測精準性及警報系統的性能相對于原始數據進行評估。結果顯示,觸發了3個(呈現真陽性(TP))早期低血糖警報,起始時間點為:21∶40、2∶35、5∶45,實際上分別在之后的22∶10、3∶05、6∶15之后出現低血糖癥狀。觸發了一個錯誤警報,時間為20∶05,但是之后的一段時間并沒有低血糖癥狀出現。
為驗證模型的普適性,本文利用篩選的50例患者的數據進行驗證。表1列出了50例患者數據時預測算法的性能。提前6步預測(30min),Nw=4(20min)λ=0.8。遺忘因子在變化檢測的情況下減到0.6。

圖2 一患者提前30分鐘血糖預測及早期低血糖警報性能

表1 50例患者在整個研究算法的預測性能

患者 實際低血糖次數566 28 3 3 0 0 3.829 5.643 29 4 4 0 0 3.843 5.760 30 3 3 0 0 4.947 7.421 31 3 3 0 0 4.536 6.800 32 1 1 0 0 3.450 5.172 33 2 2 0 0 4.232 6.337 34 5 5 0 0 3.934 5.921 35 5 4 0 1 6.675 9.583 36 3 3 0 0 3.519 5.378 37 1 1 0 0 4.335 6.702 38 1 1 0 0 3.617 5.441 39 6 6 0 0 4.525 6.795 40 2 2 0 0 3.203 4.747 41 3 3 0 0 5.087 7.775 42 3 3 0 0 4.142 6.325 43 3 3 0 0 3.519 5.378 44 1 1 0 0 4.983 7.574 45 2 2 0 0 4.412 6.817 46 3 2 0 1 5.371 8.024 47 4 4 0 0 4.247 6.370 48 5 5 0 0 3.448 5.172 49 3 3 0 0 5.040 7.506 50 3 3 0 0 2.997 4.495總和142 136 6 6--平均----4.409 6.TP FP FN SSGPE RMSE 24 1 1 0 0 3.713 5.423
如圖3、4所示,本模型的RMSE、血糖預測誤差的平方和(SSGPE)均小于傳統的AR預測模型[6],預測精度較高,可以用于預測患者血糖濃度。通過50例實驗數據驗證,該模型比傳統的AR預測模型較穩定。

圖3 自適應AR模型與傳統AR模型SSGPE指標對比

圖4 自適應AR模型與傳統AR模型RMSE指標對比
糖尿病患者經常存在過度治療而導致低血糖癥的情況。自適應血糖預測模型可以有效檢測低血糖事件,對糖尿病的管理是非常有用的。早期的低血糖警報可以提前預測低血糖,為醫生及患者采取行動提供足夠的時間。因此,我們建立的預測模型和低血糖報警方法具有較好的應用價值。
由于設備和外部因素的影響,CGMS采集的數據中存在噪聲影響預測的精準性,所以數據應先進行平滑處理;AR模型算法便捷,且具有較高的預測精度。預測時間范圍和低血糖的閾值是影響低血糖預警算法性能的主要因素。通過降低預測時間范圍可以提高低血糖警報的靈敏度,但為了確保有足夠的時間,以采取預防措施(如食物攝入量等)避免低血糖,預測時間范圍應盡可能的長。此外,低血糖閾值的選取也影響著警報的性能。如果增加閾值,將有利于提高靈敏度,但會降低特異性,所以對預測時間范圍和低血糖閾值的設置應全面考慮。本文提出該模型提前30分鐘進行血糖預測和低血糖閾值設置為70mg/dl[7]。我們使用一患者的數據進行驗證,觸發了3個早期低血糖警報、1個錯誤警報表明自適應模型可以有效預警低血糖,并且可以準確地預測血糖濃度的趨勢。此外,通過50例患者的數據進行驗證,與傳統的AR預測模型相比,均方根誤差和SSGPE相比均較小,表明所提出的模型更準確。
綜上所述,本研究提出的模型和報警方法能成功地預測未來血糖值,并提供足夠的時間為患者采取行動,以避免低血糖,具有較好的推廣應用價值。在實際工作中,可以把影響血糖的其它因素如運動,飲食等添加到模型參數中,以進一步提高預測的準確性。
1.劉群英.3068例糖尿病住院病人統計分析.中國衛生統計,2013,30(2):310.
2.Zecchin C,Facchinetti A,Sparacino G,et al.A new neural network approach for short-term glucose prediction using continuous glucosemonitoring time-series and meal information.Engineering in Medicine and Biology Society,EMBC,2011 Annual International Conference of the IEEE,2011,5653-5656.
3.Giurcaneanu CD,Razavi SA.AR order selection in the case when the model parameters are estimated by forgetting factor least-squares algorithms Signal Processing,2010,90(2):451-466.
4.Eren-Oruklu M,Cinar A,Rollins DK,et al.Adaptive system identification for estimating future glucose concentrations and hypoglycem ia alarms.Automatica,2012,48(8):1892-1897.
5.Turksoy K,Bayrak E S,Quinn L,etal.Hypoglycem ia Early Alarm Systems Based on Multivariable Models.Industrial&engineering chem istry research,2013,52(35):12329-12336.
6.Facchinetti A,Sparacino G,CobelliC.An online self-tunablemethod to denoise CGM sensor data.Biomedical Engineering,IEEE Transactions on,2010,57(3):634-641.
7.中國2型糖尿病防治指南(2010年版).中國糖尿病雜志,2012,20(1):S18-S19.
(責任編輯:丁海龍)
河南省科技攻關計劃項目(132102310191);鄭州市科技攻關項目(131PPTGG409-8)
1.鄭州大學信息工程學院(450001)
2.河南省人民醫院(450003)
3.鄭州大學公共衛生學院(450001)
△通信作者:孫長青,E-mail:suncq@zzu.edu.cn