顧 爽, 陳真誠, 張振強, 韓慧茹
(桂林電子科技大學電子工程與自動化學院, 桂林 541004)
根據國際糖尿病聯盟(The International Diabetes Federation,IDF)官網2019年發布的最新糖尿病分布地圖顯示,2019年全球患者大約4.63×108,多數為20~79歲成年患者[1]。在中國,相關患者人數已經高達1.164×108人,在糖尿病相關醫療支出中已經達到了1 090×108美元,給社會帶來了龐大的經濟負擔。考慮到人體生理生化參數之間的聯系,能夠預測建立回歸模型,但由于回歸因子較多,容易使得系數矩陣產生“病態問題”。因此,中外學者采用了Bergman模型進行胰島素-血糖動態研究。近年來,許多非線性的人工智能算法,如反向傳播(back propagation,BP)神經網絡,也開始應用于胰島素的評價預測,但傳統神經網絡算法結構復雜,需要花費大量時間通過反向調整閾值和權重,同時也容易陷入局部最優解陷阱。
極限學習機(extreme learning machine,ELM)是一種單隱含層的前饋神經網絡算法[2],能夠隨機生成隱含參數,不需要多次迭代,在訓練和分類方面存在優勢。將ELM算法模型引入胰島素-血糖相關數據的學習訓練,建立評價預測模型,將實驗得到的結果與搭建的BP神經網絡進行對比,用以驗證ELM模型的準確性,用于糖尿病的輔助診斷研究。
ELM是一種非線性的快速學習算法,通過設置隱含神經元個數,計算輸出矩陣的廣義逆,能夠產生唯一的最優解。而傳統的神經網絡學習過程中需要人為設置大量參數,且在梯度下降過程中容易陷入局部最優解[3]。對于給定樣本集有
{Xi,ti|Xi∈RD,ti∈Rm,i=1,2,…,N}
(1)
L個隱藏節點的單層神經網絡的表達式為

(2)
式(2)中:Wi為隱藏層輸入權重;βi為連接隱藏層和輸出層的輸出權重;bi為隱藏層節點的偏置;gi(x)為激活函數[4]。
對于給定的Wi和βi,為使得ELM輸出最小誤差值,需存在Wi、βi、bi滿足
(3)
可用矩陣表示為
Hβ=T
(4)
式(4)中:H為模型的隱層節點輸出矩陣;β為隱層的輸出權重;T為期望輸出矩陣[5]。
H=
(5)
(6)
(7)

口服葡萄糖耐量實驗是一種廣泛應用于臨床診斷的糖尿病檢測方法,能夠準確評價胰島β細胞功能[7]。此實驗先空腹抽取血清測量胰島素和血糖水平,然后通過口服75 g無水葡萄糖和300 mL水配置的糖水,觀測一段時間內的血糖濃度變化。正常人體的血糖濃度在實驗后60 min左右到達峰值,而后緩慢下降,在120 min后回復至人體正常水準,180 min后略低于人體正常水平。當功能缺失的人體口服相同質量的葡萄糖時,隨時間快速上升,而后緩慢下降,血糖濃度在120 min仍處于較高水平,在180 min依舊無法恢復至正常水平。通過測得的空腹胰島素以及不同時間段的血糖濃度,可依據以下指標評價胰島β細胞功能。
1.2.1 釋放效試驗曲線
釋放效試驗曲線,即為胰島素峰值(IP)與基礎值(IO)的比值[8],其計算公式為
(8)
式(8)中:IP為人體實驗后峰值狀態下的胰島素濃度;IO為人體在空腹情況下的胰島素濃度。
1.2.2 糖負荷后胰島素激增與血糖量的比值
糖負荷后胰島素激增與血糖量的比值是公認的β細胞功能指數,反映糖負荷后第一時間相胰島素的分泌情況[9],其表達式為
(9)
式(9)中:ΔINS30為空腹狀態下到實驗30 min后胰島素濃度的變化量,ΔGLU30表示30 min內血糖濃度的變化量。
1.2.3 胰島素線下面積
胰島素線下面積(area under curve-insulin, AUCI)是評價第二時間相胰島素分泌情況指標,其表達式為
AINS=0.5FINS+INS30+INS60+INS120+0.5INS180
(10)
式(10)中:AINS為胰島素線下面積;FINS為空腹的胰島素濃度;INS30、INS60、INS120、INS180分別對應糖耐量實驗后30、60、120、150 min后的人體的胰島素濃度[10]。
1.2.4 胰島β細胞功能指數
胰島β細胞功能指數(modified β-cell function index, MBCI),用MBCI表示,其計算公式為
(11)
式(11)中:FINS為空腹的胰島素濃度;FPG為空腹時的血糖濃度;PG1h為口服無水葡萄糖1 h后的血糖濃度;PG2h為2 h后的血糖濃度[11]。
胰島素的檢測通常采用酶聯免疫吸附法(enzyme-linked immunosorbent assay, ELISA)[12],仿真數據來自于實驗室合作的具有檢測資質的桂林醫學院附屬醫院內分泌科于2018年1月—2020年1月兩年時間內納入的57例2型糖尿病新診斷患者(type-2 diabetes),將其設置為研究組;另外選擇同一時間段在相同醫院正常體檢結果健康的糖耐量正常人群50例作為參考樣本,設為對照組,參數對比如表1所示。
數據集總共107組完整數據,但由于存在個別信息缺失或者明顯失常數據,故只選用100組完整數據。由表1可以看出,研究組的各項生理指標(HbA1c、FINS、FPG、PG2h)均高于對照組。
原始來源數據中包含了大量無用特征,例如姓名、患者編號、是否吸煙等,對本次實驗來說是無效數據,舍去。將異常值與缺失值預處理后的數據如表2所示。

表1 生理參數對比

表2 預處理后的數據
挑選數據集中的性別、糖化血紅蛋白、空腹血糖濃度、空腹胰島素濃度等14個生理數據作為輸入參數,釋放效試驗曲線、早期胰島素分泌指數、胰島素線下面積、胰島β細胞功能指數4個指標作為輸出參數,由于以上不同數據間的量綱各不相同,需將上述輸入數據進行歸一化,統一量綱再進行結果的預測。
將預處理后的數據利用隨機函數挑選80%作為實驗的訓練樣本,20%作為測試集,利用順序劃分得到80組訓練集數據,20組測試集數據。
實驗在英特爾酷睿i5-6400,16 GB內存,Windows10家庭版的硬件環境,在MATLAB R2017a軟件下對訓練樣本進行仿真測試。
在使用的仿真模型中,采用決定系數與均方誤差兩項指標來評價ELM模型的預測效果。決定系數R2(又稱為擬合優度),反映的是因變量的全部變異能通過回歸關系被自變量解釋的比例[13],R2越接近與1,證明模型的預測結果更好;均方誤差(mean-square error, MSE),反映的是預測結果估計量與實驗被估計量之間的差別結果,數值越接近于0,預測結果更好,計算公式為
(12)
(13)

運用極限學習機對胰島素的4項評價指標進行了結果預測,最終結果如圖1所示,實線的真實值與虛線的預測值差別較小,且從得到的決定系數(R2)及均方誤差(MSE)可知,模型的擬合程度都在0.8以上,說明評價指標的預測和真實值之間有著較好的相關性,且預測準確性較高。

圖1 胰島素預測指標Ripio、DI、AINS、MBCI與期望值對比
BP神經網絡是目前使用最廣泛的網絡模型之一,采用單隱含層的BP神經網絡對釋放效試驗曲線、早期胰島素分泌指數、胰島素線下面積、胰島β細胞功能指數4項輸出指標進行訓練,選擇相同的14個輸入參數,隱含節點選用logsig函數,輸出節點選用tansig函數,使得模型效果達到最佳,輸出結果如圖2所示。

圖2 胰島素預測指標Ripio、DI、AINS、MBCI與期望值對比
ELM模型與BP神經網絡對相同數據集做出的結果對比如表3所示,由表3可知,對于胰島β細胞功能的評價,ELM模型的決定系數R2均高于BP神經網絡,能更好地擬合預測曲線;在均方誤差方面,在DI項的預測結果上ELM的表現不如BP神經網絡,在剩余3項預測結果的表現被ELM反超。

表3 ELM與BP神經網絡性能指標比較
總的來說,極限學習機的模型預測能夠更好符合預測結果,預測性能更優,綜合前文所述,以人體多項生理指標為輸入,胰島素性能評價為輸出的ELM模型的預測性能較高,能較好地對胰島素的評價指標進行預測,更適用于糖尿病的預測研究。
利用同一時間段2型糖尿病患者和健康成人,通過OGTT實驗研究他們的血糖、胰島素變化情況,通過Ripio、DI、AINS、MBCI對胰島素功能進行評價,得出如下結論。
(1)以空腹狀態下的血糖、胰島素濃度以及口服葡萄糖后不同時間段的兩者變化情況作為輸入特征,多次迭代,搭建ELM評價模型,有著較高的分類準確率。
(2)通過對比分析BP神經網絡與ELM模型的胰島素功能評價,發現ELM模型具有較好的泛化作用,預測準確性較高,能對糖尿病患進行識別。
在后續研究中,可考慮利用深度學習方法優化ELM,進一步優化預測結果。