韓俊杰,武迪,陳志勝,肖揚,森干*
1.830017 新疆維吾爾自治區烏魯木齊市,新疆醫科大學醫學工程技術學院
2.830017 新疆維吾爾自治區烏魯木齊市,新疆醫科大學公共衛生學院
3.835099 新疆維吾爾自治區伊犁哈薩克自治州伊寧市,伊犁州疾病預防控制中心
糖尿病腎?。╠iabetic nephropathy,DN)是2 型糖尿?。╠iabetes mellitus type 2,T2DM)患者重要的并發癥之一。根據國際糖尿病聯合會預測,到2030 年世界糖尿病患病率將增至10.2%(約5.78 億人),到2045年將增至10.9%(約7 億人)[1],其中30%~40%的糖尿病患者可發展為DN[2]。由于DN 代謝紊亂較復雜,可能會造成患者腎臟損傷或者功能喪失[3],從而給患者的生活和經濟帶來極大的困擾。因此,對DN 進行早期篩查,對高?;颊叩姆乐尉哂兄卮笠饬x[4-5],也是全球公共衛生事業的重要目標。
對T2DM 患者進行適當的干預可以有效地減少或延遲DN 的發病,尤其是在DN 發病初期進行干預可獲得較好的療效。因此本研究基于醫療數據采用多種預處理的方法清洗數據,采用LASSO 回歸分析DN 可能發生的篩選特征變量,采用多因素Logistic 回歸分析構建列線圖預測模型,篩選出DN 的危險因素,進行DN 的風險預測。采用受試者工作特征(ROC)曲線下面積(AUC)、Hosmer-Lemeshow 校準曲線和決策曲線分析(DCA)對預測結果和臨床實用性進行驗證,從而為DN 的早期診斷和防治提供參考依據。
收集2016 年1 月—2021 年6 月在新疆醫科大學第一附屬醫院住院的5 810 例T2DM 患者的住院資料并進行回顧性分析。納入標準:(1)確診為T2DM 患者;(2)年齡≥18 歲;(3)可以自主溝通,并且無任何精神和心理障礙;(4)自愿簽署知情同意書。排除標準:(1)數據及資料不完整;(2)1 型糖尿病、妊娠期糖尿病及其他特殊類型糖尿病;(3)因泌尿系統感染、急性腎損傷或有腎臟腫瘤等其他原因所致的腎臟損傷;(4)有惡性腫瘤、精神疾病或嚴重的腎臟或肝功能障礙。本研究已獲新疆醫科大學第一附屬醫院倫理委員會批準(批號:K202108-24)。
T2DM 依據《中國2 型糖尿病防治指南(2010 年版)》[6]中的診斷標準;DN 診斷標準為3~6 個月內復查尿白蛋白,3 次結果中至少2 次達到或超過臨界值,且排除感染等其他影響因素。根據是否并發DN 將患者分為DN 組(481 例)和非DN 組(5 329 例)。
一般資料包括年齡、性別、BMI、是否高血壓、舒張壓(DBP)、收縮壓(SBP)和糖尿病病程等?;颊呓?~12 h,于次日清晨空腹取3 mL 肘部靜脈血,以3 000 r/min(離心半徑22 cm)離心10 min,留取血清,采用美國BECKMANDxC800 全自動生化分析儀,對患者白細胞計數(WBC)、血清肌酐(Scr)、總膽固醇(TC)、三酰甘油(TG)、低密度脂蛋白膽固醇(LDL-C)、高密度脂蛋白膽固醇(HDL-C)、載脂蛋白A1(ApoA1)、載脂蛋白B(ApoB)、24 h 尿微量總蛋白(Up)、定性尿蛋白(Upn)和糖化血紅蛋白(HbA1c)等進行測量。
Upn 標準:-表示陰性(尿蛋白<0.1 g/L),+表示尿蛋白為0.2~0.9 g/L,++表示尿蛋白1.0~2.0 g/L,+++表示尿蛋白>2.0 g/L。
采用SPSS 26.0 和R 4.1.3 軟件對收集的數據進行統計分析。符合正態分布的計量資料以(±s)表示,兩組間比較采用兩獨立樣本t 檢驗;不符合正態分布的計量資料以M(QR)表示,兩組間比較采用秩和檢驗;計數資料以相對數表示,兩組間比較采用χ2檢驗。將符合標準的481 例DN 患者和非DN 患者依據性別、年齡(±2 歲)進行1∶1 病例對照匹配。將匹配后的962例患者根據2∶1 比例隨機分為訓練組(n=641)和驗證組(n=321)。以DN 作為結局變量,通過LASSO 回歸篩選出獨立危險因素,并結合多因素Logistic 回歸分析探討和構建列線圖(Nomogram)預測模型。采用AUC驗證預測模型預測效果,ROC 曲線是真實結果與模型預測結果進行比較,以定義真陽性率與假陽性率的函數[7]。AUC 范圍為0.5~1.0,越接近1.0,說明模型的真實性越高;通過Hosmer-Lemeshow 校準曲線檢驗擬合優度[8];DCA 用來評估臨床有效性[9]。以P<0.05 為差異有統計學意義。
5 810 例T2DM 患者中男3 671 例(63.2%)、女2 139 例(36.8%),年齡(57.2±12.1)歲。非DN 組和DN 組患者性別、年齡、BMI、糖尿病病程、WBC、TC、TG、LDL-C、Scr、高 血 壓、SBP、DBP、HbA1c、ApoB、Up、Upn 比較,差異有統計學意義(P<0.05);兩組患者HDL-C、ApoA1 比較,差異無統計學意義(P>0.05),見表1。

表1 非DN 組和DN 組患者一般資料比較Table 1 Comparison of general information between the non-DN group and DN group
使用LASSO 回歸分析,對18 個變量進行非零系數預測變量的篩選(圖1)。在λ 最小值(λ=0.005)和最小值的1 SE(λ=0.035)處分別繪制垂直線,最終選取最小10 倍交叉驗證誤差1 SE 為最優值,并篩選出5個非零系數的預測變量,包括糖尿病病程、TC、Scr、高血壓、Upn。

圖1 使用LASSO 回歸模型篩選預測變量Figure 1 LASSO regression model used to screen the predictor variables
2.3.1 多因素Logistic 回歸分析:以T2DM 患者是否并發DN(賦值:否=0,是=1)為因變量,以LASSO 回歸篩選出的5 個變量糖尿病病程(賦值:實測值)、TC(賦值:實測值)、Scr(賦值:實測值)、高血壓(賦值:否=0,是=1)、Upn(賦值:-=0,+=1,++=2,+++=3)作為自變量構建條件多因素Logistic 回歸預測模型,結果顯示,5 個變量均是T2DM 患者并發DN 的危險因素(P<0.05),其中高血壓患者發生DN 的風險是無高血壓患者的2.174 倍(95%CI=1.517~3.137,P<0.001),見表2。

表2 T2DM 患者并發DN 風險的多因素Logistic 回歸分析Table 2 Multivariate Logistic regression analysis used to analyze the influencing factors of DN in T2DM patients
2.3.2 列線圖繪制:結合分析結果繪制列線圖(圖2),將各變量的分數相加得到總分。通過總分向下繪制一條垂直線可以標出T2DM 患者并發DN 風險的估計概率。以糖尿病病程的中位數(M=10年)、TC的中位數(M=4.14 mmol/L)、Scr 的中位數(M=74 μmol/L)、Upn(++)且患有高血壓為例,總分為128 分,T2DM 患者并發DN 的風險為85%。

圖2 T2DM 患者并發DN 風險的預測列線圖Figure 2 Nomogram for predicting the risk of DN in patients with T2DM
通過ROC 曲線對T2DM 患者并發DN 風險的模型進行區分度評估,結果顯示,訓練組的AUC 為0.866(95%CI=0.839~0.894)(圖3A),驗證組的AUC 為0.849(95%CI=0.804~0.889)(圖3B)。同時,校準度通過Hosmer-Lemeshow 擬合優度檢驗進行評估,結果顯示訓練組最大偏移量(Emax)為0.050,最小偏移量(Eavg)為0.024(P=0.748)(圖4A);驗證組Emax 為0.030,Eavg 為0.014(P=0.986)(圖4B),兩組均通過校準度檢驗。

圖3 列線圖預測模型預測DN 風險的ROC 曲線Figure 3 ROC curve of the nomogram prediction model to predict the risk of DN

圖4 預測模型的Hosmer-Lemeshow 校準曲線Figure 4 Hosmer-Lemeshow calibration curve of the prediction model
采用DCA 評價預測模型在臨床上的有效性(圖5),結果顯示,在當前研究中若患者或醫師的閾值概率介于0.15~0.95,則對所有患者采取干預措施相比,采用此列線圖對DN 的風險進行預測更有利。假定選擇預測概率為60%(高風險閾值為0.6)診斷為DN 并進行治療的患者,那么每100 例使用本列線圖預測模型的患者,大約有50 例(凈收益為0.5)能從中獲益并且不損傷其他人的利益。

圖5 預測模型的DCA 分析Figure 5 DCA analysis of the prediction model
本研究通過LASSO 回歸、多因素Logistic 回歸,篩選T2DM 患者并發DN 的風險因素,建立預測模型。篩選出5 個預測變量包括糖尿病病程、TC、Scr、高血壓和Upn。其次,基于篩選出的獨立風險因素構建列線圖預測模型,并利用AUC、校準曲線Hosmer-Lemeshow和DCA 分析對預測模型的區分度、準確度和臨床有效性進行驗證。結果顯示5 個變量均是T2DM 患者并發DN 風險的影響因素,預測模型有良好的區分能力,同時該模型預測概率與實際概率基本一致,具有較好的校準度。此外,校準曲線在訓練組和驗證組中均顯示了良好的校正能力。凈效益具有可比性。綜上可以看出預測模型在訓練組和驗證組均有具有較強的區分度和預測能力。
本研究采用LASSO 回歸分析方法篩選獨立風險因素,不論因變量的類型如何都可以進行建模預測,通過對所有變量的系數進行回歸懲罰,使相對不重要的自變量系數變為零,從而提高模型的穩定性。通過將Logistic 回歸形式進行轉化,使用列線圖對臨床預測模型可視化[9-11],使用者可以直接從圖中讀取模型預測結局的概率值[12],目前也有大量研究使用機器學習算法改進和訓練Nomogram 預測模型,并將其用于乳腺癌[13]、結腸癌[14-15]等疾病的生存預測。
對預測模型的驗證使用AUC 和DCA。本研究的預測模型訓練組DN 發生風險的AUC 為0.866(95%CI=0.839~0.894),預測模型驗證組DN 發生風險 的AUC 為0.849(95%CI=0.804~0.889)。XI 等[16]構建的DN 風險預測模型共納入10 個指標,其中包括性別、年齡、高血壓、Scr、糖尿病病程、BMI 以及尿氮水平等,其AUC 為0.813(95%CI=0.778~0.848)。本研究排除性別、年齡指標外納入的指標與其相似,但效能相對較優。相比SHI 等[17]構建的預測模型(AUC=0.807,95%CI=0.784~0.830)也具有較好的效能。此外,本研究基于實驗室檢測變量的結果與侯新月等[18](AUC=0.852,95%CI=0.822~0.882)和HUI 等[19](AUC=0.862,95%CI=0.834~0.890)構建的預測模型結果相似。校準曲線Hosmer-Lemeshow 模型擬合良好(訓練組P=0.748;驗證組P=0.986)。DCA 顯示當患者的閾值概率為0.15~0.95 時,使用列線圖預測模型預測DN更有益。
該預測模型提示,對于糖尿病病程較長的T2DM 患者,應盡早采取降壓、降脂、低鹽飲食和改善腎臟功能等措施降低發生DN 的風險。有研究表明,糖尿病病程與DN 的發生、發展有著密切的關系,10 年以上的T2DM 患者會逐漸發展為大量蛋白尿[20-21],發生DN的風險更高。本研究發現,是否患有高血壓是T2DM 患者并發DN 的風險因素,這與BASHIR 等[22]的研究結果相似。田蓉等[23]發現DN 組的SBP 明顯高于無DN 組。原因是當血壓升高時,機體腎血流灌注量增加,損害微血管內皮細胞并進一步加快腎臟微血管病變進程,使T2DM 患者腎臟嚴重受損,DN 發生風險顯著增大[24-25]。有研究發現研究組的尿蛋白和尿微量白蛋白均顯著高于健康組與對照組[26]。根據相關臨床研究顯示,當其腎臟功能嚴重損害后,其大分子蛋白會滲入尿液,導致尿蛋白過高[27-28]。本研究結果也顯示Upn 是T2DM 患者并發DN 的風險因素。根據《中國2 型糖尿病防治指南(2010 年版)》[6],在常規控糖基礎上應行血壓控制可延緩DN 進展。結合以上結果可以發現,高血壓可以加速DN 的尿蛋白析出,這提示T2DM 合并高血壓患者,把血壓控制在125/75 mmHg(1 mmHg=0.133 kPa)左右可以延緩DN 的發生和發展。
有研究發現TC 在腎病發生、發展以及預后的過程中都起著非常重要的作用[29]。本研究發現TC 與DN 發生風險呈正相關,其OR 值為1.260(95%CI=1.109~1.439)。周玉萍等[30]發現糖尿病腎損害不斷加重,Scr、TC 水平逐漸上升,差異有統計學意義(P<0.01)。這是由于TC 等會改變腎小球基底膜磷酸酯成分或改變機體糖代謝而增加腎小球基底膜的通透性,造成腎臟損傷。Scr 與DN 的發生密切相關[31-32],同時也是評估腎臟功能以及診斷DN 的關鍵指標,本研究也發現Scr 與DN 發生風險呈正相關,OR 值為1.008(95%CI=1.004~1.013)。有研究提示腎小球濾過功能出現嚴重損傷時Scr 水平將會升高[33]。
本研究存在一些不足之處。首先,在風險因素的分析上,預測模型未能考慮到T2DM 患者的日常生活環境和飲食習慣等潛在因素,這可能導致某些信息的偏倚或者患者的選擇偏倚,研究結果與真實結果可能產生偏差。其次,本研究是回顧性橫斷面單中心研究,未利用外部驗證對模型的預測效能進行進一步評估。在后續研究中將會借助數據庫的樣本數據對該列線圖進行外部驗證,同時將對不同地區、多中心的大樣本數據進一步驗證,以提升該模型的預測精度和通用性。
綜上所述,本研究發現糖尿病病程、TC、Scr、高血壓、Upn 是T2DM 患者并發DN 的風險因素,建立了T2DM患者發生DN 風險的預測模型,其具有良好的預測能力和臨床實用性,可為臨床醫生及早有效地診斷提供決策依據。治療DN 的關鍵在于控制糖尿病的進展,通過低鹽飲食、降壓、降脂、戒煙、戒酒和定期的醫學檢查等,預防腎臟的進一步損傷,以防止或減少DN 的發生。
作者貢獻:韓俊杰提出研究思路和設計方案,負責論文起草;武迪負責數據整理、清洗、統計學分析及臨床預測模型的構建;陳志勝負責數據采集;肖揚提出對變量篩選的方法,負責數據預處理及論文修改;森干負責研究構思與設計,負責調查對象的選取,對論文負責;所有作者閱讀并修訂了最終稿件。
本文無利益沖突。