高 霞,惠 蓉,張 艷,魯文菊,石雨潤
1.延安大學,陜西716000;2.陜西省人民醫院
2019年國際糖尿病聯盟(IDF)統計,糖尿病是一個影響超過4.63億人的全球公共衛生問題,預計在2045年將達到7億例[1]。糖尿病腎病(diabetic kidney disease,DKD)是由糖尿病引起的慢性腎臟疾病(chronic kidney disease,CKD),主要指腎小球濾過率(GFR)低于60 mL/min或尿白蛋白/肌酐比值(ACR)高于30,持續超過3個月,是糖尿病微血管病變最常見的并發癥之一[2]。近年隨著糖尿病患病率不斷上升,糖尿病腎病也在隨之增加。根據我國2型糖尿病防治指南(2020年版)指出,我國20%~40%糖尿病病人合并糖尿病腎病[3],大約10%糖尿病病人死于腎功能衰竭[4]。由于糖尿病腎病早期無臨床表現,待出現癥狀多為中晚期,這樣不僅會降低病人生活質量,還會增加病人經濟負擔和死亡風險[5]。因此,本研究總結糖尿病腎病風險預測模型現狀,為構建適合我國糖尿病腎病風險預測模型提供科學參考。
根據國內外糖尿病腎病危險因素進行檢索和分析,現將相關結果歸納為以下4個方面。
已在多個糖尿病腎病風險預測模型中參與,研究結果顯示,隨著病程延長,腎臟負擔加重,糖尿病腎病風險會增加[6-7]。
年齡、性別、血壓和體質指數(BMI)等均屬于糖尿病腎病風險預測模型中預測因子[8-9]。有研究指出,收縮壓每增加10~20 mmHg(1 mmHg=0.133 kPa),糖尿病腎病風險就會增加21%[10]。
包括糖化血紅蛋白(HbA1c)、空腹血糖、三酰甘油、總膽固醇、高密度脂蛋白和低密度脂蛋白等[2,8,11-12]。研究表明,隨著糖化血紅蛋白每增加1%,糖尿病腎病風險就會增加17%[13]。
吸煙是糖尿病腎病進展危險因素。研究表明,病人吸煙量越大,糖尿病腎病患病率越高[14]。
國外糖尿病腎病風險預測模型大部分來源于美國、意大利、日本、蘇格蘭等國家[15-18],運用較多的統計學方法是Logistic回歸模型和Cox比例風險回歸模型。近年來,隨著大數據時代到來和統計學方法不斷進步,機器學習技術受到廣泛關注[19]。
Logistic回歸模型是以疾病發生為因變量,影響疾病發生的因子為自變量的一種回歸分析法。它是在危險因素篩選的基礎上構建模型,從而來預測疾病風險。Logistic回歸模型具有簡單易行、預測效果良好優勢,在醫學研究中應用較為廣泛。Afghahi等[20]納入來自瑞典糖尿病登記處3 667例2型糖尿病病人作為研究對象,以白蛋白尿或腎功能損害發展為結局指標,運用Logistic回歸模型分析,結果顯示,年齡、收縮壓、三酰甘油、體質指數、糖化血紅蛋白、吸煙是糖尿病腎病風險因素,其中體質指數和吸煙是腎損害獨立危險因素。這意味著單獨篩查白蛋白尿不是檢測腎功能損害最佳選擇。2019年印度學者Kumar等[21]納入66例糖尿病病人,目的是找出終末期腎病病人因糖尿病腎病引起動靜脈瘺原發性失敗的危險因素,共納入橈動脈可觸及血管壁、橈動脈直徑較小、橈動脈收縮速度峰值(PSV)<45 cm/s和線性橈動脈鈣化4個危險因素,采用Logistic多變量回歸模型進行分析,結果顯示,該預測模型具有良好預測能力,受試者工作特征曲線(receiver operating characteristic curve,ROC)下面積為0.886[95%CI(0.807,0.964)],敏感度為83.9%,特異度為80.0%。進行Bootstrap 1 000人內部驗證,ROC曲線下面積為0.884。綜上所述,Afghahi等[20]研究所建立的預測模型具有良好預測效能,其優點是樣本量大和納入風險因素多,缺點是只包含了5年后隨訪中存活的研究對象,存在選擇偏倚。Kumar等[21]研究的缺點是樣本量小,內部驗證是自舉樣本完成,推薦進行外部驗證。
Cox比例風險回歸模型不僅研究多因素對發病影響,還研究不同時間點發病率或病死率。它對自變量沒有要求,無論是定性資料還是定量資料,可以對多個影響因素及它們的交互作用同時做分析,具有很高實用性,可靈活處理糖尿病腎病混合結局指標。2017年蘇格蘭學者Jenks等[22]運用Cox比例風險回歸模型分析亞臨床心血管危險因素與糖尿病腎病關系,結果顯示高敏肌鈣蛋白T是糖尿病腎病獨立相關危險因素。但還是需要進一步研究,確定高敏肌鈣蛋白T預測價值和臨床效用。2020年芬蘭學者Barlovic等[23]以1型糖尿病病人作為研究對象得出高鞘磷脂水平是糖尿病腎病獨立危險因素,擴展了脂質在腎臟中風險的作用。但目前降脂策略不足以有效解決所有脂質異常問題,還需要進一步了解脂質新療法。有學者利用Cox比例風險回歸模型探索了血紅蛋白濃度[24]、新型尿液生物標志物[25]、肝纖維化生物標志物[26]和視網膜病變[27-28]等風險因素,更是從不同角度豐富了糖尿病腎病風險因素內容。與Logistic回歸模型相比,Cox比例風險回歸模型的優勢在于不僅關注事件本身,還關注時間與事件之間的關系。但截尾數據過多會造成研究結果偏倚,從而在一定程度上限制了Cox比例風險回歸模型的應用。
近年來,隨著大數據技術快速發展,大量數據計算效率的高速提升使得機器學習在醫療領域得到廣泛關注。作為新的建模方法,其優勢在于所建立的模型具有更加準確和科學的預測能力,同時還具有模型自動預測功能。國外有學者運用醫療記錄數據庫數據,通過深度學習、神經網絡等多種方法對 糖尿病腎病病人結局進行預測。2019年Makino等[29]應用大型醫療系統中64 059例糖尿病病人的縱向電子醫療數據,建立180 d糖尿病腎病預測模型,最終預測模型中納入了3 073個變量,在5倍交叉驗證后,預測模型ROC曲線下面積平均值為0.743,分類閾值下的準確性為71%。與臨床試驗相比,機器學習技術不僅可以減少經濟費用和時間,還可以通過成像等數字數據改善糖尿病腎病臨床醫學優勢。但其局限性在于無法從每例病人身上提取數據,只能從醫療記錄中獲取消息,導致數據提取差異很大。因此,需要前瞻性研究證明對糖尿病腎病早期干預,可以預防2型糖尿病病人終末期腎病和心血管疾病。Rodriguez-Romero等[12]對10 251例2型糖尿病病人的22個預測因素分別運用線性回歸、決策樹、隨機森林、樸素貝葉斯分類、簡單邏輯回歸和支持向量機進行預測,對6種預測模型效果進行比較,結果表明,隨機森林和簡單邏輯回歸分析建立的模型(C指數均>0.6)均具有較好預測效果,并確定了8個糖尿病腎病預測因子(腎小球濾過率、尿肌酐、尿白蛋白、血鉀、膽固醇、低密度脂蛋白、尿白蛋白與肌酐比值)。該研究優點是對時間進行分層分析,明確了糖尿病腎病早期和晚期發展預測因子。局限性在于只包含了臨床常規測量因素,建議從不同角度探索糖尿病腎病風險因素。
國內有關糖尿病腎病多因素預測模型采用列線圖模型較多,列線圖模型是建立在多因素回歸分析的基礎上,將多個預測指標進行整合,然后采用帶有刻度的線段,按照一定比例繪制在同一平面上,從而用以表達預測模型中各個變量之間的相互關系,是將復雜的回歸方程,轉變為可視化的圖形,使預測模型的結果更具有可讀性,方便對病人進行評估。2020年Hu等[30]以上海6個社區3 489例2型糖尿病病人作為研究對象,納入收縮壓、舒張壓、空腹血糖、糖化血紅蛋白、三酰甘油、血清肌酐、血尿素氮和體質指數8個危險因素,統計學方面采用多變量邏輯回歸分析開發預測列線圖,列線圖頂端分值線為0~100分,各預測因素通過垂直線在列線圖頂端分值線上取對應分值,再將所有預測因素對應分值相加得到總分,總分為0~450分,若>380分,血尿素氮(BUN)>7.09,糖尿病腎病 發生風險約為80%。ROC曲線下面積為0.744,內部驗證C指數為0.737。隨后在2021年Xi等[8]選取桂林市1 095例2型糖尿病病人作為研究對象,用Logistic回歸分析篩選出糖尿病腎病危險因素,建立預測列線圖模型。結果顯示,C指數為0.819,ROC曲線下面積為0.813。內部驗證C指數為0.796,列線圖模型表現出中等預測能力。綜上所述,Xi等[8,30]均采用多變量邏輯回歸分析開發預測列線圖模型方法建立糖尿病腎病風險預測模型,使臨床醫生和病人可以在生活方式監測和醫療干預方面采取更多必要的措施預防糖尿病腎病的發生。但Hu等[30]研究的樣本量集中于社區,不利于住院病人使用,Xi等[8]研究的模型雖然將炎癥相關指標(嗜中性粒細胞與淋巴細胞比值以及紅細胞分布寬度)納入了風險因素,但還是未將糖尿病腎病所有潛在相關因素納入。二者均缺乏外部驗證,二者的實用性均有待進一步考量。
國內外學者構建了多種適用于糖尿病腎病病人的風險預測模型,這些模型不僅可以根據病人情況進行個體化評估和治療,還可以降低糖尿病腎病篩查和治療成本。但國內外大部分模型尚未進行外部驗證,適用性如何還待進一步驗證。此外,一些模型納入糖尿病腎病的危險因素并不適用,建議我國研究人員對已經開發的模型進行多中心、大樣本驗證。也可借鑒國外研究和結合我國實際情況,進一步探索適合我國糖尿病腎病研究的風險預測模型。