陳海青,賈星玲,陳 靜*,孫 嘉,張 涵
1.鶴壁職業技術學院,河南 458000;2.鄭州大學
肌少癥是與增齡相關的肌肉量減少、肌肉力量下降和(或)軀體功能減退的老年綜合征[1]。肌少癥會導致老年人生活質量下降[2],增加老年人跌倒、住院和死亡的風險[3]。研究顯示,我國社區居民肌少癥的患病率為8.9%~38.8%,80 歲及以上老年人肌少癥患病率則高達67.1%[4]。因此,隨著我國老齡化社會的到來,肌少癥將是我國老年人面臨的重大健康問題。肌少癥起病隱匿,進展緩慢,常以跌倒、失能等嚴重并發癥為首要表現,易被忽視[5]。因此,早期識別和預防至關重要。臨床預測模型是指利用多因素模型估算患有某病的概率或者將來某結局發生的概率[6]。肌少癥臨床預測模型可以幫助醫護人員提前識別可能發生肌少癥的高危老年人,從而制定適當的醫療、護理決策[7]。目前已有數個肌少癥臨床預測模型,但由于各模型構建方法不同、評估指標各異、評估內容不統一,造成了不同的預測結果。鑒于此,本研究對國內外肌少癥臨床預測模型進行總結、分析,以期為臨床實踐和后續模型開發提供參考。
目前,使用最廣泛的肌少癥篩查問卷有肌少癥五條目問卷(Strength、Assistance in Walking,Rise from a Chair,Climb Stairs and Falls,SARC-F)、SARC-F 聯合小腿圍(SARC-F combined with Calf Circumference,SARC-CalF)和微型肌少癥風險評估問卷(Mini Sarcopenia Risk Assessment,MSRA)等。SARC-F 問卷由力量、行走輔助、從椅子上站起來、爬樓梯和跌倒5 個條目組成[8]。多項研究顯示,SARC-F 具有較低的敏感性[9-13],說明該問卷識別肌少癥病人的能力較弱,且有學者認為該問卷中除跌倒史外,其他4 個問題的答案均存在主觀性,結果可能受老年人生活態度及心理因素的影響,導致結果存在偏倚[14]。盡管存在上述局限性,但是考慮到該問卷較為簡單且篩查成本較低,通過評分可以及早發現肌少癥,因此,仍被一些學者推薦用于肌少癥的篩查[15]。2016年,巴西學者Barbosa-Silva等[16]將SARC-F 問卷和小腿圍指標結合形成了SARC-CalF。2020 年,Mo 等[17]的研究結果顯示,基于2 種不同的國際金標準,SARC-CalF 均具有中度敏感性和高特異性,與Yang 等[18]的研究結果一致。MSRA問卷包括MSRA-7 和MSRA-5 2 個版本,MSRA-7 問卷由年齡、體力活動水平、住院、體重減輕、每日膳食數、乳制品消費和蛋白質消費方面相關的7 個條目組成,去除每日膳食數及乳制品消費2 個條目,形成MSRA-5[19]。Yang 等[20]基于4 種國際肌少癥診斷標準,比較了上述問卷在我國養老院277 名老年人中的應用效果,結果顯示,在不同國家金標準下,SARC-CalF的受試者工作特征(ROC)曲線下面積(AUC)最大,表明SARC-CalF 更適用于篩查養老院老年人肌少癥。2020 年,波蘭學者Krzymińska-Siemaszko 等[21]比較了以上4 個問卷在波蘭社區老年人肌少癥篩查中的應用效果,結果也表明,SARC-CalF 篩查肌少癥的能力最強。但該研究認為,肥胖是小腿圍的一個混雜因素,可能會影響SARC-CalF的診斷能力。因此,雖然SARC-F、SARC-CalF、MSRA 是常用的肌少癥篩查問卷,但結果易受老年人生理、心理及生活態度等多種因素的影響,其準確性和客觀性有待進一步考量。
2014 年,日本學者Ishii 等[22]通過調查日本的1 971名功能獨立的65 歲及以上的社區居民,構建了Ishii 評分。根據成本、測量的方便性和設備的可用性來選擇候選變量,模型最終納入了年齡、握力和小腿圍3 個預測因子,并按性別進行了分層,具體計算公式為:男性得分=0.62×(年齡-64)-3.09×(握力-50)-4.64×(小腿圍-42);女性得分=0.80×(年齡-64)-5.09×(握力-34)-3.28×(小腿圍-42),最佳截斷值為男性105 分、女性120 分,男性女性的敏感性分別是84.9%、75.5%,特異性分別是88.2%、92.0%,ROC 曲線下面積分別為0.939,0.909。內部效度評估表明,模型在相似人群中預期良好(男性為0.937,女性為0.907)。2018 年,李敏等[23]應用Ishii 評分對122 例符合標準的社區老年人進行肌少癥評估,結果表明,Ishii評分敏感性為男性88.2%、女性82.3%,特異性為男性73.4%、女性71.0%,ROC 曲線下面積男性為0.917、女性為0.859。2021 年,Chen 等[24]以亞洲肌少癥工作組(AWGS)2019 版肌少癥診斷標準為標準,驗證該模型在社區老年人中的預測準確性,結果顯示,Ishii 評分預測肌少癥的ROC 曲線下面積為0.84,其中女性為0.80~0.89,男性為0.75~0.86。按原始截斷值計算(男性105 分,女性120 分),男性、女性的靈敏度分別為64.94%和46.91%;特異度分別為85.46%和93.22%。在新的截斷值下(男性和女性分別大于95 分和102分),男性、女性的敏感度分別為70.65%和75.31%;特異度分別為81.35%和79.9%。綜上所述,Ishii 評分對于預測社區老年人肌少癥具有較高的預測價值。且模型納入的指標具有客觀、易采集和無創的特點,因此可能是簡單、可行的肌少癥的篩查模型。但由于該模型在不同人群中的截斷值不同,因此未來需要進一步擴大樣本量來確定在我國社區老年人中應用的最佳截斷值。
2021 年,Shafifiee 等[25]調查收集了2 211 名60 歲及以上老年人的數據開發了SarSA-Mod。其中,開發集(n=1 499)和驗證集(n=712),根據測量成本、待測量變量的可行性和可用性以及雙變量分析的結果選擇候選變量,且所有分析均按性別分層,最終納入了年齡、體重和小腿圍3 個預測因子。模型的具體計算公式為:男性得分=(1.4×年齡)-(1.2×小腿圍)-(0.5×體重)-37.42;女性得分=(0.2×年齡)-(1.7×小腿圍)-(體重+92.56)。結果顯示,該模型的ROC 曲線下面積男性為0.82、女性為0.87。男性和女性最佳截斷值分別為-19.07 和-14.19,男性敏感性為85.4%、特異性為64.8%,女性敏感性為84.3%、特異性為76.0%。內部驗證結果:模型的性能在開發和驗證數據集中沒有顯著差異。同時,該研究還比較了模型與SARC-F、SARCF-Calf(31 cm)和SARCF-Calf(33/34 cm) 在總人口中的不同性別的ROC 曲線下面積,結果顯示,SarSA-Mod 的ROC 曲線下面積大,女性為0.88、男性為0.83。表明SarSA-Mod 作為一種簡單、無創、可行的肌少癥預測模型,具有較高的靈敏度和準確性,在篩查肌少癥方面優于SARC-F 和SARC-Calf。但是,目前尚未見SarSA-Mod 模型的臨床驗證,缺乏外部驗證結果的支持,今后尚需擴大樣本量,以驗證其適用性、預測性能及一致性,縮小偏倚,并應用外部驗證結果進一步完善預測模型。
2020 年,臺灣學者Tseng 等[26]通過回顧臺灣健康與福利(TIHW)研究的橫斷面數據,研發了肌少癥風險評分模型。該評分模型通過逐步邏輯回歸分析,將女性、年齡、領取社會救助養老金、缺乏運動、體重過輕、空腹血糖異常、肌酐異常作為風險預測因子。通過計算調整后的比值比來確定每個項目的權重。該模型在測試數據集上進行了驗證,截斷值為76 分,敏感度、特異度和ROC 曲線下面積分別為71.8%、71.1% 和0.757。表明該模型具有良好的敏感性和特異性,其評分結果可以幫助護士指導老年人進行肌少癥的健康教育。但由于個別預測因子需要血液檢驗,這可能限制了模型在社區老年人中的應用。此外,目前也尚未見到該模型的臨床驗證,缺乏外部驗證結果的支持,今后尚需擴大樣本量進行外部驗證,以驗證其適用性、預測性及一致性。
列線圖是臨床預測模型的一種圖形表示形式,被廣泛應用于臨床研究中[27-30]。列線圖模型是基于個體預測變量的數值計算得分,然后根據得分計算某事件或生存概率的風險[31]。2022 年,莫懿晗等[32]通過調查居住在社區的1 050 名老年人的數據構建了肌少癥的列線圖預測模型,分為開發集(n=840)和驗證集(n=210)。通過多變量回歸模型納入了年齡、體質指數、婚姻狀況、體育活動習慣、久坐時間和飲食多樣性等肌少癥影響因素作為預測因子,結果顯示,開發集和驗證集的AUC 分別為0.827 和0.755,開發集的最佳截斷值為0.286,靈敏度和特異度分別為68.1%和82.5%。在驗證集中截斷值為0.224,靈敏度和特異度分別為0.679和0.758,表明該模型具有良好的敏感性、特異性和預測性能,且與其他模型相比,該模型結果可清楚、直觀地呈現,易于理解,且根據預測結果可以對肌少癥進行低、中和高風險的分類,有助于促進肌少癥分級健康管理,因此該模型具有良好的臨床實用性,尤其適合在電腦使用受限的基層社區醫療機構中使用[33]。但由于模型未納入共病、吸煙、飲酒等肌少癥的危險因素,可能限制了模型的預測能力,因此未來需要納入更多的預測因子,進一步提高模型的預測能力。
近年來,隨著互聯網和大數據的發展,利用大數據分析、機器學習算法預測及輔助臨床疾病診斷等方面的研究逐漸成為熱點[34-35],由于機器學習算法在處理復雜數據問題時準確度較高[36],也被研究者用于對肌少癥的預測研究。
2019 年,Kang 等[37]根據韓國國家健康和營養檢查調查收集了4 020 名≥65 歲參與者(男1 698 人、女2 322 人),通過對數據的管理,建立了基于邏輯回歸、支持向量機、梯度增強和隨機森林算法的肌少癥臨床預測模型。結果顯示,男性重要的危險因素是體質指數、紅細胞計數、血尿素氮、維生素D、鐵蛋白、纖維素攝入量、原發性舒張壓、白細胞計數、脂肪攝入量、年齡、谷丙酮轉氨酶、煙酸攝入量、蛋白質攝入量、空腹血糖和水攝入量;女性重要的危險因素是體質指數、水攝入量、白細胞、紅細胞計數、鐵攝入量、尿素氮、高密度脂蛋白、蛋白質攝入量、纖維素攝入量、維生素C 攝入量、甲狀旁腺激素、煙酸攝入量、胡蘿卜素攝入量、鉀攝入量、鈣攝入量、鈉攝入量、維生素A 攝入量和年齡。4種模型的AUC 分別為隨機森林算法男性0.82、女性0.78;支持向量算法男性0.80、女性0.81;梯度提升算法男性女性均為0.81;邏輯回歸算法男性0.82、女性0.80。因此,4 個模型的ROC 曲線下面積在性別上沒有顯著差異。但是該研究未報告外部驗證的結果,而且模型未經臨床應用,且該研究的結果是基于韓國老年人群,考慮到生活習慣、飲食習慣可能會影響研究結果。因此,該模型在我國老年人群中預測性能還需要進一步研究確定。
2022 年,岳益兵等[38]利用5 641 名人員的體檢數據,通過使用K 近鄰的方法填充缺失值,用5 折交叉驗證法,將數據集均分為5 份,其中1 份作為測試集,4 份作為訓練集進行5 折交叉訓練,比較了LightGBM(Light Gradient Boosting Machine)、決策樹、K 近鄰、隨機森林、支持向量機、樸素貝葉斯、人工神經網絡和邏輯回歸8 種機器學習模型在肌少癥預測方面的性能。結果顯示,肌少癥的主要風險因素有12 個,分別為年齡、體重、身高、體質指數、腰圍、臀圍、舒張壓、平均紅細胞血紅蛋白量、高密度脂蛋白、平均紅細胞體積、紅細胞、三酰甘油。在本研究評估的8 種模型中,LightGBM 模型、隨機森林模型和邏輯回歸算法模型在預測肌少癥的總體性能指標方面優于其他模型,測試集ROC 曲線下面積分別為0.979,0.970,0.936。雖然該研究樣本量較大,但研究方法只采用了一種過采樣方法,而過采樣后得到的數據并不是原始的真實數據,對預測結果會有一定的影響。因此該模型存在偏倚風險,未來需要進行外部驗證,以明確模型的預測性能和臨床應用價值。
2021 年,一項納入了68 項研究、涉及98 502 例病人的Meta 分析顯示,社區老年人肌少癥的相關因素包括年齡、婚姻狀況、日常生活活動能力(ADL)、體重不足、吸煙、缺乏體力活動、營養不良/營養不良風險、睡眠時間,獨居、糖尿病、認知障礙、心臟病、呼吸道疾病、骨質疏松癥、骨關節炎、抑郁、貧血等;未明確性別、超重/肥胖、高脂血癥、癌癥、疼痛和腎臟疾病是否與肌少癥相關[39]。此研究中,6 項[22,25-26,32,37-38]研究納入了年齡,5 項[25-26,32,37-38]研究納入了體重/體質指數,2 項[26,32]研究納入了體力活動情況,2 項[22,25]研究納入了小腿圍,2 項[26,37]研究納入了空腹血糖進行分析,其他危險因素包括性別、握力、飲食習慣等。 由此可見,不同模型納入的危險因素不同,每個危險因素在肌少癥中發揮的作用也是不明確的,因此,無法明確危險因素與肌少癥發生風險之間的關系。未來可能需要進一步開發驗證基于多種危險因素的預測模型,以提高模型的預測性能。
從內部驗證分析,6 項[22,25-26,32,37-38]研究進行了內部驗證,內部驗證可減少模型過度擬合,從而得到更為可靠的模型預測準確性評估值。從外部驗證分析,僅1項[22]研究報告了外部驗證結果,外部驗證主要是通過臨床應用評價模型預測性能,并且利用外部驗證新收集的資料和原有累積資料進行分析后重新建模,使模型動態更新,為模型的優化定型和大范圍使用提供基礎。由于未檢索到大部分模型的外部驗證,因此,無法評價預測性能和模型的優劣。未來需要在社區老年人群中進行研究。
國內外報道的肌少癥臨床預測模型均具有較好的預測效能和臨床使用價值,但由于構建模型的人群、統計方法和納入危險因素不同、收集資料受限、缺乏外部驗證,使各種預測模型都有其局限性。醫護人員需結合臨床的實際情況,選擇合適的預測模型進行肌少癥的風險預測。未來在模型構建過程中應當遵循個體預后與診斷預測模型研究報告規范(TRIPOD)[40],納入更多肌少癥生活行為相關的危險因素,為肌少癥的早期篩查與醫療護理決策提供更可靠的理論依據。