




[摘要]" 目的: 開發(fā)一種有效且簡單的工具,用于評估類風濕關節(jié)炎(rheumatoid arthritis,RA)患者發(fā)生骨質疏松癥(osteoporosis,OP)的風險,以便提早進行干預,改善患者的預后和生活質量。方法: 通過回顧性研究,選取2018年1月至2023年6月期間我院RA患者53例及RA合并OP患者44例。收集24個預測因子,采用Lasso、Boruta和SVM-REF算法篩選關鍵預測因子,并使用多變量Logistic回歸建立預測模型。進一步通過KNN及Lightgbm算法對模型進行驗證。結果: 篩選出4個關鍵預測因子:白介素4(IL-4)、總甲狀腺素(TT4)、抗環(huán)瓜氨酸肽抗體(Anti-CCP)和年齡。建立的臨床預測模型C指數(shù)為0.82;ROC曲線下面積為0.821;臨床決策曲線結果顯示,在不損害其他患者利益的情況下,當閾值概率為0.02~0.90時臨床凈獲益水平最高,顯示模型具有良好的預測能力。KNN及Lightgbm結果顯示,ROC曲線下面積均為0.973,PR曲線下面積分別為0.974和0.969。混淆矩陣結果顯示,KNN預測模型敏感度為0.886,特異度為0.962,準確率為0.928,F(xiàn)1值為0.918;Lightgbm預測模型敏感度為0.955,特異度為0.925,準確率為0.938,F(xiàn)1值為0.933。結論: 本研究成功構建了一種針對RA合并OP的臨床預測模型,發(fā)現(xiàn)年齡、Anti-CCP、TT4是高危因素,而IL-4是保護因素。
[關鍵詞]" 類風濕關節(jié)炎;骨質疏松癥;機器學習;Boruta;SVM-REF;臨床預測模型
[中圖分類號]" R593.22" [文獻標志碼]" A" [文章編號]" 1671-7783(2024)05-0377-06
DOI: 10.13312/j.issn.1671-7783.y230324
[引用格式]盧小平,蔡旭,陳新鵬,等. 基于機器學習構建類風濕關節(jié)炎合并骨質疏松患者臨床預測模型[J]. 江蘇大學學報(醫(yī)學版), 2024, 34(5): 377-382.
[基金項目]廣東省中醫(yī)藥管理局中醫(yī)藥科研項目(20221342)
[作者簡介]盧小平(1984—),女,主治醫(yī)師;肖劍偉(通訊作者),副主任醫(yī)師,E-mail: 108812365@qq.com
Construction of a clinical prediction model for patients with rheumatoid arthritis and osteoporosis using machine learning
LU Xiaoping, CAI Xu, CHEN Xinpeng, HONG Yiwei, XIAO Jianwei
(Rheumatology, Shenzhen Futian Hospital for Rheumatic Diseases, Shenzhen Guangdong 518000, China)
[Abstract]" Objective: To develop an effective and straightforward tool for assessing the risk of osteoporosis (OP) development in patients with rheumatoid arthritis (RA), thus early intervention can be facilitated to enhance patient prognosis and quality of life. Methods: A retrospective study was conducted, selecting 53 RA patients and 44 RA patients with concurrent OP treated at our institution from January 2018 to June 2023. Twenty-four predictive factors were collected. Key predictors were identified using the Lasso,Boruta and SVM-REF algorithms, and a predictive model was established using multivariate Logistic regression. Further validation of the model was performed using KNN and Lightgbm algorithms. Results: Four critical predictive factors were identified: IL-4, TT4, Anti-CCP, and age. The developed clinical prediction model exhibited a C-index of 0.82 and an area under the ROC curve (AUC) of 0.821. Clinical decision curve analysis indicated the highest net clinical benefit when the threshold probability ranged from 0.02 to 0.90, demonstrating the model′s robust predictive capability. Machine learning validation revealed that the KNN and Lightgbm models had AUCs of 0.973 and 0.973, respectively, and areas under the PR curve of 0.974 and 0.969, respectively. Confusion matrix results showed the KNN prediction model had a sensitivity of 0.866, specificity of 0.962, accuracy of 0.928, and F1 score of 0.918; the Lightgbm prediction model had a sensitivity of 0.955, specificity of 0.925, accuracy of 0.938, and F1 score of 0.933. Conclusion: This study successfully constructed a clinical prediction model for RA patients at risk of developing OP, and age, Anti-CCP, and TT4 was identified as high-risk factors, while IL-4 as a protective factor.
[Key words]" rheumatoid arthritis; osteoporosis; machine learning; Boruta; SVM-REF; clinical prediction model
類風濕關節(jié)炎(rheumatoid arthritis,RA)是一種以關節(jié)滑膜炎、滑膜細胞增殖、血管翳形成、骨與軟骨破壞為特征的自身免疫性疾病,發(fā)病機制復雜,多種細胞、細胞因子及信號通路都參與了RA發(fā)病。骨質疏松癥(osteoporosis,OP)是一種以骨量降低和骨組織微結構破壞為特征的代謝性骨病。研究發(fā)現(xiàn)[1-3],RA患者骨質疏松和骨密度下降發(fā)生率較健康人群高,其中我國RA患者中約42%合并骨質疏松,而健康人群這一比例為36%。RA患者繼發(fā)OP后不僅增加了治療難度,明顯降低患者生活質量,而且顯著增加骨折后致殘率和死亡率。因而早期識別RA合并OP的高?;颊撸兄诩霸绺深A,改善預后。
本研究的目的是開發(fā)一種有效且簡單的預測工具來評估RA患者出現(xiàn)骨質疏松的風險,從而能夠盡早干預,改善患者預后及生活質量。
1" 資料與方法
1.1nbsp; 一般資料
本研究采用回顧性研究,已通過醫(yī)院倫理委員會審查批準。選取我院2018年1月至2023年6月住院部RA患者53例及RA合并OP患者44例。納入標準:RA患者符合1987年美國風濕病學會(ARA)中的疾病診斷標準;OP患者符合《中國老年骨質疏松癥診療指南(2018)》OP診斷標準。排除標準:近6個月內服用過激素類藥物;合并有惡性腫瘤的患者。
基于既往骨質疏松患者常見的相關危險因素的研究[4-6],收集患者性別(Gender)、年齡(Age)、體重(Weight)及血沉(ESR)、三酰甘油(TG)、膽固醇(CHOL)、低密度脂蛋白膽固醇(LDL-C)、促甲狀腺激素(TSH)、游離甲狀腺素(FT4)、總甲狀腺素(TT4)、游離三碘甲狀腺原氨酸(FT3)、總三碘甲狀腺原氨酸(TT3)、25羥維生素D(25-OH-D)、維生素D2(D2)、血清鈣(Ca2+)、血清磷(P)、抗環(huán)瓜氨酸肽抗體(Anti-CCP)、類風濕因子(RF)、C反應蛋白(CRP)、腫瘤壞死因子α(TNF-α)、白介素10(IL-10)、白介素6(IL-6)、白介素4(IL-4)、白介素2(IL-2)的檢查結果,共收集24項數(shù)據(jù)作為預測因子。
1.2" 特征因子篩選
采用Lasso、Boruta及SVM-REF算法篩選預測因子。首先使用Lasso算法,nfolds設置為10,alpha設置為0.5;SVM-REF算法徑向基核函數(shù)設置為“CV”,交叉驗證次數(shù)為5。Boruta算法doTrace參數(shù)設置為2,最大迭代次數(shù)為60。將3種方法計算得到的結果取交集得到最佳預測因子。
1.3" 構建預測模型
對篩選獲得的預測因子,使用多變量Logistic回歸建立預測模型,同時繪制諾模圖。通過測量C指數(shù)來辨別諾模圖的預測能力,并進行內部驗證(1 000個Bootstrap重新采樣)以計算相對校正的C指數(shù);繪制受試者工作特征(ROC)曲線及校準曲線評估預測模型的性能;繪制臨床決策分析曲線來評估不同閾值概率下的凈收益以確定預測模型的臨床實用性。
1.4" 機器學習驗證模型
使用KNN及Lightgbm對構建的模型進行驗證。超參數(shù)尋優(yōu)隨機網(wǎng)格設置為20。通過ROC曲線、精確率召回率曲線(precision-recall curves,PR曲線)、混淆矩陣、F值驗證模型預測能力。夏普利值可解釋性模型(SHapley Additive exPlanation,SHAP)通過計算模型中各個特征因子的邊際貢獻來衡量其影響大小,進而對黑盒模型進行解釋,本研究利用SHAP方法評估預測模型中各特征因子的相對重要性。
2" 結果
2.1" 預測因子獲取
Lasso篩選得到預測因子6個(Age、Weight、TT4、Anti-CCP、IL-4、TNF-α),Boruta篩選得預測因子10個(Age、ESR、TT4、FT3、25-OH-D、Ca2+、Anti-CCP、CRP、IL-4、IL-2),SVM-REF篩選得到預測因子7個(D2、TNF-α、IL-10、IL-4、TT4、Anti-CCP、Age),見圖1;將3個結果取交集共得到4個預測因子(IL-4、TT4、Anti-CCP、Age)。
2.2" 臨床預測模型
通過多變量Logistic回歸將納入的4個預測因子構建臨床預測模型,通過諾模圖可視化(圖2)。模型C指數(shù)結果為0.82,經(jīng)1 000次Bootstrap內部抽樣驗證證實C指數(shù)為0.86。ROC曲線顯示AUC為0.821(圖3A);校準曲線結果顯示出良好的一致性(圖3B)。臨床決策曲線結果顯示,在不損害其他患者利益的情況下,當閾值概率為0.02~0.90時臨床凈獲益水平最高(圖4)。
以紅色標記為例,Anti-CCP分值為65分,TT4分值為56分,IL-4分值為60分,年齡分值為100分,總分為281,對應的骨質疏松概率為94.6%
2.3" 機器學習驗證模型
KNN及Lightgbm結果顯示,ROC曲線的AUC均為0.973(圖5),PR曲線的AUC分別為0.974和0.969(圖6)。SHAP可視化結果顯示,KNN算法變量重要性依次是年齡、Anti-CCP、TT4、IL-4,Lightgbm算法變量重要性依次是年齡、IL-4、Anti-CCP、TT4,見圖7。與臨床預測模型結果一致?;煜仃嚱Y果顯示,KNN預測模型敏感度為0.886,特異度為0.962,準確率為0.928,F(xiàn)1值為0.918;Lightgbm預測模型敏感度為0.955,特異度為0.925,準確率為0.938,F(xiàn)1值為0.933(圖8)。
3" 討論
RA是一種以慢性、侵蝕性、對稱性多關節(jié)炎為主要臨床表現(xiàn)的自身免疫性疾病。RA可發(fā)生于任何年齡段,隨著年齡的增加其發(fā)病率呈增長趨勢,好發(fā)40~50歲人群,女性發(fā)病率為男性的3~5倍,全球發(fā)病率為0.5%~1.0%[7]。RA的病理學改變是慢性滑膜炎形成的血管翳侵蝕軟骨與骨,這是RA導致關節(jié)破壞的病理基礎。OP是一種以骨量降低和骨組織微結構破壞為特征的代謝性骨病,為RA常見的并發(fā)癥之一。骨質疏松性骨折是RA患者的一個嚴重健康問題。英國一項研究顯示,RA患者髖部骨折的相對危險度(RR)為2.0(95%CI:1.8~2.3),椎體骨折的RR為2.4(95%CI:2.0~2.8)[8]。這些脆性骨折會損害生活質量,并增加醫(yī)療成本和死亡率。韓國國家健康聲明數(shù)據(jù)報告稱,RA患者3年內骨質疏松性骨折的發(fā)生率高于普通人群(17.4% vs. 11.6%)[9]。然而,在臨床實踐中,OP的及時篩查和適當管理仍然不足。美國的一項回顧性研究報告稱,在4.4年內,只有30%的RA患者接受了抗骨質疏松治療[10]。RA合并OP不僅增加了治療難度,明顯降低患者生活質量,而且顯著增加骨折后致殘率和死亡率,加重了家庭和社會的負擔。因而,在RA患者中識別高危OP是臨床實踐中的一個重要問題。
RA合并OP的發(fā)病機制復雜,目前研究發(fā)現(xiàn)多個信號通路、細胞因子、相關藥物治療等多因素參與了RA合并OP的發(fā)病。炎癥因子的過度表達可增加RA患者發(fā)生OP的風險,如IL-6通過糖蛋白130相關的JAK,激活JAK/STAT通路上調核因子-κB受體活化因子配體(RANKL),導致破骨細胞分化,骨吸收增強[11]。TNF-α、IL-1為代表的促炎細胞因子能夠誘導RANKL的表達刺激破骨細胞分化,增強骨吸收,打破骨形成和骨吸收間的平衡。
本研究的主要目的是開發(fā)并驗證一個針對RA合并OP的臨床預測模型,以便早期識別高?;颊卟⒏纳破漕A后。通過綜合分析,我們構建了一個包含IL-4、TT4、Anti-CCP和年齡四個關鍵預測因子的模型,諾模圖的可視化結果顯示,通過年齡、Anti-CCP、TT4及IL-4四個指標進行計算,能夠預測RA患者合并OP的概率。ROC曲線及校準曲線結果顯示該模型具有較高的分類效能。對于機器學習結果,本研究使用了ROC曲線和PR曲線從不同的角度來衡量模型的表現(xiàn)能力,均顯示模型具有較高的分類性能。KNN及Lightgbm通過SHAP可視化顯示在4個變量對模型的貢獻值與諾模圖展現(xiàn)的結果相一致,其中年齡、Anti-CCP、TT4是骨質疏松的風險因素,IL-4是保護因素。兩種機器學習混淆矩陣結果顯示,敏感度及特異度均大于0.850,提示模型能夠較靈敏地預測RA患者出現(xiàn)OP的概率。而兼顧了陽性預測值和敏感度的F1值也均大于0.900,提示模型在預測值和敏感度之間有著良好的平衡。該模型在多個維度上展現(xiàn)了較高的預測性能。Anti-CCP為免疫球蛋白G類抗體,在早期RA患者體內可呈陽性,已被證實與RA的發(fā)生及發(fā)展密切相關[12]。多個研究顯示,Anti-CCP可能與RA患者外周血抗原特異性T細胞的激活有關,可促使機體內產(chǎn)生大量的促炎因子,加劇炎癥反應程度,誘發(fā)骨侵蝕[13-14]。甲狀腺激素(特別是TT4)在骨骼發(fā)育和維持中起重要作用,其水平變化可直接影響成骨細胞和破骨細胞的活性[15-16]。IL-4則通過不同的信號通路,如NF-κB、MAPK信號通路,對成骨細胞和破骨細胞產(chǎn)生復雜的調控作用,既可直接抑制破骨細胞的生成,又可通過影響T細胞、B細胞和巨噬細胞間接調控骨改建過程[17-21]。
綜上,本研究構建了RA合并OP診斷的臨床預測模型,年齡、Anti-CCP、TT4是RA合并OP的高危因素,IL-4是保護因素。本研究模型在簡便性和準確性方面具有優(yōu)勢,易于臨床應用,能夠為醫(yī)生提供快速的風險評估,從而盡早識別RA合并OP的高危患者,有助于及早干預,改善預后,提高患者生存質量。對于模型預測為高危的患者,醫(yī)生可以提前采取預防性治療,如調整藥物方案或增加監(jiān)測頻率。但本研究仍存在不足,主要是納入患者數(shù)量較少,同時未能收集更多數(shù)據(jù)進行外部驗證,需要在接下來的研究中進一步收集數(shù)據(jù)進行驗證。
[參考文獻]
[1]" Adami G, Saag KG. Osteoporosis pathophysiology, epidemiology, and screening in rheumatoid arthritis[J]. Curr Rheumatol Rep, 2019, 21 (7): 34.
[2]" Raterman HG, Bultink IE, Lems WF. Osteoporosis """"in patients with rheumatoid arthritis: an update in epidemiology, pathogenesis, and fracture prevention[J]. Expert Opin Pharmacother, 2020, 21(14): 1725-1737.
[3]" Wysham KD, Baker JF, Shoback DM. Osteoporosis and fractures in rheumatoid arthritis[J]. Curr Opin Rheumatol, 2021, 33(3): 270-276.
[4]" Buttgereit F, Palmowski A, Bond M, et al. Osteoporosis and fracture risk are multifactorial in patients with inflammatory rheumatic diseases[J]. Nat Rev Rheumatol, 2024, 20(7): 417-431.
[5]" Van Staa TP, Geusens P, Bijlsma JW, et al. Clinical assessment of the long-term risk of fracture in patients with rheumatoid arthritis[J]. Arthritis Rheum, 2006, 54(10): 3104-3112.
[6]" Kwon HY, Kim HH, Sung YK, et al. Incidence and mortality of osteoporotic fracture in rheumatoid arthritis in South Korea using nationwide claims data[J]. J Bone Metab, 2019, 26(2): 97-104.
[7]" Tanaka Y. Managing osteoporosis and joint damage in patients with rheumatoid arthritis: An overview[J]. J Clin Med, 2021, 10(6): 1241.
[8]" Amarnath AL, Franks P, Robbins JA, et al. Underuse and overuse of osteoporosis screening in a regional health system: a retrospective cohort study[J]. J Gen Intern Med, 2015, 30(12): 1733-1740.
[9]" Baker R, Narla R, Baker JF, et al. Risk factors for osteoporosis and fractures in rheumatoid arthritis[J]. Best Pract Res Clin Rheumatol, 2022, 36(3): 101773.
[10]" Kareem R, Botleroo RA, Bhandari R, et al. The impact of rheumatoid arthritis on bone loss: Links to osteoporosis and osteopenia[J]. Cureus, 2021, 13(8): e17519.
[11]" Sims NA. The JAK1/STAT3/SOCS3 axis in bone development, physiology, and pathology[J]. Exp Mol Med, 2020, 52(8): 1185-1197.
[12]" Li C, Zhang Y, Song H, et al. Anti-cyclic citrullinated peptide antibody predicts the development of rheumatoid arthritis in patients with undifferentiated arthritis[J]. Chin Med J (Engl), 2019, 132(24): 2899-2904.
[13]" Sulaiman FN, Wong KK, Ahmad WAW, et al. Anti-cyclic citrullinated peptide antibody is highly associated with rheumatoid factor and radiological defects in rheumatoid arthritis patients[J]. Medicine (Baltimore), 2019, 98(12): e14945.
[14]" Stropuviene· S, Baranauskaite· A, Bukauskiene· L, et al. The impact of anti-cyclic citrullinated peptide antibody status on the management of patients with early rheumatoid arthritis: observational study results from Lithuania[J]. Acta Med Litu, 2018, 25(2): 112-123.
[15]" Tsevis K, Trakakis E, Pergialiotis V, et al. The influence of thyroid disorders on bone density and biochemical markers of bone metabolism[J]. Horm Mol Biol Clin Investig, 2018, 35(1): /j/hmbci.2018.35.issue-1/hmbci-2018-0039/hmbci-2018-0039.xml.
[16]" Williams GR, Bassett JHD. Thyroid diseases and bone health[J]. J Endocrinol Invest, 2018, 41(1): 99-109.
[17]" Amarasekara DS, Kim S, Rho J. Regulation of osteoblast differentiation by cytokine networks[J]. Int J Mol Sci, 2021, 22(6): 2851.
[18]" Wu M, Liu J. Inhibitory effect of exogenous IL-4 on orthodontic relapse in rats[J]. Oral Dis, 2022, 28(2): 469-479.
[19]" Takaki H, Ichiyama K, Koga K, et al. STAT6 inhibits TGF-β-mediated Foxp3 induction through direct binding to the Foxp3 promoter, which is reverted by retinoic acid receptor[J]. J Biol Chem, 2008, 283(22): 14955-14962.
[20]" Komatsu N, Win S, Yan M, et al. Plasma cells promote osteoclastogenesis and periarticular bone loss in autoimmune arthritis[J]. J Clin Invest, 2021, 131(6): e143060.
[21]" Sun W, Meednu N, Rosenberg A, et al. B cells inhibit bone formation in rheumatoid arthritis by suppressing osteoblast differentiation[J]. Nat Commun, 2018, 9(1): 5127.
[收稿日期]" 2023-12-21" [編輯]" 何承志