









摘要:目的" 分析MRI影像組學對前交叉韌帶損傷分級的診斷價值。方法" 回顧性選擇2017~2022年濱州醫學院附屬醫院放射科質子加權成像提示前交叉韌帶異常信號患者212例,以關節鏡檢查結果為金標準,將患者分為重度損傷組(n=141)和輕度損傷組(n=71)。提取前交叉韌帶圖像的組學特征包括形狀特征、一階特征、紋理特征和小波特征。通過SMOTE法進行過采樣,解決數據不均衡問題。通過組內及組間相關系數進行一致性檢驗。在兩組中通過7:3的比例隨機分割為訓練集和測試集。并用LASSO算法篩選出最佳影像組學特征,采用Logistic回歸建立組學模型。基于影像組學特征建立影像組學模型,基于兩組的臨床參數建立臨床模型,以及聯合兩者建立Nomogram模型。分別在訓練集及測試集繪制ROC曲線,計算敏感度、特異性、準確度評估模型的診斷效能,通過繪制校準曲線來評估模型預測值和實際觀測值之間的差異,通過繪制臨床決策曲線分析評價其臨床有效性。結果" 通過特征提取在質子加權成像橫斷位、冠狀位、矢狀位共獲得2553個特征,通過特征篩選及降維最終保留12個特征參數。影像組學模型訓練集的曲線下面積(AUC)為0.9105,測試組為0.8561。性別、關節不穩、關節交鎖以及組學積分是診斷前交叉韌帶重度損傷的最佳特征集。臨床模型訓練集的AUC值為0.6989,測試組為0.6415。Nomogram模型訓練集的AUC值為0.9449,測試組為0.8661。Nomogram模型與臨床模型差異有統計學意義(Plt;0.05),Nomogram的AUC高于組學模型,但在測試集差異無統計學意義(Pgt;0.05)。結論" 基于MRI的影像組學方法可為診斷前交叉韌帶損傷分級提供一種新型的檢測手段,使前交叉韌帶損傷的臨床診斷準確率得到很大提升,Nomogram模型比臨床模型以及組學模型的診斷效能更好。
關鍵詞:MRI;影像組學;前交叉韌帶損傷;分級
Application of MRI radiomics in classification diagnosis of anterior cruciate ligament injury
CHENG Lin1, 2, LI Yifan2, HOU Zenghao2, DU Jinhao2, ZHANG Xuanyu2, MA Zhiying2, WANG Shanshan1, 2
1Department of Radiology, Binzhou Medical University Hospital, Binzhou 256603, China; 2School of Medical Imaging, Binzhou Medical University, Yantai 264003, China
Abstract: Objective To analyze the diagnostic value of MRI radiomics in the classification of anterior cruciate ligament (ACL) injury. Methods A total of 212 patients with abnormal signals of the ACL suggested by proton density weighted imaging in the Department of Radiology of the Affiliated Hospital of Binzhou Medical University from 2017 to 2022 were reviewed. The parents were divided into severe injury group (n=141) and mild injury group (n=71) based on arthroscopic findings, which was the gold standard in the classification of ACL injury. The radiomics features of the ACL images were extracted including shape features, first order features, texture features and wavelet features. The imbalance problem of data was solved by performing oversampling using SMOTE method. Consistency test was performed by intra-group and inter-group correlation coefficients. Patients were randomly divided into a training set and a test set at 7:3. The best radiomics features were selected by LASSO algorithm, and the radiomics model was established by Logistic regression. The radiomics model was established based on the radiomics features and the clinical model was established based on the clinical parameters of the two groups. The Nomogram model was established by the radiomics features and the clinical parameters as mentioned above. The diagnostic efficacy of the model was evaluated by ROC curves, sensitivity, specificity and accuracy in the training set and the test set. The difference between the model's predicted values and the actual observed values was evaluated by the calibration curve, and the clinical efficacy was evaluated by the clinical decision curve analysis. Results A total of 2553 features were obtained from proton density weighted imaging transverse, coronal and sagittal positions through feature extraction, and 12 feature parameters were retained through feature filtering and dimensionality reduction. The area under the curve (AUC) was 0.9105 for the training set of the radiomics model and 0.8561 for the test set. The best feature sets of diagnosing severe ACL injury were gender, joint instability, joint interlock and radiomics. In the clinical model, the AUC values of the training set was 0.6989 and the test set was 0.6415. In the Nonogram model, the AUC values of the training set was 0.9449 and the test set was 0.8661. The difference between the Nomogram model and the clinical model was statistically significant (Plt;0.05). The AUC of the Nomogram was higher than that of the radiomics model, but the difference was not statistically significant in the test set(Pgt;0.05). Conclusion The radiomics method based on MRI images can provide a new diagnostic method in classification of ACL injury which can greatly improve the clinical diagnosis accuracy of ACL injury. Furthermore, the diagnostic efficiency of the Nomogram model is the best compared with the clinical model and the radiomics model.
Keywords: MRI; radiomics; anterior cruciate ligament injury; classification
收稿日期:2023-10-25
基金項目:國家級大學生創新訓練項目(202310440234)
Supported by National Undergraduate Training Program for Innovation (202310440234)
作者簡介:程" 琳,在讀碩士研究生,E-mail: 2497456895@qq.com
通信作者:王山山,博士,副教授,E-mail: wss3256590@126.com
前交叉韌帶(ACL)在膝關節前向穩定性中發揮著至關重要的作用[1-2],美國每年發生ACL損傷的人數超過25萬人,其發病率在運動活躍個體中更高[3]。韌帶損傷程度對治療方案的選擇和改善預后至關重要[4]。目前,部分學者研究僅基于影像組學特征建立組學模型診斷ACL損傷程度,未加入臨床特征建立臨床模型及聯合診斷模型[5],本研究主要應用基于MRI圖像建立組學模型、基于臨床特征建立臨床模型以及聯合兩者建立Nomogram模型,將三者進行對比研究,選擇最優模型建立診斷指標,提高ACL損傷診斷的準確性。
1" 資料與方法
1.1" 一般資料
收集本院放射科212例經膝關節MRI檢查質子加權成像(PDWI)提示ACL異常信號患者的影像學資料。納入標準:行3.0T MRI平掃檢查PDWI上提示ACL異常信號;已進行關節鏡檢查;臨床資料完整;認知狀態良好,能夠配合完成相應的MRI檢查。排除標準:既往曾有同側韌帶手術史;患側膝關節有類風濕及骨性關節炎、膝關節復雜骨折、惡性腫瘤、膝關節手術史以及其他影響膝關節癥狀、體征的疾病;嚴重心肝腎疾病;MRI檢查禁忌證。采集患者的臨床資料即年齡、性別、外傷史以及有無關節不穩、關節交鎖、間歇性跛行、關節疼痛、蹲起困難等臨床表現。根據患者關節鏡檢查結果將患者分為重度損傷組(n=141,包括完全撕裂及撕裂gt;1/2者)和輕度損傷組(n=71,包括撕裂lt;1/2及未撕裂者)。本研究已通過濱州醫學院附屬醫院倫理委員會批準(審批編號:202311070814000324347)。
1.2" 檢查方法
利用3.0T磁共振儀,患者采取仰臥位,患側膝關節保持自然伸直狀態。掃描序列:PDWI矢狀位:TR 2400 ms、TE 31 ms、FOV 160 mm、層厚3 mm、層間距0.3 mm。冠狀位:TR 2710 ms、TE 35 ms、FOV 160 mm、層厚3 mm、層間距0.3 mm。橫斷位TR 2850 ms、TE 31 ms、FOV 160 mm、層厚3 mm、層間距0.3 mm。
1.3" 韌帶勾畫
使用3D slicer軟件(Version5.1.0,https://www.slicer.org),逐層手動分割感興趣區域(ROI)。為了評估觀察者組內相關系數(ICC)即特征提取工作的一致性,首先隨機選擇30例患者的圖像,由2位放射科醫師(醫師A、醫師B)在PDWI圖像手動分割韌帶提取ROI,并且由醫師A完成剩余182例患者ROI提取工作;間隔1周后,由醫生A再次勾畫隨機選取的30例患者圖像。
1.4" 特征選擇
使用3D slicer提取影像組學特征。采用預處理的方法對PDWI圖像進行規范化處理。將像素重采樣為標準尺寸1 mm×1 mm×1 mm,使用三線插值方式實現標準化。灰度值離散化為常規的25二進制寬度。自動提取橫斷位、矢狀位、冠狀位ROI中的特征。最初提取的特征中有許多是無意義的,因此采用ICC對勾畫的影像組學特征進行一致性評價,選擇一致性良好(ICCgt;0.75)的特征。然后采用最小絕對收縮與選擇算子(LASSO)回歸,以10倍交叉驗證法選擇調整參數λ,篩選出與韌帶損傷程度有關的特征參數。
1.5" 處理不平衡類數據
因重度損傷組和輕度損傷組樣本不均衡,建模樣本的不均衡會導致樣本量少的特征標簽信息過少,在模型訓練過程中很難提取出相應的特征分布規律,從而易造成模型過擬合等問題,故采取SMOTE法過采樣合成少數類標簽樣本,以此來解決樣本量不均衡的問題[6-7]。
1.6" 模型構建
根據保留的臨床特征建立臨床模型;基于每個方位最重要的組學特征構建影像組學模型;聯合臨床模型和影像組學模型建立Nomogram模型。
1.7" 統計學分析
使用Python3.11軟件對數據進行SMOTE法過采樣。使用R4.3.1軟件分別進行組內相關一致性檢驗、影像組學特征的篩選降維、各個模型的效能評估;繪制Nomogram、校準曲線及決策曲線;采用ROC曲線下面積(AUC)來評估組學模型、臨床模型及Nomogram模型的效能,采用約登指數計算模型的敏感度、特異性及準確度;校準曲線評估Nomogram模型預測值和實際觀測值之間的差異,決策曲線評價模型的臨床有效性。以Plt;0.05為差異有統計學意義。
2" 結果
2.1" 特征提取和篩選
從PDWI圖像橫斷位、矢狀位、冠狀位中共提取2553個特征,其中形狀特征有42個,一階特征有54個,紋理特征有225個,小波特征有2232個。消除ICClt;0.75的769個特征,最終通過LASSO算法篩選出12個影像組學特征(圖1),包括橫斷位相關紋理特征7個,矢狀位相關紋理特征4個,冠狀位相關紋理特征1個(圖2)。計算每位患者的影像組學積分。
采用多變量Logistic回歸逐步向后篩選法,分析得出關節不穩+關節交鎖+性別+影像組學積分為AIC最小的特征集。
2.2" 模型診斷效能評估
組學模型顯示,訓練集與測試集各自的AUC分別為0.9105、0.8561(圖3),訓練集特異性為0.939、敏感度為0.718、準確度為0.839,測試集特異性為0.809、敏感度為0.844、準確度為0.827;Nomogram模型訓練集的AUC為0.9449,測試集的AUC為0.8661(圖4),訓練集特異性為0.85、敏感度為0.930、準確度為0.887,測試集特異性為0.795、敏感度為0.837、準確度為0.816;臨床模型訓練集AUC為0.6989,測試集AUC為0.6415(圖6)。Nomogram模型在訓練集及測試集的校準曲線顯示,校準預測曲線與標準曲線貼合可,提示Nomogram在診斷ACL損傷程度的預測概率與實際概率具有良好的一致性(圖7)。決策曲線分析顯示Nomogram模型的診斷效能均明顯高于組學模型和臨床模型(圖8)。
利用De-long檢驗對比臨床模型與Nomogram的診斷效能,訓練集和測試集的差異均有統計學意義(Plt;0.05,表1)。Nomogram的AUC值高于組學模型,但在測試集差異無統計學意義(Pgt;0.05,表2)。Nomogram診斷ACL損傷程度優于組學及臨床模型。
3" 討論
ACL損傷現已成為膝關節最常見的韌帶損傷[8],ACL損傷后如不及時準確診斷、治療可能會造成一系列的并發癥[9-12]。目前診斷ACL損傷的方法主要包括膝關節的體格檢查、影像學檢查及關節鏡檢查等。關節鏡目前作為診斷ACL損傷的“金標準”,但其屬于有創性檢查,存在一定的手術及麻醉風險以及經濟負擔。MRI目前是診斷ACL損傷的首選[13-17]。MRI將ACL損傷主要分為4級[18-19],但MRI診斷ACL損傷分級有相對局限性[20-21],當ACL水腫、滑膜內有出血、老年患者ACL退變、或合并其他損傷以及韌帶周圍的脂肪組織產生部分容積效應等原因可能使韌帶損傷分級困難或不能準確分級。影像組學為可挖掘的數據,從中提取大量、深層、定量的疾病影像特征。
有研究納入26例ACL撕裂、42例ACL未撕裂患者,采用t檢驗和LASSO方法進行特征選擇,采用隨機森林和支持向量機作為機器學習分類器,采用ROC曲線敏感度、特異性、準確性和AUC值評估模型,結果發現采用LASSO選擇方法與隨機森林分類器的模型性能更好[5]。本研究與既往研究相比,研究對象的納入包括單純損傷但未撕裂、撕裂lt;1/2、撕裂gt;1/2、完全撕裂,按ACL損傷程度分為輕度和重度,能較好地指導臨床制定治療方案[22-25]。在提取組學特征基礎上納入了臨床特征,分別構建基于組學特征的影像組學模型、基于臨床特征的臨床模型以及聯合組學特征和臨床特征的Nomogram模型。采用校準曲線評估Nomogram模型預測值和實際觀測值之間的差異、決策曲線評價模型的臨床有效性以及De-long檢驗對比臨床模型、Nomogram模型、組學模型三者之間的診斷效能。
本研究通過預實驗,分別采用Logistic回歸、Adaboosting、隨機森林、XGBoost算法建立診斷模型。Logistic回歸訓練速度快、模型解釋性好、適合二分類問題可直接對分類可能性進行建模但對多重共線性數據較為敏感、很難處理數據不均衡的問題[26]。隨機森林能夠處理高維度的數據且不用做特征選擇、訓練速度快但在某些噪音較大的分類問題上易過擬合。Adaboost是一種很高精度的分類器,不易過擬合,但數據不平衡會導致分類精度下降。XGBoost算法靈活性強、可防止過擬合但不適合處理高維特征數據[27]。預實驗結果表明,Logistic回歸算法在診斷ACL損傷方面效果更好。故本研究采用Logistic回歸建立診斷模型,用以診斷ACL損傷程度。
通過多因素Logistic回歸篩選出性別、關節交鎖及關節不穩為診斷ACL損傷程度的最佳臨床特征,本研究顯示男性易提示為ACL重度損傷,可能是因為病例篩選時導致結果偏倚,或者是因為男性職業特殊性導致ACL損傷程度更加嚴重。由于ACL在維持膝關節的前向穩定性以及參與膝關節伸膝時最后鎖扣運動中發揮重要作用,因此ACL重度損傷者關節不穩和關節交鎖的癥狀可能越明顯。
本研究顯示,與ACL損傷程度相關的組學特征主要體現在紋理特征方面。基于影像組學標簽對診斷ACL損傷程度具有較好的準確性。結合影像組學標簽、性別、有無關節不穩和關節交鎖構建的Nomogram模型進一步提高診斷性能。
綜上所述,基于MRI的影像組學方法可為診斷前交叉韌帶損傷分級提供一種新型的檢測手段,使前交叉韌帶損傷的臨床診斷準確率得到很大提升,Nomogram模型比臨床模型以及組學模型的診斷效能更好。本研究創新點在于利用Logistic回歸建立診斷模型,可以準確診斷ACL損傷分級,幫助臨床醫生制定治療方案及預后策略,減少患者不必要的檢查,有望提供一種新的無創性診斷ACL損傷的手段。但該研究樣本量較少,本研究團隊下一步將增大樣本量,并采用多中心研究,進行診斷模型的推廣。
參考文獻:
[1]" " 李長樹, 李" 政, 李" 靂, 等. 膝前交叉韌帶斷裂合并內側副韌帶Ⅲ度急性損傷一期聯合修復重建的短期臨床療效研究[J]. 中國中醫骨傷科雜志, 2023, 31(2): 18-23.
[2]" "Kokkotis C, Moustakidis S, Tsatalas T, et al. Leveraging explainable machine learning to identify gait biomechanical parameters associated with anterior cruciate ligament injury[J]. Sci Rep, 2022, 12(1): 6647.
[3]" " 金偉林, 程亞棟, 曾冠楠, 等. 前交叉韌帶斷裂損傷后并發關節軟骨損傷的相關因素研究[J]. 創傷外科雜志, 2020, 22(8): 588-91.
[4]" " 向珊珊, 傅" 明, 張志奇, 等. 關節鏡下自體或同種異體肌腱移植修復急性和陳舊性前交叉韌帶損傷: 重建效果評價[J]. 中國組織工程研究, 2018, 22(26): 4174-8.
[5]" Chen DS, Wang TF, Zhu JW, et al. A novel application of unsupervised machine learning and supervised machine learning-derived radiomics in anterior cruciate ligament rupture[J]. Risk Manag Healthc Policy, 2021, 14: 2657-64.
[6]" "Awan MJ, Mohd Rahim MS, Salim N, et al. Machine learning-based performance comparison to diagnose anterior cruciate ligament tears[J]. J Healthc Eng, 2022, 2022: 2550120.
[7]" " 王曉暉, 呂曉爍, 劉" 展, 等. 基于影像組學構建識別臨床高風險頸動脈斑塊的機器學習模型[J]. 中國胸心血管外科臨床雜志, 2024, 31(1): 24-34.
[8]" " 劉廣鑾, 郭宗磊, 戈" 進, 等. 前交叉韌帶損傷伴發內側半月板后根撕裂:解剖學的危險因素分析[J]. 中國組織工程研究, 2023, 27(5): 663-8.
[9]" " Kim HJ, Lee JH, Lee DH. Proprioception in patients with anterior cruciate ligament tears: a meta?analysis comparing injured and uninjured limbs[J]. Am J Sports Med, 2017, 45(12): 2916-22.
[10] Samuelsen BT, Webster KE, Johnson NR, et al. Hamstring autograft versus patellar tendon autograft for ACL reconstruction: is there a difference in graft failure rate? A meta-analysis of 47, 613 patients[J]. Clin Orthop Relat Res, 2017, 475(10): 2459-68.
[11] Nasseri A, Khataee H, Bryant AL, et al. Modelling the loading mechanics of anterior cruciate ligament[J]. Comput Methods Programs Biomed, 2020, 184: 105098.
[12]" O'Sullivan O, Ladlow P, Steiner K, et al. Knee MRI biomarkers associated with structural, functional and symptomatic changes at least a year from ACL injury - A systematic review[J]. Osteoarthr Cartil Open, 2023, 5(3): 100385.
[13]" 段壽生, 陳用國. MRI對膝關節交叉韌帶損傷的診斷價值研究[J]. 浙江創傷外科, 2023, 28(6): 1154-6.
[14]" "梁繼華, 梁小瑜. 磁共振成像技術診斷膝關節前交叉韌帶斷裂的準確率分析[J]. 影像研究與醫學應用, 2022, 6(24): 173-5.
[15]" 王海杰, 高明勇, 涂" 濱. 超聲與MRI檢查對前交叉韌帶損傷診斷的對比研究[J]. 中國超聲醫學雜志, 2020, 36(7): 651-3.
[16]" "孫小煜, 宋" 璐, 張雪峰, 等. 應用MRI、MSCT檢查在外傷性膝關節交叉韌帶損傷診治中臨床價值研究[J]. 中國CT和MRI雜志, 2021, 19(9): 180-2.
[17]" 王" 忠, 文" 明, 劉成渝, 等. 高分辨率CT診斷膝關節半月板及交叉韌帶損傷的價值觀察[J]. 中國CT和MRI雜志, 2022, 20(12): 153-5.
[18]" "向作林, 吳國彪, 譚必會, 等. 磁共振成像技術在膝關節前交叉韌帶損傷中的應用[J]. 現代醫用影像學, 2023, 32(7): 1234-6, 1250.
[19]" 王文河, 陳" 偉, 李克軍. 前交叉韌帶損傷的MRI征象分析[J]. 影像研究與醫學應用, 2020, 4(7): 53-4.
[20]" Van DP. Pitfalls in MR imaging of acute anterior cruciate ligament injuries[J]. Knee Surg Sports Traumatol Arthrosc, 2020, 28(11): 3622-4.
[21]" 柏" 瑞, 黃俊成, 何小華, 等. 低劑量雙能量CT診斷膝關節前交叉韌帶損傷的臨床對照分析[J]. 中國CT和MRI雜志, 2022, 20(10): 157-9.
[22]" 牛金榜. 健美操運動員前交叉韌帶損傷的康復方案研究: Ⅰ度損傷的保守治療[J]. 體育科技文獻通報, 2020, 28(2): 150-1, 154.
[23]" "謝羽婕, 季玉秀, 張" 馳. 前交叉韌帶損傷診治策略[J]. 西南醫科大學學報, 2023, 46(6): 483-8.
[24]" Stone AV, Marx S, Conley CW. Management of partial tears of the anterior cruciate ligament: a review of the anatomy, diagnosis, and treatment[J]. J Am Acad Orthop Surg, 2021, 29(2): 60-70.
[25]" Carulli C, Innocenti M, Roselli G, et al. Partial rupture of anterior cruciate ligament: preliminary experience of selective reconstruction[J]. J Orthop Traumatol, 2020, 21(1): 5.
[26]" 黃瑜亮, 黃" 斌, 嚴" 俊. 結直腸癌的早期診斷技術進展[J]. 分子影像學雜志, 2019, 42(1): 77-80.
[27]" 楊劍鋒, 喬佩蕊, 李永梅, 等. 機器學習分類問題及算法研究綜述[J]. 統計與決策, 2019, 35(6): 36-40.
(編輯:郎" 朗)