






摘要:目的" 通過聯合全視野數字化乳腺X線攝影(FFDM)影像組學特征及深度學習特征預測乳腺癌HER-2狀態。方法" 回顧性分析山西中醫藥大學附屬醫院2018年3月~2023年12月經臨床手術或穿刺活檢的乳腺癌患者FFDM、臨床及病理資料。FFDM圖像手工勾畫腫瘤感興趣區并提取組學特征和深度學習特征,分別經過LASSO特征篩選后采用支持向量機算法建立影像組學模型和深度學習模型,通過多因素邏輯回歸分析建立綜合模型。計算各模型曲線下面積(AUC)評估其預測效能,并通過決策曲線分析評估各模型在實際臨床決策中的有效性和實用價值。結果" 影像組學模型在訓練集和測試集的AUC分別為0.835(95% CI:0.761~0.898)和0.781(95% CI:0.701~0.857),深度學習模型在訓練集和測試集的AUC分別為0.904(95% CI:0.855~0.955)和0.883(95% CI:0.823~0.939),綜合模型在在訓練集和測試集的AUC分別為0.921(95% CI:0.872~0.967)和0.890(95% CI:0.828~0.942)。決策曲線分析顯示3種模型相比于全部認為HRE-2陽性或陰性可獲得更好的凈收益,其中綜合模型在風險閾值下可獲得最大凈收益。結論" 基于FFDM影像組學特征和深度學習特征的聯合應用,可以更有效地預測乳腺癌HER-2狀態,顯著提高了預測的準確性和可靠性,為乳腺癌的診斷和治療開辟了新的途徑。
關鍵詞:乳腺癌;影像組學;深度學習;HER-2狀態
Study on predicting breast cancer HER?2 status through full?field digital mammography radiomic" and deep learning features
HE Fei1, HUANG Zhongjiang2, WU Peizeng3, GUO Xiaofen1, WANG Lei1
1Department of Radiology, Affiliated Hospital of Shanxi University of Chinese Medicine, Taiyuan 030024, China; 2Department of Radiology, Shanxi Provincial Hospital of Traditional Chinese Medicine, Taiyuan 030001, China; 3School of Medicine, Xiamen University, Xiamen 361005, China
Abstract: Objective To predict the HER-2 status in breast cancer by integrating full-field digital mammography (FFDM) radiomics features with deep learning features. Methods Retrospective analysis was conducted on of breast cancer patients who underwent clinical surgery or biopsy from March 2018 to December 2023 at the Affiliated Hospital of Shanxi University of Chinese Medicine. Regions of interest within FFDM images were manually delineated to extract radiomics and deep learning features. Following LASSO-based feature selection, support vector machine algorithms were used to construct both a radiomics model and a deep learning model. A composite model was developed using multivariate logistic regression analysis. The predictive performance of each model was evaluated by calculating their AUC values, and their effectiveness and practical value in real clinical decision-making were assessed using decision curve analysis curves. Results The radiomics model exhibited AUC values of 0.835 (95% CI: 0.761-0.898) in the training set and 0.781 (95% CI: 0.701-0.857) in the test set. The deep learning model demonstrated AUC values of 0.904 (95% CI: 0.855-0.955) in the training set and 0.883 (95% CI: 0.823-0.939) in the test set. The composite model achieved AUC values of 0.921 (95% CI: 0.872-0.967) in the training set and 0.890 (95% CI: 0.828-0.942) in the test set. Decision curve analysis indicated that all three models provided a greater net benefit compared to assuming all cases as either HER-2 positive or negative, with the composite model offering the maximum net benefit at various risk thresholds. Conclusion The integration of FFDM radiomics and deep learning features significantly enhances the prediction of HER-2 status in breast cancer, greatly improving both accuracy and reliability. This advancement opens new avenues for the diagnosis and treatment of breast cancer.
Keywords: breast cancer; radiomics; deep learning; HER-2 status
乳腺癌是全球女性最常見的惡性腫瘤,并且是女性因癌癥死亡的主要原因之一[1-2]。HER-2狀態對乳腺癌治療至關重要,因其與腫瘤侵襲性和預后緊密相關[3-4]。通過準確評估HER-2狀態,可以選擇合適的抗HER-2靶向治療,定制個體化治療方案,并預測疾病結果。HER-2陽性患者使用如曲妥珠單抗等靶向藥物,可顯著抑制腫瘤生長并提高生存率[5-6]。目前,HER-2通常通過免疫組織化學(IHC)或熒光原位雜交(FISH)檢測,但這些方法由于樣本限制可能無法全面反映腫瘤狀態[7];此外,活檢可能引起并發癥如感染、出血,且存在成本高和心理壓力等問題。無創性方法不僅能降低患者的痛苦和并發癥風險,還能更頻繁地檢測和動態監測腫瘤的分子變化,幫助醫生及時調整治療方案,提高治療效果。FFDM是乳腺癌篩查的重要工具,提供高分辨率圖像和高成本效益,支持便捷存儲與共享,提升圖像處理與計算機輔助檢測效率[8]。但此技術并不直接用于評估乳腺癌的HER-2狀態。影像組學是醫學影像領域的人工智能技術,通過從影像中提取大量特征并篩選來構建預測模型,從而提升影像的預測能力[9]。既往研究探討了基于FFDM影像組學預測乳腺癌HER-2狀態,結果在訓練集、驗證集曲線下面積(AUC)分別僅為0.824、0.775[10]。這一結果揭示了僅依賴影像組學特征進行預測的局限性,整合更復雜的特征可以提升預測精度和泛化能力[11]。近年來,深度學習(DL)中的卷積神經網絡(CNN)在計算機視覺領域取得了顯著成就,并已應用于腫瘤分級和預后評估等領域。鑒于醫療數據集的限制性,采用預訓練的CNN進行遷移學習能有效防止過擬合,已廣泛應用于多種實際場景[12-14]。目前,在使用FFDM的DL技術方法中,針對乳腺癌HER-2狀態的預測尚未經過充分研究和驗證。為了提高預測精度和泛化能力,整合了更復雜的特征,以彌補現有技術的不足,并展示其創新性及潛在的改進價值。本研究通過融合FFDM影像組學特征與DL特征,開發一種創新方法以精確預測乳腺癌HER-2狀態。本研究提升診斷準確性并優化治療策略,以期簡化傳統診斷流程,提高患者的接受度和治療效率,推動乳腺癌精準醫療的發展。
1" 資料與方法
1.1" 一般資料
回顧性分析山西中醫藥大學附屬醫院2018年3月~2023年12月經臨床手術或穿刺活檢的乳腺癌患者FFDM、臨床及病理資料。納入標準:每位患者包括2張FFDM圖像,分別為頭尾位(CC)和內外斜位(MLO);手術或穿刺活檢前行FFDM檢查;病理證實為原發浸潤性導管癌。排除標準:FFDM非腫塊性病灶,包括僅表現為惡性鈣化、結構扭曲及局部密度增高等;術前有放療、化療和中醫治療史;圖像質量欠佳,無法提取可靠特征。最終納入185例患者,為確保子集中的分布與整體數據集一致,通過分層抽樣按7:3比例分訓練集129例和測試集56例。本研究為回顧性研究豁免患者知情同意,經醫院倫理委員會批準(倫理編號:202412271)。
1.2" HER-2狀態評定標準
HER-2陽性由IHC(+++)的強陽性結果或FISH檢測證實的HER-2基因擴增確定,而HER-2陰性由IHC(-)或(+)顯示的低或無HER-2表達,或IHC(++)結合FISH陰性結果共同確定,以確保無基因擴增。
1.3" 圖像采集與分割
使用西門子Mammomat Fusion數字乳腺X線機采集CC和MLO圖像,參數選用全自動曝光,管電壓25~35 kV,高年資醫師通過系統軟件評估圖像質量。將原始DICOM圖像導入ITK-SNAP3.8.0軟件,由2位15年工作經驗的射科醫師進行手動勾畫感興趣區(ROI)。
1.4" 特征提取及選擇
使用開源軟件Python3.8.8進行影像組學特征提取,分別從原始圖像及小波變換圖像上提取包括形狀特征、一階統計特征和高階統計特征,CC和MLO圖像共1774個特征。使用ResNet18模型提取DL特征之前,FFDM圖像需要預處理。首先,圖像從指定的ROI裁剪成矩形。然后,調整圖像大小至標準的224×224像素。最后,對像素值進行歸一化處理,設定均值為(0.485, 0.456, 0.406),標準差為(0.229, 0.224, 0.225),以符合使用ImageNet預訓練的ResNet18模型的要求[15]。提取自全局平均池化層前的最后一個卷積層的輸出,CC和MLO圖像共得到1024個DL特征(圖1)。為確保特征提取的一致性,本研究隨機選取了20例由2位醫師分別獨立勾畫ROI,并使用相同方法提取影像組學和DL特征。通過組內相關系數(ICC)評估了2位醫師特征提取的一致性,選取ICCgt;0.75的特征用于進一步分析。先進行Z-score標準化以消除尺度差異,隨后利用最小絕對收縮和選擇算子(LASSO)進行特征選擇。
1.5" 建立預測模型
在訓練集中分析患者的術前臨床資料和FFDM影像學表現與HER-2狀態的相關性。分析變量包括年齡、乳腺密度、腫塊位置(左乳、右乳)、腫塊最長徑、是否含有惡性鈣化。通過二元邏輯回歸確定是否存在獨立預測因子,并構建臨床模型。將篩選后的影像組學特征和DL特征分別使用支持向量機分別建立影像組學模型及DL模型。通過多因素邏輯回歸分析建立綜合模型。計算各模型AUC值評估其預測效能,并通過決策曲線分析(DCA)評估各模型在實際臨床決策中的有效性和實用價值。
1.6" 統計學分析
采用GraphPad Prism9.0.2軟件進行統計分析,對計量資料行正態性檢驗,符合正態分布的計量資料以均數±標準差表示,組間比較采用t檢驗。計數資料以n(%)表示,組間比較采用χ2檢驗或Fisher精確概率法。采用Python軟件進行LASSO特征篩選及建立預測模型。采用R軟件繪制ROC曲線、DCA曲線。以Plt;0.05為差異有統計學意義。
2" 結果
2.1" 臨床資料
HER-2陽性與陰性乳腺癌患者年齡、乳腺密度、腫塊位置、腫塊最長徑在兩組間差異無統計學意義(Pgt;0.05)。惡性鈣化在兩組間差異有統計學意義(Plt;0.05,表1)。因此將其作為預測因子納入臨床預測模型中。該模型在訓練集中的AUC值為0.595(95% CI:0.505~0.680),在測試集中的AUC值為0.586(95% CI:0.447~0.716)。
2.2" 特征篩選結果
CC和MLO圖像共納入1348個ICCgt;0.75的影像組學特征。LASSO回歸分析經過5折交叉驗證后,當λ值為0.067時得到9個系數非零最佳影像組學特征(圖2)。CC和MLO圖像DL特征分別由DF1到DF512依次命名,共納入876個ICCgt;0.75的DL特征。LASSO回歸分析顯示,當λ值為0.061時得到7個系數非零最佳DL特征(圖3)。
2.3" 預測模型建立與評估
臨床模型、影像組學模型和DL模型多因素分析顯示,影像組學模型和DL模型均為獨立的預測因子(表2)。基于這兩種模型構建了一個綜合模型,臨床模型則未被納入進一步的研究。影像組學模型在訓練集和測試集的AUC分別為0.835(95%CI:0.761~0.898)和0.781(95% CI:0.701~0.857),DL模型在訓練集和測試集的AUC分別為0.904(95% CI:0.855~0.955)和0.883(95% CI:0.823~0.939),綜合模型在在訓練集和測試集的AUC分別為0.921(95%CI:0.872~0.967)和0.890(95% CI:0.828~0.942)(圖4)。DCA結果顯示,在大多數風險閾值范圍內,3種模型相比于全部認為HRE-2陽性或陰性可獲得更好的凈收益,其中綜合模型在風險閾值下可獲得最大凈收益(圖5)。
3" 討論
乳腺癌的風險因素眾多,其中HER-2在乳腺癌分類中起關鍵作用,其過度表達或基因擴增與癌細胞的快速增長密切相關[16-17]。傳統的HER-2狀態評估方法依賴于活檢樣本,受限于樣本代表性和技術依賴性。本研究發現FFDM圖像中的惡性鈣化與HER-2過表達之間存在顯著相關性,但模型的效能偏低,與既往研究[18]一致。在本研究中,影像組學模型和DL模型都證明了作為獨立預測因子的有效性,分別在訓練集和測試集展示了較高的AUC值。具體而言,DL模型在各個數據集上均顯示出比影像組學模型更高的預測精度,這表明其更強的數據處理和特征識別能力。通過將影像組學和DL技術融合,構建的綜合模型在預測乳腺癌HER-2狀態方面表現出較高的準確性和穩定性。這種模型的優勢主要源自于它能夠綜合不同模型的分析力度和范圍,提高對復雜影像數據的全面解讀能力。綜合模型通過融合影像組學的定量特征和DL的層次深遠特征,不僅增強了模型對數據內在關聯性的捕捉,還優化了決策邊界,使之更精準地適應各種數據分布。此外,這種模型通過互補誤差的機制,降低了過擬合的風險,并提升了在多變臨床環境下的適應性和泛化能力。因此,綜合模型不只是在統計指標上超越單一模型,其在實際臨床應用中更具有高效表現。該方案不僅能有效補充傳統生物標志物檢測方法(如IHC和FISH),還為無創診斷技術的未來發展指明了方向。
隨著醫學影像技術的進步和大數據及人工智能算法的應用,影像組學展現出重要價值并正逐步推向臨床應用[19]。過往的研究已經探索了基于FFDM影像組學在乳腺癌HER-2狀態預測中的應用。有研究基于多中心FFDM影像組學來預測HER-2狀態[10],模型效能與本研究相似。此外,本研究同樣發現篩選出的經小波變換的紋理特征與HER-2狀態之間存在顯著相關性。小波變換用于分解圖像數據,可在多尺度上揭示特征,適用于捕捉醫學圖像中的局部特征和異質性。其多分辨率特性能夠有效抑制噪聲并增強圖像,從而提高影像組學模型的診斷能力,對疾病的早期診斷和病理評估至關重要[20]。紋理分析通過評估圖像中的灰度變異性和模式,對理解組織結構和病理狀態起著關鍵作用。在影像組學中,紋理特征不僅揭示了組織的生物學特性,還對疾病分類和預后評估有重要意義[21]。盡管影像組學在臨床應用方面展現出潛力,但其對圖像細節的反映較為有限,導致模型效能受限。DL通過自動學習龐大數據集中的復雜模式和特征,有望提升影像組學模型的診斷精度和泛化能力[22]。此技術能夠深入挖掘圖像數據的細微差異,進一步提高特征提取和解析的效率,從而在臨床決策支持中發揮更大作用,尤其在復雜病理狀態的識別和預后評估方面。目前,DL技術已被用于乳腺癌影像數據的分析,以預測HER-2狀態。有研究通過預訓練的CNN模型對乳腺超聲圖像進行分析,能夠有效區分HER-2陽性和陰性病例,模型的AUC達到了0.81[23]。有學者建立基于MRI的DL特征來預測HER-2狀態,模型在訓練集和驗證集中的AUC分別為0.868和0.763[24]。盡管目前尚無研究聯合影像組學和DL技術來預測乳腺癌的HER-2狀態,但已有研究表明,結合FFDM的影像組學與DL特征,可顯著提升良惡性病變的識別效果[25]。基于此,本研究旨在探索影像組學與DL技術相結合是否能提高預測乳腺癌HER-2狀態的準確性。本研究采用的基于FFDM圖像的DL模型在預測乳腺癌HER-2狀態方面,相較于先前的基于超聲和MRI的DL技術,表現出更高的性能。這一優勢可能源自于FFDM圖像的更高清晰度、針對性的模型優化,以及使用了更為先進的技術和大規模的高質量數據集。此外,結合影像組學和DL特征的綜合模型在乳腺癌HER-2狀態的預測上展示了顯著的提升,這不僅提高了預測的精確性,也增強了模型的魯棒性和可靠性,進一步推動了乳腺癌精準醫療的發展。本研究結果凸顯了兩種技術結合的潛力,不僅克服了單一技術的局限性,還顯著提高了模型的預測性能,AUC值的提升突出體現了技術整合的優勢。綜合模型的應用在不增加患者負擔的情況下,提供了更為精準的診斷信息,對于制定個性化治療計劃至關重要。相關研究表明DL技術顯著提高了多種癌癥類型生物標志物檢測的準確性和可靠性[26]。然而,這些技術也存在局限性,例如,DL技術需要大量的訓練數據,且模型解釋性有限。此外,盡管影像組學在提升診斷精度方面具有潛力,但其復雜性和對高技術的依賴可能阻礙其在資源有限的環境中普及[27-28]。本研究開發的無創診斷技術為乳腺癌治療提供了一種革新方法,其潛在的廣泛應用可能顯著改善治療效果。通過減少對傳統活檢的依賴,這種方法不僅降低了患者面臨的并發癥風險,還特別適合資源有限的地區,提供了一種更經濟、更可獲取的診斷選擇。隨著技術的進一步驗證和優化,這種無創診斷方法預計將在臨床實踐中帶來革命性的改變,優化現有的乳腺癌診斷和治療流程,提升整體治療成效,并有助于提高患者的生活質量。盡管面臨挑戰,醫療政策和法規的支持是關鍵[29-30]。未來研究應評估這些技術在不同人群和地區的適用性和效果,以推廣應用。
本研究存在幾項局限性:首先,由于研究數據僅來源于單一中心,因此需要使用外部數據集進行驗證以增強結果的普適性;其次,當前研究的數據量相對較小,擴增數據規模有望進一步提升模型的性能;最后,研究中的ROI是由醫生手動勾畫的,這可能導致特征提取的穩定性受到人為因素的影響。
綜上,本研究表明通過結合FFDM影像組學與DL特征,可以顯著提高乳腺癌HER-2狀態的預測準確性和可靠性。這一綜合技術不僅優化了診斷精度,還促進了無創診斷和個性化治療策略的發展。總體而言,影像組學與DL的結合不僅開辟了乳腺癌診療的新途徑,也推動了醫療技術的進步,特別是在提高治療效果和患者生活質量方面展現了顯著潛力。
參考文獻:
[1]" "Li CL, Song LR, Yin JD. Intratumoral and peritumoral radiomics based on functional parametric maps from breast DCE-MRI for prediction of HER-2 and ki-67 status[J]. J Magn Reson Imaging, 2021, 54(3): 703-14.
[2]" "Cao W, Chen HD, Yu YW, et al. Changing profiles of cancer burden worldwide and in China: a secondary analysis of the global cancer statistics 2020[J]. Chin Med J, 2021, 134(7): 783-91.
[3]" "Smit EF, Felip E, Uprety D, et al. Trastuzumab deruxtecan in patients with metastatic non-small-cell lung cancer (DESTINY-Lung01): primary results of the HER2-overexpressing cohorts from a single-arm, phase 2 trial[J]. Lancet Oncol, 2024, 25(4): 439-54.
[4]" "Ouyang QC, Wang Y, Zhang J, et al. HS-10352 in hormone receptor-positive, HER2-negative advanced breast cancer: a phase 1 dose-escalation trial[J]. Cancer Med, 2023, 12(24): 21849-60.
[5]" "Ibragimova KIE, Geurts SME, Laczkó D, et al. Trastuzumab resistance in patients with HER2-positive advanced breast cancer: results from the SONABRE registry[J]. Clin Breast Cancer, 2024, 24(2): 103-11.
[6]" "岳瑞雪, 胡崇珠, 郝" 鑫, 等. 曲妥珠單抗和帕妥珠單抗聯合不同化療方案新輔助治療HER-2陽性乳腺癌真實世界療效及安全性觀察[J]. 中國腫瘤臨床, 2023, 50(5): 248-54.
[7]" " 周曉蝶, 戚榮鑫, 余" 波, 等. 乳腺淋巴瘤72例臨床病理分析[J]. 臨床與實驗病理學雜志, 2023, 39(8): 925-30.
[8]" "Sheng MH, Ji J, Zhang CY, et al. Optimization of the radiation dose of digital breast tomosynthesis in opportunistic screening by studying the effect of different combinations of FFDM and DBT views[J]. Int J Gen Med, 2021, 14: 1147-54.
[9]" "Gupta S, Nayak K, Pendem S. Impact of slice thickness on reproducibility of CT radiomic features of lung tumors[J]. F1000Res, 2023, 12: 1319.
[10]" 謝玉海, 韓劍劍, 馬培旗, 等. 基于多中心數字化乳腺X線攝影影像組學預測乳腺癌人表皮生長因子受體-2過表達[J]. 中國醫學影像技術, 2023, 39(3): 365-9.
[11]" 馮" 源, 蘭曉莉. 影像組學介紹[J]. 中華核醫學與分子影像雜志, 2023, 43(1): 55-60.
[12]" Naser PV, Maurer MC, Fischer M, et al. Deep learning aided preoperative diagnosis of primary central nervous system lymphoma[J]. iScience, 2024, 27(2): 109023.
[13]" Young SI, Zhe W, Taubman D, et al. Transform quantization for CNN compression[J]. IEEE Trans Pattern Anal Mach Intell, 2022, 44(9): 5700-14.
[14]" Wang ZJ, Turko R, Shaikh O, et al. CNN explainer: learning convolutional neural networks with interactive visualization[J]. IEEE Trans Vis Comput Graph, 2021, 27(2): 1396-406.
[15]" 劉" 飛, 陳仁文, 邢凱玲, 等. 基于遷移學習與深度殘差網絡的滾動軸承快速故障診斷算法[J]. 振動與沖擊, 2022, 41(3): 154-64.
[16]" 郭" 晴, 張" 劍. HER2低表達乳腺癌的靶向治療研究進展[J]. 中國癌癥雜志, 2023, 33(2): 181-90.
[17]" Zuo D, Yang LX, Jin Y, et al. Machine learning-based models for the prediction of breast cancer recurrence risk[J]. BMC Med Inform Decis Mak, 2023, 23(1): 276.
[18]Ji Y, Shao ZZ, Liu JJ, et al. The correlation between mammographic densities and molecular pathology in breast cancer[J]. Cancer Biomark, 2018, 22(3): 523-31.
[19]" 張麗菡, 王" 化, 陳永孜, 等. 影像組學在免疫治療方面的應用現狀[J]. 分子影像學雜志, 2024, 47(2): 216-9.
[20] Anita JN, Kumaran S. A deep learning architecture for meningioma brain tumor detection and segmentation[J]. J Cancer Prev, 2022, 27(3): 192-8.
[21]" 陳" 平, 代國坡, 蔡禮彬. 基于CT紋理分析預測食管鱗癌患者Ki-67表達狀態的應用價值[J]. 實用放射學雜志, 2024, 40(2): 204-8.
[22]" 朱正群, 鞏" 萍, 黃櫟有, 等. 聯合CT影像組學與深度學習特征建立列線圖預測食管鱗癌放療近期療效[J]. 放射學實踐, 2024, 39(2): 233-8.
[23]" Zhang XY, Li H, Wang CY, et al. Evaluating the accuracy of breast cancer and molecular subtype diagnosis by ultrasound image deep learning model[J]. Front Oncol, 2021, 11: 623506.
[24] Guo Y, Xie XT, Tang WJ, et al. Noninvasive identification of HER2-low-positive status by MRI-based deep learning radiomics predicts the disease-free survival of patients with breast cancer[J]. Eur Radiol, 2024, 34(2): 899-913.
[25] Zhang XY, Liang CX, Zeng D, et al. Pattern classification for breast lesion on FFDM by integration of radiomics and deep features[J]. Comput Med Imaging Graph, 2021, 90: 101922.
[26] Avanzo M, Porzio M, Lorenzon L, et al. Artificial intelligence applications in medical imaging: a review of the medical physics research in Italy[J]. Phys Med, 2021, 83: 221-41.
[27]" Mousavi SM, Beroza GC. Deep-learning seismology[J]. Science, 2022, 377(6607): eabm4470.
[28]" 周志鵬, 趙春雷. PET影像組學臨床應用進展[J]. 中國醫學影像學雜志, 2023, 31(4): 424-8.
[29]" 劉士遠. 加強醫學影像數據庫建設 推動行業快速發展[J]. 中華放射學雜志, 2022, 56(9): 931-4.
[30]" 胡夢瑤, 袁" 飛. 人工智能臨床應用的法律規制[J]. 中華醫學雜志, 2023, 103(18): 1363-6.
(編輯:林" 萍)