張盼盼,孫醫(yī)學(xué),李 陽(yáng),李 林,杜 歡,路麗麗,喬佳業(yè)
(蚌埠醫(yī)學(xué)院第一附屬醫(yī)院超聲醫(yī)學(xué)科,安徽 蚌埠 233017)
根據(jù)2020年癌癥數(shù)據(jù)統(tǒng)計(jì),乳腺癌已經(jīng)成為女性癌癥死亡的主要原因[1],早發(fā)現(xiàn)和早診斷對(duì)于乳腺癌治療決策和提高生存率至關(guān)重要[2]。超聲是我國(guó)乳腺癌篩查的首選方法[3],規(guī)范化的乳腺影像報(bào)告數(shù)據(jù)系統(tǒng)(Breast imaging reporting and data system,BI-RADS)已在臨床得到廣泛應(yīng)用。BI-RADS使用人為規(guī)定的特征描述符作為超聲圖像分類依據(jù),缺少客觀的定量數(shù)據(jù),高度依賴于超聲醫(yī)師的經(jīng)驗(yàn)和主觀判斷,準(zhǔn)確性存在爭(zhēng)議[4]。因此,術(shù)前如何實(shí)現(xiàn)對(duì)乳腺腫塊的定量評(píng)估是臨床面臨的重要問(wèn)題。近年來(lái)隨著人工智能和大數(shù)據(jù)技術(shù)發(fā)展,影像組學(xué)方法應(yīng)運(yùn)而生[5],其可從超聲圖像提取特征數(shù)據(jù),實(shí)現(xiàn)對(duì)形態(tài)、回聲等的量化表達(dá),減少主觀判斷,提供更加客觀的定量預(yù)測(cè)數(shù)據(jù),輔助醫(yī)師決策[6]。多數(shù)研究方法僅提取病灶的影像組學(xué)特征或臨床危險(xiǎn)因素單獨(dú)來(lái)分析,未將兩者相結(jié)合。本研究旨在應(yīng)用影像組學(xué)方法實(shí)現(xiàn)對(duì)乳腺癌超聲圖像的量化表達(dá)并與臨床危險(xiǎn)因素整合構(gòu)建聯(lián)合模型,并探討其在乳腺良惡性腫瘤中的應(yīng)用價(jià)值。
1.1 研究對(duì)象回顧性收集2020年10月—2023年2月于我院行超聲檢查的女性患者共525例。將納入的525個(gè)病灶按照7∶3的比例隨機(jī)分為訓(xùn)練組(368例)和驗(yàn)證組(157例)。納入標(biāo)準(zhǔn):①病理診斷結(jié)果明確;②臨床資料完整,包括患者年齡、超聲設(shè)備、腫塊最長(zhǎng)徑、腫瘤位置等信息;③術(shù)前1周內(nèi)行超聲檢查。排除標(biāo)準(zhǔn):①由于偽影、鈣化等采集的圖像質(zhì)量顯示欠佳;②在超聲檢查前接受放療和/或化療的患者;③腫塊過(guò)大超過(guò)單幅B型超聲圖像邊界。本研究經(jīng)我院倫理委員會(huì)批準(zhǔn)。
1.2 儀器與方法
1.2.1 圖像采集采用百勝M(fèi)ylab Twice(頻率為4~12 MHz的線陣探頭)和LOGIQ E9(頻率為6~15 MHz的線陣探頭)彩色多普勒診斷儀。由2名超聲醫(yī)師(分別具有7年和8年超聲工作經(jīng)驗(yàn))對(duì)乳腺病灶進(jìn)行檢查,調(diào)節(jié)儀器參數(shù)、優(yōu)化圖像質(zhì)量后,記錄病灶最大徑線切面灰度圖像并存儲(chǔ)為DICOM格式。
1.2.2 影像組學(xué)特征提取在病理結(jié)果與臨床資料均不知情的情況下,由1名工作5年的超聲科醫(yī)師使用3D-slicer軟件對(duì)目標(biāo)病灶進(jìn)行描記(圖1),需要注意的是勾畫感興趣區(qū)域時(shí)盡可能沿腫塊輪廓進(jìn)行,隨后使用pyradiomics軟件從ROI中進(jìn)行影像組學(xué)特征的提取。2個(gè)月后,隨機(jī)抽取100例目標(biāo)病灶,由該醫(yī)師和另1名工作4年的超聲科醫(yī)師再次對(duì)腫塊進(jìn)行描記,采用組內(nèi)相關(guān)系數(shù)(Intra-class correlation coefficient,ICC)用于評(píng)估觀察者及觀察者間一致性[7]。

圖1 影像組學(xué)特征提取
1.2.3 影像組學(xué)特征篩選為了消除冗余特征對(duì)建模過(guò)程的影響,使用LASSO回歸篩選出權(quán)重影響較大的影像組學(xué)特征,并建模后計(jì)算得到影像組學(xué)評(píng)分(Radiomics score,Rad-Score)。
1.2.4 模型建立采用單因素和多因素Logistic回歸分析,以P<0.05的臨床因素作為危險(xiǎn)因素,同時(shí),采用Logistic回歸方法建立基于Rad-Score與臨床危險(xiǎn)因素的乳腺癌聯(lián)合模型,基于聯(lián)合模型繪制列線圖將結(jié)果進(jìn)行可視化。
1.3 統(tǒng)計(jì)學(xué)處理數(shù)據(jù)采用R(version 4.0.2)和IBM SPSS 25.0軟件進(jìn)行分析。計(jì)數(shù)資料以n(%)表示,組間比較采用卡方檢驗(yàn)。計(jì)量資料以±s表示,符合正態(tài)分布的連續(xù)變量采用獨(dú)立樣本t檢驗(yàn)。使用ICC評(píng)價(jià)特征提取的可重復(fù)性,ICC>0.75認(rèn)為重復(fù)性較好。通過(guò)分析AUC及校準(zhǔn)曲線來(lái)評(píng)估模型的性能,采用DeLong檢驗(yàn)比較不同模型AUC的差異。檢驗(yàn)水準(zhǔn)α=0.05。
2.1 病例基線特征共納入了525例女性患者的525例乳腺腫塊,病理確診為惡性284例(54.10%),良性241例(45.90%)。記錄采集每個(gè)腫塊的最大徑線切面超聲圖像,共525幅圖像作為研究樣本,其中訓(xùn)練集圖像368幅,驗(yàn)證集圖像157幅。訓(xùn)練集和驗(yàn)證集的基線信息中患者年齡、腫塊最長(zhǎng)徑、腫塊位置及機(jī)器型號(hào)占比、影像組學(xué)評(píng)分差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)(表1)。

表1 訓(xùn)練集和驗(yàn)證集入組患者的基線資料
2.2 影像組學(xué)特征提取和篩選從入組患者的超聲圖像中共提取了851個(gè)超聲影像組學(xué)特征,隨機(jī)選取100例病灶,其ICC值為0.776~0.897,說(shuō)明觀察者和觀察者間重復(fù)性良好。
采用LASSO回歸方法進(jìn)行特征篩選(圖2),最終13個(gè)非零系數(shù)權(quán)重較大的特征被選擇(圖3)。

圖2 使用LASSO回歸進(jìn)行影像組學(xué)特征選擇

圖3 使用LASSO回歸篩選的13個(gè)超聲影像組學(xué)特征
2.3 聯(lián)合模型構(gòu)建通過(guò)單因素和多因素Logistic回歸分析,最終確定患者年齡為臨床獨(dú)立危險(xiǎn)因素(表2)。基于LASSO回歸將所選特征和相應(yīng)加權(quán)系數(shù)的乘積相加,構(gòu)建影像組學(xué)模型,計(jì)算Rad-score?;谀挲g和Rad-score構(gòu)建乳腺癌預(yù)測(cè)聯(lián)合模型,并繪制列線圖(圖4)。

表2 臨床危險(xiǎn)因素的單因素及多因素Logistic回歸分析

圖4 基于臨床危險(xiǎn)因素和Rad-Score構(gòu)建乳腺癌預(yù)測(cè)模型的列線圖
Rad-score=(-0.168)×wavelet-HHH_firstorder_Variance + 0.713×original_shape_Elongation+0.328×original_shape_Maximum2DDiameterRow(-0.493)×wavelet-LHH_glcm_-JointEnergy+ (-0.565)×original_glrlm_HighGrayLevelRunEmphasis+(-0.287)×wavelet-LHH_glcm_-SumEntropy+(-0.163)×wavelet-LLL_glrlm_RunVariance+0.545×wavelet-HHH_glrlm_HighGrayLevelRunEmphasis + 0.134 × wavelet-HHL_ngtdm_Complexity + 0.426 × wavelet-LHH_glszm_ZoneEntropy + 0.2×wavelet-HLL_glszm_SmallAreaLowGrayLevelEmphasis + 0.009 × wavelet-LLL_glcm_ClusterProminence + 0.262 × wavelet-LLL_glrlm_RunEntropy+0.224。
2.4 列線圖預(yù)測(cè)模型的臨床應(yīng)用和效能評(píng)估在訓(xùn)練集和驗(yàn)證集中,臨床模型的AUC值分別為:0.772、0.847;影像組學(xué)模型的AUC值分別為:0.790、0.820;聯(lián)合模型的AUC值分別為:0.846、0.909(圖5)。DeLong檢驗(yàn)顯示在訓(xùn)練集和驗(yàn)證集中,聯(lián)合模型優(yōu)于臨床模型(P<0.05),聯(lián)合模型與影像組學(xué)模型及影像組學(xué)模型與臨床模型之間差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。在訓(xùn)練集和驗(yàn)證集中聯(lián)合模型的校準(zhǔn)曲線,可以看出其預(yù)測(cè)乳腺癌風(fēng)險(xiǎn)概率與實(shí)際發(fā)生率較為接近(圖6),可以更好地指導(dǎo)臨床決策。

圖5 訓(xùn)練集和驗(yàn)證集中3種預(yù)測(cè)模型的ROC曲線

圖6 聯(lián)合模型在訓(xùn)練集和驗(yàn)證集中的校準(zhǔn)曲線
校準(zhǔn)曲線表示預(yù)測(cè)值對(duì)應(yīng)的實(shí)際值,如果預(yù)測(cè)值=實(shí)際值,則與對(duì)角線重合。
近年來(lái),影像組學(xué)被認(rèn)為是一種有效的和無(wú)創(chuàng)的預(yù)測(cè)乳腺癌狀態(tài)的方法,但大多數(shù)研究是基于乳腺X線攝影和MRI成像[8-9]。然而,基于形態(tài)學(xué)特征的乳腺BI-RADS分級(jí)按照人為規(guī)定的描述符來(lái)判斷圖像高度依賴于超聲醫(yī)師的積累和經(jīng)驗(yàn),缺少量化指標(biāo),診斷可靠性也存在爭(zhēng)議[10]。隨著人工智能和大數(shù)據(jù)技術(shù)浪潮的推動(dòng),加速產(chǎn)生了新的影像組學(xué)方法,其可從腫瘤影像提取深層次的高維特征數(shù)據(jù)實(shí)現(xiàn)量化表達(dá),并運(yùn)用機(jī)器學(xué)習(xí)技術(shù)分析和建立模型,預(yù)測(cè)疾病風(fēng)險(xiǎn),輔助臨床決策。
本研究中,我們研究了從乳腺癌患者的灰度超聲圖像中提取的超聲影像組學(xué)特征是否可以作為乳腺癌危險(xiǎn)因素的預(yù)測(cè)指標(biāo),并提出了一種預(yù)測(cè)乳腺癌的新方法。從每個(gè)乳腺腫塊中共提取851個(gè)超聲影像組學(xué)特征,使用LASSO回歸進(jìn)行降維分析后,篩選出13個(gè)超聲影像組學(xué)特征作為構(gòu)建Rad-Score模型的指標(biāo),其中包括3個(gè)灰度共生矩陣(Gray-level co-occurrence matrix, GLCM)、4個(gè)灰度游程矩陣和2個(gè)灰度大小區(qū)域矩陣特征,這些特征代表了腫瘤的組學(xué)復(fù)雜性,對(duì)于識(shí)別和分類腫瘤病變的內(nèi)部空間異質(zhì)性具有重要意義[11-12]。GLCM紋理特征描述了在不同方向以及像素或體素之間的預(yù)定義距離,捕獲具有預(yù)定義灰度強(qiáng)度的像素對(duì)或體素對(duì)的空間關(guān)系[13],灰度共生矩陣反映圖像在方向、變化幅度及局部病變的灰階分布信息,有研究[14]表明MRI灰度共生矩陣可鑒別乳腺腫塊的良惡性,也給本研究結(jié)果提供了支撐。本研究不僅建立還驗(yàn)證了影像組學(xué)模型的性能,訓(xùn)練集和驗(yàn)證集中的AUC值分別為0.790和0.820。通過(guò)Logistic回歸分析,篩選出年齡作為與乳腺癌高表達(dá)相關(guān)的危險(xiǎn)因素,結(jié)合年齡和Rad-Score構(gòu)建的聯(lián)合預(yù)測(cè)模型,顯示出略高的預(yù)測(cè)性能。表明影像組學(xué)模型對(duì)乳腺癌具有較高的預(yù)測(cè)性能,結(jié)合年齡危險(xiǎn)因素構(gòu)建的聯(lián)合模型有較高的預(yù)測(cè)性能。通過(guò)校準(zhǔn)曲線評(píng)價(jià)了乳腺癌聯(lián)合模型的預(yù)測(cè)概率與實(shí)際結(jié)果具有一致性。
近年來(lái),基于乳腺癌構(gòu)建的列線圖也同樣獲得了較好的診斷效能。ZHANG S等[15]通過(guò)超聲影像組學(xué)特征和臨床危險(xiǎn)因素構(gòu)建的列線圖在鑒別乳腺BI-RADS 4類病變方面表現(xiàn)較好。YANG K等[16]通過(guò)常規(guī)超聲和雙模式彈性成像鑒別乳腺良惡性腫塊構(gòu)建的列線圖取得良好的臨床效益。與ZHANG S等[15]研究相比,本研究的數(shù)據(jù)量更大,不僅僅涉及BI-RADS 4類的病變,而是包含了更多BI-RADS類型的乳腺腫塊;與YANG K等[16]研究不同的是本研究采用定量的影像組學(xué)數(shù)據(jù),不會(huì)過(guò)度依賴超聲醫(yī)師的經(jīng)驗(yàn),從而減少對(duì)乳腺腫塊邊緣、形狀、邊界及后方特征等的判別。
雖然本研究中聯(lián)合模型與影像組學(xué)模型及影像組學(xué)模型與臨床模型AUC差異均無(wú)統(tǒng)計(jì)學(xué)意義,但是與臨床模型相比,聯(lián)合模型表現(xiàn)出顯著的預(yù)測(cè)性能,說(shuō)明聯(lián)合模型對(duì)乳腺癌有良好的預(yù)測(cè)效果。在外部驗(yàn)證中,聯(lián)合模型仍表現(xiàn)出最高的AUC,表明該預(yù)測(cè)模型的穩(wěn)定性和一致性較好。
單一的指標(biāo)已不能滿足如今個(gè)體化治療的需求,我們需將獲得的信息綜合分析,才能較準(zhǔn)確地預(yù)測(cè)病變并促進(jìn)精準(zhǔn)醫(yī)療。本研究的創(chuàng)新之處在于將臨床危險(xiǎn)因素及超聲影像組學(xué)評(píng)分納入列線圖,采用更客觀的定量參數(shù)較準(zhǔn)確地評(píng)估了術(shù)前對(duì)乳腺良惡性腫塊的預(yù)測(cè)能力。然而,本研究還需要進(jìn)一步的前瞻性設(shè)計(jì)和更大樣本、多中心研究來(lái)驗(yàn)證其可行性。
總之,基于臨床危險(xiǎn)因素和Rad-Score構(gòu)建的術(shù)前預(yù)測(cè)乳腺癌風(fēng)險(xiǎn)的聯(lián)合模型,對(duì)乳腺癌具有較高的預(yù)測(cè)價(jià)值,可以有效解決基層和部分低年資醫(yī)生因腫瘤異質(zhì)性難以定量評(píng)估的問(wèn)題。這種列線圖有望為治療策略提供信息,并協(xié)助臨床決策。