金利 俞霞 張濤 徐霖 陳文
肺癌是首位癌癥相關死亡原因,是高度惡性的腫瘤[1],嚴重威脅人類的生命安全。根據肺癌的發生部位,分為中央型肺癌和周圍型肺癌(peripheral Iung cancer,PLC),其中PLC 約占70%以上[2]。約70%的肺癌患者初 診時已是晚期[3]。因此肺癌的早期診斷和及時治療很重要。肺炎性肌纖維母細胞瘤(inflammatory myofibroblastic tumor,IMT)是指由分化的肌纖維母細胞性梭形細胞組成,常伴大量炎細胞和/或淋巴細胞的一種間葉性腫瘤。肺IMT 與PLC 在影像學特征存在重疊,兩者在臨床表現、好發年齡、好發人群等方面也有相似之處,在臨床診斷上易誤診。
荷蘭學者Lambin 等[4]在2012 年提出影像組學的概念,通過對圖像信息進行紋理分析后得到的高通量特征,對特征篩選、分析來研究腫瘤生物學特征和異質性等信息。近年來,放射組學在腫瘤定性診斷、良惡性腫瘤鑒別、放療療效預后評估等方面發揮著越來越重要的作用。本次研究擬通過影像組學的方法來區分肺IMT 和PLC。
回顧性收集十堰市太和醫院及外院2013 年1月~2020 年5 月經手術病理證實的肺IMT 72 例和PLC 79 例影像資料,其中肺IMT 組為連續性納入,男43 例,女29 例,年齡33~74歲,平均(54.53±9.16)歲。PLC 組為隨機納入,包括腺癌43 例,鱗癌24 例,腺鱗癌7 例,小細胞肺癌5 例,男45 例,女44 例,年齡35~76歲,平均(57.24±8.27)歲,肺IMT 組與PLC 組年齡和性別無統計學差別(P>0.05)。納入標準:(1)術前接受胸部CT 平掃,圖像質量好,無呼吸及運動偽影;(2)病灶在縱隔窗呈軟組織密度。(3)病灶直徑5 mm~3 cm;(4)CT 檢查前未行穿刺或放化療。
本院采用GE Optima 680 64 排CT 機,掃描參數為管電壓120 kV,管電流140 mA,螺距1.0,掃描層厚 5 mm,層間距 5 mm。外院為 GE Lightspeed 64 排螺旋CT,管電壓120 kV,管電流100 mA,掃描層厚為5 mm,層間距5 mm。采用肺部掃描模式,范圍從肺尖到肺底。

圖1 女,61歲,CT 平掃軸位示右下肺結節,病理為炎性肌纖維母細胞瘤。a)肺窗;b)縱隔窗 圖2 男,56歲,CT 平掃軸位示右下肺結節,病理為炎性肌纖維母細胞瘤。a)肺窗;b)縱隔窗 圖3 女,58歲,CT 平掃軸位示左上肺結節,病理為腺癌。a)肺窗;b)縱隔窗 圖4 男,72歲,CT 平掃軸位示右上肺結節,病理為腺癌。a)肺窗;b)縱隔窗
將DICOM 格式的胸部平掃CT 圖像(圖1~4)導入ITK-SNAP 軟件,窗寬窗位調整為縱隔窗(350、50),由一名經訓練的醫師手動逐層勾畫興趣區(region of interest,ROI),盡量避免空洞、壞死、鈣化區域(圖5a)。勾畫完畢,由一名從事胸部CT 診斷15 年的醫生確認所勾畫區域,圖像以NiFTI 格式保存。
將原始圖像及ROI 分別以DICOM 格式、NiFTI格式導入A.K(Artificial Intelligence Kit Version V3.2.2.R)軟件,采用線性插值法重采樣、高斯去噪、灰度離散化對圖像預處理,對預處理后圖像進行特征計算,提取包括直方圖特征(histogram)、形態學特征(formfactor)、灰度共生矩陣特征(graylevel co-occurrence matrix,CLCM)、游程矩陣特征(gray-level run-length matrix,GLRLM)、哈利拉克特征(haralick)等,共396 個特征(圖5b)。
首先對數據進行預處理,將異常值替換為所在列的中位數,按7∶3∶3 的比例將數據集劃分為訓練集、驗證集及測試集,其中測試集為外院數據,未參與模型訓練,對數據進行標準化處理。然后選擇方差選擇法(variance),根據閾值(閾值設為1),選擇方差大于閾值的特征,其他特征會自動刪除。再選擇多因素邏輯回歸分析法(multivariate logistic),選入P 值小于0.05 的特征值。最后使用最小絕對收縮算子算法(least absolute shrinkage and selection operator,LASSO)(圖5c)降維并十折交叉驗證,篩選出12 個較優特征。
人口統計學采用t 檢驗評估受試者的年齡差異,采用χ2檢驗評估兩組的性別差異。特征篩選使用A.K.軟件內置R 語言進行統計學分析。采用邏輯回歸(logistic regression,LR)、支持向 量機(support vector machine,SVM)、隨機森林(randomforest,RF)機器算法構建放射組學模型,受試者工作特征(operating characteristic curve,ROC)曲線下面積(area under curve,AUC)評估模型診斷效能,采用Delong 檢驗三組模型AUC 值差異。使用測試集對三種機器學習模型評估并繪制ROC 曲線。以P<0.05 為差異有統計學意義。
經特征提取及降維共提取12 個較優紋理特征,分別屬于直方圖特征、形態學特征、GLRLM 特征、CLCM 特征(表1)。隨機森林特征重要性排名前10 柱狀圖(圖6),其中灰度共生矩陣熵_ 全方向_ 步長7(GLCMEntropy_AllDirection_offset7)重要性最高。
三種機器算法分類器的準確率、特異度、敏感度、AUC 值及AUC(95%CI)見表2。三種機器學習模型的ROC 曲線見圖7。Delong 檢驗對三種機器學習模型的AUC 比較無統計學意義,LR-SVM(Z=0.975,P=0.331),RF-SVM(Z=1.504,P=0.133),LR-SVM(Z=0.672,P=0.501)。測試集中三種機器學習模型AUC 值分別為0.807、0.739、0.781(圖8)。
影像組學紋理分析能夠從數字醫學圖像中提取定量的高維數據,與傳統影像醫生主觀視覺相比分析更為詳細,且可定量評估病變特征,從而充分利用微觀潛在的醫學影像信息[5,6]。機器學習已廣泛應用于數據挖掘、計算機視覺、生物特征識別、醫學診斷等領域。已有多個研究表明紋理分析所篩選出的特征可利用機器學習產生效能較好的分類器。Malinauskaite 等[7]研究3 名骨肌方向的放射科醫師對軟組織脂肪瘤和脂肪肉瘤的鑒別表現(ROC-AUC:0.685、0.805、0.785)低于放射組學聯合機器學習模型(ROC-AUC:0.926)。Daye 等[8]研究腎上腺轉移瘤患者消融術后的生存與進展預測中,包含紋理特征的SVM 模型的AUC 值較僅有臨床變量的SVM 模型高(0.93 比0.68)。

表1 12 個用于機器學習的特征名稱及其所屬特征類別

表2 三種機器學習模型效能比較

圖5 影像組學流程圖。a)興趣區勾畫與分割;b)特征計算與提取;c)特征篩選與模型評估 圖6 節點純度增加(increase in node purity,IncNodePurity)通過計算每個變量對分類樹每個節點上觀測值的異質性影響,比較特征的重要性,該值越大表示該變量的重要性越大圖7 三種機器學習模型的ROC 曲線 圖8 測試集三種機器學習模型ROC 曲線
本研究采用了常用的三種機器學習方法,在測試集中LR、SVM、RF 三種機器學習模型的AUC值分別為0.791、0.748 和0.85,表明三種模型對鑒別肺IMT 和PLC 有較好的效能。盡管對三種機器學習模型ROC 曲線進行Delong 檢驗發現AUC 值無統計學意義,但RF 分類器準確率更高,達到了82.9%。RF 具有抗過擬合能力強的優點,不但可以產生高準確度的分類器還可以平衡誤差。嚴志強等[9]在鑒別腎嫌色細胞癌與不典型透明細胞癌研究中,基于隨機森林算法(78.5±6.3)%和LASSO回歸(76.5±12.26)%的影像組學模型表現出比放射科醫師(45.42±3.32)%更高的符合率。三種分類器模型對測試集分類的AUC 值分別為0.781、0.739 和0.807,具有較好的分類效果這表明研究中所篩選的特征具有不錯的魯棒性。
IMT 最早發現于肺部,1939 年由Brunn 描述,曾以炎性假瘤、漿細胞肉芽腫等命名用于臨床病理診斷及報道于文獻中,并認為該類病變是一種非腫瘤性炎癥性病變,近年來認為肌纖維母細胞是這些病變的主要細胞成分,2002 年WHO 在軟組織腫瘤分類將IMT 定義為由分化的肌纖維母細胞性梭形細胞組成,常伴大量漿細胞和/或淋巴細胞的一種間葉性腫瘤。盡管有文獻描述其偶發侵襲性行為和復發潛能,但絕大多數表現出良性的臨床行為[10]。IMT 的組織學可分為三種[11]:(1)黏液/血管密集型;(2)梭形細胞豐富型;(3)少細胞纖維型。根據腫瘤的組織學和細胞學類型,肺癌可分為腺癌、鱗癌、小細胞肺癌和大細胞肺癌等。原發性肺腺癌的組織學亞型多為乳頭型,其他為實性、細毛型、腺泡型和微乳頭型,常被診斷為多種亞型的混合型[12]。
肺IMT 與PLC 在病理上的細微差別可能反映在CT 的紋理上。RF 可以在決定類別時,可以評估變量的重要性。其中IncNodePurity 是在RF 評估變量重要性指標之一,其值越大,變量重要性越大,本研究發現特征重要性位于前三的分別為均勻度、灰度共生矩陣熵_ 全方向_ 步長7、灰度共生矩陣能量_ 全方向_ 步長1。均勻度是每個強度值的平方和的量度,是圖像陣列同質性的一種度量,均勻度越大意味著同質性更強。灰度矩陣能量是圖像中均勻圖案的量度。能量值大表明一種較均一和規則變化的紋理模式。本研究中均勻度、灰度矩陣能量IMT 組較PLC 更高,IMT 密度較周圍型肺癌病變更均勻,其局部像素灰度級相差小,這可能和肺IMT 的炎性細胞分布有關。灰度矩陣熵衡量圖像中像素灰度強度分布的復雜程度,熵值越大,圖像越復雜。本研究中肺癌組熵值較肺IMT 高,可能是由于肺IMT 壞死相對小于肺癌[13],肺癌組織生長快,易發生灶性壞死。據研究[14-16]平掃CT 圖像的放射組學可更好地檢測和描述腫瘤內的生物異質性,因為在平掃圖像中缺少了病灶內血池留存對比劑的干擾,突出了病灶內腫瘤細胞本身、腫瘤細胞排列及腫瘤細胞間質等特征。本次研究采用的CT 平掃圖像可能存在優勢。
本文研究存在不足之處:(1)基于IMT 的發生率,樣本量相對較小。(2)盡管手動分割能提高分割的準確性,但穩定性可能存在一定影響,半自動分割算法可以提高放射學特征的穩定性[17]。未來需要采用多中心研究,擴大樣本量,采用半自動或全自動分割算法,篩選出具有較強魯棒性的特征。
綜上所述,CT 平掃紋理特征結合機器學習的影像組學方法鑒別診斷肺IMT 與PLC 具有一定價值,為臨床準確診斷和個體化治療提供依據。