郭蘭田,張 強,許 昌,張 虎 (濱州醫學院附屬醫院放射科,山東 濱州 256603)
肺癌是世界上最常見的惡性腫瘤之一,近年來發病率和死亡率呈逐漸上升且越來越年輕化,尤其是肺腺癌這種病理類型;隨著低劑量CT用于肺部結節篩查越來越廣泛,影像表現為磨玻璃樣的肺腺癌越來越常見。2011年肺腺癌多學科分類標準將肺腺癌分為原位癌(AIS)、微浸潤腺癌(MIA)和浸潤性腺癌(IAC)[1]。目前臨床上治療肺腺癌以手術為主要手段,術后生活質量很高。影像科醫生通過人眼觀察影像征象來診斷肺腺癌的病理亞型相對困難。近年來,影像組學已成為研究的熱點,它是通過提取隱藏在圖像中大量肉眼不可見的影像特征來輔助臨床醫生決策。目前,關于影像組學鑒別肺腺癌的浸潤程度研究較多[2-3],但是關于直徑≤2 cm磨玻璃樣肺腺癌的相關研究鮮有報道,臨床醫生術前能夠準確區分磨玻璃樣肺腺癌(≤2 cm)的浸潤程度有助于個體化治療方案的制定,從而最大程度保留患者的利益,本研究通過構建基于薄層CT的影像組學模型,以新的視角對磨玻璃樣(≤2 cm)肺腺癌浸潤程度進行研究。
1.1研究對象:回顧性分析本院2019年1月~2021年3月符合本研究要求的283例患者共288個磨玻璃樣結節的影像學資料。納入標準:①具有完整的肺部平掃CT薄層圖像并滿足診斷要求;②結節最大直徑≤2 cm;③在影像圖像上表現為磨玻璃結節,包括純磨玻璃結節和混合磨玻璃結節;④經手術大病理證實為肺腺癌。排除標準:①術前接受過放化療等相關治療;②圖像有明顯偽影。詳細記錄患者的臨床資料,包括年齡、性別。本研究經過本院醫學倫理委員會同意。
1.2CT檢查方法:CT掃描機型包括Light Speed VCT,Brillinance CT,Optima CT660,各CT機型的掃描參數詳見表1。患者取仰臥位頭先進,雙手抱頭,深吸氣后屏氣狀態下進行檢查。本研究選用距手術時間最近的一次CT圖像進行后續的研究。

表1 各CT機型的掃描參數
1.3結節分割及提取:所有CT圖像通過PACS以DICOM格式導出,再導入開源醫療圖像處理軟件3DSlicer4.10.2,對肺結節進行ROI勾畫。先由一位5年資醫師使用軟件內勾畫工具在肺結節最大直徑所在層面的圖像上進行ROI邊緣的勾畫,盡可能剔除結節邊緣的正常的血管、支氣管等結構,然后由一位15年年資醫師對ROI邊緣進行審核和修改,圖像經過像素大小歸一化處理、重采樣預處理后提取病灶的影像組學特征。一共851個影像組學特征,包括14個形狀特征、162個一階直方圖特征及675個紋理特征。
1.4可重復分析:隨機選取288個結節中的50個磨玻璃樣結節,讓兩位分別有5年和15年胸部影像診斷經驗的影像科醫生分別獨立進行ROI勾畫和影像特征提取,采用組內相關系數對二位診斷醫師提取的影像組學特征進行一致性分析,組內相關系數>0.75認為一致性較好。其余的結節由5年胸部影像診斷的醫師進行ROI的勾畫,再由15年經驗的醫師進行審核完成。
1.5病理診斷:具有10年以上經驗的病理科醫師按最新的指南進行病理結果診斷,分為AIS、MIA、IAC,其中AIS、MIA定義為第1組,IAC定義為第2組。
1.6Logistic回歸模型:將數據按照3∶2的比例分為訓練集(n=169)與測試集(n=119),采用t檢驗和最小絕對收縮和選擇算子(LASSO)在訓練集中篩選出具有鑒別意義的特征,采用10倍交叉驗證的方法進行過擬合,建立Logistic回歸模型。使用AUC值來評價Logistic回歸模型在訓練集和測試集效能。
1.7統計學分析:使用Python、SPSS22.0和R語言(R Studio,Version:3.4.4)統計學分析,并進行t檢驗與χ2檢驗。t檢驗和LASSO算法使用Python進行特征降維,篩選出具有鑒別診斷價值的影像組學特征。R語言進行Logistic回歸模型的建立和ROC曲線計算和校準曲線。
2.1患者一般資料比較:283例患者共切除288個磨玻璃樣結節,患者隨機分為訓練集(n=169)和測試集(n=119),兩組患者的性別、年齡及病灶大小比較,差異無統計學意義(P>0.05)。見表2。

表2 兩組一般臨床資料比較
2.2對影像醫師提取的影像組學特征進行可重復性分析:低年資醫師與高年資醫師對同一組結節(50個)進行標注后獲得的各項影像組特征比較,ICC>0.75,兩者一致性較好。
2.3對≤2 cm肺腺癌浸潤程度最具價值的特征進行分析:在169個磨玻璃樣結節組成的訓練集中,采用t檢驗和LASSO算法篩選出11個對鑒別≤2 cm肺腺癌浸潤程度最具價值的特征(見圖1、圖2)。包括Sphericity、Maximum2D Diameter Slice、Minor Axis Length、10 Percentile、Maximum2D Diameter Row、Maximum2D Diameter Column、Median.1、Small Dependence High Gray Level Emphasis、Size Zone Non uniformity Normalized、Maximum.1、Mean.1。具體每個特征對應的系數見圖3。

圖1 LASSO模型中特征集合,垂直虛線表示最佳取值對應的Lambda值,本研究共選出11個特征

圖2 LASSO模型中影像組學特征的特征系數收斂圖,圖中的每一條曲線代表了每一個自變量系數的變化軌跡

圖3 LASSO降維后保留的11個特征參數及其對應的系數
2.4選取的影像組學特征利用Logistic回歸建立磨玻璃樣(≤2 cm)肺腺癌浸潤程度的模型預測:回歸模型為:logit(P)=-2.845+5.716×影像組學標簽。預測模型在訓練集的AUC為0.876,在測試集AUC為0.880。兩組預測模型的結果見表3;預測模型的ROC曲線見圖4A-B。訓練集和測試集中校準曲線均顯示該模型具有良好的校準度(見圖5A-B)。

表3 訓練集與測試集的預測模型結果對照

圖4 訓練集影像組學模型(4A)和測試集影像組學模型(4B)鑒別磨玻璃樣肺癌浸潤程度的ROC曲線

圖5 訓練集影像組學模型校準曲線(5A)和測試集影像組學模型校準曲線(5B)
肺部CT掃描是診斷肺癌的主要無創性檢查手段,但每個影像科醫生診斷水平不同,導致診斷肺癌的準確率不高。隨著人工智能和影像組學在醫療領域的應用,CT圖像不僅能觀察病變的形態、密度等常規征象,而且可以利用計算機軟件提取影像特征并應用于臨床診斷,從而提高了腫瘤病變的診斷準確率、預后及療效的評估,并且避免人為因素干擾。大量的文獻顯示基于CT的影像組學可以準確預測不同腫瘤的浸潤程度和臨床預后[2-5]。因此,本研究通過構建薄層CT的影像組學預測模型,來預測磨玻璃樣(≤2 cm)肺腺癌浸潤程度。
腫瘤具有時間、空間、內在基因等異質性,包括分子水平、基因突變和表型水平、細胞核密度、腫瘤新生血管和壞死等不同層面水平的異質性。腫瘤這些異質性,如腫瘤的分化程度、有無基因突變等,很難通過影像常規征象進行評估,而影像組學就可以評估和量化腫瘤的異質性。通過影像組學實現疾病診斷,大致包括圖像采集、ROI勾畫、影像提取特征和構建模型這幾個步驟,已用于肺結節的良惡性鑒別、肺癌分期、肺癌病理學分型及預后等[6]。有文獻發現AIS、MIA患者術后5年生存率百分之百,預后良好,生活質量好,而IAC的5年生存率并不樂觀,并且生活質量差[7]。肺腺癌的病理亞型除與患者預后密切相關外,還對手術方式的選擇、術后是否需要輔助放化療亦有影響[8]。影像組學特征包括,基于腫瘤形狀的影像特征,用于描述腫瘤的幾何特性,腫瘤的直徑大小、是否圓形等;基于直方圖強度的影像特征,主要用于評估腫瘤的密度信息、像素灰度值的大小、區域的灰度值是否均勻等;基于紋理結構的影像特征,首先計算圖像的共度共生矩陣、灰度區域矩陣等多種模式,用于描述病灶組織內空間分布的像素信息,反映圖像的灰度值的變化、相鄰像素灰度值的差異程度、像素粗糙與光滑程度等異質性特征。本研究與葉釘利等[9-11]人研究結果大致一致,根據文獻介紹,肺腺癌的浸潤程度與影像組學中的病灶大小、灰度峰值在直方圖中的位置、能量、焗、部分小波特征等有關[12-13]。而本研究大部分有意義的影像組學特征來源于形狀和直方圖特征,這些特征反映了磨玻璃樣肺腺癌病灶的表面粗糙程度、灰度分布非均勻性等的局部差異,從不同層面反映了腫瘤的異質性。本研究還進行基于小波變換的影像特征提取,全面反映腫瘤不同空間頻率信息,盡可能用完善的影像組學特征來反映腫瘤的異質性。本研究通過Logistic回歸建立肺腺癌浸潤程度的模型預測,預測模型在訓練集的AUC為0.876,測試集中預測模型的AUC為0.880,具有很高的預測能力。因此,本研究中的Logistic回歸模型能為臨床預測磨玻璃樣(≤2 cm)肺腺癌浸潤程度以及臨床決策預后等提供非常可靠的依據。
盡管影像組學是現階段醫學科研研究的熱點,但是影像特征的不穩定性以及冗余性都是科研者迫切關注的問題[14-16]。本研究中所納入的均為≤2 cm大小的磨玻璃結節,手動勾畫ROI不僅受到主觀因素的影響,病灶本身直徑過小等也給勾畫帶來了難度。此外,本研究提取的影像組學特征為二維特征,并且數據采集來自不同廠家不同型號的CT掃描儀器,因此采用了Z-score標準化、重采樣處理以及單因素方差分析和LASSO降維等措施來避免提取的影像特征不穩定以及冗余性帶來的結果影響。
本研究存在以下不足:①這只是單一中心回顧性研究,并且只僅僅納入≤2 cm大小的磨玻璃結節,樣本數量有限,不排除存在數據偏差的可能;②本研究納入的病例采用本院幾種不同的CT機型,掃描參數等存在一定的差異,也可能對結果有影響;③未分析肺癌常規影像征象。因此,本研究的結論可能尚需要進一步多中心、大樣本、多參數的研究來驗證結果。
綜上所述,本研究通過篩選影像組學特征,建立了一個預測磨玻璃樣(≤2 cm)肺腺癌浸潤程度的Logistic回歸模型,并具有較好的預測價值,有望用來輔助臨床醫師術前決策和預后的判斷。