陳小琪, 徐華霞, 王小玥, 李銳進, 邱明鏈, 邱模良, 吳凱明, 胡志堅
我國是食管癌(esophageal carcinoma, EC)的高發地區,發病率為11.130/100 000,居我國腫瘤發病率第六位;其死亡率為8.280/100 000,居我國腫瘤死亡率第五位[1]。EC的病理類型包括鱗狀細胞癌和腺癌,我國約90% EC為食管鱗癌(esophageal squamous cell carcinoma, ESCC)[2]。淋巴結轉移(lymph node metastasis, LNM)是ESCC的主要轉移方式,是TNM分期中重要的病理特征之一,也是影響ESCC患者總生存期的關鍵性預后指標[3]。由于獨特的淋巴引流方式,EC極易在食管黏膜及黏膜下層豐富的淋巴管網內發生廣泛或跳躍性轉移[4],具有較高的LNM發生率[5],導致患者預后不佳。因此,識別ESCC患者是否發生LNM并評估患者預后顯得尤為重要。
影像組學作為一種非侵入性方法,能夠從醫學影像中挖掘出定量特征,并結合統計學方法篩選出最有價值的影像特征,用于疾病的診斷、療效評估及預后預測,包括乳腺癌、肺腺癌、結直腸癌等惡性腫瘤的診斷及預后評估[5-6],特別是用于識別原發性腫瘤是否伴有LNM[7]。已有研究[8-9]證實,影像組學在預測ESCC LNM和預后方面的潛在價值。然而,這些研究僅僅關注原發性腫瘤的影像特征,未探討淋巴結影像特征與LNM的關聯。同時,這些研究大多使用人工手動法對影像特征進行分割與提取[10-12]。人工手動分割不僅耗時,且受經驗與主觀因素影響比較大,難以適用于大規模的病例研究[12]。與人工手動分割相比,用卷積神經網絡(convolutional neural networks, CNN)獲取到的特征可以讓復雜的內部信息得到更好的描述,能夠發現更深層次的特征[13],適用于大數據研究。本研究基于CNN分割提取到的淋巴結影像組學特征,探討LNM相關的影像組學特征與ESCC LNM及預后的關聯,為ESCC淋巴結的識別及預后判斷提供理論依據。
1.1 對象 收集2014年6月—2021年9月福建醫科大學附屬第一醫院308例新發ESCC患者,其中淋巴結未轉移者154例,LNM者154例。將研究對象按照2∶1隨機分為訓練集(n=206)和驗證集(n=102)。納入標準:(1)經手術病理組織學確診的原發性ESCC;(2)術前未接受放、化療;(3)在福建省居住10 a以上。排除標準:(1)經病理診斷確診為非原發性ESCC、復發性ESCC患者;(2)伴有肝腎功能不全或急慢性感染;(3)病情危重不能清晰回答問題者。本研究通過福建醫科大學倫理委員會批準(審批號:201495),患者及家屬均知情同意。
1.2 影像資料收集 影像資料來源于福建醫科大學附屬第一醫院胸外科。采用Toshiba Aquilion One 320排CT機,從胸廓入口到肺底,進行胸部螺旋掃描。掃描參數:根據醫院統一標準執行。所有患者數據格式均保持一致,采用digital imaging and communications in medicine (DICOM)格式。
1.3 影像組學特征提取與篩選
1.3.1 影像資料標記 根據影像指南統一標記標準,由2位具有5 a以上工作經驗的影像科醫生使用MRIcroGL軟件標記ESCC患者CT影像資料中的淋巴結。
1.3.2 圖像分割 為確保分割的準確性及節省人力物力,本研究使用CNN對標記的淋巴結區域進行自動分割,進而提取ESCC淋巴結的影像組學特征。
1.3.3 影像資料提取 為減少各種CT掃描儀的影響,統一將DICOM圖像轉換為灰度值圖像,并對每個患者自動提取感興趣區(region of interest, ROI)的影像特征進行進一步分析,使用CNN自動提取ESCC的CT淋巴結特征,共提取到999個影像組學特征值用于后續研究。
1.4 統計學處理 采用SPSS 24.0軟件及R(4.10)軟件進行統計分析。使用χ2檢驗比較2組患者臨床特征的分布情況。本研究使用CNN對標記的淋巴結區域進行自動分割,并自動提取ESCC淋巴結的影像組學特征;進而分別使用LASSO回歸和隨機森林篩選影像組學特征構建ESCC LNM的預測模型。根據最佳λ納入LASSO回歸篩選的影像組學特征;根據十折交叉驗證擬合的模型誤差及increase in mean squared error(%IncMSE)納入隨機森林篩選的影像組學特征。以曲線下面積(area under the curve, AUC)作為判斷模型的效能;并使用Delong法比較,選擇最佳模型進行后續研究;根據Cox回歸(向后法)算法所得回歸系數構建與篩選出ESCC預后相關的影像組學標簽(radiomics signature),并使用Cox回歸探討影像組學標簽與ESCC預后的關聯;以C指數評價由多因素Cox回歸分析變量所建列線圖的預測能力。
2.1 臨床特征比較 訓練集和驗證集在性別、年齡、腫瘤部位、腫瘤直徑、分化程度和T分期分布均衡可比(P>0.05,表1)。

表1 訓練集和驗證集患者的臨床特征比較
2.2 篩選與ESCC LNM相關影像組學特征構建ESCC LNM的預測模型
2.2.1 使用LASSO回歸篩選影像組學特征構建ESCC LNM的預測模型 使用LASSO回歸篩選影像特征,最佳λ為0.024(圖1)。使用LASSO回歸,共篩選出19個影像特征,分別為:173、417、457、473、504、521、546、583、585、611、678、695、761、812、884、905、932、974和987。

CNN:卷積神經網絡。
使用上述19個影像特征構建預測模型,在全模型、訓練集和驗證集中,其AUC (95% CI)分別為:0.747(0.694,0.801)、0.751(0.686,0.817)和 0.766(0.672,0.860)(圖2)。

ESCC:食管鱗癌;LNM:淋巴結轉移;AUC:曲線下面積。A:全模型;B:訓練集;C:驗證集。
2.2.2 使用隨機森林篩選影像組學特征構建 ESCC LNM的預測模型 根據隨機森林計算結果(圖3)。以十折交叉驗證曲線中模型誤差的穩定性及%IncMSE作為篩選影像特征的依據,選擇排序為前9位的影像特征用于構建ESCC LNM預測模型,9個影像特征分別為987、306、505、438、111、546、799、566和850。

%IncMSE:增長的錯誤率平方均值;CNN:卷積神經網絡。
使用上述9個影像特征構建預測模型,在全模型、訓練集和驗證集中,其AUC (95% CI)分別為:0.692(0.633,0.751)、0.683(0.610,0.755)和 0.723(0.624,0.822)(圖4)。

ESCC:食管鱗癌;LNM:淋巴結轉移。AUC:曲線下面積。A:全模型;B:訓練集;C:驗證集。
2.2.3 篩選最佳預測模型 使用Delong法比較LASSO回歸與隨機森林篩選的影像組學特征構建的ESCC LNM預測模型。分析發現,使用LASSO回歸所構建模型的AUC優于使用隨機森林所構建的模型(Z=-3.955,P<0.001)。因此,本研究選擇使用LASSO回歸篩選的變量進行后續的分析。
2.3 使用ESCC LNM相關的影像組學特征構建ESCC預后相關的影像組學標簽 通過Cox回歸(向后法)算法進一步篩選出與ESCC預后相關的影像組學特征,根據回歸系數構建影像組學標簽,具體計算方式如下:
影像組學標簽=β1X1+β2X2+β3X3+…+βnXn
(1)
式中Xn表示影像組學特征變量,βn表示所對應的回歸系數[14]。
2.4 影像組學標簽與ESCC預后的關聯分析 本研究對象的生存時間中位數為 17.430 個月,1、3及5 a生存率分別為77%(95% CI:0.720, 0.830)、52%(95% CI:0.450, 0.590)和42%(95% CI:0.310, 0.520)。根據影像組學標簽的中位數,將其分為低風險影像組學標簽組和高風險影像組學標簽組。
調整性別、年齡、腫瘤直徑、分化程度、T分期、術后放化療和影像組學標簽,多因素Cox回歸分析發現,高風險的影像組學標簽與ESCC不良的預后相關(P<0.05,表2)。

表2 多因素LASSO Cox回歸分析
2.5 列線圖 使用多因素Cox回歸分析的變量構建列線圖(圖5,圖6),影像組學標簽能很好地預測食管癌的預后,總生存率(overall survival, OS)C指數(95% CI)在全模型、訓練集和驗證集中分別為0.710(0.670,0.749)、0.765(0.742,0.788)和0.652(0.568,0.736),無病進展生存率(disease free survival,DFS)C指數(95% CI)在全模型、訓練集和驗證集中分別為0.775(0.746,0.804)、0.754(0.726,0.781)和0.774(0.760,0.789)。

A:全模型;B:訓練集;C:驗證集。OS:總生存率。

A:全模型;B:訓練集;C:驗證集。DFS:無病進展生存率。
影像組學在醫療領域應用越來越廣泛,其在疾病的輔助診斷、療效評估和預后預測方面已有初步效果[8-9]。本研究通過CNN提取影像組學特征,并使用LASSO回歸篩選與ESCC LNM相關的影像組學特征,構建ESCC LNM的預測模型,發現該模型識別LNM的效果較好(AUC=0.750, 95% CI:0.690,0.800)。同時,多因素Cox回歸分析發現,高風險影像組學標簽與ESCC不良預后有關。此外,列線圖結果顯示,影像組學標簽在預測ESCC預后方面有較高的價值。
近年來,多項研究[5,15-17]證實影像組學在LNM的預測價值。如ZHAO等[18]基于ESCC患者臨床特征及計算機斷層掃描提取到的影像組學特征,構建LNM預測模型,訓練集和驗證集的AUC分別為0.870和0.840。趙博[19]的研究發現,基于CT影像組學可以較好地預測ESCC LNM,且對“隱匿”LNM的預測也有一定的潛力,訓練組和驗證組的AUC分別為0.870和0.840。然而,上述研究大多采用手動分割對CT影像資料進行圖像分割和特征提取,耗時又耗力,且手動分割存在分割不準確、對邊界判斷具有主觀性等問題[10-12]。本研究通過CNN來分割并提取ESCC LNM的影像組學特征,其分割精準,且能節省時間,并擇優選擇LASSO回歸對提取到的999個特征值進行篩選,共篩選出19個影像特征并構建預測LNM的預測模型,其AUC (95% CI)在全模型、訓練集和驗證集中分別為0.747(0.694,0.801)、0.751(0.686,0.817)和0.766(0.672,0.860)。
使用Cox回歸篩選與預后相關的影像組學特征,并根據回歸系數構建影像組學標簽,根據中位數將其分為低風險和高風險影像組學標簽,結果顯示,與低風險影像組學標簽比較,高風險影像組學標簽與不良預后相關,說明影像組學標簽與ESCC預后存在關聯,可用于ESCC預后的預測,與文獻 [8-9] 結論一致。此外,基于影像組學標簽,構建ESCC預后預測的列線圖,分析發現總OS C指數(95% CI)在全模型、訓練集和驗證集中分別為0.710(0.670,0.749)、0.765(0.742,0788)和0.652(0.568,0.736),DFS C指數(95% CI)分別為0.775(0.746,0.804)、0.754(0.726,0.781)和0.774(0.760,0.789),說明影像組學標簽能較好地預測ESCC的預后。但本研究為小樣本、單中心研究,模型的外推使用及穩定性有待進一步進行多中心、大樣本的驗證。