紀敬斌,張宸瑜,彭壘,矯文捷
(青島大學附屬醫院胸外科,山東 青島 266003)
近年來,隨著人工智能(AI)的快速發展,其在輔助醫師對肺部病變(包含肺結節及包塊等)的CT結果作出影像學診斷方面得到了廣泛的認可和應用[1-2]。多項研究顯示,AI在提高肺部病變診斷效率、降低肺部病變漏診誤診率及改善肺部病變診斷性能等多個方面展示出了較為明顯的應用前景[3-7]。2022年首次發表的AI在肺結節診治中的應用專家共識指出,AI在肺結節識別、良惡性鑒別診斷和病理分型預測等方面均有重要價值,對實現手術前肺癌及亞型精準診斷和提高手術成功率具有重要意義[8]。然而,目前AI對部分亞實性結節等多類結節診斷的假陰性率較高,其準確度也低于人工,仍需要人工閱片以減少漏診和提升準確度。本文使用目前廣泛應用于臨床的深睿醫療AI醫學影像輔助診斷系統(AI系統),對肺占位性病變病人不同掃描層間距的胸部CT影像資料進行回顧性分析,旨在分析及評價AI系統在兩種不同掃描層間距CT檢查圖像上對肺占位性病變的診斷價值,探討CT影像學特征和病變大小對AI系統診斷準確度的影響。
回顧性分析2021年6月—2022年3月就診于我院胸外科的821例肺占位性病變病人臨床資料。根據病人術前最后一次CT檢查影像片的掃描層間距分為厚層CT(≥3 mm)和薄層CT(<3 mm)。所有入組病人均有可供AI分析的厚層CT影像資料,808例病人有可供AI系統分析的薄層CT影像資料。病人納入標準:①進行手術治療并于術中取得病理學標本,有對應病灶明確的病理診斷結果;②術前1周內進行過胸部CT檢查,若進行過多種或多次檢查則以術前最后一次檢查方式和檢查結果為準;③影像學資料提供了CT影像學特征,可導入AI系統進行診斷分析。本文研究獲得青島大學附屬醫院醫學倫理委員會批準(IRB#QYFYWZLL 27703)。
1.2.1儀器與方法 檢查設備為Siemens SOMATOM Definition Flash CT機,檢查時病人取仰臥位且頭先進,掃描范圍自胸廓入口到肺底部。掃描參數:管電壓120 kV,管電流200~300 mA,層厚1 mm。注射對比劑為碘海醇(350 g/L)50 mL,注射流量3.5 mL/s。注射對比劑后,啟用對比劑團注跟蹤技術,采集注入對比劑后60 s的圖像。
1.2.2CT影像數據分析 由兩位有10年以上工作經驗的放射科醫師對所有病人胸部CT資料進行分析,意見不同時再與一名有15年以上工作經驗的放射科醫師討論后得出最終影像學診斷結果。病人肺部有多個病變或結節影時,對手術切除的主要病變進行分析并記錄多發結節影位置和大小。CT資料中部分影像學特征不明的樣本,從對應影像學特征的分析中排除。主要觀察的影像學指標如下。①大小:測量病變的長徑及短徑;②單發或多發:病變有無單側肺部或雙側肺部的多發結節影;③邊界:病變的邊緣是否清楚;④胸膜牽拉:病變有無胸膜牽拉現象;⑤其他:病變有無毛刺、分葉現象。
1.2.3AI系統診斷準確度的判定 將病人術前所進行的最后一次CT檢查圖像導入AI系統,以AI系統自動判斷結節的危險度分為良性病變及惡性病變。以病人術中送檢標本的病理診斷結果為金標準,與AI系統的診斷結果進行比較。判定標準為:①若病理診斷結果為良性病變,AI系統在對應掃描層間距的CT圖像上發現該病變并診斷為良性病變,則認定AI系統判定正確;未發現該病變或診斷為惡性病變,則認定AI系統判定錯誤;②若病理診斷結果為惡性病變,AI系統在對應掃描層間距的CT圖像上發現該病變并診斷為惡性病變,則認定為AI系統判定正確;未發現該病變或診斷為良性病變,則認為AI系統判定錯誤。

以病理診斷結果為金標準,AI系統診斷厚層CT組肺占位性病變的靈敏度為92.4%(744/805),特異度為93.8%(15/16),陽性預測值為99.9%(744/745),陰性預測值為19.7%(15/76),符合率為92.4%(759/821),ROC曲線下面積(AUC)為0.931(95%CI=0.854~1.000,P<0.001);AI系統診斷薄層CT組肺占位性病變的靈敏度為94.1%(746/793),診斷特異度為100.0%(15/15),陽性預測值為100.0%(746/746),陰性預測值為24.2%(15/62),符合率為94.2%(761/808),ROC曲線AUC 0.970(95%CI=0.957~0.983,P<0.001)。見表1、2。

表1 AI系統對厚層CT組肺占位性病變的診斷價值

表2 AI系統對薄層CT組肺占位性病變的診斷價值
AI系統對厚層CT的影像學診斷結果顯示,肺部病變的多項CT影像學特征,包括病變的長徑、短徑、邊緣是否清晰、有無胸膜牽拉、有無分葉,對AI系統診斷準確度影響差異有顯著意義(χ2=4.747~123.691,P<0.05);AI系統對薄層CT的影像學診斷結果顯示,肺部病變有無胸膜牽拉對AI系統診斷準確度影響差異均具有統計學意義(χ2=4.031,P<0.05)。見表3。

表3 AI系統診斷準確度與CT影像學特征關系
本研究肺部病變CT影像上的長徑為5.0~130.1 mm,平均(19.8±12.7)mm。結合臨床和影像學判斷標準,將肺部病變按長徑分為5.0~8.0、8.1~20.0、20.1~30.0和>30.0 mm 共4組。AI系統基于厚層CT對不同大小肺占位性病變的診斷準確度差異有顯著性(Z=-4.237,P<0.001),AI系統基于薄層CT對不同大小肺占位性病變診斷準確度差異無顯著性(Z=-0.877,P>0.05)。見表4。

表4 AI系統對胸部CT不同大小肺占位性病變診斷準確度比較
結合2022年版AI在肺結節診治中的應用專家共識[8]及近年來相關研究結果,AI系統在臨床中可以根據影像學相關資料快速鑒別肺占位性病變(尤其是肺結節病變)良惡性[8-10]。然而,在病理診斷為惡性腫瘤的肺部病變中,AI系統對其惡性程度診斷存在缺陷。有研究顯示,對良性病變尤其是表現為亞實性結節等幾種特定影像學表現的病變,AI系統診斷的假陽性率較高,需要人工閱片進行進一步的確診[8,11]。本研究對我院手術治療的821例肺部疾病病人CT影像學資料,使用目前廣泛應用于臨床的深睿醫療AI系統進行回顧性分析。結果顯示,AI系統診斷兩種不同掃描層間距肺占位性病變CT影像資料的靈敏度、特異度、陽性預測值和符合率均超過90%,AUC均超過0.95。本文研究結果高于目前該類研究結果[10,12],顯示出了較高的應用價值。本文結果還顯示,AI系統對薄層CT組的診斷效果略優于厚層CT組。然而,兩組的陰性預測值均較低,這可能是因為本文研究病人均為在胸外科行手術治療的病人,惡性病變所占比例較高。基于上述研究結果,AI系統對影像科醫生的工作具有較強的輔助作用,但人工閱片仍然是對肺占位性病變良惡性鑒別不可缺少的一部分。當AI系統報告肺占位性病變為“高危”時,該病變應引起足夠的重視;當AI系統報告肺占位性病變為“低危”時,仍需影像科醫生進行人工閱片以減少漏診。
本文對AI系統診斷準確度與CT影像學特征的關系分析顯示,AI系統的診斷準確度在厚層CT和薄層CT圖像上有一定的差異,有無胸膜牽拉在兩種厚度的CT圖像中均會影響AI系統診斷準確度;而肺部病變長短徑、邊緣清晰度和有無分葉現象等因素則只在AI系統對厚層CT圖像的診斷中會產生影響,對薄層CT圖像AI系統診斷無明顯影響。腫瘤的大小是決定腫瘤分期和處理方式最重要的因素之一。在CT影像學范疇內,腫瘤的長徑、短徑和體積均可以作為影像學上判定腫瘤大小的依據。而在臨床中對腫瘤大小作出判定通常是根據腫瘤的長徑。本文研究結合臨床和CT影像學判斷標準,將肺部病變根據長徑不同分為4組,AI系統對4組厚層CT圖像的診斷準確度差異有顯著性,而對4組薄層CT圖像的診斷準確度差異無顯著性。
本研究存在以下局限性:①該研究是一項單中心的回顧性研究,本研究取得的CT影像學資料存在一定的滯后性,研究結果可能產生數據偏移;②本研究以病變最終的病理診斷結果作為金標準,納入研究的結節均為術后病理診斷的肺占位性病變。由于臨床上對長徑<5 mm肺占位性病變的處理原則通常為優先進行觀察而非手術或取活組織檢查,故本研究無法評估AI系統對長徑<5 mm肺占位性病變的診斷準確度。
綜上所述,AI系統評估不同掃描層間距肺占位性病變影像資料的靈敏度、特異度、陽性預測值、符合率和AUC均較高,病灶有無毛刺及分葉在各種掃描層間距的CT片中均會影響AI系統的診斷準確度;AI系統對掃描層間距≥3 mm的厚層CT片上不同大小的腫瘤診斷準確度差異有顯著性,而對掃描層間距<3 mm薄層CT片診斷結果差異無顯著性。以后的研究中,應在多個使用深睿醫療AI系統的醫院收集更多樣本,進一步驗證AI系統對CT影像診斷的準確度。