宋冬冬,朱曉明,朱麗娟,顧俊,伍建林,張清
1. 大連大學附屬中山醫院 放射科,遼寧 大連 116001;2. 北京推想科技有限公司 全球臨床科研合作學院,北京 100025
肺癌是我國目前發病率和死亡率最高的惡性腫瘤[1],并仍呈逐年增長趨勢。多層螺旋CT肺癌的早期篩查,對肺癌的預防以及早期治療意義重大[2],能有效提高早期肺癌患者的5年生存率[3]。隨著人工智能(Artificial Intelligence,AI)深度學習技術在醫療領域的推廣應用,肺CT圖像的AI輔助結節篩查,在臨床上得到廣泛開展[4],在提高工作效率的同時能有效降低肺結節的漏診率[5]。目前關于AI對肺結節檢測效能的研究正逐步深入,但這些研究多集中在胸部CT單源掃描以及AI臨床應用方法及價值[6-8]的探討上,而雙能掃描對人工智能輔助肺結節檢測效能的研究尚無人開展。本文旨在探討臨床中,胸部雙能CT掃描結合AI行肺結節篩查,其檢測效能與常規胸部CT單源120 kVp掃描的對比,同時比較兩種模式的輻射劑量。
研究通過了本院倫理委員會批準,所有研究對象檢查前簽署知情同意書。收集2018年12月至2019年2月行雙源CT肺結節篩查的患者。納入標準:18歲以上,臨床行胸部CT平掃檢查的患者。排除標準:由于胸部手術史、胸腔積液、彌漫性間質性病變、肺不張、肺部炎性病變及CT圖像中呼吸運動偽影等,影響結節確認及標注者。381例患者納入研究。按照掃描模式不同將患者分為兩組:A組(183例)采用單源120 kVp掃描,B組(198例)采用雙能模式掃描并收集融合120 kVp圖像。兩組患者的年齡、性別、結節大小及結節類型差異均無統計學意義(表1)。

表1 兩組患者的臨床資料比較結果
所有患者均在雙源CT機(Siemens Somatom Definition Flash,德國)上進行。掃描范圍為胸廓入口到膈肌水平,包括整個肺野。單源掃描方式參數:探測器準直器128×0.6 mm,機架旋轉時間為0.5 s /周,螺距為1.2,管電壓120 kVp,參考管電流130 mAs,開啟CAREDose 4D技術;雙能掃描方式參數:探測器準直器64×0.6 mm,機架旋轉時間為0.28 s /周,螺距為0.7,A管球管電壓100 kVp,B管球管電壓sn140 kVp,融合圖像為120 kVp(兩者按4:6的比例融合圖像),參考管電流A管球110 mAs、B管球94 mAs,開啟CAREDose 4D技術。
A、B兩組圖像均行1 mm、骨算法重建,得到單源120 kVp和雙能融合120 kVp兩組標準CT薄層圖像。使用推想科技的肺結節薄層訓練模型檢測軟件(Infer Read CT Lung Research, Infervision, Beijing,China),該系統基于40萬訓練數據集且數據來源于全國多家大型三甲醫院,能將疑似肺結節的部位準確標記[9]。對上述兩組CT圖像進行肺結節檢測,記錄檢測出所有結節的數量、位置,并按大?。ㄖ睆健? mm或<4 mm)、類型(實性或亞實性)分類;三名不同年資的影像診斷醫生結合AI對兩組圖像的肺結節進行分析,均依據《肺結節診治中國專家共識(2018年)》。首先由兩名有10年以上經驗的醫師對兩組圖像所有結節的數量、位置分別進行標注,并按大小(直徑≥4 mm或<4 mm)、類型(實性或亞實性)分類,標注結果不同之處由二人討論后統一結果,最后再由一名主任醫師對以上二人制定結果進行審閱,確立最終金標準結節。將人工智能軟件自動檢測結果與金標準比對,并統計檢出結節的真陽數、假陽數,計算出檢測敏感度、精確度和假陽性率。按公式ED=DLP×k(k為轉換系數)計算有效輻射劑量。
所有統計學處理均應用SPSS 20.0版本進行。計量資料使用均數±標準差(±s)表示,比較采用卡方檢驗,分別對敏感度、DLP、CTDIvol、ED進行組間方小差分析,P<0.05差異具有統計學意義。
兩組圖像對于AI的肺結節檢測效能比較,差異有統計學意義(P<0.005),見表2。

表2 兩組圖像對于AI的肺結節檢測效能
兩組對于AI對直徑≥4 mm和直徑<4 mm肺結節的檢測效能比較,差異有統計學意義(P<0.005),見表3~4。

表3 兩組圖像對于AI對直徑≥4 mm肺結節的檢測效能

表4 兩組圖像對于AI對直徑<4 mm肺結節的檢測效能
兩組圖像對于AI對實性肺結節和AI對亞實性肺結節的檢測效能比較,差異有統計學意義(P<0.005),見表5~6。

表5 兩組圖像對于AI對實性肺結節的檢測效能

表6 兩組圖像對于AI對亞實性肺結節的檢測效能
A組CTDIvol、DLP、ED均高于B組,差異有統計學意義(P<0.05),見表7。

表7 兩組掃描輻射劑量
基于深度學習[10]的AI肺結節輔助檢測在臨床CT圖像上的廣泛應用[11],極大地提高了醫生對肺結節的檢診效率[12]。目前臨床多在單源掃描下采集CT薄層圖像,進行AI輔助肺結節篩查,其檢測效能還有不足之處,尤其在臨床上極易漏診的最大直徑<4 mm和亞實性結節的檢出上[13],敏感度還有待提高[14]。
隨著雙源CT的普及應用[15-17],胸部CT雙能掃描成為日常臨床工作中的一個選項,常規條件下與單源掃描相比,胸部CT雙能掃描在不增加輻射劑量的前提下,能夠得到融合120 kVp、sn140 kVp與100 kVp不同能量的圖像,為診斷與鑒別診斷提供更多的參考依據[18]。本研究在雙源CT常規劑量胸部CT肺結節篩查中,將單源掃描120 kVp與雙能掃描融合120 kVp的肺CT圖像中,肺結節的AI檢測效能進行了比較,結果顯示雙能掃描融合120 kVp圖像的肺結節檢測敏感度明顯更高,輻射劑量明顯更低,而假陽性率卻不高,AI檢測效能明顯優于單源掃描120 kVp圖像。其中:無論對于結節直徑≥4 mm(臨床需選擇性影像隨訪或12個月影像隨訪[19]),還是直徑<4 mm(臨床需12個月影像隨訪或6~24個月間不同方式影像隨訪[19]),融合120 kVp圖像檢測敏感度均明顯更高,對于直徑≥4 mm的結節融合120 kVp圖像檢測假陽性率更低;無論實性結節還是亞實性結節,融合120 kVp圖像的檢測敏感度均明顯更高,對于實性結節融合120 kVp圖像的假陽性率更低。盡管與單源120 kVp圖像相較,融合120 kVp圖像在肺結節檢測的假陽性率上沒有明顯的降低,但在AI輔助醫生對肺結節的檢出上,更高的結節檢測敏感度,減少肺結節的漏診臨床意義更大,尤其在臨床中容易漏檢的小結節(最大直徑<4 mm)和亞實性結節上,雙能融合120 kVp圖像的檢測敏感度較單源120 kVp圖像有了較大的提高。圖1顯示了2例臨床易漏診<4 mm亞實性結節在雙能融合120 kVp結合AI被檢測出來,而在單源120 kVp圖像結合AI中漏診。

圖1 兩組圖像對臨床易漏診結節的AI檢出對比
最新發表在RSNA旗艦雜志Radiology: Artificial Intelligence的文章[20]比較了一些掃描參數(比如CT設備廠家、掃描輻射劑量)對于深度學習肺結節檢出模型檢出效能的影響,結果發現CT設備廠家以及輻射劑量對于檢出效能(敏感度、假陽率)并沒有影響,在我們的研究當中,單源120kVp的有效輻射劑量(4±1.1)mSv雖然略高于雙源掃描(3.23±0.97)mSv,但是這不太可能是影響結節檢出率的決定因素。因此我們猜測可能是由于雙源融合圖像(mixed image)的圖像質量優于單源120 kVp圖像質量從而導致AI輔助診斷軟件的檢出效能更高。雙源融合圖像選取來自低能100 kVp和高能Sn140 kVp的掃描圖像,低能(100 kVp)圖像具有高對比度,高能圖像(Sn140 kVp)具有較低噪聲,尤其Sn140是在140 kVp球管上添加了錫板過濾掉低能射線,讓射線更“硬”,因此圖像噪聲得以進一步降低,所以融合圖像兼具高對比度和低噪聲的特點,往往圖像的對比噪聲比優于單源120 kVp掃描圖像[21]。相比于單源120 kVp掃描,雙能掃描更優的融合圖像質量可能是引起雙能掃描AI檢出效能更高的潛在原因,當然這還有待進一步試驗和數據的驗證。
本研究也存在一定不足之處,首先兩組數據的人口統計學信息沒有納入本研究,其次樣本量還需繼續加大,我們將在以后的研究中予以完善。
總之,雙能掃描融合120 kVp的CT圖像較單源120 kVp的CT圖像,在結合AI肺結節的檢測中,敏感度更高,總體假陽性率也更低,且輻射劑量明顯降低,值得在臨床中推廣應用。