蔡雅倩, 張正華, 韓丹, 黃建強(qiáng), 李浚利, 金文鳳
肺癌的發(fā)病率、病死率已位居我國(guó)惡性腫瘤第一位,早期診斷和治療可明顯提高患者生存質(zhì)量,延長(zhǎng)生存期。隨著高分辨率CT (high resolution CT,HRCT)在肺癌早期篩查中的普及,圖像數(shù)量倍增、小結(jié)節(jié)顯示率提高及定量測(cè)量使閱片工作量顯著增加,高強(qiáng)度工作致影像科醫(yī)生易產(chǎn)生視覺疲勞,加之經(jīng)驗(yàn)不足等,不可避免導(dǎo)致小結(jié)節(jié)的漏診率增高,特別是磨玻璃結(jié)節(jié)(ground glass nodule,GGN),密度淺淡,漏診率更高。以往研究表明持續(xù)存在的GGN可能提示癌前病變、微浸潤(rùn)性或浸潤(rùn)性腫瘤的可能[1],因此在大量圖像資料中準(zhǔn)確篩查出GGN并早期定性,已成為臨床迫切需求。基于深度學(xué)習(xí)的人工智能(artificial intelligence,AI)憑借其準(zhǔn)確的算法模型,不僅能在短時(shí)間內(nèi)檢出GGN,而且能對(duì)其進(jìn)行定性分析,預(yù)判其良惡性,已在臨床廣泛試用,但對(duì)其準(zhǔn)確性目前尚無明確定論。本研究旨在探討AI對(duì)GGN篩檢和定性診斷的臨床應(yīng)用價(jià)值。
搜集2018年12月-2019年6月間行胸部CT平掃的200例患者。病例納入標(biāo)準(zhǔn):①結(jié)節(jié)直徑≤3 cm;②CT圖像層厚為1 mm。病例排除標(biāo)準(zhǔn):①肺部彌漫性病變;②圖像有嚴(yán)重偽影。137例GGNs患者經(jīng)手術(shù)病理證實(shí),其中良性54例,惡性83例。54例良性病變患者中,男25例,女29例,平均年齡(52.24±8.47)歲,包括不典型腺瘤樣增生6例,肺泡間隔纖維化12例,結(jié)核11例,炭末沉積6例,炎癥19例;83例惡性病變患者中,男30例,女53例,平均年齡(54.64±8.45)歲,包括浸潤(rùn)性腺癌44例,微浸潤(rùn)性腺癌29例,原位癌10例。
采用Siemens Somatom Definition AS 128層螺旋CT機(jī)、Siemens Somatom Definition Flash及聯(lián)影UCT 760行胸部HRCT平掃。Siemens Somatom Definition AS 128層螺旋CT機(jī)及Siemens Somatom Definition Flash掃描參數(shù):管電壓100 kV,管電流80 mAs,CarekV semi,自動(dòng)管電流調(diào)制,螺距0.938,重建卷積函數(shù)采用B70f。聯(lián)影UCT 760掃描參數(shù):管電壓100 kV,管電流80 mAs,自動(dòng)管電流調(diào)制,螺距0.938,肺窗濾波函數(shù)B-SHARP-C。重建層厚1 mm,層間距1 mm。掃描范圍從肺尖至肺底全部區(qū)域,兩側(cè)包括胸壁、腋窩。采用肺窗進(jìn)行圖像分析(窗寬1500 HU,窗位-400 HU)。
由兩位從事胸部影像診斷的高年資醫(yī)師對(duì)200例患者的胸部CT圖像同時(shí)進(jìn)行閱片分析,定量結(jié)節(jié)個(gè)數(shù),兩者意見不一致時(shí),討論后達(dá)成統(tǒng)一意見。根據(jù)閱片方式不同將200例患者分成3組:A組由住院醫(yī)師單獨(dú)閱片,B組由AI(醫(yī)學(xué)影像輔助診斷軟件Dr.Wise Lung Analyzer,版本:V1.1.0.1,型號(hào):MIDS-PNA)單獨(dú)閱片,C組由住院醫(yī)師結(jié)合AI綜合閱片。記錄每組的閱片時(shí)間及結(jié)節(jié)檢出數(shù),并以兩位高年資醫(yī)師的診斷結(jié)果為標(biāo)準(zhǔn),分別計(jì)算A、B、C三組的誤診率、漏診率、敏感度、陽(yáng)性預(yù)測(cè)值,誤診率=誤診數(shù)/檢出數(shù)×100%,漏診率=漏診數(shù)/結(jié)節(jié)總數(shù)×100%,敏感度=診斷正確數(shù)/結(jié)節(jié)總數(shù)×100%,陽(yáng)性預(yù)測(cè)值=診斷正確數(shù)/檢出數(shù)×100%。
將經(jīng)手術(shù)病理證實(shí)的137例患者的肺窗薄層圖像調(diào)入進(jìn)行AI分析(圖1),得到相關(guān)量化參數(shù):結(jié)節(jié)長(zhǎng)徑、短徑、最大面積、體積、平均CT值、最大CT值、最小值CT值及惡性概率。長(zhǎng)徑和短徑分別為結(jié)節(jié)在三維空間內(nèi)的最長(zhǎng)徑和最短徑。惡性概率為AI基于計(jì)算機(jī)深度學(xué)習(xí)分析肺結(jié)節(jié)特征后得出結(jié)節(jié)為惡性的概率。
采用SPSS21.0軟件包進(jìn)行統(tǒng)計(jì)學(xué)分析。采用χ2檢驗(yàn)和t檢驗(yàn)比較A、B、C三組間肺GGN檢出效能的敏感度、誤診率、陽(yáng)性預(yù)測(cè)值和平均診斷時(shí)間;比較GGN良、惡性組間一般臨床資料和AI量化參數(shù)的差異,采用受試者工作特征(receiver operator characteristic,ROC)曲線分析其診斷效能,并采用Logistic回歸分析其惡變的獨(dú)立危險(xiǎn)因素。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
由兩位從事胸部影像診斷的高年資醫(yī)師對(duì)200例患者的胸部CT圖像進(jìn)行分析,確認(rèn)有1230個(gè)結(jié)節(jié)。A組檢出854個(gè)結(jié)節(jié),誤診52個(gè),漏診428個(gè); B組檢出1476個(gè)結(jié)節(jié),誤診320個(gè),漏診74 個(gè);C組檢出1476個(gè)結(jié)節(jié),誤診63個(gè),漏診49個(gè)。三組的平均診斷時(shí)間見表1,兩兩比較差異均有統(tǒng)計(jì)學(xué)意義(P值均<0.05)。統(tǒng)計(jì)學(xué)分析結(jié)果顯示B組誤診率高于A、C組,陽(yáng)性預(yù)測(cè)值小于A、C組;A組漏診率高于B、C組,敏感度低于B、C組,差異均有統(tǒng)計(jì)學(xué)意義(P值均<0.05,表1)。

圖1AI自動(dòng)篩選肺結(jié)節(jié)并對(duì)其進(jìn)行定量分析,計(jì)算機(jī)自動(dòng)測(cè)量其長(zhǎng)徑、短徑、最大面積、平均CT值、最大CT值、最小CT值,并對(duì)其進(jìn)行準(zhǔn)確定位。a) AI對(duì)肺內(nèi)結(jié)節(jié)進(jìn)行篩檢、勾畫結(jié)節(jié)輪廓并標(biāo)注序號(hào); b) AI直接顯示肺結(jié)節(jié)的各參數(shù)。
圖2GGN各量化參數(shù)的ROC曲線。

表1 三種閱片方式肺結(jié)節(jié)檢出情況比較
注:*表示與其它組比較,差異具有統(tǒng)計(jì)學(xué)意義(P<0.05)。
GGN良、惡性患者組間年齡、性別、短徑、最小CT值差異均無統(tǒng)計(jì)學(xué)意義(P值均>0.05),長(zhǎng)徑、最大面積、體積、平均CT值、最大CT值及惡性概率差異均有統(tǒng)計(jì)學(xué)意義(P值均<0.05,表2)。

表2 GGN良惡性組間臨床特征及AI量化參數(shù)比較
對(duì)良、惡性組間有統(tǒng)計(jì)學(xué)差異的各個(gè)參數(shù)進(jìn)行ROC曲線分析(圖2),以曲線下面積(area under curve,AUC)大于0.7的參數(shù)為自變量,以病理結(jié)果良惡性為因變量,進(jìn)行二元Logistic回歸分析,結(jié)果顯示長(zhǎng)徑[優(yōu)勢(shì)比(odds ratio,OR)=4.232,P<0.001]和最大面積(OR=0.896,P=0.008)是GGN惡變的獨(dú)立危險(xiǎn)因素。

表3 GGN良、惡性組的ROC曲線分析
肺癌是我國(guó)最常見的惡性腫瘤,病死率高,但研究表明IA期肺癌患者中,原位癌和微浸潤(rùn)性癌術(shù)后五年生存率可接近100%[2,3],因此肺癌的早期發(fā)現(xiàn)、早期診斷及治療顯得尤為重要。早期篩查已成為肺癌防治的重要手段,其中HRCT是國(guó)際公認(rèn)的有效手段。肺結(jié)節(jié)篩查圖像診斷較為簡(jiǎn)單,但隨著人們健康體檢意識(shí)不斷加強(qiáng),胸部HRCT篩查人群日益增多,圖像數(shù)量倍增,影像醫(yī)師的工作壓力也日趨增大,漏診、誤診的風(fēng)險(xiǎn)不斷增加。AI的出現(xiàn)不僅降低了早期肺癌的漏診率,也在一定程度上解放了影像科醫(yī)生的雙眼,使其可將有限的精力用于更高難度的工作中。AI是現(xiàn)階段各行各業(yè)研究的熱點(diǎn),目前已廣泛運(yùn)用于影像、臨床及病理等多個(gè)醫(yī)學(xué)領(lǐng)域[4,5],主要集中在發(fā)現(xiàn)異常、量化測(cè)量及鑒別診斷等方面[6,7]。而用于肺結(jié)節(jié)篩查和定性的輔助診斷軟件國(guó)內(nèi)外各有不同,主要是由于模型算法不同使其結(jié)果的靈敏度、特異度出現(xiàn)一定偏差[8]。本研究旨在探討我院引入的深睿公司醫(yī)學(xué)影像輔助診斷軟件對(duì)肺GGN檢出和定性診斷的價(jià)值。
本研究結(jié)果顯示A組的漏診率明顯高于B、C兩組,而敏感度明顯低于B、C兩組,正是由于醫(yī)生在進(jìn)行大量重復(fù)閱片過程中不可避免地產(chǎn)生視覺疲勞,大大影響結(jié)節(jié)的檢出情況。B組的誤診率明顯高于A、C兩組,而陽(yáng)性預(yù)測(cè)值明顯低于A、C兩組,原因?yàn)锳I主要容易將局部稍增粗的肺紋理誤判為GGN,表明AI的算法有待進(jìn)一步完善和提高。C組(住院醫(yī)師結(jié)合AI)的閱片診斷水平接近于高年資醫(yī)師,明顯提高了GGN的檢出率,減少了漏診風(fēng)險(xiǎn),又彌補(bǔ)了AI假陽(yáng)性率高的缺點(diǎn)。另外,AI平均6s能完成1例閱片,而一般人工閱片需要7 min,人工結(jié)合AI大大提高了影像科醫(yī)生的工作效率和診斷準(zhǔn)確性,值得廣泛推廣,與胡瓊潔等[9]和邵亞軍等[10]的研究結(jié)果一致。
以往較多研究探討肺GGN良、惡性間三維特征的差異,對(duì)其良惡性預(yù)判具有一定參考價(jià)值,但測(cè)量繁瑣、費(fèi)時(shí),AI彌補(bǔ)了這些缺點(diǎn),可直接提取結(jié)節(jié)并對(duì)其各指標(biāo)進(jìn)行準(zhǔn)確量化,方便、快捷,減少了人工測(cè)量的誤差,可重復(fù)性強(qiáng)。另外AI可根據(jù)其模型算法計(jì)算出結(jié)節(jié)的惡性概率,影像醫(yī)生可參考AI提供的三維特征參數(shù)及惡性概率對(duì)其進(jìn)行定性分析,提高診斷效率。本研究中,GGN良、惡性組間結(jié)節(jié)短徑和最小CT值差異無統(tǒng)計(jì)學(xué)意義,長(zhǎng)徑、最大面積、體積、平均CT值、最大CT值及惡性概率差異均有統(tǒng)計(jì)學(xué)意義,與Shi等[11]的研究結(jié)果一致。回歸分析結(jié)果顯示長(zhǎng)徑和最大面積是GGN惡變的危險(xiǎn)因素,AUC分別為0.867、0.899,當(dāng)臨界值分別為10.34 mm、61.12 mm2時(shí),敏感度均為0.795,特異度分別為0.852、0.870。Kitami等[12]和熊廷偉等[13]的研究結(jié)果表明直徑是GGN惡變的危險(xiǎn)因素,Yang等[14]的研究結(jié)果也表明基于直徑的logistic回歸模型用于區(qū)分良、惡性GGN的準(zhǔn)確率達(dá)78.7% ,AUC為0.861,敏感度和特異度分別為78.0%、80.0%。最大面積是GGN惡變的獨(dú)立危險(xiǎn)因素以往少有文獻(xiàn)報(bào)道,可能與本研究中部分GGN整體體積縮小、局部惡變面積增大有一定關(guān)系,需擴(kuò)大樣本量進(jìn)一步證實(shí)。關(guān)于GGN的CT值以往研究結(jié)果各有不同,矯娜等[15]研究表明惡性GGN的平均CT值及最大CT值均明顯高于良性GGN,而Xiang等[16]認(rèn)為兩者差異并無統(tǒng)計(jì)學(xué)意義,本研究結(jié)果表明兩者間差異有統(tǒng)計(jì)學(xué)意義,病理機(jī)制可能是由于惡性GGN內(nèi)腫瘤細(xì)胞沿著肺泡間隔貼壁生長(zhǎng),導(dǎo)致肺泡腔內(nèi)氣體減少,或由于肺泡塌陷、纖維化等導(dǎo)致病灶內(nèi)局部密度增高[17]。Logistic回歸分析結(jié)果顯示惡性概率不是GGN惡變的危險(xiǎn)因素,表明AI對(duì)GGN的定性預(yù)判能力有待提高。但是,本研究發(fā)現(xiàn)良、惡性兩組GGN的惡性概率差異有統(tǒng)計(jì)學(xué)意義,當(dāng)惡性概率大于80%時(shí),提示GGN惡性的可能性較大,具有一定參考價(jià)值。因此在診斷工作中重點(diǎn)觀察AI提供的GGN長(zhǎng)徑、最大面積、體積、CT值、惡性概率等參數(shù),并結(jié)合常規(guī)形態(tài)學(xué)進(jìn)行綜合分析,可明顯提高GGN定性診斷的準(zhǔn)確率。
本研究存在以下局限性:①需擴(kuò)大樣本量,進(jìn)一步對(duì)結(jié)果進(jìn)行驗(yàn)證;②未引入隨訪數(shù)據(jù)等重要指標(biāo)說明AI在肺結(jié)節(jié)隨訪中的價(jià)值,有待進(jìn)一步研究。
綜上所述,在肺GGN的檢出及良、惡性鑒別診斷方面,AI可在短時(shí)間內(nèi)有效提高GGN檢出的敏感度,并對(duì)其三維特征參數(shù)進(jìn)行準(zhǔn)確量化,計(jì)算其惡性概率,且結(jié)果可信度較高,是影像科醫(yī)生可靠而實(shí)用的有力助手,可在臨床中廣泛應(yīng)用。但目前AI的假陽(yáng)性率仍較高,需進(jìn)一步改善其算法以提高特異度。