吳鍵 侯代倫
肺結核是一種嚴重的傳染性疾病,影像學檢查是肺結核篩查及治療后療效評估的主要手段之一。由于肺結核影像學形態的多樣性,有時與肺部其他相關病變的影像特點相似而難以鑒別,因此,肺結核的影像診斷往往成為臨床工作中的重點與難點[1]。而深度學習擅長識別大量成像數據中的復雜模式,并能夠以自動化方式提供定量評估,因此,深度學習可以被整合到臨床工作流程中,作為影像學的評估。醫療數據中超過90%的數據來自于醫學影像[2],影像醫師需要分析海量的圖像信息,不可避免地會產生視力疲勞,容易漏診。多學科相互滲透交叉是當前的臨床醫學發展的趨勢,而深度學習與常規影像診斷的融合恰好可在學科發展方面查缺補漏。深度學習在肺結核影像上的應用不僅可以極大緩解放射科醫生的工作壓力[3],改善影像報告的質量控制和保證,還能提高影像醫生的診斷效率和準確性[4]。筆者將對深度學習在影像診斷及肺結核影像診斷中的應用、不足及展望進行綜述。
深度學習是一種涉及高階思維能力的學習狀態,具有自發性、高投入性、理解性、遷移性等特點[5]。1998年Lecun等[6]首次提出使用反傳播算法訓練多層神經網絡,為深度學習的進一步發展奠定了堅實基礎。隨著深度學習技術在圖像處理和計算機視覺領域的廣泛應用,利用深度學習技術輔助臨床診斷目前已成為醫學圖像分析領域的研究熱點。深度學習的一些算法如 AlexNet、GoogleNet、 ResNet等在醫學影像分類、定位、分割和重建等方面均取得了較好的效果[7-9]。此外,其他諸多深度學習網絡模型如卷積神經網絡[10]、循環神經網絡[11]、全卷積神經網絡[12]和U-net[13]等,均在針對不同領域的影像實際問題中展示了良好的潛力,有巨大的應用空間。因此,將諸多的深度學習方法與實際圖像特點相結合,繼而提高識別醫學圖像特征的準確率,必然是醫學輔助診斷發展的重要趨勢[14]。
近年來,深度學習在輔助X線影像診斷方面取得了快速發展。劉凱等[15]利用胸部X線攝片(簡稱“胸片”)深度學習模型就胸片對肺亞實性結節的檢出效率與高年資醫師做了對比,結果發現,深度學習模型的檢出率高于醫師組,但假陽性率偏高。此外,基于深度學習建立X線診斷乳腺癌[16]、肺炎[17]等模型,均取得了很好的預測及輔助診斷的效果。同時,深度學習在輔助CT影像診斷方面也逐漸得到認可。Ciompi等[18]檢測肺結節利用深度學習技術使用計算機斷層掃描中的二維視圖,建立與三維視覺效果相似直觀檢測模型,最終測試模型檢測肺結節的平均曲線下面積(area under curve,AUC)為0.868。Coudray 等[19]也研發了一種自動分析病理圖像的深度學習模型,它可以區分正常組織和腫瘤組織,而且鑒別病灶性質與病理檢查結果的一致性極高。如今,深度學習在輔助CT影像診斷中的應用也越來越廣泛,可以對肺癌[20]、皮膚病變[21]、病理顯微圖像[22]、視網膜照片[23],以及放射資料[24]等各種醫學影像進行診斷分析,明顯提高了診斷準確性、穩定性和工作效率。
Maduskar等[25]使用自動讀圖軟件(CAD4TB)對胸片上結核病病灶的診斷符合率與醫師診斷結果進行對比,CAD4TB的準確率為73%,雖然CAD4TB軟件可以針對胸片中的病灶區域進行輔助診斷肺結核,但診斷的準確率還有待提升。此后,Murphy等[26]對CAD4TB進行改進,使用了更加敏感的深度學習模型CAD4TB v6,同時訓練分類和定位網絡。這可在沒有任何預先訓練模型的情況下,僅采用圖像層面的標記數據集就可給感興趣區域進行精確定位,經過測試,新模型在90%的敏感度下取得了98%的特異度,相比CAD4TB有了明顯提升[27]。Lakhani和Sundaram[28]提出在深度學習框架下以AlexNet和GoogLeNet網絡模型相融合對X線影像進行檢測,診斷準確率可提高至99%。這進一步表明,深度學習在胸部X線上準確診斷肺結核具有可行性及較高的診斷符合率。近年來,Hwang等[29]建立了一種基于深度學習的自動檢測 (deep learning-based automatic detection,DLAD)算法,對這種算法的圖像分類和病變定位性能與15名有經驗的影像科醫師進行對比,DLAD在兩個分類性能的準確率均高于診斷醫師。曹盼等[30]嘗試在胸片上先進行人工標記結核病病灶,建立基于特征金字塔網絡的診斷肺結核模型,通過測試集的100張肺結核患者胸片和100張健康人胸片來評價最終訓練好的深度學習診斷模型,結果顯示,此模型在分類效能、病灶檢測、定位效能上均表現良好。
深度學習在肺結核CT影像輔助診斷中也具有重要價值,可以為人工智能在臨床應用中診斷活動性肺結核打下堅實基礎[31]。Huang等[32]研究了一種基于深度轉移卷積神經網絡和極端學習機的肺結核新型診斷方法,將兩種算法的協同作用融合在一起,新型模型的準確度為94.57%,敏感度為93.69%,特異度為95.15%。Ma等[33]收集了846例患者的CT圖像,使用U-Net深度學習算法以自動檢測活動性肺結核病變,將病灶在二維圖像上的表現通過組合的方式呈現在三維圖像,測試結果顯示深度學習工具的AUC為0.98,準確度、敏感度、特異度、陽性預測值和陰性預測值分別為 96.8%、96.4%、97.1%、97.1% 和 96.4%,與之前的方法相比,具有更可靠的效果。吳樹才等[34]通過收集1764例結核分枝桿菌陽性并接受胸部高分辨率CT平掃檢查患者的資料,并由4名影像科醫師對含病變的20 139幅CT圖像進行分類標注,建立基于CT圖像的CNN診斷肺結核模型,CNN模型總體敏感度和準確度分別為 95.47%和 90.40%。但是,對CT圖像進行分類標注不僅需要耗費大量時間,而且還需標注者對病灶的識別有著深刻的理解,Wang等[35]建立了一種無需標注的深度學習模型3D-ResNet,用來區分非結核分枝桿菌病和結核病,此模型在訓練集、驗證集、測試集上的準確率分別為90%、88%、86%,同時也驗證了此模型在自動識別CT影像異常病灶的效率明顯高于醫師診斷。所以,基于深度學習技術的肺結核CT輔助診斷已具有較高的準確度和敏感度。
目前,深度學習已在計算機視覺任務處理中獲得了卓越性能,在部分醫學圖像處理領域也取得了堪比臨床專家的診斷效果。但是,總體來說,深度學習在醫學圖像處理領域仍存在很多挑戰和限制[36]。第一,缺乏高質量的標注訓練樣本。在醫學領域中,缺少高質量標注的影像數據會導致訓練數據的類別不平衡,進而導致預測結果會偏向樣本量多的類別,出現過擬合現象[37]。第二,深度學習技術的本質是一個類似“黑盒子”的模型,很難或幾乎不可能解釋其系統的技術和邏輯基礎。因此,在醫療行業中是否能被認可也是一個問題。第三,使用深度學習輔助影像診斷也可能會使年輕醫師產生一定的依賴性,導致診斷水平停滯不前。第四,使用臨床醫學圖像數據促進基于深度學習系統的商業開發可能存在法律和倫理問題,因為該系統的性能高度依賴于訓練數據的數量和質量。
深度學習在肺結核影像診斷中的應用研究還不盡完善,仍有值得改進的空間。筆者認為,未來可能的研究重點與方向包括:(1)建立全國多中心標注團隊,如此,則既可以避免單一醫療機構收集訓練樣本造成的局限性,又能夠在短時間內收集大量樣本;(2)目前的深度學習技術還是以已標注圖像的感興趣區域進行學習為主,但在日常工作中,有大量的未標注的圖像需要分析,所以日后需要越來越重視對無標注數據的學習,以及無標注數據自動添加標注信息的研究;(3)加強深度學習模型的理論研究,結合互補的多模態醫學圖像數據集和圖像結構,改善深度學習模型提取特征的功能,進而提高提取特征分類和分割準確性;(4)目前,深度學習的算法及模型的驗證是建立在大量樣本的基礎上,使用有效技術識別小樣本數據的方法作為識別數據集,也是未來的研究方向。