張政
(上海體素信息科技有限公司 上海市 201114)
攻堅小數據下的醫學圖像算法難題。近年來,深度神經網絡的出現給醫學圖像分割領域帶來了革命性的發展,但他們的成功需要大量的高質量標注圖像進行訓練。然而現實情況中,一方面罕見病和疑難雜癥的數據收集較為困難,另外一方面,醫學圖像的標注過程成本較高,對于不同的標注內容往往需要開發特殊的標注工具并交由有經驗的醫生進行。這兩方面的原因導致對于某些醫學圖像問題,高標注質量的醫學圖像數據集非常稀缺。體素科技在近些年一直在探索如何從不同科研角度來解決這個難題,已有部分成果。
人類擅長通過極少的樣本就能辨別新的事物,機器學習領域中小樣本學習(few-shot learning)領域的目標就是模仿人類的這種能力。模型在學習了一定類別的大量資料后,對于新類別僅通過極少量數據便能快速學習。小樣本學習的關鍵是在算法中納入合適的先驗知識。很多醫學圖像模態中廣泛存在器官的位置先驗信息,例如CT 圖像中肝臟主要位于腹腔的右上位置,而脾則在腹腔的左上部分,顯然這些位置先驗信息對識別特定類別的器官有非常大的幫助。
體素科技在醫學頂級會議ISBI2021 上發表了論文《Location Sensitive Local Prototype Network For Few-shot Medical Image Segmentation》,提出了一種基于位置先驗信息的局部原型網絡(location sensitive local prototype network,見圖1)。一旦模型在訓練集上完成訓練,借助非常少量的新器官的標注,即可用于沒有出現在訓練集中的新器官的分割任務(例如訓練集器官類別為肝和脾,而測試集中新的器官類別為腎)。在公開的CT 器官分割數據集Visceral 實驗結果表明,論文提出的新框架比目前的最好方法在Dice Score 指標上提高了10%,顯著推進了小樣本下的器官分割這一領域的技術進展。
醫學圖像的拍攝設備和拍攝環境和方式多樣,各個醫院和體檢中心之間的人群分布差異明顯,因此很難收集和標注足量的訓練數據充分涵蓋不同來源的圖像特征。訓練數據多樣性不足導致模型在實際使用中,由于訓練數據和實際測試數據的分布差異(domain shift)而使模型性能變差。

圖1:基于位置先驗信息的局部原型網絡框架

圖2:左邊是基于極端一致性的半監督學習方法的偽代碼,右邊是網絡結構示意圖。
針對以上問題,體素科技在醫學頂級會議MICCAI2020 上發表了論文《Extreme Consistency: Overcoming Annotation Scarcity and Domain Shifts》。該論文提出了極端一致性(extreme consistency)的概念,核心思想是在訓練數據中加入極端的圖像變換(比如大量強烈的亮度,對比度,旋轉,尺寸變換)來增加訓練數據的多樣性。并且假設這些極端的圖像變換并不影響圖像的語義含義。舉例來說,眼底圖像中的血管在經過極端的旋轉和亮度對比度等變換后,依然能夠對應血管本身。該論文提出了一種半監督算法(semi-supervised learning,見圖2),迫使模型遵守極端變化前和變化后的語義一致性這一約束,來提高模型對于分布差異的魯棒性。該論文在皮膚病變分割數據集(ISIC)和兩個眼底血管分割數據集 (HRF 和STARE)上進行了測試,展現了在數據不足和分布差異較大時算法的魯棒性和準確性的優勢。
醫學影像中圖像數據標注非常昂貴,尤其是像素級別的醫學圖像分割標注,人力成本十分巨大。近期大量的研究工作試圖解決不完善醫學圖像分割數據集中的兩類典型問題:
(1)標注稀缺。數據集中只有極稀少的圖像數據有分割標注。
(2)弱標簽。數據集中的圖像數據只有部分標注、或者標注帶有噪聲、或者只有圖像級的類別標簽沒有逐像素的分割標注。
體素科技在發表到醫學頂級期刊《Medical Image Analysis》的文章《Embracing Imperfect Datasets: A Review of Deep Learning Solutions for Medical Image Segmentation》中,針對這兩個主要問題,系統性的對現有的方案進行了詳細的回顧和分類總結(見圖3 所示)。在運用中,根據醫學圖像分割數據集的不同問題和數據量需求的多寡,論文對這些方案的選擇給出了實際的指導建議。
體素公司和交大科研團隊合作參與了多個醫學AI 挑戰賽并獲得佳績。體素公司團隊在ISBI2020 學術會議上舉辦的ADAM 比賽黃斑定位任務上獲得了第三名的成績。ADAM 比賽是由百度靈醫智慧和中山大學中山眼科中心聯合舉辦,包含了黃斑定位等四個任務,吸引了來自20 多個國家的近400 支參賽隊伍。
黃斑區域是眼底的一個特別重要的功能區域,精確定位黃斑對于進一步的輔助診斷很有幫助。該任務一大難點是,很多嚴重影響視力的眼底疾病都發生在黃斑區域,使其外觀和正常黃斑相比有較大變化,導致現有常見深度學習模型對于病變黃斑的定位不夠魯棒。體素科技團隊創新性的設計了一個雙流網絡融合眼底圖像和對應的血管分割信息,可以借助于眼底血管形狀和走向信息來估計黃斑的位置,大大提高了嚴重病變的黃斑區域定位效果。該模型在ADAM 比賽決賽中平均黃斑定位誤差為25 個像素(≈0.07mm,排名3/11),體現了一定的臨床可用性。
體素科技所發表的幾篇論文,提高了大家對可用于處理不完整醫學圖像分割數據集的技術的認識,本文介紹的一系列小數據學習方法以模仿人類的判別能力為目標,嘗試通過減少需要的數據量,實現特定目標圖像的識別,最終克服醫學領域數據量少、標準缺乏的問題。