胡守興
當今,由大數據和深度學習技術開啟了新一波人工智能熱潮,大數據、人工智能技術在疾病預防篩查和診斷方面的應用日趨成熟。本文圍繞醫療和體檢行業,提出雙驅動的“人工智能+健康醫療”的平臺,同時,從影像診斷的角度以肺結節檢測的案例出發,研究有關的技術現狀。最后對雙驅動平臺技術和應用進行展望,并提出一些建議。
一、人工智能概述
早在1950年,Alan Turing在《計算機器與智能》中就闡述了對人工智能的思考。1956年,“人工智能”這個詞首次出現在達特茅斯會議上,標志著其作為一個研究領域的正式誕生。之后人工智能的發展經歷過一次一次的低谷期。隨著大數據的積聚、理論算法的革新、計算能力的提升,人工智能在很多應用領域取得了突破性進展,尤其是深度學習作為機器學習研究中的一個新興領域,起初由Hinton等人于2006年提出。2012年,杰弗里·辛頓的學生IIya Sutskever和Alex Krizhevsky在圖片分類比賽ImageNet中,使用深度學習打敗了Google團隊,深度學習的應用,使得圖片識別錯誤率下降了14%。同年,谷歌首席架構師Jeff Dean和斯坦福大學教授AndrewNg主導著名的GoogleBrain項目,采用16萬CPU來構建一個深層神經網絡,并將其應用于圖像和語音的識別,并獲成功。
二、人工智能+健康醫療
人工智能是一種很好的工具,能夠緩解大健康產業醫生資源緊缺的問題,緩解漏診誤診的問題,提高醫生工作效率,醫院可以利用人工智能進行范圍內居民健康管理。通過人工智能還可以模擬醫生診療過程并給出診療建議,比如服用日常藥物,掛什么科,或者就近聯系醫生等,滿足常見病咨詢需求。這也給患者和醫生節省了大量的時間,也保證了生命的安全。隨著社會的高速發展,人們越來越認識到“防患于未然”,日常保健、定期體檢的重要性。對于健康的重要性,“預防優先”的健康觀念日益深入人心,個人體檢的意愿及頻次必將進一步提升。
三、雙驅動“人工智能+健康醫療”平臺
醫療人工智能平臺的建設輔助醫療機構提升服務水平,平衡醫療資源,緩解就醫壓力,特別是醫療資源匱乏的區域。醫療機構根據自身信息化水平選擇不同的建設模式,幫助提升自身的醫療服務水平。人工智能平臺由數據、算力、開源框架和算法以及各種技術構成,計算能力為人工智能平臺的運算速度提供保障。其中算法、數據和算力、深度學習是帶動本輪人工智能產業發展的“三駕馬車”。開源框架是算法的工程體現。
數據驅動在輔助醫療影像診斷技術,其應用包括而不限于腦瘤分割、肺結節檢測、阿茲海默癥檢測、淋巴結檢測、肺支氣管擴張檢測、X光胸片疾病檢測、肝超聲檢測。以肺結節醫療影像數據為例,每位患者平均擁有20~30張片子,在自動識別肺結節時常用的計算機視覺模型如殘差神經網絡,它可以使數十層甚至上百層的神經網絡的訓練成為可能,這對計算能力提出了很高的要求。龐大的數據量致使計算機的運算時間變得漫長,因此搭建一個超算平臺不僅能縮短運算時間,也能提升醫療的效率,降低患者的等待時間,可謂至關重要。
知識驅動的構建,構建了醫療診斷圖譜,醫療診斷圖譜的落地是非常有價值的。知識圖譜是典型的大數據時代產物,大規模語義網絡與大數據技術、深度學習技術相結合,正在成為推動人工智能發展的核心驅動力,醫學知識圖譜中具備了知識表示、知識抽取、知識融合和知識推理這4個模塊的關鍵技術和研究進展進行綜述。
開源的Neo4j、Twitter的FlockD、sones的GraphDB等。模式層構建在數據層之上,是知識圖譜的核心。比如業界的百度的醫療大腦和IBM Watson提供了行業解決方案。
四、人工智能影像輔助診斷
人工智能已經在肺結節、甲狀腺結節、乳腺癌、冠狀動脈斑塊、皮膚癌、眼底病、病理等領域取得了諸多成果。早期的肺癌是沒有任何癥狀的,中國70%~80%的肺癌病人一發現就是晚期,失去了手術治療的機會,越來越多的肺結節在檢查中被發現,雖然大部分肺結節為良性病變,但仍有較高比例的早期肺癌,因此需高度重視肺結節的篩查。
肺結節篩查工作量大,易漏診誤診,早在人工智能技術出現之前,人們已經嘗試通過各種方式提高影像診斷效率,其中以CAD(計算機輔助決策系統)應用最為廣泛,它通過專家提取特征,制定分類規則,建立各種復雜嚴密的數學模型,實現了對影像的自動分析。公開的有代表性的系統有:ISICAD、SubsolidCAD、LargeCAD、ETROCAD,它們僅能處理和識別非常有限的影像表現,魯棒性差,無法自動深層次學習和優化。
1.任務目標
基于深度學習的人工智能影像分析技術解決了傳統CAD的不足,通過廣泛的影像大數據訓練,從底層提取特征,能夠實現對更加多樣化的影像表現識別并不斷自動優化。基于人工智能新的解決方案給醫學影像分析帶來諸多益處:
·高效的處理和分析影像速度,快速給出輔助判斷結果。
·良好的靈敏度(或召回率),降低篩檢中的漏診率。
2.數據集
LIDC-IDRI是由美國國家癌癥研究所(National Cancer Institute)發起收集的,目的是為了研究高危人群早期癌癥檢測。該數據集中,共收錄了1018個研究實例。對于每個實例中的圖像,都由4位經驗豐富的胸部放射科醫師進行兩階段的診斷標注,會標注三種類別:① >=3mm的結節,②<3mm的結節,③>=3mm的非結節。
LUNA16發布于2016年,是肺部腫瘤檢測最常用的數據集之一,它包含888個CT圖像,1084個腫瘤,圖像質量和腫瘤大小的范圍比較理想。數據分為10個subsets,subset包含89/88個CT scan。LUNA16的CT圖像取自LIDC/IDRI數據集,選取了三個以上放射。
Kaggle數據集中有1000張來自高危患者的低劑量肺部CT圖像(dicom格式),每張圖像包含多個胸部的軸向切片;該比賽的任務是建立一種自動化方法以確定患者是否會在1年內被診斷出惡性腫瘤。
3.候選結節檢測
將高維CT圖降維到一些感興趣的區域, 比較高概率的召回/提取出候選區域ROI/region proposal,可以通過3D RPN或語義分割出來。
語義分割是一個活躍的研究領域,DCNN用于對圖像中的每個像素進行單獨分類,這是由計算機視覺和醫學成像領域中不同的具有挑戰性的數據集所推動。在深度學習革命之前,傳統的機器學習方法主要依靠手工設計的特征來獨立地對像素進行分類。在過去的幾年里,人們提出了許多模型,證明基于FCN的CNN分割方法為自然圖像分割提供了優越的性能。這種方法的主要缺點是多次執行大量的像素重疊和相同的卷積。通過在非常大的數據集上對遞歸神經網絡(RNN)進行微調,FCN的性能得到了改善。SegNet和DeepLab也是通用領域語義分割常用的方法。
然而,針對醫學圖像分割中存在的數據不足和類間不平衡等問題,提出了一些針對醫學圖像分割的深度學習模型。語義醫學圖像分割最早也是最流行的方法之一被稱為U-NET。基本的U-NET模型是根據結構,網絡主要由卷積編碼和譯碼兩部分組成。在網絡的兩個部分中,基本的卷積操作在relu激活之后執行。對于編碼單元中的向下采樣,執行2×2最大池操作。在解碼階段,執行卷積轉置(表示上卷積或去卷積)操作,對特征圖進行上采樣。U-NET的第一個版本被用于從編碼單元crop and copy特征映射到解碼單元。U-NET模型為分割任務提供了幾個優勢。首先,該模型允許同時使用全局位置和上下文。
其次,它使用很少的培訓樣本,并為分段任務提供更好的性能。最后,端到端的管道在前向通道中處理整個圖像,并直接生成分割圖。這樣可以確保U-NET保留輸入圖像的完整上下文。
深度學習方法提出基于U-NET的可用于3D醫學圖像分割任務3D UNET體系結構,從稀疏標注的體素圖像中學習。三維醫學圖像分割網絡另有研究V-NET,它由一個具有殘差連接的FCN組成。醫學圖像自動分割方法res3dnet是基于殘差網絡的voxresnet在2016年提出,其中使用深voxewise殘留網絡進行大腦分割。2017年Kaggle數據科學競賽第一名獲獎團隊的則基于3D U-net模型提出了N-Net。
前饋路徑:由兩層卷積層和四個融合單元構成。反饋路徑:由兩層反卷積(裝置卷積)層和兩個融合單元構成。Location crop:位置信息可能影響是否為結節和是否為惡性的判斷,因而引入輸入數據。輸入數據大小,并隨機選擇兩種patch:一種為70%的輸入數據至少包含一個結節,另一種為30%的輸入數據不含結節。其中,patch超出圖像部分用灰度值為170填充。
對于一些易誤診為結節的反例數據,通過使用hard negative mining方法解決。將不同的patch輸入至網絡得到不同置信度的輸出映射;隨機選擇N個反例數據構成候選池;侯選池中的數據以置信度值大小排序,且選出top-n的數據作為反例數據。輸出數據且使用非極大值抑制操作來重疊的proposal。損失函數為交叉熵函數。為了避免過擬合采用了數據增強和正則化操作。
4.置信檢測
由于第一階段產生的假陽性區域,最終將肺結節的識別結果提供給醫生作為診斷的參考,明確區分出結節與非結節,以及確定結節的性質(陽性或陰性腫瘤)。
置信檢測可以基于3D-NET(NET), 可對更豐富的空間信息進行編碼,通過分層提取更有代表性的特征。可以應用深度殘差網絡或堆疊google inception來增強網絡的表達能力。
MV-CNN:使用多視角卷積神經網絡(multiple view-convolution neural network)-MV-CNN對肺結節進行分類。在傳統的圖像識別神經網絡中,輸入通道的數量取決于圖像的顏色通道的數量。一般來說,用于分析CT的神經網絡只有一個輸入通道,因為一個CT掃描片是只有一個顏色通道的灰度圖像。肺部結節只是整個肺部CT圖像的一小部分,因此可以裁剪多個結節視圖,不同的視圖將提供不同的信息。具有小視場的斑塊可以提供結節的細節,而具有大視場的斑塊可以提供腫瘤組織周圍的信息。
置信檢測模型一般采用3D深度卷積網絡且往往融合多尺度進行集成訓練提升分類的效果。集成學習(Ensemble learning)通過組合幾種模型來提高機器學習的效果。與單一模型相比,在許多著名的機器學習比賽(如 Netflix、KDD 2009 和 Kaggle比賽)中能夠取得很好的名次。LUNA16第二名組采用了多尺度的模型組合學習xgboost的思路,提高了學習的效果。訓練過程還通過數據增強來防止過擬合。
5.性能評價
通過測量算法的檢測靈敏度和對應的每次掃描的假陽性率來進行評估。
五、行業和技術的發展期望
基于數據規模小、標注質量差、懂算法的不懂醫療的研發現狀,以及結合人工智能本身的特點,談幾點個人的想法和建議:
1)目前數據是行業發展的瓶頸,數據積累與數據共通,是解決問題的關鍵;
2)人工智能模型和模式核心創新,降低對數據和人工標注的依賴;
3)建設人才隊伍,包括科研人才、醫療專業性人才和工程化人才;
4)雙驅動平臺建設,打通業務和數據壁壘,構建以知識驅動和數據驅動的優勢互補的預防診斷系統,并整合對接原有的HIS、PACS系統;
5)從應用看,醫療機器人、虛擬助手、風險預測、智能輔助診斷、細胞分析是未來的熱點,但需要深耕細作,確保質量和創新兩不誤。