張世豪 冼麗英 高敏 陳志曉
在1956年,由幾位科學家在達特茅斯會議提出了人工智能概念。得益于計算機技術和互聯網的高速發展,人們看到了人工智能在諸多領域的巨大潛力。隨后,高科技公司和社會資本踴躍進入并積極參與和推動人工智能的發展。如今,人工智能可謂是如火如荼,四處開花結果。目前,基于深度學習的人工智能已經影響了病理學以及與其相關的行業的工作模式。為什么基于深度學習的人工智能在醫學界、學術界乃至工業界受到如此廣泛的關注?病理學科面臨什么樣的窘境?基于深度學習的人工智能將如何解決這些問題?本文將帶著上述問題,介紹基于深度學習的人工智能在病理診斷的應用進展,并簡要分析在這一領域的發展。
人工智能是計算機科學的一個分支,它是一種產生出與人類智能相似表現的智能機器,是人們試圖通過研究、開發人工智能來模擬、延伸和擴展人類智能的理論、方法、技術及應用系統[1]。
學習是人類具有的一種重要智能行為,機器學習是一種實現人工智能的方法。實現機器學習最基本的做法是通過算法來使機器解析數據、并從數據中學習規律。
深度學習是一種實現機器學習的技術,在機器學習中深度學習是一種基于對數據進行表征學習的方法[2]。由于無監督學習訓練深度神經網絡和殘差網絡的出現,深度學習被人們有爭議地認為是一種獨立的學習方法。
從機器學習模型的層次結構維度來看,機器學習的發展歷程經過了兩個階段,分別是淺層學習和深度學習。深度學習被認為是一個相對于淺層學習的概念。
2.1 淺層學習階段 1960年文獻[3-4]提出迭代法(Delta規則)之前,機器學習中一直沒有引入隱層的概念。1984年文獻[5-6]研究者提出受限玻爾茲曼機(Boltzmann machine),便是這種概念延伸出的算法。1986年,Rumelhart等[7]研究者提出的反向傳播算法(Backpropagation algorithm),成為這種概念延伸出的經典算法。這種算法在機器學習中實質是簡單感知器的收斂程序,能讓人工神經網絡模型從大量訓練樣本中簡單地學習一些能用簡單網結解決問題的規則。往后數年間陸續有淺層機器學習模型被提出,如支撐向量機(Support Vector Machine)、Boosting算法等。這個時候的人工神經網絡雖然也被認為是多層感知器,實際上由于沒有足夠多層網絡訓練的經驗,多數例子是只含有一層隱層網絡(特征層次)的淺層模型。
2.2 深度學習階段 通過對貓視覺皮層細胞的探討,揭示了高級動物視覺神經的機理,與高級動物視覺神經的機理相似,深度神經網絡同樣具有豐富的層次結構,區別于淺層學習,深度學習的模型結構含有多層隱層網絡,且著重特征層次的特性,在算法上常表現為權重疊加。在1989年,Lecun等[8]研究者提出了卷積神經網絡(Convolutional Neural Network),便是高級動物視覺認知模型延伸出的網絡計算模型。
在2006年,Hinton等[9]研究人員在一篇關于機器學習中實現深度學習的文章中報道了兩項重要成果:(1)很多隱層的人工神經網絡具有優異的特征學習能力,學習得到的特征對數據有更本質的刻畫,從而有利于可視化或分類。(2)無監督學習的“逐層初始化”(layer-wise pre-training)可有效克服深度神經網絡訓練上的難度。從此掀起了基于深度學習的機器學習熱潮,如今依舊熱度不減。
基于深度學習的人工智能已在乳腺癌、胃癌、肺癌等多種疾病病理診斷中應用[10-14],范圍集中于早期腫瘤篩查、疾病分級和良惡性診斷等方面。
3.1 乳腺癌病理領域 文獻[15]基于深度學習的機器學習方法構建了一個“乳腺影像報告數據系統”用于檢測評判乳腺癌患者CT圖像,驗證階段取得了顯著的成績。文獻[16]基于卷積神經網絡和計算機圖像處理構建了一個智能圖像診斷系統對細胞學涂片進行檢測評判,發現二分類(癌和非癌組織)與病理專家的一致性高達0.833,四分類(正常組織、良性疾病、原位癌和侵襲癌)與病理專家的一致性高達0.778。2016年在英國英格蘭諾丁漢市舉辦的PathSoc大會上,基于深度學習的人工智能的自動人表皮生長因子受體-2評分系統對人表皮生長因子受體-2評分的結果優于病理專家[17]。
3.2 胃癌病理領域 Bejnordi等[18]研究者基于深度學習的機器學習方法構建了一個智能圖像診斷系統對細胞學涂片進行檢測評判,發現對于胃癌分類與病理專家的準確性高達69.90%。Yoshida等[19]研究者同樣基于深度學習的機器學習方法構建了一個智能圖像診斷系統對細胞學涂片進行檢測評判,發現三分類[非腫瘤、癌(包括可疑癌)和腺瘤(包括可疑腫瘤性病變)]與病理專家的一致性為0.556,二分類的敏感度高達89.50%、陰性預測值高達90.60%。
3.3 肺癌病理領域 張纓等[10]研究者基于人工神經網絡和計算機圖像處理構建了一個“肺癌早期細胞病理電腦診斷系統”對細胞學涂片進行檢測評判,發現系統能完成肺癌主要病理類型(肺鱗癌、腺癌以及小細胞癌等)的細胞病理診斷;系統與病理專家的符合率高達91.80%;以術后組織病理為“金標準”,系統的敏感度、特異度和準確性分別為94.79%、90.91%、94.20%。
人們健康意識不斷提高對醫療衛生提出了的更高要求,因此各類疾病的液基細胞學篩查和診斷的需求量不斷增加。同時,我國執業病理醫生和細胞病理學篩查員的職業回報率低且工作環境惡劣,以至于相關執業人員不斷流失[20-22]。三甲醫院病理醫生必須每天高強度閱片,不單耗費大量精力,也因為工作疲勞導致工作能力暫時降低(不能完成任務或診斷效能降低)。這種狀況已經持續許久,至今未能有效解決,著眼將來基于深度學習的人工智能病理診斷系統有望能化解這一窘狀。
基于深度學習的人工智能特別適合于學習結構化數據,也特別適合解決結構化數據分類問題。數字化病理圖像是一種結構化數據,是基于深度學習的人工智能創建或訓練的絕佳材料[23-25]。基于深度學習的人工智能病理診斷系統正實現著過往只有人類才能完成的工作和任務,在醫學領域,特別是病理學領域展現出了獨特的優勢。不久以前,數字化病理技術和計算機圖像處理技術得到長足發展,數字切片掃描儀和計算機在醫院得到廣泛應用,解決了基于計算機圖像處理的病理診斷系統不可避免的工程問題,也為基于計算機圖像處理的病理診斷系統帶來了更廣闊的發展空間。因此,病理圖像是基于深度學習的人工智能的絕佳應用場景。
目前基于深度學習的人工智能病理診斷系統在病理診斷中仍然存在失真的情況,然而病理診斷是終末診斷,診斷結果不允許失真。解決此類問題的主要途徑是增加醫療數據以及精準標注,特別是增加由病理專家標注的醫療數據,因為訓練集用于監督學習中精準標注是高質量模型的先決條件,訓練集源于偏差或不完整的數字化病理圖像,會影響建立模型的效果(最終決策會產生失真);或者深入研究無監督學習的深度學習系統,試圖讓系統解決進行人工類別標注成本高或難以人工標注類別的問題;或是從另外一些方面整合醫療信息,如分子檢測、基因測序等;同時,由于疾病類型和病癥繁多,病理診斷針對每單以病種建立模型是病理標注簡潔化的方式,因此病理標注需要亞專科化,病理標注團隊需要制定標準化的流程。還有,病理學是一門經驗性醫學,目前病理樣本的類型存在分布不均或部分病例稀缺等問題,從業者應該聯合起來,分享優秀算法和有價值病理樣本,打破利益集團的壟斷。總之,試圖通過各個方面力求提高基于深度學習的人工智能系統在病理診斷中的準確性。圍繞基于深度學習的人工智能在病理診斷深入研究,將為新型醫學概念與醫療模式帶來無限可能。