劉大路,李 靜
(空軍軍醫大學 軍事預防醫學系 輻射防護醫學教研室 特殊作業環境危害評估與防治教育部重點實驗室, 陜西 西安710032)
隨著人工智能(artificial intelligence,AI)的發展轉向實用問題,AI迅速應用于醫學實踐[1]。近來機器學習(machine learning,ML)通過訓練計算算法自動化輔助臨床數據分析,發展為醫學應用最廣泛的AI架構。但是,ML只能識別標準化的數據集。而臨床診療過程涉及繁雜醫療信息的分析,數據類型錯綜復雜。因此,在醫學生實習或住院醫師培訓中加入ML的素養培養, 可提高基礎數據收集的標準化。通過對臨床數據導入算法的成功案例的學習,使醫學生能理解臨床數據的標準化方法,通過算法輔助繁重的一線數據分析工作。
本文研究對象為:2010—2019年收錄臨床醫學相關AI或機器學習應用的文獻。文獻檢索詞為:topic: (clinical medicine) and topic: (artificial intelligence) or topic: (clinical medicine) and topic: (machine learning). timespan: 2010—2019. 文獻檢索信息來自WOS、KJD、MEDLINE、RSCI、SCIELO等數據庫。
圖1A表明從2010至2019年基于ML/AI算法的臨床應用的文獻數量。該臨床技術革新的報道被引次數逐年激增(圖1B),廣泛影響公共管理、工學領域。相關文獻信息的統計結果表明,ML對特定類型的醫學問題的效能不同(圖2),架構的訓練成功率與合適的標化臨床數據以及數據樣本規模相關。下文按特定任務說明ML實踐的知識目標。

圖1 2010—2019 年基于“人工智能或機器學習醫療”主題的研究文獻發表數(A)和被引次數(B)

圖2 2010—2019 年基于AI算法的臨床醫學研究主題詞歸類統計
放射影像數據標準化程度高,數據量大。為了診斷肺腺癌,通常需要影像醫師對肺結節影像進行人工分級。卷積神經網絡(convolutional neural networks, CNN)架構被報道可用于電子計算機斷層掃描(computed tomography,CT)圖像上實性、部分實性和非實性肺結節進行自動分類。研究所采用的臨床數據來自公共云數據庫 “lung image database consortium(LIDC)”的1 010名患者影像及病例資料,用以訓練和測試CNN分類器和回歸方案。該方法在應用三分類范式進行肺結節分級取得了90%以上的準確率[2]。
ML善于提高真實照片的分析效率。研究者應用“Googlenet” 輔助糖尿病視網膜病變的分期。通過分析不同視野的4張彩色眼底照片,將眼底攝影覆蓋角度達到200°(臨床常規檢查為45°)。超寬角度照片分析提高了疾病分期準確度[3]。針對眼底照片的ML架構還成功應用于同時對多種視網膜疾病進行分類。研究者從公開視網膜圖像數據庫“retina structured analysis”收集了397張眼底照片數據,輸入CNN架構進行對多分類任務的訓練。輸出預測事件包括正常、背景糖尿病視網膜病變、干性年齡相關性黃斑變性等7種視網膜疾病。訓練后CNN自動分類結果與患者最終診斷吻合率達到70%[4]。
ML還可以增加新的疾病篩查方法。一項研究收集了527例肢端肥大癥患者和596名健康人的面部照片,用于訓練和驗證自動分類架構,并對分類結果通過“診斷金標準”——激素抑制試驗進行驗證。研究者比較了多種常用的ML算法對人面部照片的訓練效率,包括廣義線性模型、K-近鄰算法、支持向量機(support vector machine,SVM)算法、隨機森林算法和CNN。ML架構篩出患者的平均靈敏度為 86%,平均特異性為96%[5]。面部照片以應用廣泛和無創的特點,適合用于疾病的公眾篩查。
化學治療藥物替莫唑胺對多形性膠質母細胞瘤(glioblastoma,GBM)的療效取決于MGMT基因啟動子或增強子區域的甲基化狀態。腫瘤影像數據庫“the cancer imaging archive”收集GBM患者的腦磁共振功能成像(functional magnetic resonance imag-ing, fMRI)數據,而“the cancer genome atlas”數據庫保存同一患者的活檢基因組信息。研究者以兩大數據庫收集的樣本為基礎,訓練雙向卷積遞歸神經網絡架構 (convolutional recurrent neural network, CRNN)預測患者GBM腫瘤細胞對化學藥物治療的反應性。CRNN學習患者三維fMRI圖像中基因組學信息后,預測替莫唑胺化學藥物治療效果的準確度與會診醫師組相當[6]。放射基因組學對患者放射影像紋理建模,通過ML結合腫瘤異質性、基因測序分析,建立個體化影像資料和患者放療敏感性的關系。提取其中高級特征可用于早期干預患者腫瘤細胞的放射治療抵抗,或預測患者放射治療后期并發癥,實現精準放射治療[7]。
為了ML能自動解決乳腺癌患者抗HER2靶向治療療效預測,基于SVM和隨機森林模型的算法被建立用于對組織學標志物進行評分。研究者收集“Astrazeneca biobank”數據庫中74張乳腺腫瘤活檢的免疫組化圖像作為ML的訓練數據。通過提取描述細胞核顏色、細胞核紋理、細胞核形態、HER2膜染色強度和HER2膜染色陽性比例等18個特征,算法可以批量完成患者腫瘤組織HER2基因病理學分類[8]。而大型真實圖像數據庫Imagenet可為訓練和驗證提供足夠的臨床病例圖像數據。研究者首先訓練CNN架構執行病理圖像最優分割任務,然后經獨立的第2個CNN提取分割圖像的高級特征,區分病理學圖像上肉眼難于察覺的邊界[9],優于病理醫師的分析。
為預測患者的消化疾病發生發展,中國傳統醫學對患者的舌頭顏色、形狀和質地進行了幾千年的研究和分類。而研究者采用基于主成分分析(principal component analysis,PCA)卷積核的高約束高分散神經網絡 (chdnet) 弱監督架構,從舌象照片中提取高級特征用于疾病分類。該架構通過對44例胃炎患者和40名健康人的舌象數據進行訓練后,將 chdnet提取的高級特征輸入SVM的分類器liblinear中,其對胃炎患者的分類的效率優于人工初篩[10]。
最先進醫學教育將醫學生職業素養從勝任能力的角度劃分為職業道德、職業技能、職業行為與作風和職業意識。中國協和醫學院對長學制醫學生提出具備信息素養是發展能力和潛力的基本條件[11],這是引領未來醫學生職業技能教育的重要組成。而ML實踐將圍繞以下方面提升醫學生的職業勝任力。
準確的最小樣本量估算是提高訓練成功率的重要環節,前者是臨床數據收集整理和效率的保證。ML需要大量臨床真實樣本,以減少內部偏差。但是,規范的臨床數據收集受到諸多醫療條件的限制,尤其是為獲得完整的臨床數據,部分確定性檢查花費大或有創,如基因檢測、組織活檢等。因此,在臨床ML實踐教學活動中,教會學生準確估量訓練樣本量,確保數據集完整性同時最大程度減少對醫療秩序的干擾,是保證ML輔助診療成功的關鍵。
訓練所需樣本量分析需要采用個體化的方法。有效訓練取決于ML架構的臨床目的、已知的輸入特征、訓練數據中含有的噪聲、已經提取的特征的偏倚以及模型的復雜性。對于應用最廣泛的神經網絡架構,通過推演Hoeffding不等式求“計算”特征數量下限,可以減小樣本量需求。但該方法計算復雜。VC維(Vapnik-chervonenkis dimension)也是計算訓練樣本量的重要參數,前者是神經網絡神經元數與神經連接數的乘積,而10倍VC維的樣本量一般足以充分訓練神經網絡。但是由于特征的稀疏性,10倍VC維計算出的樣本量很可能巨大。如果以上計算得出訓練樣本需要量過大,還需要將結果最小化。通過正則化(regularization)方法,即修改模型結構(局部感受野和權值共享),減少了特征個數,可明顯降低VC維。此外,數據增強范式(data augmentation)可以提高低樣本量數據的訓練效率。
如果缺乏足夠的標準化病例數據來訓練ML怎么辦?在ML的醫療案例中,部分研究采用了通用數據庫的臨床資料和組織標本。這些數據網站建立有生物樣本數據庫,管理多中心的醫學圖像信息、人類基因組信息,以及病理標本庫,可幫助招募足夠的樣本來增加訓練和驗證的數據。此外,電子病理數據庫保存大量醫師主觀醫療記錄也可用于ML,從文字分析建立臨床邏輯思維[12]。醫學生應該在實習或臨床培訓環節熟悉前文所述前沿數據庫的發展,掌握基本數據庫語言。在樣本量不足時應該充分調用開放數據,提高架構學習的效率,這對增強醫學生學習信心有重要幫助。
對ML架構的解讀有利于醫學生發現新的臨床診斷思維。CNN隱藏層神經元往往輸出的是訓練數據的高級特征,這些特征是具有一定的生物學意義的量化信息。而提取的特征信息包括大量線性思維不易分析的成分。因此,通過中間層特征提取的解讀,將有利于醫學生發現以往未分析出的臨床資料與疾病的權重量化關系,從而建立算法輔助的新臨床思維。在人腫瘤組織芯片的學習案例中,研究者從ML的隱藏層提取了8個被賦予高權重的神經元[13]。因為不能用生物信息學進行回歸和解釋,因此在人工分析中這些多維度的高級特征提取很少見。而ML對部分神經元的高賦值,提示神經元標注的特征代謝通路對疾病的發生發展具有潛在的相關關系。尤其當醫學生面對于臨床罕見病時,其病例儲備、分析思路、模式視角、方法應用有其特征,診斷思維難于訓練。ML綜合循證證據和遺傳背景,建立科學邏輯特征,在教學實踐中有助于兒童矮小癥的罕見疾病診斷思維教學[14]。因此,經典診斷依據與ML系統結合成“專家系統”,可以輔助醫學生臨床思維的形成。
未來ML可能將醫生從耗時且準確率低的數據初篩工作中解放出來,投入更多的時間用于醫患溝通、總結交流和醫學整合,而且能夠駕馭臨床大數據的“智能時代”醫生還能將設計ML架構在臨床實踐中揚長避短,破解目前臨床實踐效率的限制因素。臨床實踐教學也將從培養醫學生的ML應用素養做起,推進醫學教育過程目標的改革。