張晨光
國家藥品監督管理局醫療器械技術審評中心,北京市,100081
自2019年12月以來,新型冠狀病毒肺炎(COVID-19)疫情席卷全球,根據世界衛生組織(WHO)的統計數據,已經造成超過2 500萬人確診,死亡人數超過80萬人[1],疫情的快速傳播為世界公共衛生系統帶來巨大挑戰。短時間內大量病人涌入急診和發熱門診等待診斷和治療,醫療機構負荷驟然提升。作為COVID-19診斷的重要方法[2],CT影像和實時熒光PT-PCR核酸檢測能力在疫情早期嚴重不足。此外,由于缺乏對患者病情走勢的判斷,對COVID-19急性并發癥也難以提前準備和干預 。隨著人工智能(artificial intelligence,AI)技術不斷發展成熟,其在圖像識別、數據分析、決策輔助等方面的先進算法越來越豐富。將AI技術與現有條件下的疾病診療手段進行深度融合,充分發揮其獨特優勢,將可以幫助我們更好地應對COVID-19等突發性重大傳染病帶來的挑戰。
AI技術是在計算機科學、控制論、信息論、心理學等學科的基礎上發展起來的融合性技術,基于卷積神經網絡(convolutional neural network,CNN)、機器學習(machine learning,ML)和深度學習(deep learning,DL)等方法,通過對海量數據的訓練和學習,使模型具有良好的決策判斷能力、適應能力和自我完善能力[3]。AI模型的建立需要基于一定數量的既有樣品數據,而一旦有效的模型得以確立,將幫助人們做出快速、穩定的決策。隨著訓練數據量不斷增加,模型的準確性和魯棒性也將不斷增強。
COVID-19是一種突發新型急性傳染病,人群普遍易感,且其癥狀與普通肺炎及其他呼吸系統疾病具有很多相似性,這些特點進一步加大了診療的困難。醫生一方面需要逐步認識和學習這種新型病癥的診療方法,另一方面要面對大量等待診斷和治療的患者,疫情在發病高峰期造成了醫療資源的嚴重透支。AI技術可以充分利用自身特性與現有醫療手段結合,在病情分析、影像閱片、患者分類、病情預判等環節,輔助醫生做出快速準確的判斷,在緩解醫療資源緊張、提升診斷質量、減少人為失誤、增強欠發達地區診療能力等方面發揮重要作用。本次COVID-19疫情激發各國研究人員進行多項研究,目的是讓現有診療方法在AI技術的幫助下發揮出更大作用。
隨著AI技術的演進和發展,越來越多的算法和成熟模型可被用來模擬醫生的決策過程,以海量數據和強大算力為支撐,實現超越單個診療專家或團隊的決策效果,通過云計算和虛擬服務器,還能以較低的成本,快速復制和推廣到多個地區,幫助我們更好應對COVID-19。根據不同臨床需要和診療特點,需采取不同的技術方案。目前比較成熟的是醫學影像AI:一是利用卷積神經網絡和深度學習技術分析醫學影像,進行病灶自動定位、圈劃以及疾病的診斷、分類和分級。二是機器決策:通過決策樹、隨機森林、貝葉斯分類等方法輔助醫生對患者類型、病情嚴重程度進行分類和預判。三是特征篩選技術:采用機器學習中的特征工程(feature engineering)方法,通過特征提取、特征選擇和特征構造,按照重要程度,篩選出COVID-19不同合并癥的特征以及影響診療效果的主要因素。
胸部高分辨率CT(high resolution CT,HRCT)為當前篩查COVID-19的首選影像學方法[4~5],患者早期多發小斑片影,晚期多發雙肺磨玻璃影和浸潤影[2]。利用AI技術建立模型訓練學習這些影像特征并輔助醫生進行閱片,將大幅提高閱片效率,緩解醫生閱片經驗不足和能力水平差異帶來的閱片質量問題。
新冠肺炎與普通肺炎的CT影像學表現具有很強的相似性,診斷模型需要同時學習不同肺炎的影像特征以提高診斷準確性。WANG等[6]通過COVID-19確診患者和先前被診斷為典型性肺炎患者的CT影像數據訓練模型,使用CNN技術學習這些影像的特征,代表其算法性能的曲線下面積(area under curve,AUC)達到了0.93,其單個病例的平均診斷時間為10 s,特異性和靈敏性也有較好表現。針對這類診斷模型的研究證明,AI技術在大幅提高影像學診斷效率的同時,也能夠在一定條件下保障診斷的準確性。另一方面,圖像本身的質量對于診斷結果具有較強的影響,在模型訓練時,應明確定義納入訓練數據的圖像質量標準。
AI技術在COVID-19定性診斷的基礎上,在判斷病情嚴重程度方面也能夠有所作為。GOZES等[7]使用基于CNN技術且擅長可視化分析的Grad-Cam模型[8]用于病灶的定位分析,將不同分辨率的CT平掃圖像融合為3D圖像后計算被COVID-19侵入的肺部體積,提出冠狀病毒評分(Corona Score)用于評估病毒在肺部的傳播程度。疾病的定量分析需要預測模型輸出連續值,該研究表明弱監督深度學習方法在病情分析上也能取得較好的應用效果。此外,相較由支氣管鏡或有創方式提取肺部組織液分析病情進展的方式,基于CT影像的AI定量分析方法展示出更加廣闊的臨床應用前景。
疫情傳播初期,由于COVID-19癥狀與流行性感冒等其他呼吸系統疾病癥狀類似,需要排查的疑似病例數量激增,而醫療機構特別是欠發達地區和基層的醫療機構,其CT造影和核酸檢測能力短期無法滿足大量等待排查的病患,供需矛盾加劇了有限醫療資源的透支程度。通過大數據分析和人工智能算法,研究病例的常規臨床身體指征及病情變化,并用于輔助診斷新冠患者,對于新型傳染病發病早期的患者分類分級,以及提高醫療資源利用效率具有一定意義。
門診可取得的數據種類繁雜,人口學、血常規、臨床體征、住院病程的各項數據都可能成為疾病診斷的影響因素,利用這些數據進行病情早期診斷,難點在于將影響模型決策的主要因素按照關聯性挑選出來。FENG等[9]觀察了疫情初期醫院發熱門診收治的具有流行病學意義的COVID-19接觸史病例,將體溫、心率、血常規、肌肉疼痛、入院時間等門診記錄列為備選特征,使用邏輯回歸(logistic regression)方法對特征的重要性進行篩選排序,再采用機器學習算法Lasso遞歸建立無CT檢查下的疑似病例早期診斷輔助模型。這類研究顯示,篩選特征的過程至關重要,不同特征組合可能適用于不同的訓練算法和模型方案,對最終模型的選擇需要通過數據測試集和驗證集進行評估。
在缺乏PT-PCR核酸檢測資源的條件下,利用常規急診檢查指標進行COVID-19診斷預測,給出高?;颊叩霓D診提示,這對于基層醫院的診療具有一定意義。BATISTA等[10]選取除PT-PCR核酸檢測以外的年齡、性別、血紅細胞數量、紅細胞平均血紅細胞濃度、C反應蛋白等特征,采用隨機樹(random tree)和支持向量機(support vector machine)算法訓練,獲得了性能較為理想的模型。即使是用同樣的特征集和數據集,當采用不同學習算法,也會導致性能上的較大差異,模型建立過程中應根據算力條件和臨床終點指標進行算法選擇。
目前,多數研究中選擇的算法都屬于有監督學習,即每個訓練樣本的輸入,都對應著確定的輸出,即訓練后的模型對新的輸入進行處理,將得出一個確定的預測值。對于COVID-19的預測模型的輸出基本是離散值,即主要是分類問題。AI算法的性能會受分類數量、標記情況、樣本數量等方面的影響,這些特點應在模型建立與算法選擇時給予關注。
回顧性分析COVID-19患者入院時的臨床特征,顯示重癥患者易出現急性呼吸綜合征(ARDS)、心肌損傷、凝血障礙、腎損傷和休克等并發癥[11],通過分析致病因素、患者身體指征、病情發展時間等數據,利用深度學習等AI技術,提前獲取病情發展趨勢并預測可能出現的并發癥,對于病人危重程度預判、醫療資源調配、診療方案早期介入,降低COVID-19患病死亡率等方面具有重要意義。
ARDS的癥狀較為復雜,為在提升AI算法準確性的同時節約運算資源,預測模型的設計需要根據特征貢獻值控制特征值規模,可采用特征工程方法對數據特征進行預處理,選取臨床適宜的特征集。JIANG等[12]利用COVID-19咽拭子核酸檢測陽性確診病例數據,設計了一個預測COVID-19患者患ARDS的模型。該研究在數據預處理過程中采用過濾法(filter)確定出含有谷丙轉氨酶、淋巴細胞數量、肌酐等生化指標及性別、年齡等11項的特征集并用于模型訓練,獲得了較好的性能。同時WANG等[13]的一項研究顯示,肺部CT、發燒癥狀、淋巴細胞減少癥等都無法預測ARDS的發生。
COVID-19另外一個危險的并發癥是急性腎衰竭(acute kidney injury,AKI),其中部分患者預期將需要接受透析治療。AI算法的作用在于提前推斷出哪些患者將出現AKI,甚至將進行透析治療。CHAN等[14]利用Python的機器學習模型解釋工具SHAP(SHapley Additive exPlanation)分析模型各特征值的重要性,進而通過改進的決策樹機器學習算法得到預測模型。他們觀察到:肌酐、年齡、血鉀以及心率對模型結果的影響程度要大于白細胞數量和淋巴細胞數量等其他特征。這類研究過程除了讓我們得到有效的預測模型,對于臨床并發癥的影響因素也有更深的理解。
盡管過去AI技術在醫療領域應用的嘗試已經全面展開,但在COVID-19診療方面的研究和應用依然處于初始階段,一些問題仍然有待探討和解決。比如人工智能診療的責任歸屬尚不清晰,AI自動出具的診斷報告是否需要醫生最終確認仍在討論之中;假陰性和假陽性診斷的風險依然存在,經驗豐富的醫生可能依然傾向于人工診斷,而 AI對缺乏醫療資源的基層地區或者經驗不足的醫生幫助更為顯著;模型訓練依賴海量數據,當前研究的樣本數量受條件的限制還比較有限,各項研究的數據集依然呈現出小而散的特點;人種差異、病毒變異等因素是否會對模型的構建造成影響還有待研究;數據的收集、脫敏、標記、訓練、驗證等過程缺乏相應的質量保證體系,數據質量難以評估,一套標準全面并受到廣泛認可的數據集有待建立;AI模型在當前臨床數據的基礎上還應結合遺傳學、流行病學等更寬角度的信息以進一步提升模型的準確性等。
在應對COVID-19給診療工作帶來的巨大挑戰過程中,世界多個國家研究人員紛紛利用人工智能技術開展了多角度的研究并取得了豐碩的成果,為解決突發重大疫情下的醫療資源緊張、提升醫療質量和降低患病死亡率等問題帶來了新的機遇。隨著病例樣本數據量的擴大和更多研究力量的參與,AI技術將在人們解決COVID-19診療過程中發揮更大作用。