趙陽光
中國信息通信研究院 北京 100191
人工智能已經非常廣泛的應用于醫療領域,人工智能技術與醫療領域呈現出不斷融合的趨勢。醫療行業長期存在優質醫生資源分配不均,診斷誤診漏診率較高,醫療費用成本過高,放射科、病理科等科室醫生培養周期長,醫生資源供需缺口大等問題。隨著近些年深度學習技術的不斷進步,人工智能逐步從前沿技術轉變為現實應用。在醫療健康行業,人工智能的應用場景越發豐富,人工智能技術也逐漸成為影響醫療行業發展、提升醫療服務水平的重要因素。與互聯網技術在醫療行業的應用不同,人工智能對醫療行業的改造包括生產力的提高、生產方式的改變、底層技術的驅動、上層應用的豐富。通過人工智能在醫療領域的應用,可以提高醫療診斷準確率與效率;提高患者自診比例,降低患者對醫生的需求量;輔助醫生進行病變檢測,實現疾病早期篩查;大幅提高新藥研發效率,降低制藥時間與成本[1]。
人工智能與醫療的結合方式較多,就醫流程方面包括診前、診中、診后;適用對象方面包括醫院、醫生、患者、藥企、檢驗機構等;從賦能醫療行業的角度分析,包括降低醫療成本,提高診斷效率等多種模式。我國醫療人工智能企業聚焦的應用場景集中在虛擬助理、病歷與文獻分析、醫療影像輔助診斷、藥物研發、基因測序等領域。
健康管理助手是指通過語音識別、自然語言處理等技術,將患者的病癥描述與標準的醫學指南作對比,為用戶提供醫療咨詢、自診、導診等服務的信息系統。多數疾病都是可以預防的,但是由于疾病通常在發病前期表征并不明顯,到病況加重之際才會被發現。雖然醫生可以借助工具進行疾病輔助預測,但人體的復雜性、疾病的多樣性會影響預測的準確程度。人工智能技術與醫療健康可穿戴設備的結合可以實現疾病的風險預測和實際干預。風險預測包括對個人健康狀況的預警,以及對流行病等公共衛生事件的監控;干預則主要指針對不同患者的個性化的健康管理和健康咨詢服務(如圖1)。
健康管理助手在醫生端和用戶端均發揮了較大的作用。在醫生端,智能問診可以輔助醫生診斷,尤其是受限于基層醫療機構全科醫生數量、質量的不足,醫療設備條件的欠缺,基層醫療成為了我國分級診療發展的瓶頸。人工智能虛擬助手可以幫助基層醫生進行一些常見病的篩查,以及重大疾病的預警與監控,幫助基層醫生更好地完成轉診的工作,這是人工智能問診在醫生端的價值體現。在用戶端,健康管理助手能夠幫助普通用戶完成健康咨詢、導診等服務。在很多情況下,用戶身體只是稍感不適,并不需要進入醫院進行就診。健康管理助手可以根據用戶的描述定位到用戶的健康問題,提供輕問診服務和用藥指導。患者在就診前使用預問診系統填寫病情相關信息,由系統生成規范、詳細的門診電子病歷發送給醫生。預問診系統采用層次轉移的設計架構模擬醫生進行問診,既能有邏輯地像醫生一樣詢問基本信息、疾病、癥狀、治療情況、既往史等信息,同時,可以圍繞任一癥狀、病史等進行細節特征的問診。除問診外,預問診系統基于自然語言生成技術自動生成規范、詳細的問診報告,主要包括:患者基本信息、主訴、現病史、既往史和過敏史五個部分[2]。
電子病歷是在傳統病歷基礎上,記錄醫生與病人的交互過程以及病情發展情況的電子化病情檔案,包含病案首頁、檢驗結果、住院記錄、手術記錄、醫囑等信息。其中既有結構化數據,也包括大量自由文本輸入的非結構化數據。對電子病歷及醫學文獻中的海量醫療大數據進行分析,有利于促進醫學研究,同時,也為醫療器械、藥物的研發提供了基礎。人工智能利用機器學習和自然語言處理技術可以自動抓取來源于異構系統的病歷與文獻數據,并形成結構化的醫療數據庫。國內眾多相關企業正是基于自己構建的知識圖譜,形成了供醫生使用的臨床決策支持產品,為醫生的診斷提供輔助,包括病情評估、診療建議、藥物禁忌等服務。

圖1 人工智能+健康管理:預測+干預
醫療影像數據是醫療數據的重要組成部分,從數量上看90%以上的醫療數據都是影像數據,從產生數據的設備來看包括CT、X光、MRI、PET等醫療影像數據。據統計,醫學影像數據年增長率為63%,而放射科醫生數量年增長率僅為2%,放射科醫生供給缺口很大。人工智能技術與醫療影像的結合有望緩解此類問題。人工智能技術在醫療影像的應用主要指通過計算機視覺技術對醫療影像進行快速讀片和智能診斷。人工智能在醫學影像中應用主要分為兩部分: 一是感知數據,即通過圖像識別技術對醫學影像進行分析,獲取有效信息;二是數據學習、訓練環節,通過深度學習海量的影像數據和臨床診斷數據,不斷對模型進行訓練,促使其掌握診斷能力[3]。目前,人工智能技術與醫療影像診斷的結合場景包括肺癌檢查、糖網眼底檢查、食管癌檢查以及部分疾病的核醫學檢查和病理檢查等。
以肺結節檢出為例,利用人工智能技術進行肺部腫瘤良性惡性的判斷步驟主要包括:數據收集、數據預處理、圖像分割、肺結節標記、模型訓練、分類預測。首先要獲取放射性設備,如CT掃描的序列影像,并對圖像進行預處理以消除原CT圖像中的邊界噪聲,然后利用分割算法生成肺部區域圖像,并對肺結節區域進行標記。數據獲取后,對3D卷積神經網絡的模型進行訓練,以實現在肺部影像中尋找結節位置并對結節性質進行分類判斷。
藥物研發需經歷靶點篩選、藥物挖掘、臨床試驗、藥物優化等階段。利用傳統手段的藥物研發需要進行大量的模擬測試,周期長、成本高,傳統藥物研發需要投入大量的時間與金錢,制藥公司平均成功研發一款新藥需要10億美元及10年左右時間。目前,業界已嘗試利用人工智能開發虛擬篩選技術,發現靶點、篩選藥物,以取代或增強傳統高通量篩選(HTS)過程,提高潛在藥物的篩選速度和成功率。通過深度學習和自然語言處理技術可以理解和分析醫學文獻、論文、專利、基因組數據中的信息,從中找出相應的候選藥物,并篩選出針對特定疾病有效的化合物,從而大幅縮減研發時間與成本。
基因測序是一種新型基因檢測技術,它通過分析測定基因序列,可用于臨床的遺傳病診斷、產前篩查、罹患腫瘤預測與治療等領域。單個人類基因組擁有30億個堿基對,編碼約23000個含有功能性的基因,基因檢測就是通過解碼從海量數據中挖掘有效信息。目前高通量測序技術的運算層面主要為解碼和記錄,較難以實現基因解讀,所以從基因序列中挖掘出的有效信息十分有限。人工智能技術的介入可改善目前的瓶頸。通過建立初始數學模型,將健康人的全基因組序列和RNA序列導入模型進行訓練,讓模型學習到健康人的RNA剪切模式。之后通過其他分子生物學方法對訓練后的模型進行修正,最后對照病例數據檢驗模型的準確性。
數據是人工智能技術最重要的因素之一。對于機器學習而言,模型越復雜、越具有強表達能力越容易降低對未來數據的解釋能力,而專注于解釋訓練數據。這種現象會導致訓練數據效果很好,但遇到未知的測試數據預測效果會大幅降低,即發生過擬合現象,從而也就需要更多的數據來避免該問題的發生,以保證訓練的模型對新的數據也能有良好的預測表現。對于醫療人工智能而言,數據的重要性更為明顯。以醫療影像輔助診斷公司為例,企業訓練模型的數據來源通常是公開數據集,或者企業與個別醫院合作獲取的影像數據。這種模式在企業創業初期可以維持,但是當企業發展到一定階段時弊端會開始出現。以肺結節CT篩查為例,企業通常與個別醫院展開合作,獲取該醫院CT設備的數據。但是,目前,市面上廣泛流通的CT設備商有七到八家,機型則達到了上百種,企業在與醫院合作時是針對某一機型的設備進行的數據訓練,該模型在適用于其他機型時,如果一些諸如層厚、電流、電壓、掃描時間等參數不同,模型需要重新針對新機型進行數據預訓練。除此以外,病人受檢測時的姿勢(平躺或者趴窩),CT長寬512像素或者768像素的差別,不同排數機器的層厚差異以及薄層重構算法都是對模型訓練產生影響的因素。因此,數據問題的解決是保證醫療影像輔助診斷產品是否能夠廣泛應用的關鍵,廣泛開展合作,加深數據的積累以及技術上的創新或是下一步行業發展的重點。
醫療AI產品需要實現從試驗向臨床應用的突破。目前,業內針對肺結節、糖網病檢查等場景的醫療人工智能產品診斷準確率普遍很高,但是真實情況并非如此樂觀。企業在訓練自己模型時通常都有自己的數據庫,各自的算法都是按照自己的數據進行訓練,然后以自己的數據來驗證準確性。在沒有得到臨床驗證前,基于標準或特定數據集的實驗室測試結果并不具備較大的意義,因為實際臨床應用的場景是非常復雜的。以糖網病篩查為例,瞳孔較小、晶狀體渾濁等人群的免散瞳眼底彩照,圖像質量往往達不到篩查的要求。此外,受限于成本因素,很多基層醫療機構使用的是手持眼底相機,成像質量堪憂。
另外,目前圖像識別技術在醫療影像輔助診斷上的應用已經取得了比較好的應用,技術上也取得了較大的突破,但是醫療影像輔助診斷產品下一步應當完善自己的算法,避免“就圖論圖”。以甲狀腺結節診斷為例,醫生診斷的依據并非只是彩超的拍片結果,還要結合甲狀腺功能化驗,查看抗體的相關表現;因此,將臨床表征信息、患者基本信息、LIS指標、隨訪記錄等都作為預測模型的因子,實現多模態的診斷體系將是醫療影像輔助診斷產品下一步重點突破的方向。
現在的醫療人工智能企業多數是依靠單點醫療機構開展工作,合作方式較為單一,數據作為醫院資產也難以供企業放置于院外使用[4];此外,醫療人工智能產品想以銷售軟件的形式讓醫院付費,不論從計費方式、軟件資質等方面都較為困難;因此,建立可持續的商業模式是醫療人工智能行業長久發展的關鍵。
人工智能協助進行輔助診斷在醫療責任認定方面也存在問題和挑戰。例如,用戶在使用醫療虛擬助手表達主訴時,可能會漏掉甚至錯誤地進行描述,導致虛擬助手提供的建議是不符合用戶原本的疾病情況的;因此,目前監管部門禁止虛擬助手軟件提供任何疾病的診斷建議,只允許提供用戶健康輕問診咨詢服務。我國監管部門對于利用人工智能技術提供診斷功能的審核要求非常嚴格,對于能夠對病變部位進行自動識別并提供明確診斷提示的產品,必須按照第三類醫療器械進行臨床試驗認證管理。未來,應進一步明確針對AI診斷進入臨床應用的法律標準,做出AI診斷的主體在法律上是醫生還是醫療器械,AI診斷出現缺陷或醫療過失的判斷依據等問題。
雖然我國醫療人工智能領域近幾年取得了應用層面的突破,但我國醫療人工智能整體發展水平與發達國家相比仍存在差距,在前沿基礎設施建設、產業應用、人才培養和監管體系等方面都亟待建立和完善。
尤其在基層建設層面,有效的醫療大數據的積累將是醫療人工智能產業未來發展的核心因素。醫療數據的有效性包括三個方面:電子化程度、標準化程度以及共享機制。電子化程度強調數據和病歷的供給量;標準化程度強調數據之間的可比性和通用型;共享機制強調數據獲取渠道的便利性和合法性。只有滿足上述三個方面的條件,醫療大數據才能得到有效搜集和應用,進而為人工智能打下基礎。在醫療大數據策略方面,美國聯邦制定了各種數據標準,包括數據交換格式、數據模型表達方法等,因此,美國醫療大數據的積累擁有大量底層、標準、數據規范、標準代碼等作為基礎支撐。我國在醫療數據質量控制方面存在一定的問題,不同醫療機構間的數據差異性非常大,導致構建一致性的數據集難度較大,即便在醫院內部,數據分別存儲在不同臨床業務系統,沒有實現互聯互通,數據間的鴻溝導致大量的數據未實現大數據的價值。
由于國內醫學影像數量年增長率很高,而相應的放射科醫師增長率較低,因此,供需缺口是推動國內AI技術在醫學影像應用的重要因素。我國人工智能+醫學影像的公司數量眾多,而且應用領域也較為廣泛,在放射影像、糖網圖像、甲狀腺圖像、宮頸癌病理圖像等方面都有很深入的研究,產業界實力在世界范圍內屬于前列。但是,除醫學影像外,我國對于AI技術利用的多樣性較發達國家存在一定差距。例如,美國許多企業在研究利用算法分析動物的血管和疾病,這對行業上下游非常重要。再比如腸道微生物有大量的數據,微生物數據量達到百萬級別,甚至高于基因測序測的數據量,對于此部分數據的分析也具備巨大價值。根據國家《新一代人工智能發展規劃》的總體戰略部署,以及《促進新一代人工智能產業發展三年行動計劃(2018-2020年)》中關于醫療領域的具體實施目標,我國正在重點培育和發展醫療影像輔助診斷系統等醫療人工智能產品,并通過搭建醫療行業訓練資源庫、標準測試集及知識產權服務平臺夯實人工智能產業發展的軟硬件基礎,完善醫療人工智能發展環境。未來醫療人工智能行業需要加強上下游協同,形成產業發展閉環。在構建醫療輔助診斷系統過程中,應結合患者基本信息、臨床表現、影像學特征、病理檢驗結果、隨訪等多種因素,研發多模態人工智能輔助診斷系統,從而逐步推進醫療人工智能產品實現從試驗向臨床應用的突破。
[1] 徐國平,王家驥.基礎醫療衛生服務應該在中國新醫改中得到正確理解和全面實施[J].中國全科醫學,2015:18-20
[2] 王斌,杜方冬.醫院信息化的相關理論問題研究[J].中國現代醫學雜志,2013:108-112
[3] 鉛筆道.人工智能與影像診斷相結合的醫生界阿爾法狗[J].中國醫學計算機成像雜志,2016:282-282
[4] 聶金福.人工智能在生物醫療領域的應用和機遇[J].軟件和集成電路,2017(04)