遲兆艷

2017年5月,在中國浙江烏鎮,谷歌公司旗下的人工智能機器人“阿爾法圍棋”(AlphaGo)與當時世界排名第一的圍棋世界冠軍柯潔對戰,以3比0的總比分獲勝。這是在2016年AlphaGo與韓國圍棋選手李世石對戰之后,又一次戰勝人類圍棋高手,引起了全世界特別是中國人的廣泛關注。人們既為技術的進步而歡呼雀躍,也對機器人戰勝人類感到隱隱不安,唯恐科幻小說中“機器人統治人類”的情節成為可怕的現實。
實際上,目前的智能機器人要成為高等智能還有很長的一段路要走,在可以預見的未來,并不會發生機器人統治人類的危機,與機器人相關的技術對人類世界的發展有著巨大的推動作用。人工智能、機器學習、大數據這些技術方法在近幾年飛速發展,正在廣泛而深入地改變著人們的生活。在醫療領域,人工智能、機器學習和大數據應用更是炙手可熱,無數醫療領域的公司借助新的技術和方法而冉冉升起,成為業界明星。
人工智能和大數據被應用到臨床研發、疾病診斷、醫療輔助服務等多個領域,改變了傳統的醫療模式。
罕見病也被稱為“孤兒病”,因其單一疾病發病人數低于普通疾病而鮮為人知,被稱為 “無聲的苦難”。
雖然罕見病中有“罕見”二字,但由于罕見病種類繁多,這些疾病的患者其實并不“罕見”。據統計,全球有4億人患有罕見病,而中國至少有1000萬以上的罕見病患者。國際上目前已經確認的罕見病約有7000種,例如,“瓷娃娃”“漸凍癥”等。雖然患者群體龐大,但醫生對罕見病的診斷水平并不高。罕見病涉及血液、骨科、呼吸等多個學科,但臨床醫生普遍缺乏罕見病的專業知識,又因其病例稀少,醫生也無法通過確診案例獲得經驗。
由于罕見病發病率低,病例過于分散,醫生在臨床上無法積累豐富的個案經驗,長期以來,罕見病一直存在無法及時確診的問題。據調查,罕見病患者的平均確診時間為5年。不過,科技的進步為罕見病的診斷帶來了希望,除了基因檢測技術,醫生還可以利用大數據進行智能診斷。
在美國,許多大型醫療數據公司積累了豐富的、各個層次的醫療數據,擁有上億病人數十年的診斷、用藥、住院及醫保記錄,甚至還有病人的家族史信息。通過這些數據的積累,公司及政府可以建立起病人的數據庫。
人工智能科學家從這些醫療數據中提取出罕見病病人的相關信息,利用機器學習算法,建立起罕見病病人的特征模型。例如,科學家可以將罕見病病人以往的疾病、用藥特征與其他病人進行對比,從而建立起罕見病病人的“人物畫像”,一旦有新的病人進入數據庫,特征模型可以根據該病人的情況來幫助醫生進行診斷,提高對罕見病的診斷效率。
特發性肺動脈高壓是一種罕見的心血管疾病,每年的發病率為百萬分之一,患者平均年齡在30歲左右,女性發病率高于男性,目前是不可治愈的重度慢性疾病。其病因不明,可能與藥物、病毒感染和遺傳等因素有關。2018年,特發性肺動脈高壓被收錄進中國的《第一批罕見病目錄》。
特發性肺動脈高壓早期癥狀并不明顯,常見的初始癥狀包括:呼吸困難、疲乏、胸痛等,存在一定的診斷難度。為了幫助醫生診斷可能存在的特發性肺動脈高壓,數據科學家從既有的臨床數據庫里調取出特發性肺動脈高壓病人和普通病人的相關診斷和治療的信息,比如病人之前是否患有感冒、肺氣腫等疾病,這些信息被數據科學家稱為“特征”。接下來,數據科學家把這些特征輸入到機器學習算法中,算法就會形成一個模型,將特發性肺動脈高壓病人和普通病人區分開來。出診醫生借助算法模型可以判斷該病人是否患有特發性肺動脈高壓。當然,算法所得到的結果不可能百分之百準確,但它卻可以為醫生提供非常有價值的診斷、治療信息。
如何利用人類幾千年來積累的豐富知識,一直是人工智能的重要研究方向,知識圖譜就是一種結構化的人類知識,它的出現受到了學術界和工業界的普遍關注。
知識圖譜的概念起源于2012年,當時谷歌推出了一款產品,其功能是搜索內容時提供附加的衍生結果,這款產品名字叫作知識圖譜(Knowledge Graph)。知識圖譜本質上是基于語義網絡的知識庫,旨在描述客觀世界的概念、實體、事件及其之間的關系。可以簡單將其理解為一種較為高級的知識庫。
自2012年以來,知識圖譜的應用領域越來越廣,其在醫療領域也有了長足發展。知識圖譜在醫療領域的應用主要體現在兩方面:搜索和推薦功能、臨床決策服務。
搜索和推薦功能
通過知識圖譜,可以建立起海量的數據庫,包含疾病、病人和醫生等各方面信息,應用場景包括疾病診斷、醫生推薦等。相對于傳統的搜索,其結果更準確,更深入,更具有針對性。
比如,在傳統搜索中,搜索“白血病”將獲得零碎的知識分享及大量的廣告推廣;在基于知識圖譜的智能系統中搜索白血病,則可獲取白血病病情的準確描述信息、全國治療白血病的專家醫生及其所擅長的領域等。目前,國內利用知識圖譜建立搜索和推薦功能的平臺有丁香園、百度的靈醫智惠、中國平安的平安好醫生以及阿里巴巴的阿里健康等。
另外,知識圖譜可以建立豐富的醫學知識庫,可以為醫務人員提供可靠的醫學知識,比如,擁有可靠來源的權威知識數據和臨床指南等。在這個領域,美國一直處于發展的前沿,2013年,美國的IBM公司制定了一項醫療領域的“登月計劃”,該計劃整合了大量醫療文獻和書籍以及各種電子病歷,從而獲取海量高質量醫療知識,并基于這些知識向醫護人員提供輔助臨床決策和用藥安全等方面的應用。
臨床決策服務
知識圖譜可以為病人及醫務人員提供更加智能的服務,比如,它可以實現智能導診、智能自診和病案管理等功能。
醫生的問診一般會遵循一套標準化流程,因此可以通過人工智能的方式來取代人工問診。智能系統模擬醫生問診的流程和方法被稱為智能自診。智能自診系統從病人身體最明顯的癥狀開始分析,在經過嚴謹的醫療問診后,會為病人分析病因,并提出進一步的診療指導,如用藥指導、需要檢查的項目和注意事項等。例如,如果病人有發燒、咳嗽等癥狀,智能系統會從這些癥狀問起,對可能患有的疾病如感冒、肺炎等進行篩選,并最終給出診療意見。
對醫務人員來說,智能系統還可以提供病例分析。智能系統集合了成千上萬的病例,臨床醫生輸入病人的信息,系統便可提供以往所有病史,并提供病例特點、診療方法以及治療效果,從而為醫生提供診療的思路。
在這種人機互動的過程中,機器扮演了“大腦”的角色,知識圖譜可以在更高的層次上整合信息,并提供更準確和有效的服務。例如,病人在完成掛號的時間里,可以在手機或者電腦客戶端輸入自己的基本信息、癥狀、既往病史、過敏史等,客戶端將通過智能系統形成初步的診斷報告,可以大大縮短問診的時間。未來,科學家還可以實現更加高級的功能,例如,智能系統可以根據病人的初診報告,給出需要檢查的項目及治療方案,從而進一步縮短醫生問診的時間,提升臨床診斷的效率。

傳統的醫藥研發依托于小樣本的臨床數據,如今,大數據技術也被應用到醫藥研發的過程中。
“真實世界研究”是近幾年醫療大數據領域較為熱門的一個話題。2012年12月,美國食品藥品監督管理局(FDA)頒布了《21世紀治療法案》,要求在醫療產品審批和監管程序中納入真實世界證據。2018年12月,FDA宣布了《真實世界證據方案框架》,為實現真實世界證據支持藥品審批決策的目標提供了一個指導方案,由此引發了真實世界研究在各國的藥品審批決策中的廣泛應用和發展。
那么,什么是真實世界研究呢?
通俗來講,真實世界研究建立在真實世界數據的基礎上,數據科學家及其他醫療從業人員將收集到的真實數據加以分析,從而提供對診療的結論和建議。通常情況下,真實世界研究會圍繞病因、診斷、治療、預后及臨床預測等相關問題展開。比如,研究幽門螺旋桿菌感染與十二指腸潰瘍的關系,住院新冠肺炎病人的抗病毒治療效果及治療引起的不良反應等。
其中,將真實世界研究與新藥品研發相結合是真實世界研究的重要應用場景。
為什么要將真實世界研究應用到臨床藥物研發中呢?因為傳統的臨床藥物研發是在一種區別于真實世界的實驗環境中進行的,在這種環境中,病人經過了嚴格的篩選,研究還控制了各種混雜因素。基于真實世界研究的一些干預性研究,在精確設計的基礎上具有更貼近日常診療的特性,比如將電子病例數據、醫保數據引入研究過程。
真實世界研究的應用場景包含療效評估、副作用評估等。比如,在癌癥治療或者罕見病治療的過程中,傳統的臨床醫療面臨成本高昂、缺少樣本的問題,具有大量樣本的真實世界證據可以作為輔助證據支持新藥上市。在腫瘤藥物研究中,可以將新藥臨床1、2、3期的療效和全球已有藥品治療的療效進行對比,從而驗證新藥的治療效果。
真實世界研究可以避免臨床試驗等傳統方法的樣本數小、采樣分布有限等問題,它從成千上百萬的病人的數據中挖掘到與某種藥物相關的不良反應,樣本數大、采樣分布廣,獲得的結果更具有說服力。
當然,真實世界證據也存在一定缺陷,例如,一些數據有可能與某些具體研究的相關性不大,所以在使用的時候也需要嚴格限制可以應用的場景。
除了真實世界研究,醫藥公司還可以通過大數據技術分析公眾對藥品需求的趨勢,從而提供更好的藥品供給服務。在醫藥副作用的研究上,研究者還可以從社交網絡中搜索人們服用某種藥物的不良反應記錄,通過比對分析和數據挖掘方法,更科學、更全面地獲得藥物副作用的影響。
發展醫療大數據技術已是全球發展的大趨勢,無論是國家層面還是企業層面都在打造更先進、更具個性化的醫療大數據平臺。
在國家層面上,美國是大數據技術的先行者,也是醫療領域的領頭羊。美國非常重視醫療大數據的收集和使用,擁有完整的醫療健康大數據庫,建成了覆蓋本土12個區域電子病歷的數據中心、9個醫療知識中心、8個醫學影像與生物信息數據中心。
同樣,英國也有發達的醫療體系和診療系統。英國國民醫療服務系統擁有龐大而完備的醫療數據,包括病人的健康記錄、疾病數據等,而且英國還有長達210年的全國普查健康記錄,這些數據可以用來為公共衛生服務、醫學研究等創造更多的價值。基于該系統,研究者及藥企研發人員可以進行豐富的臨床和市場研究。
在中國,我們已初步建立健康醫療數據庫,但還沒有一個系統性的、國家層面的醫療大數據平臺。目前,相關部門已經出臺了一些相應的政策,促進醫療大數據的發展。例如,2016年國務院辦公廳發布的《關于促進和規范健康醫療大數據應用發展的指導意見》是針對醫療大數據的首個頂層文件,首次提出醫療大數據是國家級的戰略資源,明確醫療大數據發展目標。
在公司層面上,一些國外醫療公司在建設醫療健康大數據方面已經初具規模,他們主要利用人工智能、機器學習為醫療服務提供者搭建平臺、提供服務。比如,有的美國大數據公司會收集醫療保險數據,為制藥公司或者保險機構提供數據服務。
在國內,由于起步較晚,很多公司還停留在數據采集的層面,需要將收集到的數據統一化、標準化,離數據平臺的搭建及數據的挖掘和分析還有一定的距離。
在可預見的未來,隨著人工智能和大數據的迅猛發展,醫療設施的使用將更加便捷和人性化;病人將獲得更可靠、更具有針對性的診療信息;醫生將在智能系統的幫助下開展更準確和個性化的診療措施。人工智能、大數據、機器學習等高新技術將為我們創造一個高效、便捷、專業以及個性化的醫療環境,而且隨著技術的傳播,未來將有更多人享受到科技發展帶來的健康福祉。