朱 晶
人工智能在醫學研究領域獲得越來越多的應用和關注,包括醫學影像智能判讀、生物醫學輔助診斷、手術機器人與人工智能輔助藥物發現、決策支持與醫院監測等。從發展相對成熟的源于IBM Watson自然語言理解技術的智能輔助診斷,到基于深度學習技術的放射學影像診斷,再到可預期地將人工智能與量子計算結合起來、應用到醫學領域的診斷假設①M. B. Vicente,“ Emerging Technologies in Artificial Intelligence: Quantum Rule-based Systems”, Progress in Artificial Intelligence, Vol.7, No.7, 2018, pp.155—166.,人工智能在醫療行業呈現數據爆發式增長,被認為有很好的應用前景。甚至有人工智能醫學領域的研究者預測,未來最大的醫療公司不會有實體醫院,但是卻擁有數據。①K. Krisberg, “Artificial Intelligence Transforms the Future of Medicine”, AAMC News, November 14, 2017.與其他領域的人工智能不同,智能醫學之所以受到重視,除了技術變革,還因為醫療的受眾是每一個人。已有的對人工智能醫學的討論,多為工程師和醫生參與,關注它在醫療數據上的存儲、保護和壟斷,對人類是否產生傷害等安全與倫理問題②劉榮:《智能醫學中的安全問題》,載《中華腔鏡外科雜志》2018年第1期。,或者機器學習等模式在人工智能醫學領域的具體應用。③J. H. Chen, S. M. Asch, “Machine Learning and Prediction in Medicine—Beyond the Peak of Inflated Expectations”,New England Journal of Medicine, Vol.376, No.26, 2017, pp.2507—2509.人工智能普遍存在的哲學挑戰得到了深入而全面地討論④成素梅:《智能化社會的十大哲學挑戰》,載《探索與爭鳴》2017年第10期。,但少有專門針對人工智能醫學的哲學思考。人體作為復雜的動力系統,疾病的產生和康復亦具有復雜性。為此,本文將從復雜性哲學的視角探討人工智能醫學,而不僅僅是生物醫學或者普遍的人工智能在方法論和認識論上存在的優勢和問題。
數據是人工智能醫學的關鍵點,利用海量的醫學文獻數據、臨床研究數據、病人的電子病歷、人體基因序列數據、醫療診斷影像以及病毒化合物數據,人工智能醫學分析和挖掘出有價值的信息,用于輔助診斷或預測治療決策,從而實現精準醫療與藥物發現。這些功能的獲得,得益于人工智能醫學相對于傳統的診斷和治療,在面對作為復雜系統的人體和疾病時,在方法論和認識論上所具有的優勢。
從復雜系統的視角來看,人體作為復雜的生理系統,具有開放性、不確定性、非線性以及多層次性與多樣性等特征。人體內的組織與組織、器官與器官、組織器官與環境之間的相互作用,使得健康和疾病也是一種復雜現象。疾病不僅通常由多重因素引起,從疾病到康復還是一個復雜的過程,身體內的組織、器官與環境等相互作用的各種過程以復雜的方式互相影響。復雜人體系統的各個要素之間以非線性的相互作用涌現出宏觀秩序和規律。也就是說,影響疾病的成因和治療的因素復雜多樣,其間的關系除了線性特征,還有非線性與非加合性。
現有的生物醫學研究方法,無論是藥物還是臨床治療,均使用一套標準化的方法與程序,對疾病的成因與藥物治療的解釋基于少量因素之間的因果關系與邏輯推理。基于封閉系統的熱力學平衡原則,生物醫學將健康定義為一種靜態狀態。因而,無論是對藥物還是治療的有效性評價,抑或對疾病的解釋,生物醫學關注的是主要的、單一的原因與變量,并且假定微小的影響因素不會帶來治療結果的變化。①W. E. Herfel, Y. Gao, D. J. Rodrigues, “Chinese Medicine and Complex System Dynamics”, in Philosophy of Complex Systems, edited by Cliff Hooker, Amsterdam:Elsevier, 2011, pp.675—719.以作為醫學研究黃金標準的隨機、雙盲、控制對照臨床實驗為例,這種方法通常基于大樣本的病人所得出的具有統計代表性、雙盲或者三盲的實驗結果,而且實驗中必須設置安慰劑并進行對比,所得到的藥物測試與安慰劑結果之間要存在區別,才能成為在數字上有意義的判定,這種方法被認為排除了實驗對象或實驗人員的主觀偏向和心理因素對治療手段或者藥物實際效果的影響。而且,這種方法對實驗過程和數據采取了隨機化的處理,在對實驗數據進行處理和建立模型時,隨機化的目的是為了增加這種可能性,即混雜多樣、影響治療的變量,將會平均地分布在治療和控制組中。但是,這種臨床研究方法論對隨機性的關注,目的是去除讓研究者困惑的、被視為無關的變量,試圖避開人體和疾病的復雜性。而這些令人困惑的變量對于理解疾病,特別是個體化的疾病狀態而言,是必不可少的。因而對于常規醫學,實現個性化、精準的診斷與治療非常困難。癌癥作為復雜的基因疾病,對其進行精準治療則更加不易。
人工智能醫學的優勢在于,可以利用數據量大、來源多樣、搜集的信息特征復雜等優勢,發掘并識別多種變量之間的相關性,從而對抽象、復雜的病人信息進行更直觀、準確地處理和識別,并利用算法,不做預先假定,通過整合、映射等形式刻畫數據所傳遞的信息特征,捕獲數據中強的、與理論無涉的復雜非線性關系,消除不確定性,從而提高預測的準確性。
首先在數據的利用上,人工智能醫學使用了大量實用的生物信息,包括數百萬病人的診斷圖像、Medline或者PubMed數據庫中的海量醫學研究論文以及成千上萬個醫生的電子病歷。而對于常規醫學,醫生診斷疾病所依賴的是個體的醫療史,對個體生物器官的醫學檢查結果,以及對病人健康狀況的簡單評估,比如社區獲得性肺炎CURB-65評分表。而人工智能醫學所利用的大數據則不同,除了數據量大,更重要的是數據的多樣性,通過海量數據可以搜集復雜的關于人體和疾病的深層和全面的信息。正如電子病歷本身的設計并非用來預測疾病的風險,或者對更加精準的治療做出預測,但是將病歷與人工智能結合起來,電子病歷數據在搜集復雜信息上的價值便體現出來。例如IBM Watson腫瘤智能診療系統,已經儲存了多種醫學專業期刊和有關腫瘤的專著,超過1500萬頁的論文研究數據和臨床指南,而且能夠學習和更新最新的醫學指南和研究數據。再如,在西奈山伊坎醫學院(Ichan School of Medicine at Mount Sinai)的人工智能醫學項目Deep Patient中,科學家們利用了70萬份電子病歷。因而,相比傳統的醫生診斷時所利用的小樣本數據,大數據可以涵蓋關于健康和疾病的更加豐富的信息,其中包括關于疾病的不確定性信息,復雜人體和疾病系統中的非線性數據等。
其次,數據本身是無用的,數據要發揮作用,需要被分析、解釋并應用于行動和實踐。利用機器學習,特別是專家系統和深度學習,人工智能醫學能夠通過算法來識別多種變量之間的相關性,而不僅僅是線性的因果關系。機器學習同時使用了線性和非線性的模型,使用更加抽象的方式來表達特定的數據,挖掘數據隱藏的結構和關系。而且深度學習往往會構建多層數、多節點、多復雜度的模型。基于專家系統的人工智能醫學,按照一個給定的主題或者規則設定編碼知識,按照一般的醫學原則來進行判斷,并給出關于特定臨床場景的結論,比如檢測藥物的相互作用或者判斷獲取圖像的合適性。較之機器學習,專家系統更像是一個理想的醫學學生的工作方式。而機器學習更進一步,可以從數據中來學習規則,從病人層面的觀察開始,算法可以篩選出大量的變量和模式,利用相關分析尋找變量之間的組合,從而準確地預測結果。與傳統的小數據分析使用的回歸模型相比,機器學習也有結果和變量以及連接這兩者的統計功能。但是機器學習能夠挖掘數據的非線性關系,對原始數據進行不同程度的抽象化表征,處理大量預測變量,而且有些情況下預測變量比觀察量還要多,然后再以非線性和高度交互的方式組合它們,進而發現一些有意義的模式,提升對目標數據識別的準確度。這種能力可以實現復雜數據的使用,找出數據之間的相關性并做出預測。不僅如此,醫學數據的來源多樣,缺少一致的架構,而且原始數據本身的搜集并非為醫學服務,比如有的醫療數據是為了獲得保險賬單;通過對海量醫學數據的相關分析,還可以從數據中消除偏見和不確定性①J. H. Chen, S. M. Asch, “Machine Learning and Prediction in Medicine—Beyond the Peak of Inflated Expectations”.,減少干預,識別數據中獨特的指標,既能精確預測重大疾病的發生,又能根據病人的特征實現個體化診斷和治療,提高診斷的精確性,減少誤診。②Z. Obermeyer, E. J. Emanuel, “Predicting the Future—Big Data, Machine Learning, and Clinical Medicine”,New England Journal of Medicine, Vol.375, No.13, 2016, pp.1216—1219.從膿毒癥的早期預警系統,到人體影像診斷,這些方法都顯示出預測的準確性。
已有的基于深度學習的人工智能醫學的研究和應用,證實了大數據與算法的結合,能夠通過搜集復雜信息并識別變量之間的線性與非線性關系,利用不事先做出假設的優勢,發現常規醫學中被忽略的變量,實現精準預測。例如,利用Deep Patient,科學家將70萬份電子健康病歷去識別化,并整合進入電腦神經網絡,通過隨機組合數據來獲得并監測有關疾病風險的新變量,并建立預測模型。2016年的一份研究表明,以7.6萬份、患有78種疾病的病人原始病歷為基礎,Deep Patient將多源的臨床數據進行預處理和粗略表征,識別和規范與臨床相關的表型,并根據病人的矢量進行分組。接著利用人工神經網絡的多層結構,逐層抽象出上一層的特征,建立一系列高層級的模型,并發現數據之間的穩健、深度特征,用于個體化的臨床任務。研究結果發現,Deep Patient非常好地勝任了數據評價,在預測嚴重的糖尿病、精神分裂癥和各種癌癥方面做得尤為出色。①R. Miotto,et al.,“ Deep patient: An unsupervised Representation to Predict the Future of Patients from the Electronic Health Records”, Scientific Reports, Vol.6, 2016, 26094, doi: 10.1038/srep26094.此外,研究者使用了1千多份去識別病人的放射學影像和信息,來訓練深度網絡識別結核病,該網絡的準確率接近100%。②P. Lakhani, B. Sundaram,“ Deep Learning at Chest Radiography: Automated Classification of Pulmonary Tuberculosis by Using Convolutional Neural Networks”, Radiology, Vol.284, No.2, 2017, pp.574—582.更重要的是,通過機器學習不僅可以提高心血管疾病風險預測的準確性,還能發掘出與疾病相關的更多變量,而這些變量是被常規醫學所忽視的,比如體重指數、嚴重的腦部疾病、口服皮質激素、甘油三酯的水平等。而在常規醫學中被列為主要風險因素的糖尿病,卻在機器學習中呈現為首要的影響因素。這是因為神經網絡和邏輯回歸算法強調分類變量以及與心血管疾病相關的醫學狀態,根據相似特征集簇化病人到不同的分類組中。③S. F.Weng, et al.,“ Can Machine-Learning Improve Cardiovascular Risk Prediction Using Routine Clinical Data?”, PLOS ONE, Vol.12, No.4, 2017, e0174944. https://doi.org/10.1371/journal.pone.0174944.研究者通過網絡化人工智能發現,有大量用戶在網絡中咨詢有關丙肝與四肢無力之間的關系,而丙肝與肌無力在醫學領域屬于兩個完全不同的病癥,這就為醫學研究進一步考察丙肝與肌無力之間的關系提供了新的知識。④汪建基、馬永強、陳仕濤等:《碎片化知識處理與網絡化人工智能》,載《中國科學:信息科學》2017年第2期。這些研究和應用說明,機器學習有助于幫助發掘更加多樣化的預測因子以及新的預測路徑,發掘缺失的、被忽略的影響疾病的變量。這意味著研究人員和醫生能夠使用人工智能來分類和識別海量的長串相關的病理學數據,監測和解釋大量的生理學數據,并且有可能揭示出新的方法來進行癌癥的預防、診斷和治療。機器學習將取代大量放射學和解剖病理學家的工作等這類預言,就變得容易理解了。
雖然人工智能醫學可以通過海量數據涵蓋復雜的人體與疾病信息,例如從多種器官中獲得有關疾病感染等信息,從病歷中讀取難以控制的疾病癥狀、輪椅使用情況等多樣化的數據,并且通過機器學習刻畫復雜系統的非線性特征來精確地預測大量病人亞群體的死亡率接近100%,而其他人的死亡率低至10%。而且深度學習模型的生理學理論基礎得到了深入討論,特別是深度學習模型中的隱層節點的物理意義,在于腦內的位置細胞和網格細胞的激活機制和數值分布,幾乎呈一一對應的關系①A. Banino, et al., “Vector-based Navigation Using Grid-like Representations in Artificial Agents”, Nature,Vol.557, 2018, pp.429—433.,為深度學習在機理上的有效性提供了有力支撐。智能輔助診斷和醫學影像智能判讀發展亦相對成熟。但是作為復雜系統的人體,疾病是一個動態的過程,病原體自身會發生演化,人體和疾病具有復雜系統的動態特征。由于動態的活體組織數據難以獲取,動態系統對初始條件敏感,復雜系統中現象的突現性,以及機器學習并沒有解決數據的因果推理問題,人工智能醫學對于狀態的預測和長時段的預測難以實現。
生物醫學對疾病的分類和解釋基于因果關系和邏輯推理,診斷遵循著線性模式。例如,如果檢查出幽門螺旋桿菌,則病人患有胃潰瘍。②P. Thagard, How Scientists Explain Disease, Princeton: University Press, 1999, p. 35.這種邏輯推理與時間無關,生物醫學中疾病的分類和解釋,忽視了疾病過程及其影響因素的動態性。而疾病中動態的、暫時的維度和細節,對于識別、解釋、診斷和治療疾病至關重要。疾病有各種不同的表現形式,包括表征和癥狀,在宏觀的臨床和微觀的生理水平上表現出不同的模式。身體和疾病的演化過程具有偶然性和不可逆性的動力學性質。復雜的人體系統在宏觀水平的器官與器官之間,與微觀水平的生物大分子之間,以及人體細胞與病原體之間存在著高度復雜的關系,相互作用的節點之間呈現出拓撲結構,節點不僅數量巨大而且在不斷發生變化。以病原體的演化和抗藥性為例,許多醫學和公共政策領域的重大挑戰來源于藥物對病原體的抗藥性,有的病原體與藥物或者疫苗作用的過程中,會產生強的演化反應并且快速出現抗藥性③J. W. Pepper, “Defeating Pathogen Drug Resistance: Guidance from Evolutionary Theory”, Evolution, Vol.62,No.12, 2008, pp.3185—3191.,從而增加了疾病過程的復雜性。也就是說,疾病過程體現出動力系統特征,給疾病特別是狀態的精準預測帶來了困難。例如,預后模型HER2-陰性的乳腺癌已經被用于靶標治療,但是流感疫苗等預測有效性與疾病的流行以及群體的免疫率有關系,因為流感是一個動態的復雜過程,病毒在被感染的身體內的傳播遵循著一定的模式,免疫系統也遵循著特定的模式。而且影響流感流行的要素處于不斷的變化之中,不僅與人體的復雜性有關,還與復雜的社會現象相關。流感與影響因素的動態性,使得對流感無法進行靶標治療,因為這個靶標呈現出動態變化。另外,中樞神經系統是人體最復雜的網絡,神經性疾病具有不同水平的復雜性。多樣性硬化作為主要的神經疾病,會引起嚴重癱瘓,這種疾病是慢性和動態的,盡管許多計算模型被應用,科學家在理解和治療多樣性硬化方面仍存在困難。④F. Pappalardo, A. M. Rajput, S.Motta, “Computational Modeling of Brain Pathologies: the Case of Multiple Sclerosis”, Briefings in Bioinformatics, Vol.19, No.2, 2018, pp.318—324.
需要指出的是,科學家并非沒有意識到疾病在動態過程中會產生差異性變化,而是科學家對疾病的動態模式尚未建立起解釋框架,并能夠適用于臨床研究、診斷和治療。雖然機器學習可以直接從腦部讀取皮質活動,將它從與人類運動皮質平行的信號轉變成手部肌肉的信號,并存儲運動控制,從而獲得實時的、高分辨的生理數據,但是對于多樣化的、動態的疾病而言,相關且精確地反映這些信息的數據難以獲取。對疾病的動態過程進行分析、利用與疾病相關的組織進行生理學上的基因解讀是衡量基因和環境因素在疾病進程中相互作用的有效途徑。這就需要獲取與疾病相關的活體組織的生理學基因資料。但是,除了腎臟穿刺活檢等少量技術可以獲得活體組織的數據信息,其他活體組織的信息很難獲取。①A. M. Williams, et al., “Artificial Intelligence, Physiological Genomics, and Precision Medicine”, Physiological Genomics, Vol.50, No.4, 2018, pp.237—243.困難一方面來自活體提取和檢測技術,一方面來自活體器官取樣帶來的倫理問題。
另外,疾病的動態復雜性也給基于人工智能的藥物開發在方法上帶來了挑戰。人工智能用于有機合成,可以加快藥物的開發過程。②D. C. Blakemore, et al., “Organic Synthesis Provides Opportunities to Transform Drug Discovery”, Nature Chemistry, Vol.10, No.4, 2018, pp.383—394.但是藥物開發針對的是與疾病相關的有效靶標,根據靶標再利用計算機輔助虛擬篩選技術、高通量組學技術,并綜合計算化學、結構生物學等知識,根據有機化合物結構與功能之間的關系,進行有效的藥物篩選與設計。由于疾病的動態復雜性,目前發現的能夠有效解釋藥物治療的靶標太少,特別是腫瘤系統不斷地演化并且具有高度的異質性,大多數復雜疾病的發病機制并不清楚,靶標并不明確。單一或者若干個靶標的突變,可能并非是疾病發生的根本原因。例如,與癌癥相關的突變位點非常多。即使是從以靶標為目標進行藥物篩選轉向基于疾病的表型數據(phenotype data)進行篩選和設計③J. Lamb, et al., “The Connectivity Map: Using Gene-expression Signatures to Connect Small Molecules, Genes,and Disease”, Science, Vol.313, No.5795, 2006, pp.1929—1935.,對多源高維的異質數據進行整合,可以避開復雜疾病和疾病過程中靶標不明確的困難,但是依然繞不開對疾病動態過程的精確理解和預測需要的數據來源問題。
再者,復雜系統本身具有不確定性,對過程敏感,難以進行長時段預測。復雜系統中的突現特征與不可還原性,使得系統中復雜的中間過程不可壓縮,從而無法像牛頓定律一樣,可以根據系統的初態和已知規律進行預言。即使這個系統的初始狀態和支配規律是簡單的,在經歷一段時間演化后,也會呈現出突現的屬性或模式,從而不可預言。④酈全民:《分析突現的兩個維度》,載《哲學研究》2010年第9期。谷歌流感趨勢的預測,利用的是整個美國幾十億條互聯網搜索記錄,而不是隨機的小樣本數據。它提供了精細化程度非常高的數據,進而預測出某個特定城市的流感疫情狀況,但是谷歌流感預測只對幾個月后的流感疫情具有較高的準確性。2013年谷歌流感趨勢做出的估計比實際數據高兩倍,研究者認為這是大數據分析存在的陷阱。①D. Lazer, R. Kennedy, G. King, A.Vespignani, “Big Data—the Parable of Google Flu: Traps in Big Data Analysis”,Science, Vol.343, 2014, pp.1203—1205.這說明了預測模型在有效地僅用了單獨的數據點之后,再試圖以此進行長時段的預測是不成功的。因為復雜系統的突現特征與不可還原性,未來與過去并不是足夠相似,僅僅依靠海量數據并不能重復歷史趨勢。已有的研究也說明,從電子病歷中進行深度學習,建立了住院病人的醫學實踐模型之后,隨著時間逐漸增加,雖然數據量得到累積,但是預測結果卻比僅僅使用最近幾年的數據得到的結果要差,這說明臨床數據的有效性有四個月的半衰期。②J. H. Chen, S. M. Asch. “Machine Learning and Prediction in Medicine—Beyond the Peak of Inflated Expectations”.衰老是最明顯的突現現象,衰老問題特別容易受各種因素的影響,因為衰老并不是一個有關組分的問題,而是系統問題,這也是衰老問題難以獲得精確解釋和預測的重要原因。
復雜系統的過程敏感性,還表現為一種“蝴蝶效應”,即,微小的輸入也許會在大數據預測中對結果產生較大的影響。這意味著預測對初始條件極端敏感。混沌理論說明,即使是簡單的非線性系統,也不能精準地預測長時段的未來。而人類的醫療還是一種社會行為,社會行為的復雜性更增加了醫療在長時段上的不可預測性。例如,再次住院的行為除了與疾病本身有關,還與對健康進行的社會決定相關,這就是為什么臨床數據對病人再次住院的可能性的預測能力上存在局限。再如,關于百日咳這種已經被認為得到了控制的流行病在2012年突然回到爆發高峰的問題,人們曾一度認為這種狀況是由疫苗有效性的減少以及公眾拒絕接種疫苗造成的。但是利用復雜性科學對細菌的基因數據建立了百日咳傳播的遺傳學模型后發現,是生物活性疫苗助長了百日咳的爆發,它讓受感染但是沒有癥狀的人群不知情地傳播了百日咳病菌。③B. M. Althouse, S. V. Scarpino, “Asymptomatic Transmission and the Resurgence of Bordetella Pertussis”, BMC Medicine, Vol.13, 2015, p.146.這些都說明,作為復雜系統的人體和疾病對狀態和過程敏感,難以對其進行精準預測。
總之,疾病的動態復雜性、過程敏感性以及突現特征,反映疾病狀態的動態數據難以獲取,疾病成因的動態模式使得治療疾病的靶標亦是動態的,從而使得無論是診斷還是藥物開發都存在困難。
人工智能醫學可以進行精準和個性化診斷和預測,診斷的目的是為了治療。機器學習通過對數據中強的相關信息的辨識來進行準確預測。基于相關性的預測雖然提高了準確性,但并不能直接產生治療方案。生物醫學的特殊性在于,它通過一致的邏輯因果解釋,采用共有的一套標準化方法,整合了實驗室研究、臨床研究與臨床治療。但是機器學習并沒有解決在觀察數據中有關因果推理的根本問題,算法給出的是預測指標而不是原因,針對的是診斷而非治療。帶來的結果是,人工智能醫學從診斷預測到治療方案的提出,再到具體的治療,在銜接上存在困難。即使關于算法的研究不斷地增加臨床預測的精確性,提供非常完善的校準預測模型,但是它不能告訴我們接下來應該怎么做才能改變診斷結果,所以不能直接用于臨床上的醫學照
料。誠然,相關因素會帶來疾病結果的改變,如何利用所得的相關信息,依然需要醫生基于臨床經驗的專業判斷。也就是說,算法不能替代人的判斷,數據判斷的臨床意義需要由醫生做出。人工智能醫學可以協助診斷增強解決關鍵的、相關數據的能力。例如,當放射學家調出胸部CT查看時,人工智能立刻讀取并識別信息,從圖像、解剖學掃描相關的病史中來做出診斷。如果檢查的目的是胸部疼痛,人工智能系統將會調出與胸部疼痛相關的所有數據、先前所做的針對性檢查與藥物學信息,如心臟病、冠狀動脈疾病、抗凝血等,還會搜集已有的關于胸部和胸部疾病的標準信息圖像、胸部或者心臟病的過程、最近的實驗室結果等,并且建立起所有信息之間的聯系。對于個體化的醫生而言,搜集所有這些信息太困難,也不可能花時間專門去尋找這些海量的信息。但是,僅僅根據人工智能做出的治療建議將是單一而且不合理的。例如,姑息治療和點滴注入去腎上腺素都會高度預測病人死亡。根據預測結果,人工智能會給出治療建議:停了這兩種之中的任何一種將會減少死亡。很明顯,這種建議不合理。①J. H. Chen, S. M. Asch. “Machine Learning and Prediction in Medicine—Beyond the Peak of Inflated Expectations”.再如,用人工智能可以判斷出一個高齡且有各種病史的患者有極高的手術風險,而臨床需求是看哪種診斷或治療方案更有用。因此,將人工智能和醫生結合起來,共同實現單方面都無法提供的臨床效果,才能從精確的診斷過渡到治療實踐。例如,Project CORE正在與Human Dx合作,聯合醫生的專業視角與人工智能,從而促進高質量的在線咨詢,支持高質量的醫療,幫助人工智能系統實現臨床治療功能。
同樣,因為對疾病的解釋和治療的建議目前依然是基于因果邏輯,在藥物設計和發現中,算法也不能替代判斷。高通量組學技術與人工智能的結合可以發現新靶點,但是對靶點的解釋仍然是分子生物學的研究范疇,僅僅通過分析海量文獻數據,并不一定能夠發現可靠的靶點。正如所有的復雜自適應系統,人體在健康與疾病上能夠展現出路徑依賴和對初始條件的敏感性。在臨床情境中,病人即使有相似的癥狀,但是有不同的醫療史,可能對治療有不同的響應,治療體現出情境性。人體作為復雜系統,有很多同樣有效的路徑來治療特定的疾病,我們稱為復雜系統的路徑依賴。醫生診斷與下棋不一樣,診斷和治療需要與病人進行交流、溝通、獲得反饋,醫生除了利用病人的病史和技術診斷等現有資料,還需要識別病人的情緒等動態特征。神經生理學和醫學人類學等對安慰劑效應的研究,揭示出身體會對有意義的臨床情境做出響應,從而與身體的自愈能力以及藥物等技術方法,一起促成身體的康復。①D. E. Moerman, Meaning, Medicine and the Placebo Effect, Cambridge: Cambridge University Press, 2002,pp.35—49.也就是說,疾病的治療是生理—心理—社會三重維度交互作用的結果。診斷和治療不僅依賴實踐者的專業判斷,還與醫生對病人的同情和關懷、醫生對專業的熱情、病人所處的社會文化情境和家庭照料等存在密切關系。
除此,醫療不僅是以生物醫學為基礎的科學的醫學,還是一種具身性的技藝。與所有的其他技藝一樣,醫生和護士的具身化的臨床實踐知識與經驗,特別是手術中醫生的具身性經驗,在治療中顯得尤為重要。其他如體現在職業護理、產前照料等臨床治療中的身體感知,如觸摸、觀察等技巧,以及具身性知識和技巧的轉移和傳遞等,都會影響治療的效果。人工智能醫學目前并未也難以將醫生和護士的具身性知識納入考慮范圍。
人體作為復雜系統所具有的開放性,不僅體現為人體與外在自然環境的相互作用,疾病還與社會行為之間存在密切關系。網絡化人工智能的研究表明,氣候變化影響著人體健康。不僅是氣候,飲食習慣、人際關系、社會壓力等社會環境和行為都可能會影響健康。此外,醫生對疾病的定義與病人對疾病的理解不一致,對于接受何種治療還涉及病人與病人所在家庭的集體決定。這些因素使得疾病的治療呈現出復雜的拓撲結構。雖然有研究試圖闡明社會行為與健康之間的關系,但這些至少是人工智能醫學目前所難以涵蓋的。
人體和疾病作為復雜系統所具有的開放性、非線性和多層次特征,基于邏輯和因果關系的常規生物醫學很難表征這些復雜性,也就無法做出精準的、個性化的診斷。人工智能醫學可以利用海量數據搜集復雜的人體系統中更多的信息,發掘并識別多種變量之間的相關性,通過機器學習捕獲數據中復雜的、非線性關系,消除不確定性,克服還原主義、專業醫生知識有限性的局限,從而提高預測的準確性和個體性。疾病過程體現出的動態復雜性、復雜系統的不確定性和突現特征,動態數據難以搜集,使得人工智能醫學對疾病和治療狀態的預測和長時段的預測難以實現。從預測到臨床治療,以及治療的臨床情境的缺失,是當前的人工智能醫學在實現從精準預測到有效治療上存在的問題,也凸顯了具身化的醫學技藝與臨床情境中醫患互動的重要性。醫學不僅僅是科學,同時也是技藝,數據與人類不同,至少暫時不能提供臨床上的有效判斷、與病人的互動、同情和人文關懷。
此外,人工智能醫學還具有其他人工智能共有的問題,比如數據搜集的質和量的問題。人工智能醫學要獲得更大的發展,需要搜集高質量的、無偏見的數據以及獲得除了醫療記錄以外更多的數據,但是圖像數據、病理數據以及其他各種信息目前并不容易得到,難以保持數據的高準確率。比如深度學習模型可以應用于病理圖像分析,但是仍然缺乏高質量的、可靠的病理圖像標記樣本;已經發表的醫學文獻中展示的預測結果,缺乏統一的獨立測試數據集、完善的數據與處理方法以及有效的評價標準來對預測結果進行評估等。在算法上,由于數據偏見,人工智能醫學還有可能出現過度擬合。結果是,當前人工智能在醫學領域的研究非常興盛,但最終應用到臨床卻微乎其微。
值得注意的是,利用復雜性科學的概念框架來研究疾病的癥狀和傳播,進行預測和預防,這類工作正在展開。研究者通過聯合不同的學科,探討如何將健康和疾病作為復雜系統進行研究。這些探索除了利用復雜性思維考察具體的疾病和治療,如將信息理論應用到心臟手術中并且模型化心臟的輸送系統、研究肥胖的復雜系統知識、探討基于模型的自主體如何被用到健康系統中,還關注疾病和治療的社會與文化環境。如,通過追溯下一次大范圍流行病來考察社交網絡對公共健康的影響,醫療環境和復雜系統,醫療參與者之間的網絡化與有意義的關聯,等等。這些研究的逐漸展開,將有助于克服目前人工智能醫學難以捕獲復雜人體系統動態特征方面的缺陷,以及對社會文化情境的忽略,推動人工智能的拓展和應用。
因此,提高醫療數據的質和量,發展提取活體組織信息的檢測技術,將醫生的具身化知識和臨床經驗與人工智能醫學結合,才能更好地促進人工智能醫學在方法論和認識論上的優勢,實現精準診斷和治療。