主編簡介:楊欽泰,教授、主任醫師、博士生導師。中山大學研究生院副院長、中山大學附屬第三醫院副院長、中山大學醫學人文聯合研究院副院長、耳鼻咽喉頭頸外科和過敏科學科帶頭人。研究方向:鼻黏膜炎癥免疫學機制、鼻內鏡顱底手術臨床及基礎、大數據人工智能。獲國家高層次人才特殊支持計劃領軍人才、廣東省高層次人才特殊支持計劃領軍人才、第八屆“廣東好醫生”等稱號,入選2024年版國家健康科普專家庫,獲2021年廣東省科技進步獎二等獎,獲2018年“廣東省杰出青年醫學人才項目”,獲中山大學芙蘭獎。主持22項科研基金項目,發表研究論文80余篇,其中在《新英格蘭醫學雜志》等國際期刊發表SCI論文45篇,科普論文30余篇;獲得國家發明專利3項,實用新型專利8項;參與編寫專著3本,主編科普圖書1本。
在醫學研究的歷史長河中,基礎研究與臨床實踐始終是推動醫學進步的兩大核心動力。傳統模式下,醫學科研的主要形式是在實驗室中培養各種類型的組織細胞/細胞株(系),以及實驗動物,俗稱“養細胞”和“養老鼠”,通過實驗模型探索疾病機制、驗證藥物效果。然而,隨著大數據和人工智能技術的飛速發展,醫學研究的模式正在發生深刻變革。特別是近期生成式人工智能大模型(如ChatGPT、DeepSeek等)的出現,為醫學研究提供了全新的工具和視角。在這一背景下,“養數據”逐漸成為醫學科研的重要組成部分,與“養細胞”和“養老鼠”共同構成了現代醫學研究的“三重奏”。
1 傳統科研模式:養細胞與養老鼠
1.1 養細胞:微觀世界的探索
“養細胞”是基礎醫學研究的基石。通過體外培養細胞,研究人員可以模擬生物體內的環境,研究細胞生長、分化、凋亡等基本生命過程,這一過程為我們理解生命現象和發病機制提供了重要的實驗基礎。例如,癌癥研究中的細胞系實驗可以幫助科學家理解腫瘤細胞的增殖和轉移機制,并為藥物篩選提供平臺。然而,“養細胞”的研究模式也存在局限性。首先,體外培養的細胞無法完全模擬人體內復雜的微環境;其次,細胞實驗的結果往往需要進一步在動物模型中進行驗證,才能推斷其在人體中的實際效果。
1.2 養老鼠:從實驗室到臨床的橋梁
實驗動物是生命科學研究中必備的“動物、設備、信息和試劑”四大要素之一,生命科學領域的科研、教學、生產等都離不開實驗動物。近代以來,通過生物學方法,將一些需要研究的生理或病理相對穩定地顯現在標準化的實驗動物身上,這些標準化的實驗動物就稱之為模式動物。小鼠模型因其基因組與人類高度相似、繁殖周期短、成本相對較低等優勢,成為醫學研究中最常用的動物模型。通過基因編輯技術,研究人員可以構建特定疾病的小鼠模型,用于研究疾病機制、評估藥物療效和安全性。“養老鼠”是連接基礎研究與臨床實踐的重要環節。盡管如此,動物實驗也存在倫理爭議和物種差異問題。小鼠與人類在生理結構和代謝機制上的差異,可能導致實驗結果無法直接應用于臨床。
1.3 傳統模式的局限性
“養細胞”和“養老鼠”的研究模式雖然在醫學發展中發揮了重要作用,但其局限性也日益凸顯。首先,這兩種模式的研究周期長、成本高,難以滿足快速發展的醫學需求;其次,它們無法完全模擬人體的復雜性和個體差異。因此,醫學研究亟需一種新的模式來補充傳統方法的不足。
2 大數據人工智能時代的科研新模式:養數據
2.1 數據的來源與類型
在大數據人工智能時代,我們所有的工作都記錄在案,而且有跡可循,醫院信息系統(HIS)電子健康記錄(EHR)醫學影像數據庫、基因組學數據、可穿戴設備數據等,為醫學研究提供了海量的數據資源。這些數據涵蓋了從分子水平到個體水平的多個層次,為研究人員提供了前所未有的研究素材。常用的大數據有:①醫院數據,包括患者的病歷、檢驗結果、影像資料等,是臨床研究的重要數據來源;②互聯網數據,如社交媒體、健康論壇等平臺上的患者自述數據,可以反映患者的真實體驗和需求;③交叉學科數據,如環境數據、流行病學數據等,為研究疾病的宏觀規律提供了支持。
2.2 數據的價值與挑戰
“養數據”的核心在于從海量數據中提取有價值的信息。通過數據挖掘、機器學習和人工智能技術,研究人員可以發現疾病的新機制、預測患者的預后、優化治療方案等,將會引導個性化診療和精準智能醫療的發展。例如,利用深度學習算法分析醫學影像,可以提高疾病診斷的準確性和效率;通過分析基因組數據,可以實現個性化醫療。然而,“養數據”也面臨諸多挑戰。首先,數據的質量和標準化問題亟待解決;其次,數據隱私和安全問題需要高度重視;最后,數據分析需要跨學科的合作,這對研究人員的能力提出了更高的要求。
2.3 生成式人工智能的賦能
生成式人工智能大模型的出現為“養數據”提供了強大的工具。這些模型可以處理自然語言、生成文本、分析數據,甚至模擬科學實驗。例如,研究人員可以利用生成式人工智能大模型自動生成實驗設計、分析文獻、輔助撰寫論文,從而大幅提高科研效率。此外,生成式人工智能大模型還可以用于數據增強和模擬。例如,在醫學影像分析中,生成式對抗網絡(GAN)可以生成高質量的合成圖像,用于訓練深度學習模型;在藥物研發中,生成式人工智能大模型可以預測分子結構,加速新藥的發現進程。因此,新時代應該用大數據和人工智能“賦能”我們每位醫生,而不是被其取代。
3 “三重奏”的協同與融合
3.1 養細胞、養老鼠與養數據的互補性
“養細胞”“養老鼠”和“養數據”并非相互替代的關系,而是相輔相成的。“養細胞”和“養老鼠”可以為數據研究提供生物學基礎和驗證手段,而“養數據”則可以為實驗研究提供新的假設和方向。例如,通過分析臨床數據發現某種基因與疾病相關后,研究人員可以在細胞和小鼠模型中進行功能驗證。
3.2 數據驅動的實驗設計
在大數據人工智能時代,實驗設計可以更加精準和高效。例如,通過分析患者的基因組數據和臨床數據,研究人員可以篩選出最有可能受益于某種治療的患者群體,從而設計更有針對性的臨床試驗。
3.3 從數據到臨床應用的閉環
“養數據”的最終目標是將研究成果轉化為臨床應用。通過整合多源數據,研究人員可以構建疾病預測模型、優化治療方案、實現個性化醫療。例如,基于大數據的腫瘤精準治療平臺,可以根據患者的基因組信息和臨床特征,推薦最合適的治療方案。
4 未來展望
未來,數據科學將成為醫學研究的重要組成部分。醫生不僅需要掌握傳統的實驗技能,還需要具備數據分析和人工智能應用的能力。醫學教育也需要相應調整,培養更多跨學科人才。其次,隨著數據在醫學研究中的應用日益廣泛,數據隱私和倫理問題將變得更加重要。如何在保護患者隱私的前提下充分利用數據資源,是未來需要解決的關鍵問題。此外,生成式人工智能大模型將繼續推動醫學研究的變革。這些模型在未來可能會具備更強的推理能力和創造性,甚至能夠自主設計實驗、提出科學假設,賦能臨床醫師。