陳耀龍,羅旭飛,史乾靈,呂 萌,周 奇,王健健,楊 楠,高東平,楊 書,商洪才,楊克虎,4,5
1蘭州大學公共衛生學院,蘭州 730000 2蘭州大學健康數據科學研究院,蘭州 730000 3蘭州大學基礎醫學院循證醫學中心,蘭州 730000 4世界衛生組織指南實施與知識轉化合作中心,蘭州 730000 5Cochrane中國協作網蘭州大學分中心,蘭州 730000 6蘭州大學第一臨床醫學院,蘭州 730000 7中國醫學科學院 北京協和醫學院醫學信息研究所/圖書館,北京 100020 8成都中醫藥大學,成都 610075 9北京中醫藥大學東直門醫院中醫內科學 教育部和北京市重點實驗室,北京 100700
在醫學領域,人工智能(artificial intelligence,AI)目前不僅被廣泛應用于輔助診斷、治療選擇、風險預測等[1],還被引入循證醫學(evidence-based medicine,EBM)領域,用于系統評價和臨床實踐指南(下文簡稱“指南”)的制訂、評價、傳播與實施等[2-3]。雖然目前該領域很多方面仍處于理論探索階段[4],但進展迅速,未來可期。本文通過分析AI在指南中的應用現狀,探討如何通過AI縮短指南的制訂周期,提高其制訂效率,創新其傳播與實施模式,并對促進AI與指南領域的有效結合提出思考與建議。
美國食品藥品監督管理局迄今已批準29款AI相關醫療產品[5]。盡管AI在醫學領域的應用取得了一系列較為重要的成果,但其在指南領域的應用仍處于起步階段。目前國際上AI與指南結合的領域主要集中在模型、算法及工具的開發方面,其相關方法已在指南的制訂、評價、傳播與實施等某些環節小范圍內試用,常用的算法和技術包括樸素貝葉斯法和決策樹等。表1列舉了近年來AI在指南領域應用的重要事件及進展情況。

表1 人工智能在臨床實踐指南領域應用的重要事件
我國相關研究人員已在該領域開展積極探索。2013年,李博等[6]基于語義關系,將高血壓指南文本轉變為臨床實踐指南知識庫,以提高指南的轉化和利用;2019年,羅旭飛等[4]將AI在指南領域的應用現狀和發展進行了概況評價,結果顯示來自美國、澳大利亞、英國和加拿大的研究居多,但大部分研究仍停留于理論探索和算法的驗證階段;2020年,蒲曉蓉等[7]提出了一種基于機器學習的計算機輔助智能分析方法,自動分析不同版本《新型冠狀病毒肺炎診療方案》的異同。此外,北京大學第三醫院開發的EBM AI-Reviewer(http://www.ebm-easyreviewer.com/login),致力于協助系統評價人員快速篩選文獻。
AI應用于指南制訂領域,旨在縮短指南的制訂時間、提高制訂質量、優化和加速整個制訂流程,現就其中較為重要的5個方面展開闡述。
2.1.1 篩選臨床問題,確定指南領域
關于研究選題的確定,傳統方法主要依靠研究人員的經驗。隨著AI的發展,Chen等[8]采用結構主題模型(structural topic modeling,STM)與文獻計量分析相結合的方法,從近十年AI輔助人腦研究的6317篇文獻中自動識別突出的研究主題,通過對主題趨勢、相關性和集群的分析,以及對其在有影響力的國家/地區和研究機構中多樣化分布的描述,揭示了有研究前景的主題方向。
關于臨床問題的遴選,傳統方法一般需耗時數月,對臨床一線醫務人員進行多輪調查后方可完成,但AI技術可對數據庫或網絡上已有的相關臨床問題進行快速分析,自動篩選出高頻問題清單,作為指南擬解決問題的重要參考。AI可對已發表的指南、系統評價及臨床研究進行快速、全面的文獻掃描和分析,發現指南與研究領域的關聯分布,以及指南與臨床問題的涵蓋關系。
2.1.2 尋找合適專家,管理利益沖突
關于指南專家的遴選,傳統方法多采用“方便抽樣”,而AI有助于查找到最適合參與指南制訂的成員,特別是在專業、地域、性別等方面更具代表性。同時,可借助算法分析出每位專家潛在的利益沖突。如AI通過對不同渠道信息和數據的關聯分析,可發現某專家多次出席某企業產品的推廣活動或其直系親屬與醫藥企業關系密切,指南利益沖突管理委員會可以此作為其存在潛在利益沖突的證據。Graham等[21]使用機器學習法對159種期刊發表的128 781篇文章的利益沖突進行分析,發現有商業利益關系的期刊更有可能發表存在利益沖突的文章。
2.1.3 進行研究合成與評價
使用自動化軟件可極大縮短系統評價制作過程中文獻檢索、篩選及質量評價等過程的周期[22-23](表2);國際系統評價自動化小組(International Collaboration for the Automation of Systematic Reviews,ICASR)提出的系統評價自動化維也納原則[19](表3),為AI加速系統評價制作指明了方向。此外,為方便讀者選用合適的自動化工具,Marshall等[24]于2015年建立了系統評價制作工具箱(systematic review toolbox),用戶可登錄網站進行文獻搜索和選取。AI技術的應用使系統評價的制作周期縮短至幾天甚至幾個小時。Clark等[22]使用自動化技術,僅用2周時間完成了一篇評估患者增加液體攝入量對泌尿系統感染(urinary tract infection,UTI)的復發、抗菌素的使用及UTI癥狀影響因素的隨機對照試驗的系統評價。

表2 系統評價中的自動化工具匯總[22-23]

表3 系統評價自動化維也納原則[19]
2.1.4 形成當前最優推薦意見
傳統方法制訂的指南推薦意見,主要依靠專家對干預措施的安全性、有效性、成本、可實施性及患者意愿等進行綜合分析后得出。然而,在指南制訂過程中是否對這些因素進行了全面考慮,以及各因素之間相互作用對指南造成影響的系統考量,是傳統方法的主要局限性。AI可以在更廣闊的視野下對相關數據進行挖掘和分析,為制訂者提供更全面的有效信息,協助制訂者更好地平衡干預措施的利弊,形成對患者最優的推薦意見。
2.1.5 改編和更新指南
傳統依靠人工更新指南的方法,已滿足不了對最新文獻的跟進與整合。借助AI可推斷出最佳證據的出現時間,協助完成指南的及時更新,并確定指南中推薦意見最適合的實施環境。特別是隨著動態指南(living guideline)的出現,指南更新的頻率和要求越來越高[25]。如關于新型冠狀病毒肺炎的文獻已超過20萬篇,占2020年所有文獻的4%。新型冠狀病毒肺炎指南的更新頻率已從每月縮短至每周甚至實時[26]。AI可對新文獻進行更快速和更高效地監測和遴選;另一方面,還可幫助缺乏指南制訂能力的國家改編現有的指南[27]。與指南的制訂過程不同,指南的改編需評估已有的指南推薦意見,以及與本地區人群和臨床環境的匹配性,通過AI提供更為全面的當地數據,可協助指南改編人員,作出更合適的推薦意見。
當前指南傳播與實施最常用的方法為媒體、期刊或學術會議宣傳等,通過多種途徑讓使用者知曉指南,進而應用于臨床實踐。研究顯示,這種模式花費時間較長,從指南發布到被指南使用者知曉和應用,需數月甚至數年不等[28]。應用AI技術,則可將該過程明顯縮短。AI技術將指南中的推薦意見整合至電子病歷(electronic medical record,EMR)系統中,通過OpenMRS及DHIS2等開源EMR平臺,進一步加速了指南信息的傳播,惠及更多醫療資源匱乏的機構或地區[29-30]。此外,研究顯示,美國約25%的醫療費用被浪費掉,每年約合7600億~9350億美元[31];若采用AI技術,則可以促進指南或醫療信息在患者中的傳播,通過去偽存真,為患者提供有價值的信息,從而節約醫療資源。
目前針對單個臨床研究的風險偏倚AI評估工具已經產生[32]。而指南的評價工具,有針對方法學質量的指南研究與評價工具(Appraisal of Guidelines for Research and Evaluation Ⅱ,AGREE Ⅱ),包含6個領域的23個條目[33];以及針對報告質量的國際實踐指南報告標準(Reporting Items for Practice Guidelines in Healthcare,RIGHT),包含7個領域的22個條目[31]。然而,研究顯示使用這些工具時存在一定挑戰,即不同的使用者對標準的把握不一致,人力和時間成本亦不可控[34-35]。如使用AGREE Ⅱ評價一部指南,常規情況下需要3~4名經過培訓的研究人員,每人至少耗時1 h;如評價糖尿病領域百余部指南的質量,則需500 h以上。但通過開發、訓練相應的AI算法,不僅可以降低評價的主觀偏倚,還可較大程度上縮短評價所需的時間。此外,對指南的評價還包括對推薦意見的對比分析,而快速提取其中的推薦意見是關鍵步驟。Hussain等[36]開發的AI算法,用于提取高血壓指南中的推薦意見,其準確度可達85.54%。
就目前科技進步的速度和學科交叉的深度而言,AI技術與指南的結合已是箭在弦上。指南的制訂已從1.0時代邁向2.0時代[37],而AI很有可能引領指南發展的3.0時代。為提前做好應對并促進其科學發展,筆者提出以下思考與建議。
AI在指南領域的發展和應用,除技術支持外,還有賴于政策支撐。2021年,國家自然科學基金委新增設了交叉科學部,為AI與指南結合相關研究工作的開展提供了獲取更多支持的可能性。近年來,“國家重點研發計劃”“科技創新2030-重大項目”等也加大了對AI、大數據在醫學領域應用的支持力度。此外,多所高校先后設立了人工智能學院,開設AI與醫學交叉相關課程,招收本科生和研究生,并在基礎理論和關鍵技術等方面開展相關研究和培訓,是未來在該領域把握機遇和掌握話語權的重要途徑。
在指南制訂者和實施者層面主要提出以下建議:(1)制訂指南或開展指南研究時,應納入AI相關學科人員。(2)使用已被證實可靠的AI算法、模型和工具時,應提供相應的指導手冊或操作規范。(3)撰寫基于AI的指南手冊或專著。英國國家健康與臨床優化研究所(National Institute for health and Clinical Excellence,NICE)在其指南制訂手冊中納入應用機器學習搜索和篩選文獻的內容[38],其他指南制訂手冊則無相關內容的描述。(4)借助AI加速指南的傳播與實施,促進醫患溝通,改善患者關系。正如斯坦福大學AI實驗室主任Christopher Manning教授所言:“AI可以把指南帶入每一次的患者咨詢中,讓每一次咨詢都安全、穩妥地支持醫患雙方溝通。”[39]
在研究者層面主要提出以下建議:(1)研發基于AI的系統評價工具。指南制訂的限速環節主要是系統評價的制作,盡管當前已有AI協助系統評價制作的案例,但仍需進一步深入研究,推動AI大范圍應用于系統評價的制作是當前指南制訂最重要和最需優先開展的研究。(2)研發AI相關的報告規范。指南制訂過程中應用AI的關鍵步驟和信息應予以充分、透明地報告,故應研發AI應用于指南的報告規范“RIGHT for AI”,現已成為RIGHT工作組擴展版內容之一。目前,AI聲明“CONSORT(Consolidated Standards of Reporting Trail) for AI ”已完成研發,其成果已在學術期刊上發表[40]。隨著AI相關系統評價的不斷增多,系統評價和Meta分析優先報告條目“PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) for AI”的出現將是必然。在AI相關的臨床研究、系統評價和指南等領域形成完整的報告規范體系,對于促進AI發展、彰顯其應用價值具有重要意義。(3)開展AI識別與管理指南參與人員的利益沖突、患者偏好及形成推薦意見等相關研究是未來需要探索的重要方向。如利用AI收集患者偏好與價值觀等信息時,如何考慮公平性(當前關于患者偏好與價值觀的研究基本上是基于西方患者人群);管理指南參與人員的利益沖突時,如何保護其個人隱私等,都是研究者需要關注和解決的問題。AI為指南提供的信息越全面,制訂者做出最優推薦意見的可能性越大。
目前,AI在指南領域的應用仍處于起步階段,未來前景廣闊,其可在指南的制訂、實施到自動更新全過程中發揮作用,但也面臨諸多問題與挑戰,這些問題和挑戰將隨著人們對AI的認識和掌握不斷加深而轉化為機遇。我們可以期待,未來指南的制訂也許只需基于患者個體數據便可產出極具針對性的“基于證據的個體化指南”,屆時精準醫學的受益對象將不再是少數人的罕見病,而是所有人的大健康。
作者貢獻:陳耀龍、羅旭飛負責統計數據并撰寫文章初稿;史乾靈、呂萌、周奇、王健健、楊楠、高東平、楊書、商洪才、楊克虎負責修改初稿;陳耀龍負責文章審校。
利益沖突:無