真實世界研究外對照設置的方法學進展*

2022-01-17 07:07:48李戈楊智榮趙厚宇劉志科宋海波詹思延孫鳳

醫藥導報 2022年1期

李戈，楊智榮，趙厚宇，劉志科，宋海波，詹思延，孫鳳

(1.天津中醫藥大學健康科學與工程學院，天津 301617；2.中國科學院深圳理工大學計算機科學與控制工程學院，深圳 518055；3.英國劍橋大學臨床醫學院初級醫療中心，劍橋 CB1 8RN； 4.北京大學公共衛生學院流行病與衛生統計學系，北京 100191；5.國家藥品監督管理局藥品評價中心中藥監測和評價部，北京 100022)

藥品/醫療器械的監管覆蓋醫藥產品從研究開發開始的全生命周期，是衛生管理部門、醫療機構、科研院所、生產銷售企業和患者等共同關注的重要話題。在過去的幾十年間，指導衛生監管決策和臨床指南制定的金標準是隨機對照試驗(randomized controlled trial，RCT)及對既往相關RCT研究進行的系統評價和Meta分析(systematic review and Meta-analysis，SR/MA)，根本原因在于RCT通過隨機化設置內對照的方式可以有效控制基線混雜[1-3]。但是，RCT的研究環境通常過于理想化，基于RCT研究的證據效力(efficacy)與實際效果(effectiveness)往往并不相同，有時甚至存在較大差異[4]。此外，RCT研究通常存在多種局限性，例如研究樣本量偏小、隨訪時間較短、研究成本較高、部分研究存在倫理困境而難以實施等[5]。因此，近十幾年，收集/利用真實世界數據(real-world data，RWD)開展真實世界研究(real-world study，RWS)產生真實世界證據(real-world evidence，RWE)的研究方式日益普遍。相比于RCT，RWS人群覆蓋面廣、代表性好、成本低、耗時少且可操作性強，可獲得目標人群應用的實際效果和長期安全性證據，其應用價值已得到認可[3-7]。

在監管決策需求和大數據技術發展的雙重驅動下，世界各國衛生決策機構致力于RWS的方法學研究，以提高RWE的級別[8]，為臨床及監管決策提供最佳證據支持[9-10]。2021年4月，我國國家藥品監督管理局發布了《真實世界證據支持藥物研發與審評的指導原則(試行)》[11]。基于RWD開展RWS能否產生高質量的RWE，取決于研究設計是否嚴謹以及對偏倚和混雜的控制是否嚴格[12-13]。對比是流行病學研究方法的核心思想之一，通過設置對照來實現，最理想的對比是同質的人群在相同時間內分別經歷暴露和非暴露兩種狀態，不僅可以發現信號，而且通過模擬反事實場景，增強因果推斷強度。RWD常見于多源異構的觀察性數據，RWS對照設置的合適與否直接決定了研究質量以及RWE的可靠性。

目前，已有學者對基于RWD開展觀察性研究內對照選擇方法進行了系統總結[14-15]。外對照這幾年在RWS中也被廣泛提及，已成為RWS一個重要話題，除了拓展了傳統外對照在觀察性研究中的應用場景，在臨床實踐中真實世界外對照試驗(externally controlled trials，ECT)證據使用頻率也逐漸增加[16]。但迄今為止，筆者尚未見國內研究者對RWS的外對照的應用進行全面介紹。本文將概述RWS外對照含義、分類、研究設計、質量評估及其應用場景。

1 外對照

1.1外對照定義和類別

1.1.1外對照定義外對照的定義出自隊列研究[17]，后來不斷演變，相繼出現過以下稱呼：歷史對照(historical controls)、合成對照(synthetic controls)、自然史對照(natural history controls)、外對比(external comparators)等[18]。隨后拓展至臨床干預試驗和RWS。外對照是一個相對而非絕對概念，內/外對照邊界是一個灰色交叉區間，需回到流行病學三間分布的理念，取決于對比組間研究對象在時間、空間及人群間的相似性。

RCT可以設置安慰藥對照、陽性對照、不同劑量對照以及空白對照，與試驗組來自同一目標總體，同期接受干預，屬于內對照。當RCT的內對照研究人數不足或者缺乏時，如單臂研究(single-arm trial，SAT)，可以從其他試驗或歷史病例中找一組特征相似的研究對象，即在該研究之外合成一個接受不同干預措施的對比組，即為外對照[19-21]。補充設置外對照的臨床研究，是一種RCT-RWS混合研究類型。

1.1.2外對照構建方式對于RWS，根據研究型數據庫和研究問題選擇適合的研究設計，如隊列研究、病例-對照研究、巢式病例-對照研究、自身前后對照研究等[22]。隨著多中心隊列聯盟構建，按照研究框架區分內、外對照并不適合。因此，在應用RWD進行RWS設計時，需要根據對照組與暴露組的特征分布一致性確定是否設置外對照。當內對照研究人數不充足時，可依據暴露組的特征合成一個特征相似的外對照作為補充或者替換內對照，這些特征包括社會人口學信息、臨床特征、保險狀態、就醫偏好，以及有關地理、風俗、制度等方面的特征。外對照人群可以來自既往已完成的RCT(歷史外對照)，也可以來源于RWD(可以是歷史/平行同期的，也可以是回顧性/前瞻性的)，因此根據外對照與暴露組在時間軸上的關系，可以構建5種外對照，見圖1[3，23]。此外，外對照也可以源自不同于原始研究的地域(如多中心平行對照)或人群(如不同的源人群)[18，23]。

注：用5種顏色區分5種構建方式，其中實線為暴露組，虛線為外對照。圖1 基于RWD構建外對照的5種方式Note：Five colors were used to distinguish five kinds of construction methods，where solid line represents exposure group，and dashed line represents the external control.Fig.1 Five ways to construct external control based on RWD

1.1.3設置外對照的研究類型利用RWD構建外對照時，首先需要尋找與研究問題匹配的數據庫，并評估其適用性，確定目標人群的代表性、干預信息和重要混雜因素記錄的全面性及結局指標的準確性[22]。然后以傳統的RCT設計為基準，根據場景和研究問題利用RWD形成外對照，可以考慮的研究設計有多種組合：當RCT內對照樣本量不充足時，在RWD中匹配合適數量的外對照；當RCT內對照樣本量充足時，在RWD中匹配外對照，增強了研究外推性；對于單臂研究，利用RWD匹配外對照，稱為補充單臂研究結果的解釋性增強；對于單臂研究，利用RWD或其他臨床試驗合成標準治療(standard of care，SOC)效果作為外對照，而不用個體數據(individual patient data，IPD)直接比較；在隊列研究之外為暴露組尋找非暴露組；利用RWD構成兩個觀察干預組，比較實際的干預效果(effectiveness)[18，24]。

1.2偏倚風險控制及外對照質量評估

1.2.1外對照研究的偏倚風險控制為了提高單臂研究和RWS因果推斷真實性，強化證據的可信度，必須充分了解ECT的偏倚，并在研究設計階段減少潛在的偏倚風險[7，22]。流行病學研究中常見偏倚控制措施適用于ECT，常見的偏倚及控制策略有[22]：①選擇偏倚，使用客觀指標作為納入/排除標準，如疾病診斷編碼、金標準檢查結果及處方藥品構建算法定義研究對象。②混雜偏倚，按照試驗組的基本特征合成外對照，如年齡、性別構成、臨床分期及合并癥等，但是當基線信息不足或者缺失，則無法預測和控制殘余混雜。③信息偏倚，試驗組與外對照的暴露、結局和協變量的確定和設置盡可能一致，測量方法和標準一致，對于縱向研究，組間測量時間間隔一致；定義標準并驗證算法，控制處方信息與患者實際用藥不符可能產生的錯分偏倚。另外，外對照與研究觀察組的數據集信息缺失程度、類別不一致，填補數據或者剔除數據都有可能增加額外偏倚[25]。

1.2.2外對照研究的質量評估外對照質量評價標準見表1[23]，高質量的外對照特征與試驗組具有“互換性(exchangeability)”，即受試對象基本特征和結局指標定義測量高度一致，無明顯偏倚，而且充分考慮了協變量。為此盡可能利用實施完好的RCT試驗組，并通過合適的統計方法確定臨床特征、場景設定、人口學分布與當前試驗組的可比性可靠有效。

表1 外對照質量評價清單Tab.1 Quality evaluation list of external control

1.3外對照研究統計分析與報告在進行外對照研究統計分析時，可參考中國真實世界數據與研究聯盟(ChinaREAL)制定的規范，如預先制定研究統計分析計劃(statistical analysis plan，SAP)，根據臨床意義預先設定效應值，計算樣本量，評估和控制偏倚的策略，制定缺失數據處理、調整混雜及敏感性分析的方案等[26]。但是外對照研究統計分析有些特殊性，如貝葉斯模型由基于現有知識的先驗分布，基于當前試驗數據的似然分布和更新信息的后驗分布構成[18]，適合補充了外對照的RCT研究。

1.3.1合成外對照的統計方法盡管可以直接從外部研究或RWD中收集IPD作外對照，從而在研究內降低使用或者不設內對照。但是，由于存在患者特征差異和混雜因素，直接利用IPD或許過于簡單。嚴格使用傾向性評分匹配和Meta分析設置外對照更可靠和有效[27]。

利用傾向性評分設置外對照，不僅適用于觀察性研究，也適用于SAT和補充外對照的RCT，最終目的是降低混雜影響，使得對比組間具有互換性[18]，從而增強研究的因果推斷能力。

利用隨機效應模型的Meta分析獲得外對照的預測值，根據數據源的類型，可用的方法有：根據基線調整協變量的Meta回歸、多種干預比較的網狀Meta分析、多結局變量的多元Meta分析等。該方法考慮了試驗間的異質性及不同試驗目標人群的異質性[27]。數據源可以來自多個歷史RCTs的相同安慰藥/干預組的IPD，也可以整合既往發表文獻數據。目前該方法多用于公開的臨床試驗數據，亦可嘗試應用RWD。

1.3.2外對照研究報告規范大部分設置外對照的研究是RWS，可依據觀察性研究報告規范STROBE(The STrengthening the Reporting of Observational Studies in Epidemiology)拓展而來的RECORD(The REporting of studies Conducted using Observational Routinely-collected health Data)[28-29]和事先擬定的SAP撰寫研究報告。特別需要注意報告[22，26]：①數據來源和篩選流程。②偏倚評估和處理缺失數據方法。③外對照合成的統計方法及理由。④外對照與觀察組比較的統計分析方法選擇及其理由。⑤結果部分詳細描述基線特征，及各個結局事件的統計描述和假設檢驗結果；主要結局的敏感性分析結果。

1.4外對照研究倫理許多外對照研究設計通常是在RCT存在倫理問題時的備選方案，因此在倫理問題上外對照研究比傳統RCT更有優勢。另外，在利用RWD合成外對照進行RWS時，外對照研究倫理規范與內對照相同，但是因為涉及的人群范圍更大，所以在共享研究需要特別注意確保信息安全。

1.5真實世界研究外對照應用實例和場景

1.5.1醫療實踐中發生率低的病種日常診療中的罕見病，病例過少無法實施RCT，通常進行單臂試驗。隨著精準醫學興起，根據基因構成對很多疾病進行了更細致的亞型劃分，例如非小細胞肺癌(non-small cell lung carcinoma，NSCLC)的表皮生長因子受體(EGFR)突變亞型[23]。復發、難治重癥研究困境與之相似。通過合理設置外對照可以更好地解釋試驗結果，彌合證據裂痕，增加獲得審批的概率。截至2019年12月，以單臂試驗證據提交世界衛生組織衛生技術評估(Health Technology Assessment，HTA)審批的項目逐年增加，疾病譜廣泛，以腫瘤、代謝、血液/免疫、感染性疾病為主[16]。案例1：阿維魯單抗(avelumab，商品名 Bavencio)，簡稱B藥，基于一項開放標簽、單組、全球多中心Ⅱ臨床試驗(JAVELIN Merkel 200)，與同期外對照(以美國和歐洲的平行病例回顧為基線數據)比較后，2017年獲美國食品藥品管理局(FDA)和EMA批準用于治療罕見且預后極差的Merkel細胞癌[3]；基于歷史外對照(基于電子醫療數據庫和德國腫瘤登記共同構建的自然史隊列)，2021年5月7日，FDA批準B藥增加適應證：用于治療晚期腎細胞癌和擴散的尿路上皮癌[24]。案例2：博納吐單抗(blinatumomab，商品名BLINCYTO)，根據一項多中心單臂臨床試驗與注冊病例形成的歷史外對照比較結果，2014年獲FDA批準上市，用于治療急性淋巴細胞白血病(acute lymphoblastic leukemia，ALL) 的一個亞型[Ph-陰性 B-前體(R/R) ALL][19]。

1.5.2單臂研究醫療器械是多學科技術與現代醫學交叉融合的產物，被應用在疾病的預防、診斷、治療、監護、康復等領域，其監管評估涵蓋上市前后的整個生命周期[30]。由于倫理學和可行性限制，對Ⅲ類高風險產品無法實施RCT進行評估[30]。美國FDA支持主動監測，并逐漸構建起醫療器械生產方、衛生技術評估監管方、醫療服務方和健康支付方合作體系[31]。常規收集和分析上市后臨床實踐數據和患者體檢數據，通過利用歷史或同期外對照，產生了諸多安全性/有效性的RWE，進而改善醫藥產品和技術的局限性、擴大適應證，成為監管機構審批醫藥產品和證據體重新分級的依據[31]。外科手術具有侵入性、復雜性、個體化、高度依賴操作者技能等特點，2009年，IDEAL(The Idea，Development，Exploration，Assessment，and Long-term Follow-up)協作網正式提出了IDEAL框架與建議，該框架將外科干預的評價路徑分成5個階段，其中第3階段評價，以當前標準治療為外對照，評估外科創新療效及安全性[32]。即使倫理和可行性都滿足，在RCT完成后，可將安慰藥或SOC對照病例納入到試驗組，繼續拓展試驗，通過合理設置外對照獲得長期有效性或安全性結局證據。同理，可以設置外對照完善藥物上市后安全性試驗，并提供附加結局及終點結局等方面證據，為監管決策在人群外推、擴大適應證、合并用藥等方面提供決策依據[18]。

1.5.3其他潛在場景開展藥物/醫療器械經濟學RWS，除了可以提供成本和健康相關證據，有助于合理配置有限的醫療資源[33]，還能同時了解實際醫療環境中醫生和患者的醫療行為，如可以設置不同時期的歷史外對照，了解變化和趨勢。結合RWS中醫藥研究場景可以有以下幾個方面：評價中醫藥安全性、發現規律提出假說、明確非藥物療法臨床價值和適應證、評估疾病預防技術、評價中西藥物合并用藥[34]。如中醫藥的安全性問題，可以在大的隊列聯盟里找到試驗組和平行外對照，長期監測相關結局。在預防慢性病的非免疫規劃疫苗方面，我國尚有較大發展空間，如HPV疫苗[35]。安全性是疫苗研發和推廣的根基和保障[36]，為此，疫苗的安全信號監測一直以來都是重要話題。基于RWS監測數據，通過歷史外對照或者前瞻性平行外對照，可以估計出各種不良反應(adverse drug reaction，ADR)的發生風險，也可以評估疫苗獲益，有助于疫苗推廣及良性有序發展，提高一級預防證據質量，促進人群健康[27]。在這些研究中合理設置外對照，可以回答非常廣泛的實際問題。

2 啟示

RWD和RWS如何為藥械監管、醫保決策、醫療健康管理等衛生領域的循證監管決策提供有力證據成為重要話題。由于倫理、可行性及過于嚴格的納入/排除標準，RCT不足以回答所有臨床問題，RWE作為補充和替代方案在一些領域的循證監管決策中受到重視。相信未來我國生物醫學領域RWS數量和質量都會有重要突破，為臨床決策和藥械監管提供更廣泛、更可靠的證據，在這個過程中依據流行病學的原理方法恰當選擇外對照是解決問題的技術之一。當評估藥物/醫療器械存在倫理問題，或者對其進行適用人群拓展、超說明書使用或者長期使用的有效性和安全性評價時，可以考慮設置外對照，同時注意選擇合適的外對照形式，提高外對照質量，控制研究偏倚，保證研究結果的真實性和可靠性。