田磊 管欣 馬愛霞
中圖分類號 R-33 文獻標志碼 A 文章編號 1001-0408(2018)04-0493-04
DOI 10.6039/j.issn.1001-0408.2018.04.15
摘 要 目的:對隨機對照試驗研究與觀察性研究進行系統性地比較,為臨床研究者選擇合適的設計類型提供借鑒和參考。方法:比較隨機對照試驗研究與觀察性研究的研究設計、研究報告范式,并檢索PubMed數據庫、中國期刊全文數據庫中的文獻,分析國內外隨機對照試驗研究與觀察性研究文獻發表的差異。結果:隨機對照試驗研究與觀察性研究在設計原則、研究目的、研究對象、干預措施、效度等多方面均存在差異。CONSORT聲明和STROBE聲明對兩種研究報告范式的題目和摘要、引言、結果、討論等內容的要求基本一致, 主要差別在于方法和其他信息方面。國外隨機對照試驗研究與觀察性研究的文獻數量相差較小,而國內相差較大,特別是在證據等級較高的隊列研究方面。結論:觀察性研究近年來發展迅速,但隨機對照試驗研究仍然是臨床研究中評價因果效應的“金標準”,研究者在進行研究時應根據實際情況選擇合適的設計類型。
關鍵詞 隨機對照試驗研究;觀察性研究;系統比較;設計類型
ABSTRACT OBJECTIVE: To compare randomized controlled trial (RCT) study and observational study systematically, and to provide reference for selecting suitable study design types for clinical researchers. METHODS: RCT study and observational study were compared in respects of study design and study report paradigm. Relevant literatures were retrieved from PubMed database and Chinese Journal Full-text Database. The differences of literature publication of RCT study and observational study were compared at home and abroad. RESULTS: There were differences in design principles, objectives, subjects, interventions and validity between RCT study and observational study. The requirements of CONSORT statemtnt and STROBE statement to the topics, abstracts, introduction, results and discussions of report paradigm of two studies were basically consistent, and main difference of them were in aspects of methods and other information. The number of literatures about RCT study and observational study had little gap at abroad, but had great gap at home, especially in cohort study with high-level evidence of evidence-based medicine. CONCLUSIONS: The observational study has developed rapidly in recent years, but RCT study is still a “gold standard” to evaluate the causal effect of clinical study. The researchers should choose the appropriate type of design according to the actual situation.
KEYWORDS Randomized controlled trial study; Observational study; Systematic comparison; Design type
醫學研究與其他自然學科的研究類似,均為探求事物之間的本質聯系,即因果效應(Causal effect)[1]。隨機對照試驗(Randomizd controlled trial,RCT)研究因采用隨機化、盲法和對照原則,極大程度地避免了試驗實施過程中可能出現的偏倚,因而成為了臨床研究中評價因果效應的“金標準”[2]。但是RCT研究獲得的只是理想條件下或某一年齡段或疾病亞組人群干預措施的效果,隨著疾病譜的變化和醫學技術的發展,臨床疾病診療已面臨越來越復雜的局面,單純的RCT研究很難解決所有真實世界中發生的臨床問題。在此基礎上,觀察性研究逐步發展起來,亦成為醫學研究設計的一個重要類型。為此,本研究對RCT研究和觀察性研究的研究設計、研究報告范式、應用情況等方面進行了系統地比較,旨在為臨床研究者選擇合適的設計類型提供參考。
1 研究設計
1.1 設計原則
RCT研究的設計原則為隨機化、盲法和對照原則。隨機化原則是RCT研究最基本的原則,即通過隨機化方法將研究人群以平等的機會分配到觀察組和對照組,并接受相應的干預措施,通過這一原則可極大程度地消除組間及組內差異、平衡各種混雜因素并消除選擇偏倚,提高統計學檢驗的有效性;盲法原則是指研究者和受試人群均不知曉分組結果,從最大程度上消除試驗參與者對于觀察組和對照組可能出現的測量偏倚和實施偏倚;對照原則是指通過設置對照組來評價干預措施的有效性,通過對照原則來消除各種非試驗因素(如時間因素等)引起的因果效應[3]。
觀察性研究的設計原則與RCT研究設計原則存在明顯差異,主要為非隨機化、不干預和開放性原則。非隨機化原則是指不對受試人群進行隨機化分組,醫師可根據研究人群的具體情況選擇其認為最合適的干預措施;與此同時,醫師不會對患者的依從性加以干預,研究者僅僅是對干預措施的效果進行相應的記錄,即不干預原則;開放性原則是指研究設計中不進行盲法設計,醫師和受試人群對干預措施均有較為充分的認識,從而使受試人群在研究中獲得最好的因果效應[4]。因此,觀察性研究屬于真實世界研究(Real world studies,RWS)。
1.2 研究目的
RCT研究一般是在新藥或新的醫療措施上市前進行的研究,其通過隨機化、盲法、對照原則驗證該新藥或醫療措施是否能達到預期效果,以此來協助其獲得在某一國家或地區的上市許可;觀察性研究是新藥或新的醫療措施上市后進行的研究,通過對該藥品或醫療措施在真實世界中的因果效應進行觀察,以驗證其實際臨床應用價值[5]。
1.3 研究對象
由于受經費、資源和時間等多方面限制,RCT研究樣本量較小,通常會采用由統計學方法計算出的最小樣本量;同時,為了保證研究質量,RCT研究通常會設定較為嚴格的納入與排除標準,比如研究人群的年齡、病情嚴重程度、合并的慢性疾病等,以盡可能地提高研究人群的同質性。觀察性研究為了獲得更加真實的臨床效果,需要覆蓋盡可能多的研究人群,因此觀察性研究的樣本量較大;且其研究人群并未設立嚴格的納入與排除標準,通常情況下只要符合用藥標準均可納入研究[6-8]。
1.4 干預措施
由于RCT研究的目的是驗證新藥或新的醫療措施的有效性和安全性,因此RCT研究的對照組的干預措施通常為空白對照,少量為陽性對照,且RCT研究需要嚴格控制聯合用藥、用藥劑量、患者依從性等內容[6-8]。由于觀察性研究是為了獲得藥品或醫療措施的實際臨床應用價值,因此觀察性研究的對照組多為臨床最常用或療效已獲得普遍認可的治療方案,同時醫師可根據患者實際情況來決定聯合用藥、用藥劑量等問題。
1.5 效度
效度是衡量研究質量的重要指標,研究設計的基本目標是提高內部效度和外部效度。內部效度是指研究結果解釋的唯一性,若一項研究結果具有唯一的解釋,則認為該研究的內部效度高;若可能存在其他解釋,則認為該研究的內部效度低。外部效度是指研究對象在脫離特定的研究環境后,研究結果還是否成立或成立的程度[9],成立程度越高表示外部效度越高。
RCT研究具有較高的內部效度,但為了盡可能高的內部效度,RCT研究在很大程度上犧牲了其外部效度,這也成為了RCT研究的一個劣勢[10]。內部效度的高低決定了一項研究能否得出確定的因果效應,較高的內部效度可保證研究結果的穩健性和可重復性;外部效度的高低決定了研究結論外推到特殊環境中的可能性,因此較高的外部效度可保證研究結果的可外推性[9]。在RCT研究中,一般需要制訂嚴格的納入與排除標準,同時為了保證設計方案的嚴格執行,研究者會對患者進行多次的觀察與隨訪,這在一定程度上消除了研究環境中的混雜因素。混雜因素的降低可提高RCT研究的內部效度,這也是RCT研究會成為臨床研究中評價因果效應的“金標準”的重要原因。但實際臨床治療過程遠比RCT研究復雜,如患者可能出現多種并發癥、用藥依從性差等情況,這均會在一定程度上影響治療方案在實際應用中的效果。因此,RCT研究的外部效度通常較差,這使得RCT研究結果無法很好地外推到實際臨床應用中。因觀察性研究的環境更接近臨床實際治療環境,故具有較高的外部效度,但由于混雜因素過多,且研究過程中無法做到對所有的混雜因素均進行觀測和量化,因此可能存在未被觀測或控制的混雜因素導致研究結果出現偏倚的情況。RCT研究與觀察性研究比較見表1。
2 研究報告范式
研究報告范式能使讀者更好地了解一項研究從設計到得出結論的整個過程,從而判斷研究質量的高低。讀者、專家對于一項已發表研究的評估主要依賴于對其研究報告的解讀[11],但較多試驗研究報告的范式并不規范,重要信息往往出現遺漏。如Tooth L等[12]在2005年對49篇有關卒中的縱向研究報告進行相關研究后發現,有17篇研究未詳細報道患者的納入標準,這也反映了研究的不規范性,大大降低了研究的可信度。為了規范研究流程、提高研究質量,CONSORT工作組和STROBE工作組分別針對RCT研究和觀察性研究發布了CONSORT聲明[13-14]和STROBE聲明[15-16],對研究報告的范式以聲明的形式進行了公布。對比兩個聲明,CONSORT聲明與STROBE 聲明條目數量差別不大(25條 vs. 22條),無論是RCT研究還是觀察性研究均由題目和摘要、引言、方法、結果、討論、其他信息等六部分組成。其中,對兩類研究的題目和摘要、引言、結果、討論等四部分的要求基本一致,如結果部分都需要對參與者及其基線資料、主要結局指標進行統計分析,如有需要還可進行亞組分析、敏感性分析等輔助分析。兩類研究的主要差別在于方法和其他信息部分。由于研究性質的不同,RCT研究更注重報告中的隨機、盲法的設計與實施,而觀察性研究更注重易對研究結果產生影響的因素及對混雜因素的處理。此外,由于隨機、盲法的設計原則,使得臨床研究對RCT研究的審批更加嚴格,每一個RCT均需要進行審批注冊,因此研究報告中需報告試驗注冊的情況,而觀察性研究則不需要此流程。
3 應用情況
以“Randomized controlled trial”“Observational study”為關鍵詞檢索PubMed數據庫、以“隨機對照試驗”“觀察性研究”為關鍵詞檢索中國期刊全文數據庫(按年份檢索),結果見表2。由表2可知,橫向對比,RCT研究與觀察性研究的文獻數量相差較大,其原因可能為RCT研究起源較早,且RCT研究一直被看作是臨床研究的“金標準”,因此臨床研究可能更偏重于RCT研究;縱向對比,國外RCT研究與觀察性研究的文獻數量相差較小,但國內RCT研究與觀察性研究的文獻數量相差較大,這可能與國內學者對觀察性研究了解較少,對RCT研究盲目依賴有關。
觀察性研究可進一步細分為“橫截面研究”“隊列研究”“病例對照研究”。橫截面研究主要用于描述現象的特點和規律,證據等級較低,但可為后續研究提供線索,是研究新的臨床問題的重要步驟之一[17];隊列研究是直接觀察暴露于不同危險因素的人群或接受防治措施患者的結局,主要用于探討危險因素、防治措施與疾病發生或結局之間的因果效應,是循證醫學證據等級僅次于RCT研究的臨床研究[18];病例對照研究是就某一暴露因素對兩組患者進行的回顧性分析,在循證醫學證據等級中屬于三級證據,證據等級低于隊列研究[19]。分別以這3個細分類別為關鍵詞檢索PubMed數據庫、中國期刊全文數據庫(按年份檢索),結果見圖1、圖2(因檢索關鍵詞不同,故圖1、圖2中的數據與表1有所差別)。由圖1、圖2可知,橫向對比,國外更偏重于證據等級較高的隊列研究,其次為橫截面研究,文獻數量均遠高于病例對照研究;國內文獻數量最多的為病例對照研究,而隊列研究、橫截面研究文獻數量相當,均遠低于病例對照研究。由此也可以看出,國內觀察性研究的文獻證據等級偏低且創新性較差。縱向對比,國外隊列研究和橫截面研究近幾年發展迅速,文獻數量逐年增加,病例對照研究發展相對較平穩;而國內各類研究均較少,發展較緩慢,且病例對照研究的文獻數量有逐年遞減的趨勢。
4 結語
由于內部效度的問題,觀察性研究結果受到了很多學者的質疑,這也在一定程度上阻礙了觀察性研究的發展[20]。但隨著研究設計的逐步完善以及統計學方法的突破,使得很多學者開始接受觀察性研究。有研究曾對1985-1998年發表的19個治療方案的136篇觀察性研究和RCT研究文獻進行比較,發現觀察性研究與RCT研究的結果相似,僅有兩個領域的治療方案差異在95%置信區間內顯著,這表明觀察性研究結果與RCT研究基本一致[20],亦推翻了以往學者認為的RCT研究結果優于觀察性研究結果的傳統觀念。國際藥物經濟學與結果研究協會認為,良好的研究設計和嚴格的實施控制保證了觀察性研究可為臨床研究中因果效應的探究提供足夠充分的證據[21]。目前,國內觀察性研究起步較晚,雖然國內研究者在一定程度上忽視了觀察性研究在研究設計中的重要性,但實際上除了一些特殊情況(如新藥上市前必須進行RCT研究)外,研究者在進行研究時應該根據研究的實際情況(如研究時長、研究資金、研究對象等)選擇合適的設計類型。
參考文獻
[ 1 ] 耿直.觀察性研究與混雜因素[J].統計與信息論壇,2004,19(5):13-17.
[ 2 ] 陳耀龍,李幼平,杜亮,等. 醫學研究中證據分級和推薦強度的演進[J]. 中國循證醫學雜志,2008,8(2):127- 133.
[ 3 ] BYAR DP,SIMON RM,FRIEDEWALD WT,et al. Randomized clinical trials:perspectives on some recent ideas[J]. N Engl J Med,1976,295(2):74-80.
[ 4 ] CONCATO J. Observational versus experimental studies: whats the evidence for a hierarchy?[J]. NeuroRx,2004,1(3):341-347.
[ 5 ] FLAY BR. Efficacy and effectiveness trials(and other ph- ases of research) in the development of health promotion programs[J]. Prev Med,1986,15(5):451-474.
[ 6 ] 黃卓山,羅艷婷,劉金來. 真實世界研究的方法與實踐[J]. 循證醫學,2014,14(6):364-368.
[ 7 ] 曹越,尹慶鋒,曾憲濤. 真實世界研究概述[J]. 武警醫學,2017,28(4):400-403.
[ 8 ] 徐菲,劉國恩. 真實世界研究與藥物經濟學評價[J]. 中國藥物經濟學,2015,10(10):8-10.
[ 9 ] 李欣,石文典. 內部效度、外部效度及其關系[J]. 心理研究,2009,2(1):9-12.
[10] TUNIS SR,STRYER DB,CLANCY CM. Practical clinical trials: increasing the value of clinical research for decision making in clinical and health policy[J]. JAMA,2003,290(12):1624-1632.
[11] MORTON SC,COSTLOW MR,GRAFF JS,et al. Standards and guidelines for observational studies: quality is in the eye of the beholder[J]. J Clin Epidemiol,2016. DOI: 10.1016/j.jclinepi.2015.10.014.
[12] TOOTH L,WARE R,BAIN C,et al. Quality of reporting of observational longitudinal research[J]. Am J Epidemiol,2005,161(3):280-288.
[13] MOHER D,HOPEWELL S,SCHULZ KF,等. CONSORT 2010說明與詳述:報告平行對照隨機臨床試驗指南的更新[J]. 中西醫結合學報,2010,8(8):701-741.
[14] DAVID M,KENNETH FS,DOUGLAS GA,等. CONSORT聲明:提高平行隨機試驗報告質量的修訂建議[J]. 中國循證醫學雜志,2005,5(9):702-707.
[15] STROBE聲明:隊列研究報告寫作清單①:對文題、摘要、引言、方法的寫作要求[J]. 中國組織工程研究,2012,16(22):4000-4008.
[16] 王波,詹思延. 如何撰寫高質量的流行病學研究論文第一講:觀察性流行病學研究報告規范:STROBE介紹[J]. 中華流行病學雜志,2006,27(6):547-549.
[17] 曹衛華. 橫斷面研究在臨床研究中的應用[J]. 北京大學學報(醫學版),2010,42(6):659-660.
[18] 韓梅,陳薇,曹卉娟,等. 比較效果研究常用方法之二:隊列研究設計[J]. 現代中醫臨床,2015,22(3):20-23.
[19] 于河,李贊華,劉建平. 觀察性研究在中醫臨床研究中的應用:2:病例對照研究設計與報告[J]. 中醫雜志,2008,49(7):598-601.
[20] BENSON K,HARTZ AJ. A comparison of observational studies and randomized,controlled trials[J]. N Engl J Med,2000,342(25):1878-1886.
[21] BERGER ML,DREYER N,ANDERSON F,et al. Prospective observational studies to assess comparative effectiveness: the ISPOR good research practices task force report[J].Value Health,2012,15(2):217-230.
(收稿日期:2017-03-17 修回日期:2018-01-04)
(編輯:陳 宏)