崔偉鋒,王秉權,董永書,范軍銘
450004河南省鄭州市,河南省中醫藥研究院
?
傾向評分法在中醫藥臨床研究中的應用
崔偉鋒,王秉權,董永書,范軍銘
450004河南省鄭州市,河南省中醫藥研究院
【摘要】本文介紹了傾向評分法的基本原理及實現方法,回顧了傾向評分法在醫學臨床研究中的應用及其特點,并通過分析傾向評分法在中醫藥科研中的優勢,得出利用傾向評分法開展中醫臨床真實世界的研究,可以均衡研究中的混雜因素,將非隨機研究變成接近隨機對照研究,更契合中醫“整體觀念”及“辨證論治”的特點。傾向評分法適合中醫真實世界的研究。
【關鍵詞】醫學,中國傳統;傾向評分;生物醫學研究
崔偉鋒,王秉權,董永書,等.傾向評分法在中醫藥臨床研究中的應用[J].中國全科醫學,2016,19(13):1591-1593.[www.chinagp.net]
Cui WF,Wang BQ,Dong YS,et al.Application of propensity score method in the clinical research of traditional Chinese medicine[J].Chinese General Practice,2016,19(13):1591-1593.
1983年,Rubin等[1]首次提出傾向得分的概念,傾向評分法提出以后,其在醫學研究中被大量應用。本文就傾向評分法的基本原理及實現方法進行介紹,回顧傾向評分法在醫學臨床研究中的應用及其特點,并重點討論中醫臨床研究的特點及利用傾向評分法開展中醫藥科研的優勢,現報道如下。
1傾向評分法的基本原理及實現方法
1.1基本原理傾向評分法是將所有混雜因素或協變量綜合成一個變量。主要用來均衡處理組和對照組間的協變量分布,用于將非隨機研究中混雜因素變成接近隨機化均衡處理,從而達到減少偏移的目的。常用的傾向評價法包括傾向評分匹配法(propensity score matching)、傾向評分分層法(propensity score stratification)、傾向評分協變量調整法(propensity score covariate)和傾向評分加權法(propensity score weighting)[2-3]。傾向評分匹配法、分層法、協變量調整法和加權法在醫學研究中都有著不同程度的應用,各有其特點,其中匹配法應用最為廣泛。傾向評分匹配法是在通過模型計算傾向得分后,從對照組中選出與處理組傾向得分相等或相近的研究對象進行配對,來達到均衡組間的協變量分布的目的[2]。匹配法比分層法能更好地消除混雜因素產生的偏移。傾向評分匹配法能得到平均處理效應的無偏估計,而分層法只能得到處理效應的有偏估計[4-5]。匹配法能直接比較混雜在組間的均衡性,分層法只能在層內比較,不能直接比較混雜的均衡性。協變量調整法是基于模型的分析,其要求模型的正確性,同時其結果不易于理解和解釋。傾向評分加權法在醫學研究中應用很少。
1.2實現方法在實際工作中,傾向評分法需要在統計軟件中實現。常用的統計軟件SAS、SPSS、STATA均可進行傾向評分分析。由于目前的統計軟件中沒有固定的模塊進行匹配的過程,需要在這些軟件中編制宏程序來實現。Parsons[6]提供的SAS宏匹配程序,該程序先使用統計模型,如Logistic、判別分析、Probit模型等估算出傾向評分,然后用貪心法進行匹配。國內學者李智文等[7]提供了用貪心法進行匹配的SPSS宏程序。
2傾向評分法在醫學臨床研究中的應用及其特點
傾向評分法是平衡觀察性研究中混雜因素的有效方法,越來越多的研究者將其應用到流行病學研究的方案設計階段和臨床療效評價,相關學者還對傾向評分方法學進行研究。我國學者于2003年開始把傾向評分技術介紹到國內。趙守軍等[8]最早于2003年在醫學領域用實例介紹傾向評分法的基本原理和適用條件。2004年汪濤等[9]首次提出一種適用于非隨機化醫學研究的,結合傾向指數與非參數生存分析估計風險比的方法。2009年鄭亮等[10]使用五等分分層法對臨床試驗中的非隨機化數據進行處理,分層前兩組協變量間的不均衡在分層后達到了均衡。2010年李智文等[11-13]詳細介紹了傾向評分原理及其分層法、回歸法和加權法,并介紹了傾向評分法在SPSS中的實現方法。2011年王永吉及其團隊[14-15]開展了對傾向評分方法學的研究,如多組資料的傾向評分匹配法的研究、傾向指數匹配法與Logistic回歸分析方法的對比研究。2012年在臨床療效評價的研究中出現了利用傾向評分法的報道。王素珍等[16-19]平衡組間協變量后比較射頻消融術和經皮穿刺無水乙醇瘤內注射治療原發性肝癌的效果研究;基于傾向指數匹配法的肝癌患者生存分析;經傾向指數匹配后的肝癌患者療效評價。2013年臨床各個領域出現了大量的利用傾向評分法進行療效評價的研究,如腫瘤、心腦血管病、介入治療、不孕不育、手術等。
應用傾向評分法的臨床研究特點:干預手段比較特殊,比如手術、介入等無法進行隨機,或者干預為復雜干預,如中醫藥的干預;評價指標中大部分為結局評價指標,比如腫瘤的生存、心腦血管疾病死亡率的研究,研究者一般需要進行較長時間的臨床觀察和隨訪,開展較長期的評價,除替代指標的改善,評價指標主要包括病死率、復發率、傷殘程度、生活質量等更具廣泛臨床意義的結局指標;混雜因素多,比如藥物的不良反應研究中合并用藥太多等。
3中醫臨床研究的特點及利用傾向評分法開展中醫藥科研的優勢
3.1中醫臨床研究的特點
3.1.1中醫具有復雜干預的特點復雜干預貫穿于整個中醫臨床醫療活動中,中醫所用的干預措施是以辨證論治為基礎的中藥治療,還包括針灸、推拿治療以及音樂、心理等輔助治療,其復雜之處體現為疾病證候動態演變,選方遣藥亦隨之調整,選方及其加減體現出中醫辨證論治的復雜干預特性。針對患病個體干預的治療手段多樣化,各種治療手段單獨或聯合應用。中醫治病是多維度干預,既控制病情活動,又改善生存質量;既改善患者主觀感受,又注重功能恢復等。李先濤等[20]研究指出,傾向評分法是一種較好的復雜干預評價方法及模型,其可在缺乏隨機化分配的情況下增加治療組間可比性的一種統計分析方法,該方法盡量將所有可能的混雜因素綜合為一個變量即傾向評分(propensity score,PS),通過平衡對比組的傾向評分而有效地均衡混雜變量(也稱協變量)的分布,從而達到控制混雜偏倚的目的,從而使組間具有可比性。
3.1.2結局性指標能夠體現中醫的臨床療效臨床試驗結局有效性指標主要包括終點結局的指標與替代指標。終點結局指標與患者最為相關,可以用率來表示,如病死率、治愈率、發病率等,對臨床決策最具參考價值。這些研究需要進行長期隨訪的試驗研究來觀察。終點結局符合中醫對慢性病并發癥預防的治療特點,能夠更好反映中醫治療的有效性。替代指標是在終點指標的測量不可行時(觀察時間長),用來替代終點結局指標,主要是一些理化檢測和體征等,而這些特異性指標很難體現中醫藥的有效性。中醫研究中必須選擇適合中醫療效評價的結局指標。
3.1.3中醫研究適合真實世界的研究中醫復雜干預強調個性化治療,替代性指標很難反映中醫的真實療效,結局性指標最能體現中醫的療效。中醫干預的復雜性和結局性指標長時間隨訪很難保證隨機的執行,并且往往會遇到倫理和依從性的挑戰。另外,隨機對照試驗(RCT)的高級別臨床證據實際應用價值受到了越來越多的質疑。而真實世界研究(real-world study,RWS)更注重臨床實際的應用情況,今年來受到了許多研究者的追捧。RWS即運用流行病學研究方法,在真實無偏倚或偏倚較少的人群中,對某種或某些干預措施的實際情況進行研究。RWS在評價指標上主張應用具有廣泛臨床意義的結局指標,干預手段上主張綜合、個性化治療,不主張專病專藥、專病專方,這與中醫的“整體觀念”及“辨證論治”,以及中醫豐富的治療手段相契合[21]。
3.2利用傾向評分法開展中醫藥科研的優勢傾向評分法可以均衡RWS中的混雜因素,將非隨機研究變成接近隨機對照研究。中醫“整體觀念”及“辨證論治”的特點適合RWS。因此,利用傾向評分法適合開展中醫真實世界的研究。2012年范軍銘[22]首次提出利用傾向評分法構建一種適合中醫藥臨床療效的研究與評價模式——CPOE模式,通過分析當前中醫臨床療效評價存在的問題認為,在倫理學等條件限制下,中醫辨證論治、中醫治療慢性病、中西醫結合治療疾病等療效評價往往不適合RCT,CPOE模式不采用隨機,患者可采取中醫藥辨證施治的個體化治療,以結局指標評價中醫藥復雜干預。CPOE模式是符合中醫RWS的新模式。
4討論
傾向評分法可以應用到中醫藥設計階段。在中醫藥病因學和臨床療效評價研究中,為探討處理因素與疾病的關系,理想的設計方案是RCT。在RCT中,研究對象是否接受處理因素是隨機的,混雜因素在處理組和對照組分布相同,具有可比性。這樣才能顯出處理因素與疾病的關系。觀察性研究中研究對象是否接受處理因素不是隨機的,但是利用傾向評分法應用于設計階段,可以使觀察性研究產生類似于RCT的效果。如果原有病歷資料中有足夠的觀察對象,并有混雜因素資料(或缺乏部分的混雜因素的資料)。研究者都可以利用傾向評分法從所要觀察的人群中隨機抽出混雜因素均衡可比的足夠樣本。然后再對抽出的均衡樣本進行調查或隨訪。實例分析表明,利用傾向評分法篩選后的研究對象,主要混雜因素在兩組中的偏差下降55%以上[23]。
目前,中醫藥臨床研究中把傾向評分法應用到設計階段的較少,但部分研究已經開始將其應用到臨床療效評價階段,開展中藥上市后再評價的研究。由于傾向評分技術專業性較強,統計軟件中沒有固定的模塊來完成傾向評分的匹配過程。在臨床報道中應用傾向評分技術的研究不多。國內只有部分專業統計人員掌握這項技術,能夠掌握這項技術的中醫藥科研人員較少,傾向評分技術急需在中醫藥研究領域進一步推廣。另外,缺乏以中醫藥臨床數據為基礎開展的傾向評分的方法學研究。
作者貢獻:崔偉鋒負責撰寫論文、收集資料;王秉權負責收集資料;董永書負責審校;范軍銘負責設計、方法指導,為文章負責人。
本文無利益沖突。
參考文獻
[1]Rubin DB,Rosenbaum PR.The central role of the propensity score in observational studies for causal effects[J].Biometrika,1983,70(1):41-55.
[2]Katherine HH,Thomas AL.Propensity score modeling strategies for the causal analysis of observational data[J].Biostatistics,2002,3(2):179-193.
[3]Austin PC,Mamdanil MM.A comparison of propensity score methods:a case-study estimating the effectiveness of post-AMI statin use[J].Statistics in Medicine,2006,25(12):2084-2106.
[4]Austin PC.A critical appraisal of propensity-score matching in the medical literature between 1996 and 2003[J].Statistics in Medicine,2008,27(12):2037-2049.
[5]Perkins SM,Tu W,Underhill MG,et al.The use of propensity scores in pharmacoepidemiologic research[J].Pharmacoepidemiology & Drug Safety,2000,9(2):93-101.
[6]Parsons LS.Reducing bias in a propensity score matched-pair sample using greedy matching techniques[C].The Twenty-Sixth Annual SAS Users Group International Conference,2001:214-226.
[7]李智文,李宏田,張樂,等.用SPSS宏程序實現觀察對象的傾向評分配比[J].中國衛生統計,2011,28(1):89-90.
[8]Zhao SJ,Zhang Y,Wang XY,et al.An effective method to reduce bias between two compared groups:propensity score[J].Chin J Epidemiol,2003,24(6):92-95.(in Chinese)
趙守軍,張勇,汪萱怡,等.均衡組間差異的有效方法:傾向評分[J].中華流行病學雜志,2003,24(6):92-95.
[9]汪濤,馮學山,吳擢春.非隨機化醫學研究中風險比的一種估計方法[J].中國衛生統計,2004,21(5):38-41.
[10]Zheng L,Xia JL,Wang SZ,et al.Application of propensity score in non-randomized clinical trial[J].Modern Preventive Medicine,2009,36(15):2805-2809.(in Chinese)
鄭亮,夏結來,王素珍,等.非隨機化臨床試驗中傾向指數的應用[J].現代預防醫學,2009,36(15):2805-2809.
[11]李智文,任愛國.傾向評分法概述[J].中國生育健康雜志,2010,21(1):62-64.
[12]李智文,任愛國.傾向評分分層和回歸分析[J].中國生育健康雜志,2010,21(3):186-189.
[13]李智文,任愛國.傾向評分加權分析法[J].中國生育健康雜志,2010,21(4):251-253.
[14]王永吉.多分組資料傾向得分匹配法的研究[D].西安:第四軍醫大學,2011.
[15]Wang YJ,Cai HW,Xia JL,et al.Comparison of propensity score matching and Logistic regression[J].Modern Preventive Medicine,2011,38(12):2217-2219.(in Chinese)
王永吉,蔡宏偉,夏結來,等.傾向指數匹配法與Logistic回歸分析方法對比研究[J].現代預防醫學,2011,38(12):2217-2219.
[16]Wang SZ,Meng WJ,An HQ,et al.Outcome evaluation of hepatocellular cavcinoma patients after balancing ten covariates between groups through propensity score[J].Academic Journal of Second Military Medical University,2012,33(10):1090-1094.(in Chinese)
王素珍,孟維靜,安洪慶,等.傾向指數平衡組間混雜因素后的原發性肝癌療效評價[J].第二軍醫大學學報,2012,33(10):1090-1094.
[17]Wang SZ,Meng WJ,An HQ,et al.Comparison of effects between radiofrequency ablation and percutaneous etharol injection in treatment of hepatocellular carcinoma after balancing covariates betwween groups[J].Journal of Jilin University:Medicine Edition,2012,38(6):1068-1072.(in Chinese)
王素珍,孟維靜,安洪慶,等.平衡組間協變量后射頻消融術和經皮穿刺無水乙醇瘤內注射治療原發性肝癌效果的比較[J].吉林大學學報:醫學版,2012,38(6):1068-1072.
[18]Wang SZ,Meng WJ,An HQ,et al.Propensity score matching-based therapeutic effect evaluation in patients with hepatocellular carcinoma[J].J South Med Univ,2012,32(9):1234-1237.(in Chinese)
王素珍,孟維靜,安洪慶,等.基于傾向指數匹配法的肝癌病人療效評價[J].南方醫科大學學報,2012,32(9):1234-1237.
[19]Wang SZ,Meng WJ,Zhao XM,et al.Effect evaluation of hepatocellular carcinoma patients after propensity score matching[J].Journal of Zhengzhou University:Medical Sciences,2012,47(6):769-772.(in Chinese)
王素珍,孟維靜,趙曉蒙,等.經傾向指數匹配后的肝癌患者療效評價[J].鄭州大學學報:醫學版,2012,47(6):769-772.
[20]李先濤,胡鏡清,劉保延,等.復雜干預概述[C].西安:第四屆中國中西醫結合學會心身醫學專業委員會換屆大會暨第七屆全國中西醫結合心身醫學學術交流會,2013.
[21]Fu L,Zhou XP,Li GC."Real-world study"(RWS)——new spproach to traditional Chinese medicine scientific research[J].Journal of Zhejiang Chinese Medical University,2013,37(9):1127-1129.(in Chinese)
付玲,周學平,李國春.“真實世界研究”——中醫藥科研新思路[J].浙江中醫藥大學學報,2013,37(9):1127-1129.
[22]范軍銘.中醫藥臨床療效評價的新思路——CPOE模式[J].中醫研究,2012,25(4):1-6.
[23]Li ZW,Zhang L,Liu JM,et al.Application of propensity score matching in ten design of an epidemiological study[J].Chin J Epidemiol,2009,30(5):1127-1129.(in Chinese)
李智文,張樂,劉建蒙,等.傾向評分配比在流行病學設計中的應用[J].中華流行病學雜志,2009,30(5):1127-1129.
(本文編輯:崔沙沙)
Application of Propensity Score Method in the Clinical Research of Traditional Chinese Medicine
CUIWei-feng,WANGBing-quan,DONGYong-shu,etal.
HenanInstituteofTraditionalChineseMedicine,Zhengzhou450004,China
【Abstract】The paper introduced the basic theory and implementation process of propensity score method and reviewed its application and features in clinical research.Through the analysis of advantages of propensity score method in the research of TCM,we found that the use of the method in real-world clinical research of TCM can balance the confounding factors in research and make non-randomized studies change to random control research in a certain degree,which accords with the features of TCM,such as "holistic concept" and "treatment based on syndrome differentiation".Propensity score method is more fit for the real-world research of TCM.
【Key words】Medicine,Chinese traditional;Propensity score;Biomedical research
基金項目:國家自然科學基金面上項目(69788090);河南省領軍人才項目(2014-10);河南省科技攻關項目(162102310063)
通信作者:范軍銘,450004河南省鄭州市,河南省中醫藥研究院;E-mail:642596880@qq.com
【中圖分類號】R 24
【文獻標識碼】A
doi:10.3969/j.issn.1007-9572.2016.13.026
(收稿日期:2016-01-15;修回日期:2016-03-22)
·中醫·中西醫結合研究·