南方醫科大學公共衛生學院生物統計學系(510515)
唐欣然 黃耀華 曹穎姝 陳平雁△
【提 要】 目的 介紹平均累積函數(mean cumulative function,MCF)在臨床試驗重發不良事件分析中的應用,并提供分析所用SAS程序,通過實例闡述該方法與傳統方法的不同之處,為重發不良事件數據處理和分析提供方便可靠的工具。方法 首先介紹MCF方法基本原理,展示MCF點估計值及其置信區間,以及兩組間MCF逐點的差值及其置信區間的計算公式,并提供用于分析的SAS RELIABILITY過程步核心語句。最后通過一項降糖藥物臨床試驗實例分析組間不良事件發生情況,對比傳統方法和MCF方法在分析不良事件的區別。結果 SAS軟件RELIABILITY過程步可實現MCF在重發不良事件分析中的應用。實例中,傳統方法得到試驗組和對照組低血糖事件發生率分別為11.6%和11.7%,組間差異無統計學意義(P=0.958)。采用MCF方法,提示在治療40周內,試驗組和對照組的每個受試者低血糖事件平均累積發生頻數分別為0.11和0.19例次,組間MCF差值及95%CI為-0.08(-0.16,-0.01);但在治療40周之后,試驗組低血糖平均累積發生頻率明顯增加,組間MCF無顯著性差異。MCF方法能通過圖形直觀地觀察兩組不良事件累積發生的變化情況。結論 對于臨床試驗重發不良事件的分析,MCF相比傳統方法能提供更多信息,并且能將不良事件發生過程通過圖形展示,讓研究者更直觀充分地了解整個試驗階段不良事件的發生情況。
臨床試驗中的不良事件分析主要基于個體和事件兩個層面,前者多用發生率或風險比描述,用率或比的比較方法進行統計推斷;后者分為單發事件和重發事件(recurrent events)兩種情況,單發事件系指每個個體最多只發生一種或一次不良事件,重發事件系指每個個體可能發生兩種及以上不良事件或同一不良事件發生兩次及以上。對于單發事件,其分析方法與基于個體的方法無異;對于重發事件,則是臨床試驗中更為常見的現象,實踐中多用平均發生人次描述,而缺乏更深入的推斷分析。本研究將介紹在臨床試驗的重發不良事件分析中鮮有應用的平均累積函數(mean cumulative function,MCF)方法,并提供重發不良事件數據整理及分析所采用的SAS程序,通過實例闡述該方法與傳統方法的不同之處,以期為重發不良事件的數據處理提供方便可靠的工具。
1.平均累積函數
臨床試驗中的不良事件多具有重發事件的特征,并且在一定暴露時間內可能由于失訪或提前退出研究等原因發生事件刪失,Nelson[1]提出用于縱向數據分析的非參數MCF方法可以估計研究人群中平均每個個體在一定時間內事件發生的累積頻數。假設試驗中共n例受試者,在試驗期間可能在t1,t2,t3,…,tN時間點發生事件或刪失,那么到時間點tj,平均每個受試者不良事件發生的累積頻數可表達為[2]:
其中,ek是到時間tk累積發生的事件個數,nk-1是時間tk-1之后處于風險的人數,即可能發生事件或刪失的人數。在時間點tk-1處于風險的人數等于受試者總人數減去在時間tk-1之前刪失人數。對于單發不良事件,MCF就等同于發生該不良事件的受試者比例。
2.單組MCF置信區間
采用Nelson提出的MCF方差估計方法[1],平均累積函數MCF在t時間的雙側C%置信區間的估計表示為:
M(t)±KC{v[M(t)]}1/2
其中,M(t)是平均累積函數在t時間的點估計值,KC是標準正態分布(100+C)/2的百分位數,v[M(t)]是M(t)的方差估計,Nelson的文章介紹中展示了MCF方差估計的表達式。
3.MCF組間比較
兩組MCF的差值及其置信區間采用Doganaksoy和Nelson[3]提出的方法進行估計。兩組間MCF差值逐點的置信區間計算公式為:
[M1(t)-M2(t)]±KC{v[M1(t)]+v[M2(t)]}1/2
如果以上兩組MCF在時間t的置信區間不包含0,則提示兩組某事件到時間t的累積發生頻數差異有統計學意義。
4.MCF應用于臨床試驗不良事件分析
平均累積函數用于描述一定時間內平均每個個體發生不良事件的累積頻數,可反映不良事件的發生強度。MCF應用于臨床試驗不良事件分析的四大特點是:(1)能估計重發不良事件的累積發生頻數;(2)可考慮因失訪等原因導致的刪失數據和不同長度的隨訪時間;(3)可計算MCF逐點的置信區間,并用圖形直觀地展示;(4)可進行組間MCF的比較,計算組間MCF逐點的差值及置信區間,從而評價組間差異是否有統計學意義[4]。
此外M(t)點估計及其置信區間與t的關系圖可為研究者提供一些關鍵信息,包括至時間t平均每個受試者發生不良事件的累積頻數、不良事件的發生頻數是增加、減少還是不變,以及組間不良事件的平均累積頻數差異是否有統計學意義。通過個體和平均水平的MCF圖可以對數據中的任何異常情況獲得更多的了解。研究者可以使用SAS軟件的RELIABILITY過程步計算和繪制各組逐個時間點的M(t)及其置信區間,并進行組間MCF的比較[5-6]。
以下程序(1)應用DATA步實現將符合CDISC標準的ADAE(不良事件分析數據)和ADSL(受試者水平分析數據)轉化為用于MCF分析的數據;程序(2)采用RELIABILITY過程步計算和繪制各組逐點的M(t)及其置信區間,若將分組變量改為受試者編號變量(SUBJID),則可繪制每個受試者逐點的累積發生頻數圖;程序(3)采用RELIABILITY過程步的MCFDIFF選項計算并繪制組間逐點的MCF差值及其置信區間。
(1)/*將符合CDISC標準的ADAE和ADSL轉化成MCF分析數據*/
proc sort data=adae; by subjid; run; /*將ADAE和ADSL用SUBJID排序*/
proc sort data=adsl; by subjid; run;
data adae1; /*合并ADAE和ADSL,保留AE關鍵變量,識別有AE和未發生AE的受試者*/
merge adae(keep=SUBJID SAFFL AESEQ AETERM AEDECOD AEBODSYS ASTDT ASTDY AENDT AENDY where=(SAFFL=′Y′)in=ae)adsl(keep=SUBJID TRT01P TRT01PN SAFFL TRTSDT TRTEDT EOSDT EOSDY where=(SAFFL=′Y′));
by SUBJID;
if ae then withae=1;/*withae=1代表發生AE,=0代表未發生AE*/
else withae=0;
run;
/*變量解釋:SUBJID=受試者唯一識別碼、SAFFL=安全性分析集識別碼、AESEQ=AE序列碼、AETERM=AE名稱、AEDECOD=AE首選術語、AEBODSYS=AE系統器官分類、ASTDT=AE開始日期、ASTDY=AE開始日期距隨機天數、AENDT=AE結束日期、AENDY=AE結束日期距隨機天數;TRT01P=治療組別、TRTSDT=治療開始日期、TRTEDT=治療結束日期、EOSDT=試驗結束日期、EOSDY=試驗結束日期距隨機天數*/
data adae2; /*產生MCF分析數據集,value=1代表發生AE,value=-1代表完成試驗或刪失,days/weeks代表發生AE或完成試驗或刪失的時間*/
set adae1;
by SUBJID aeseq;
if withae=0 then do;
days=eosdy; value=-1; output;
end;
if withae=1 then do;
if last.SUBJID=1 then do;
days=astdy; value=1; output;
days=eosdy; value=-1; output;
end;
else if last.SUBJID=0 then do;
days=astdy; value=1; output;
end;
end;
weeks=days/7;
run;
(2)/*計算各組各時點MCF及其置信區間,并繪制MCF-時間曲線*/
proc reliability data=adae2;
unitid subjid;
mcfplot weeks*value(-1)=trt01p / overlay font=arial haxis=0 to 52 by 16 vaxis=0 to 1.5 by 0.25
i=step ;
run;
(3)/*計算兩組MCF差值及其置信區間,并繪制組間MCF差值-時間曲線*/
proc reliability data=adae2;
unitid SUBJID;
mcfplot weeks*value(-1)=trt01p / mcfdiff font=Arial haxis=0 to 52 by 16 vaxis=0 to 0.5 by 0.1
i=step ;
run;
一項多中心、隨機、雙盲、陽性藥物平行對照的Ⅲ期臨床試驗,評價某新型降血糖藥物治療對二甲雙胍單藥治療效果不佳的2型糖尿病患者的有效性和安全性,其中低血糖事件是特別關注的不良事件。研究將應用傳統不良事件的分析方法對治療期間發生的不良事件以及特別關注的低血糖事件發生率進行分析,并采用MCF方法與其比較。
通過傳統的不良事件發生率和例次的分析結果見表1。基于安全性分析集,在52周的治療期間,試驗組380例受試者中,共有148例(38.9%)發生316例次不良事件,其中44例(11.6%)發生68例次低血糖事件;對照組376例受試者中,共有144例(38.3%)發生284例次不良事件,其中44例(11.7%)發生76例次低血糖事件。對于總不良事件發生率和低血糖事件發生率,組間差異均無統計學意義。兩組間總不良事件和低血糖事件發生例次差異亦無明顯差異。

表1 不良事件發生情況(安全性分析集)
通過MCF方法,采用程序(2)繪制兩組總體不良事件逐點的MCF,見圖1。治療48周時兩組不良事件平均累積發生頻數均為0.75,圖中陰影邊界代表M(t)置信區間界限,兩組置信區間基本重疊,提示不良事件M(t)組間差異無統計學意義。
對于特別關注的低血糖事件,采用程序(2)繪制兩組低血糖事件的M(t),見圖2。兩組M(t)置信區間重疊較少,尤其是治療初期,對照組低血糖事件發生頻率明顯高于試驗組。

圖1 試驗組和對照組總體不良事件逐點MCF及置信區間

圖2 試驗組和對照組低血糖事件逐點MCF及置信區間
對于特別關注的低血糖事件,進一步采用程序(3)繪制低血糖事件逐點的組間MCF差值(試驗組MCF-對照組MCF)及其置信區間,見圖3。治療40周內,試驗組和對照組受試者低血糖平均累積發生頻數分別為0.11和0.19例次,組間MCF差值點估計及其95%CI為-0.08(-0.16,-0.01),置信區間上限小于0,提示試驗組低血糖事件發生頻率低于對照組;而治療40周之后,試驗組低血糖平均累積發生頻數明顯增加,此后兩組MCF差異無統計學意義。

圖3 組間低血糖事件MCF差值及置信區間
本文實例展示了傳統方法和MCF方法分析不良事件的區別,傳統方法的結果僅分析了發生不良事件的例數、例次和發生比例的相關信息,得到兩組之間差異無統計學意義的結論(11.6%VS 11.7%),對于不良事件在整個觀察時間段發生情況如何變化,是否會因為觀測時間段不同而呈現不一樣的規律不得而知。MCF方法卻能在這些方面發揮其優勢,進行組間MCF的比較,計算不同時間點下組間MCF逐點的差值及置信區間,從而更加全面評價組間差異是否有統計學意義。在隨機對照臨床試驗的重發不良事件分析中,MCF方法可以結合縱向數據的特征,考慮刪失數據,基于不依賴數據分布特征的非參數方法,估計個體在一定時間內不良事件的平均累積發生頻數,通過圖形直觀地觀察不良事件累積發生的變化情況。基于SOC/PT或受試者水平的平均累積發生頻率描述,可以用于不良事件的探索性分析,也可用在臨床試驗進行過程中的數據監管,來發現異常數據和情況。MCF還可以通過統計推斷估計置信區間,對組間不良事件發生強度進行比較,對試驗不同階段的不良事件發生情況做更深層的分析和解讀。另外,本文展示了MCF分析不良事件的SAS程序,程序所使用的是臨床試驗常用的數據集和相關變量,研究者只要基于符合CDISC標準的ADSL和ADAE數據集,便可直接套用此段程序,避免了繁雜的編程過程,大大提高了效率。
除了MCF方法,Poisson回歸和生存分析等方法也可用于重發事件的推斷分析[7-8],實例中作者通過
Gamma-Poisson回歸得到組間(試驗組vs.對照組)低血糖事件發生率的率比(RR,ratio rate)和95%CI為0.91(0.55,1.50),P值為0.710;通過生存分析獨立增量模型得到組間低血糖事件發生風險比(HR,hazard ratio)和95%CI為0.83(0.59,1.15),P值為0.437。以上兩種方法只能評估整個試驗階段重發不良事件的平均發生強度,而無法實現各時間點事件發生強度的組間比較。幾種常用方法和MCF在隨機對照試驗中的重發事件分析的應用和更深入的比較將在后續研究中報道。