南方醫科大學公共衛生與熱帶醫學學院生物統計學系(510515) 張惠風 段重陽 陳方堯 陳平雁
樣本量估計及其在nQuery和SAS軟件上的實現*
——率的比較(四)
南方醫科大學公共衛生與熱帶醫學學院生物統計學系(510515) 張惠風 段重陽 陳方堯 陳平雁△
*教育部重點課題(DIA070113)
△通訊作者:陳平雁
2.1.1.1 兩組構成比檢驗
方法:Lachin(1977)〔4〕提出的兩組構成比的樣本量估計是建立在自由度為c-1,非中心參數為2NΔ2的非中心χ2分布基礎上。檢驗效能計算公式為

式中,π1j和π2j分別是兩組第j類的總體構成比;Δ2為效應量;c為分類數;n為每組樣本量。樣本量可以用循環逼近的方法根據式(2-28)求得。
〔例2-12〕某研究欲驗證A、B兩種基因標記物是否與兩種炎性腸病(Crohn's病和潰瘍性結腸炎)有關。預實驗的結果如表2-4所示。如果每組樣本量為40例,試計算檢驗效能是多少。

表2-4 兩種基因標記物在兩種腸病中顯示的構成
nQuery Advisor 7.0實現:設定檢驗水準 α=0.05;c=4;n=40。在nQuery Advisor 7.0主菜單選擇:

方法框中選擇:Two-group Chi-square test comparing
proportions in C categories.
注意,首先應根據兩組每類構成比對效應量Δ2進行估計,在菜單欄中選擇:
Assistants:⊙Compute Effect Size
彈出輔助計算窗口。依據上述基礎數據,在彈出的計算窗口將各參數值鍵入,如圖2-27所示,結果為Δ2=0.194。

圖2-27 nQuery Advisor 7.0關于例2-12樣本量估計中效應量的計算結果
在彈出的檢驗效能計算窗口將各參數值鍵入,如圖2-28所示,結果為1-β=0.92。

圖2-28 nQuery Advisor 7.0關于例2-12樣本量估計的參數設置與計算結果
SAS9.2軟件實現:

SAS運行結果見圖2-29。
2.1.1.2 CMH 檢驗
方法:Nam(1992)〔10〕提出二分類CMH檢驗的樣本量估計公式為

圖2-29 SAS9.2關于例2-12樣本量估計的參數設置與計算結果

其中,π1c和π2c分別為對照組和試驗組第c層(c=1,2,…k)的陽性率;OR為公共比值比;fc為第c層占的比。
〔例2-13〕某項臨床試驗欲驗證一種預防夜間胃灼痛的新藥療效是否優于安慰劑。由于身體質量指數(BMI)可能對治療的反應率有影響,故本試驗根據BMI進行分層設計,各層的比例按照目標人群的分布,即BMI<25的為35%,25≤BMI<30的為45%,BMI≥30的為20%。根據以往研究報道,對照組各層陽性事件發生率分別為0.5、0.4、0.3,試驗組相對于安慰劑組的公共OR值為1.6,試估計檢驗效能為90%時的樣本量。
nQuery Advisor 7.0實現:設定檢驗水準α=0.05;分層數k=3;1-β=0.9;采用雙側檢驗,即取s=2。
在nQuery Advisor 7.0主菜單選擇:

方法框中選擇:Mantel-Haenszel(Cochran)test。
注意,首先應根據總體各層陽性事件發生率和在總體中各層占的比對D1、V0和V1進行估計,在菜單欄中選擇:
Assistants:⊙Compute Effect Size
彈出輔助計算窗口。依據上述基礎數據,各層占比分別為0.35、0.45、0.20,各層對照組的陽性率分別為0.50、0.40、0.30,在彈出的計算窗口將各參數值鍵入,如圖2-30所示,結果為D1=0.114、V0=0.244、V1=0.240。
在彈出的檢驗效能計算窗口將各參數值鍵入,如圖2-31所示,結果為n=393。
SAS9.2軟件實現:

圖2-30 nQuery Advisor 7.0關于例2-13樣本量估計中效應量的計算結果

圖2-31 nQuery Advisor 7.0關于例2-13樣本量估計的參數設置與計算結果

SAS運行結果:

圖2-32 SAS9.2關于例2-13樣本量估計的參數設置與計算結果
2.1.1.3 校正CMH檢驗
方法:Nam(1992)〔10〕同時給出了校正CMH檢驗的樣本量估計公式,

式中,n'為校正CMH檢驗的樣本量,n為根據式(2-29)求得的樣本量。
2.1.2 等效性檢驗
2.1.2.1 兩樣本率比較的等效性檢驗
方法:Machin & Campbell(1987)〔7〕提出的兩樣本率的等效性檢驗的樣本量估計建立在正態近似的基礎上,其公式為

式中,πS是對照組的總體陽性率;πT是試驗組的總體陽性率;Δ1=πT-πS;Δ0是等效性界值,其符號由試驗組與對照組陽性率之差的符號決定。
〔例2-14〕某臨床試驗欲對一款新研發的人工髖關節進行臨床驗證。試驗采用非劣效驗證,以目前臨床應用最多的一款人工髖關節為對照。據以往研究報道,使用現有人工髖關節進行髖關節置換,兩年成功率在90~95%。我們假定兩年成功率的非劣效界值為-0.05(試驗組-對照組),并預期試驗組的兩年成功率與對照組相等。如果我們用平衡設計,設定檢驗水準為0.05,檢驗效能為85%,試計算樣本量。
nQuery Advisor 7.0實現:設定檢驗水準 α=0.025(等效性檢驗取雙單側界值,等價于雙側的0.05);1-β=0.85。
在nQuery Advisor 7.0主菜單選擇:

方法框中選擇:Two group test of equivalence in proportions。
在彈出的樣本量估計窗口將各參數值鍵入,如圖2-33所示,如果試驗組的兩年成功率為90%,則所需樣本量為647例;如果為95%,則樣本量為342例。

圖2-33 nQuery Advisor 7.0關于例2-14樣本量估計的參數設置與計算結果
SAS9.2軟件實現:


SAS運行結果:

圖2-34 SAS9.2關于例2-14樣本量估計的參數設置與計算結果
2.1.2.2 基于非劣效下限的檢驗(試驗組-對照組)
方法:Newcombe(1988)〔11〕提出的兩樣本率比較的等效性或非劣效驗證的樣本量估計是基于可信區間的方法,通過模擬實現的。首先模擬產生四格表資料,然后使用Newcombe-Wilson score的連續校正方法計算觀察可信區間,如果該區間的下限小于事先所確定的非劣效下限,則記為成功,然后將總的成功次數除以總的模擬次數就是所需要的檢驗效能。計算公式如下:


l1和u1是關于 π1的方程 |π1-a/m|=z1-α/s的根,l2和u2是關于π2的方程|π2-的根。
式中, θ為總體率差θ=π1-π2的估計值,m和n分別是兩組的樣本量,a和b分別是兩組的陽性例數,π1和π2分別是兩總體率。
〔例2-15〕以例2-14為例,試根據非劣效界值的下限為-0.05估計樣本量。
nQuery Advisor 7.0實現:設定單側檢驗水準α=0.025;模擬次數5100次;隨機數種子35。在nQuery Advisor 7.0主菜單選擇:

方法框中選擇:Two group test of equivalence in proportions(using Confidence Interval)。
在彈出的檢驗效能計算窗口將各參數值鍵入,如圖2-35所示,如果試驗組的兩年成功率為90%,則所需樣本量為658例;如果為95%,則樣本量為369例。

圖2-35 nQuery Advisor 7.0關于例2-15檢驗效能估算的參數設置與計算結果
SAS9.2軟件實現:


SAS運行結果:

圖2-36 SAS9.2關于例2-15樣本量估計的參數設置與計算結果
2.1.2.3 基于非劣效上限的檢驗(試驗組-對照組)
方法:將上述基于非劣效下限檢驗改為上限,這里就不贅述。
2.1.2.4雙單側等效性檢驗(試驗組-對照組)
方法:將兩樣本率比較基于非劣效下限檢驗和上限檢驗的樣本量估計結合在一起就是所謂的雙單側等效性檢驗。
〔例2-16〕以例2-14為例,應用Newcombe-Wilson Score方法估計樣本量。
nQuery Advisor 7.0實現:設定單側檢驗水準α=0.025,則雙側為0.05;模擬次數5100次;隨機數種子35。在nQuery Advisor 7.0主菜單選擇:

方法框中選擇:Two group test of equivalence in proportions(using Confidence Interval)Two sided confidence interval for πT-πS。
在彈出的樣本量計算窗口將各參數值鍵入,如圖2-37所示,如果試驗組的兩年成功率為90%,則所需樣本量為843例;如果為95%,則樣本量為466例。

圖2-37 nQuery Advisor 7.0關于例2-16樣本量估計的參數設置與計算結果
SAS9.2軟件實現:


SAS運行結果:

圖2-38 SAS9.2關于例2-16樣本量估計的參數設置與計算結果