南方醫科大學公共衛生學院生物統計學系(510515) 吳海燕 劉偉杰 傅利強 譚旭輝
【提 要】 目的 使用內部預試驗解決成組序貫設計中方差未知時樣本量估計的問題,同時得出內部預試驗適宜的樣本量。方法 以兩樣本均數比較的優效性檢驗為分析目的,利用損耗函數法在拒絕型成組序貫設計下,通過設定不同的內部預試驗樣本量、方差真實值和方差估計值,計算方差重估法的Ι類錯誤、功效Power和平均樣本量。結果 方差估計正確時,方差重估法能控制Ι類錯誤,功效和平均樣本量隨著內部預試驗樣本量n0的增加而增加,當n0≥20時能獲得較好的功效和適宜的平均樣本量;方差估計錯誤時,方差重估法同樣能控制Ι類錯誤且不會出現傳統成組序貫設計中功效過高或過低的情況,當標準差估計值s為10,標準差真實值σ分別為6、8、12和14時,該方法的功效分別為0.895、0.886、0.887和0.887。結論 方差重估法能有效解決成組序貫設計中方差未知的問題,避免了方差錯誤估計時導致的功效異常。
在臨床試驗中,成組序貫設計(group sequential design)由于能夠有效降低試驗所需樣本量和提前結束試驗而成為了較好的設計選擇[1]。損耗函數法(error spending function method)[2]是成組序貫設計中一種常用的方法。為了使試驗能夠以一定的功效發現處理組間的差異,試驗設計階段必須合理估計所需的樣本量,但在試驗設計之初用于估計樣本量的方差往往是未知的,其估計值通常來源于以往的經驗和文獻回顧。如果設計方差估計過大,會造成資源的浪費;反之,會導致功效不足。Wittes&Brittain[3]針對這一問題提出利用內部預試驗(internal pilot studies,IPS)來重新估計方差。其中,重新估計方差可在盲態和揭盲狀態下進行,為保證試驗的完整性,一般在盲態下進行。故本文在大樣本成組序貫設計的條件下,利用內部預試驗在盲態條件下對設計方差進行重估,比較基于內部預試驗的方差重估法和傳統成組序貫設計的優劣,為該方法在成組序貫設計中的應用提供理論參考。
1.成組序貫設計
成組序貫設計能在試驗過程中對已經累積的數據進行多次期中分析。由于期中分析[4]為試驗提供了提前終止的可能,成組序貫設計可以顯著減少試驗樣本量,縮短試驗周期。從設計角度來看,成組序貫設計將試驗劃分成K個連續的階段,每個階段內都有新的受試者加入。當第k個階段(k=1,2,…,K)結束后,把之前所有階段的試驗結果累積起來進行一次統計分析。對于拒絕型的成組序貫設計,如果拒絕H0則試驗結束,否則繼續下一階段試驗。在最后的試驗階段,其結果只能是接受H0或拒絕H0[5]。
損耗函數法是成組序貫設計臨界值計算的一種方法,每階段損耗的I類錯誤為αk,總I類錯誤α=α1+…+αK,具體損耗過程如下[6]:
α1=f(I1/IK)
(1)
αk=f(Ik/IK)-f(Ik-1/IK),k=2,…,K
(2)
每階段分析的臨界值ck滿足以下條件:
Pr{Z1≥c1}=α1
(3)
Pr{Z1 (4) 其中Ik為第k階段累積信息量,f(t)=min(αt3,α)為選定的損耗函數,Zk為第k次期中分析的檢驗統計量。 2.基于內部預試驗的成組序貫設計 在功效一定的情況下估計樣本量,往往需要知道一些未知參數的估計值,例如方差或事件率,而這些參數在試驗設計階段通常是無法準確獲得的。解決這類問題的常用辦法是在主要試驗開始之前進行初步的預試驗研究[6]。Wittes&Brittain[3]在其研究中利用內部預試驗估計方差并重新估計試驗所需的樣本量。該方法允許利用首批進入試驗的部分受試者信息對相關未知參數進行估計。相關研究表明,該方法可以解決試驗設計中方差估計不準所導致的樣本量偏差[7-10]。 現以兩均數比較的優效性成組序貫設計為例,利用內部預試驗對方差進行重新估計。在研究設計開始時,方差σ2的估計值大多數源于以往的經驗或文獻,假定其估計值為s2,在單側檢驗水準為α、兩均數之差為δ和總階段數為K的情況下,為使功效達到1-β,試驗所需總樣本量由公式(5)算出。 n=R(K,α,β)nf(α,β,δ,s2) (5) (6) 其中,nf(α,β,δ,s2)={Φ-1(1-α)+Φ-1(1-β)}22s2/δ2 τ={Φ-1(1-α)+Φ-1(1-β)}22R(K,α,β)/δ2,R(K,α,β)是根據K,α,β確定的常數,其取值要滿足檢驗所需的功效。 (7) (8) (9) 在大樣本條件下,本文通過隨機模擬研究,對拒絕型損耗函數法成組序貫設計條件下方差重估法的實際效果進行評估,并對內部預試驗的樣本量進行探討。在此基礎上,對方差重估法和傳統成組序貫設計的優劣性進行比較。 本文以兩樣本均數比較的成組序貫為設計框架,采用SAS 9.4隨機產生模擬研究的數據。本模擬過程分為兩個部分,設計框架均為優效性假設檢驗H0:θ≤0,H1:θ>0(δ=2),單側α=0.05,β=0.1(即Power=0.9),成組序貫設計方法為損耗函數法,其中損耗函數為f(t)=min(αt3,α),階段數K=5,模擬次數為2000次;δ為效應差值,試驗組均值Mt=5或7,對照組均值Mc=5,σ為標準差真實值,s為標準差估計值,每階段每組樣本量m=30、50或100,內部預試驗樣本量n0設定為20或根據內部預試驗樣本比例ρ計算,其中ρ=0.25,0.5,0.75。對于非劣效性假設檢驗H0:θ≤-Δ,H1:θ>-Δ(Δ為非劣效界值),當非劣效界值為0時,本文所設定的統計優效性假設檢驗實際上等價于非劣效性假設檢驗。 1.模擬比較一 在方差估計正確的條件下(即σ=s,其中σ為標準差真實值,s為標準差估計值),用不同的標準差σ、內部預試驗樣本量n0計算方差重估法的I類錯誤、功效(power)和平均樣本量(average sample number,ASN)等指標,得出適宜的內部預試驗樣本量n0。具體參數設置如表1所示: 表1 參數設定(模擬一) 2.模擬比較二 在方差估計錯誤的情況下(即σ≠s),使用傳統的成組序貫設計能控制住總體Ι類錯誤,但功效不能保持。當設計方差(即總體方差估計值)偏離總體方差真實值時,功效通常會出現低估或高估的情況。因此本研究采用方差重估法解決這一難點問題。根據模擬比較一的結果,我們在內部預試驗樣本量n0=20的情況下計算方差重估法的總體Ι類錯誤、功效和平均樣本量等指標,評價該方法的優劣。具體參數設置如表2所示: 表2 參數設定(模擬二) 1.模擬比較一 在方差估計正確的情況下,按照表1的參數設置進行模擬研究,方差重估法的Ι類錯誤、功效(power)和平均樣本量(ASN)如表3所示。由表3的模擬結果可以看出,方差重估法可以較好地將Ι類錯誤控制在0.05左右。在大樣本條件下,總樣本量和內部預試驗樣本量的變化對Ι類錯誤影響不大。陰性研究的平均樣本量隨著內部預試驗樣本量的增加輕微增加。 在陽性研究條件下,功效受內部預試驗樣本量的影響較大,內部預試驗的樣本量越大,功效越高。當σ=5.8且n0=8和σ=7.5且n0=13時,功效分別為0.875和0.878。由此可見,當內部預試驗樣本量較小時,功效偏低。陽性研究的平均樣本量也隨內部預試驗樣本量的增加而略微增加。在大樣本成組序貫設計條件下,內部預試驗樣本量在20以上時,功效均能較好的維持在0.9左右。 2.模擬比較二 在方差估計錯誤的情況下,按照表2的參數設置進行模擬研究,方差重估法的Ι類錯誤、功效(power)和平均樣本量(ASN)如表4所示。由表4的模擬結果可以看出,當內部預試驗樣本量為20時,在方差估錯的情況下,方差重估法與傳統的成組序貫設計一樣能較好地控制Ι類錯誤在0.05左右。 表3 方差估對時Ι類錯誤、功效(power)和平均樣本量(ASN) 就功效和平均樣本量來看,方差重估法能較好地維持住功效和獲得適宜的平均樣本量。當方差真實值小于方差估計值時,傳統成組序貫設計的功效均明顯高于設定功效0.9,而方差重估法的功效均能控制在0.9左右,其平均樣本量明顯低于傳統成組序貫設計;當方差真實值大于方差估計值時,傳統成組序貫設計的功效明顯低于設定功效0.9,而方差重估法的功效依舊能較好維持功效在0.9左右,其平均樣本量相較于傳統成組序貫設計有明顯的提高。 表4 方差估錯時Ι類錯誤、功效(power)和平均樣本量(ASN) 當方差估計錯誤時使用傳統的成組序貫設計會導致功效得不到保證,當方差真實值小于方差估計值時會導致功效過高,造成樣本量不必要的浪費;當方差真實值大于方差估計值時會導致功效過低,說明試驗的樣本量不足。通過模擬研究二我們發現方差重估法能較好的解決這個問題。從實際效果來看,當方差真實值小于方差估計值時,方差重估法能降低過高的功效,避免樣本量的浪費。在使用內部預試驗重估樣本量的過程中,會存在重估樣本量低于設計樣本量的情況。而在實際臨床試驗的過程中,減少試驗樣本量有時是很難被人接受的。按照Wittes[3]和Birkett[9]的觀點,當出現重估樣本量低于設計樣本量的時候,應繼續使用原來設計時樣本量,從而使得樣本量在試驗過程中只增不減。如果在方差重估法中使用這種樣本量“只增不減”的策略,此時基于內部預試驗的方差重估法必然也會導致功效過高和樣本量增加的情形。因此,在試驗過程中如要降低樣本量并維持住功效,那么基于內部預試驗所得的方差估計值必須足夠精確和可信。這就需要內部預試驗的樣本比例ρ不能太低,我們認為內部預試驗樣本比例ρ在75%以上時,基于內部預試驗的方差估計值是可信的。當方差真實值大于方差估計值時,該方法能提高功效,避免功效過低。在此過程中,方法重估法一般情況下并不會出現重估樣本量低于設計樣本量,即減少樣本量的情況。 在臨床試驗中可能會存在早期試驗數據不穩定的情況,這種不穩定會導致方差重估法估計方差時出現偏差,從而對樣本量的重估計產生較大的影響。因此,針對早期數據不穩定的情形,可通過適當的增加內部預試驗的樣本量來減少估計偏差(例如ρ增大到75%)。另外,在每次期中分析后,利用已有的數據進行方差重估,并重新計算下一階段的樣本量,也可有效解決早期數據不穩定導致的樣本量錯估問題。由于此方法屬于適應性設計,不屬于經典成組序貫設計范疇,故本文不做討論。 綜上所述,在大樣本成組序貫試驗中,當設計方差大于真實方差時,對于重估樣本量小于設計樣本量的情況需慎重處理,尤其是要考慮內部預試驗樣本量和早期不穩定的試驗數據對方差估計值的影響。當設計方差低于真實方差且早期試驗數據較穩定時,可采用基于內部預試驗的方差重估法對樣本量進行重估計,從而避免因為設計方差的錯誤估計導致試驗設計功效的異常。


模擬比較


結 果


討 論
