胡純嚴 ,胡良平 ,2*
(1.軍事科學院研究生院,北京 100850;
2.世界中醫藥學會聯合會臨床科研統計學專業委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
在對臨床資料進行統計分析時,研究者常選擇的統計分析方法是差異性檢驗。其中,一般差異性檢驗[1-3]僅考慮差異是否具有統計學意義,而3種特殊差異性檢驗,即非劣效性檢驗、等效性檢驗和優效性檢驗[4]除了考慮差異應具有統計學意義外,還需要考慮應具有“臨床意義”。本文將結合臨床實際,介紹與“兩總體率比較的等效性檢驗”有關的內容。
等效性檢驗是指主要研究目的為顯示兩種治療效果之間的差別大小在臨床上并無重要意義的試驗。在試驗設計階段需要設定等效性界值(δL,δU)來界定兩種藥物或兩種治療方案的等效性[4-5]。
【例1】一個新的抗腫瘤藥物A與臨床有效藥物B對照進行臨床試驗,選取300例符合要求的患者并隨機均分成兩組,分別接受A藥和B藥治療。試驗結果為A藥的有效率是58.00%(有效例數n=87),B藥的有效率是46.00%(有效例數n=69)。現根據臨床實際,設置等效性界限為10%,試問兩種藥物是否等效[6]?臨床資料見表1。

表1 兩組患者的治療效果
【對數據結構的分析】該資料的試驗因素為“藥物種類”,其兩個水平分別為“藥物A”與“藥物B”,觀測指標為“有效率”,所以該資料為成組設計一元定性資料。
【統計分析方法的選擇】研究者的研究目的是評價兩種藥物抗腫瘤效果是否等效,并且設定了等效性界值δL=-10%、δU=10%,這時應選用等效性檢驗。
【例2】在伊曲康唑治療手足癬的平行對照臨床試驗中,335例患者入選,166例患者服用伊曲康唑400 mg/d,服藥1周(治愈92例),169例患者服用伊曲康唑100 mg/d,連續服藥4周(治愈98例)。設定等效性界值為12%,試問兩種治療方案是否等效?臨床資料見表2。

表2 兩組患者的真菌感染治愈率
1.3.1 檢驗假設
規定整個等效性檢驗的檢驗水準α(每個單側檢驗的檢驗水準為α'=α/2)的值。

1.3.2 檢驗統計量

在式(1)和式(2)中,檢驗統計量Z服從標準正態分布;(PT、nT)與(PR、nR)分別為試驗組(T)與對照組(R)的“樣本率、樣本含量”;δL與δU分別為等效性界值的下限(下限取負值)與上限。
1.3.3 基于檢驗統計量Z的取值計算單側尾端概率
根據檢驗水準查表或借助相應的SAS函數進行計算,獲得檢驗統計量Z的臨界值(針對手工計算而言)和(或)標準正態分布尾端的概率(針對統計軟件而言)。
1.3.4 得出統計學結論和專業結論
根據拒絕還是不能拒絕H0的結果,得出統計學結論,最后結合專業知識得出專業結論。需注意,須同時拒絕H0(1)和H0(2),方能得出等效性結論。
基于SAS語言和標準正態分布函數等知識[7]并按式(1)和式(2)進行編程,就可間接實現兩總體率比較等效性Z檢驗。
由于典型的太行山地質構造,受儲水層含水量的限制,和順縣境內泉水出漏量較小,聯村集中供水工程不易采用泉水作為供水水源,而單村供水水源采用較多。主要優點:(1)當地的水資源達到充分利用,有效控制了地下水的開采量,使所屬區域的地下水得到充分涵養。(2)山泉水水質優良是很好的飲用水水源。(3)水源建設形式簡單,投資費用較小,多數山泉水所處地形較高屬于高地泉,水借重力流向高位水塔,后期運行費用低。
SAS程序如下:

【程序說明】變量名后面的“_t”與“_r”分別代表“試驗組”與“對照組”相應的量(包括樣本含量與有效率)。等效性下界值應采用負值來表示。
【SAS輸出結果】

【統計學結論】因Z1=3.841,P=0.000061(單側概率)<0.025,所以,應拒絕H0(1),接受H1(1),又因Z2=0.349,P=0.63654(單側概率)>0.025,所以,應接受H0(2)。
【專業結論】在等效界值為(-0.10,0.10)的前提條件下,藥物A與藥物B不等效。
由于SAS中FREQ過程包含了幾乎絕大多數定性資料假設檢驗方法[8],所以,此處將采用此過程來直接實現兩總體率比較等效性Z檢驗。
SAS程序如下:

【程序說明】各組中的數據應為“有效例數”與“無效例數”,而不適合直接采用“有效率”。程序中equiv表示進行等效性檢驗,MARGIN=0.10表示等效界值(即下界值為-0.10、上界值為0.10),若下界值與上界值的絕對值不相等,需要明確寫出,例如:MARGIN=(-0.12,0.15)(注意:下界值必須采用負數)。
第1部分輸出結果:

第2部分輸出結果:

【統計學結論】由第1部分輸出結果可知:因Z1=3.8414,P<0.0001(單側概率)<0.025,所以,應拒絕H0(1),接受H1(1)。又因Z2=0.3492,P=0.6365(單側概率)>0.025,所以,應接受H0(2)。由第2部分輸出結果可知:兩總體率之差的90%置信區間為[0.0258,0.2142],該區間包含了等效性上界值δU=0.10,說明與上界值對應的等效性檢驗未通過,即不等效。
【專業結論】在等效界值為(-0.10,0.10)的前提條件下,藥物A與藥物B不等效。
等效性檢驗結果不是絕對的,隨著條件的改變,最終的檢驗結果也會發生相應的改變。具體地說,影響其結果的因素有“顯著性水平α”“等效性界值(δL,δU)”和“樣本含量”。
3.1.1 α的取值對等效性檢驗結果的影響
等效性檢驗結果與顯著性水平α有密切關系。現以例2的數據為例,若取每個單側檢驗的顯著性水平α=0.025,等效界值取為(-0.12,0.12),計算結果為Z1=1.7428,P=0.0407>α=0.025;Z2=-2.6911,P=0.0037<α=0.025,結論為兩藥不等效。若取每個單側檢驗的顯著性水平α=0.05,由前面的計算結果(兩個P值都小于0.05)可知,結論為兩藥等效。
3.1.2 等效性界值(δL,δU)的取值對等效性檢驗結果的影響
等效性檢驗結果與等效性界值(δL,δU)的取值也有密切關系。現仍以例2的數據為例,若取每個單側檢驗的顯著性水平α=0.025,等效界值取為(-0.12,0.12),計算結果為Z1=1.7428,P=0.0407>α=0.025;Z2=-2.6911,P=0.0037<α=0.025,結論為兩藥不等效。若取每個單側檢驗的顯著性水平α=0.025,等效界值取為(-0.14,0.14),計算結果為Z1=2.1123,P=0.0173<α=0.025;Z2=-3.0606,P=0.0011<α=0.025,結論為兩藥等效。
3.1.3 樣本含量對等效性檢驗結果的影響
若保持“3.1.3”中“兩藥不等效”情況的大部分條件不變,僅改變樣本含量,例如,兩組樣本含量都擴大10倍,即A藥組有效例數為920例,無效例數為740例;B藥組有效例數為980例,無效例數為710例。計算結果為Z1=5.5113,P<0.0001;Z2=-8.5100,P<0.0001,結論就變為“兩藥等效”。即使樣本含量擴大2倍,也能得出“兩藥等效”的結論。需注意的是,在擬開展等效性試驗研究之初期,就應當按照已知的條件[包括兩組估計的有效率、顯著性水平α的值、檢驗效能(1-β)的值和等效性界值(δL,δU)的值],找到相應的計算公式,估計出合適的樣本含量[4]。
本文介紹了兩總體率比較等效性Z檢驗的原理、方法和SAS實現。在SAS實現方面,介紹了基于SAS語言編程間接實現兩總體率比較等效性Z檢驗以及基于SAS中FREQ過程直接實現與前面提及的相同計算。在后者中,還給出了兩總體率之差的置信區間。基于置信區間也可以判斷等效性結論是否成立。