999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

如何正確運用χ2檢驗
——生存資料的似然比檢驗和六種非參數檢驗與SAS實現

2021-11-04 08:31:32胡純嚴胡良平
四川精神衛生 2021年5期
關鍵詞:方法

胡純嚴 ,胡良平 ,2*

(1.軍事科學院研究生院,北京 100850;2.世界中醫藥學會聯合會臨床科研統計學專業委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

在臨床研究中,生存資料出現的頻率很高[1-7]。生存時間t是生存資料中的結果變量,它具有兩個明顯的特點:①生存時間一般不服從正態分布;②生存資料中常包含刪失數據或稱為不完全數據。因此,對生存資料進行統計分析的方法有別于常規的統計分析方法。本文將結合實例,介紹單因素和多因素生存資料的差異性檢驗方法,包括似然比檢驗方法和六種非參數檢驗方法。

1 生存函數假設檢驗的基礎

1.1 生存函數的定義

生存分布函數(SDF)也叫生存函數,常用符號S(t)表示,它描述感興趣的總體(群體)的壽命時間[8]。在t時刻SDF的估計值是來自總體的試驗單元(或受試對象)的壽命時間超過t的概率,即有下式:

式(1)中的S(t)為生存函數,T是隨機選擇的一個試驗單元(或受試對象)的壽命時間。

1.2 基本變量的定義

讓t1<t2<…<tD代表不同的事件時間。對每一個i(i=1,2,…,D),讓Yi代表ti時刻之前的生存單元數目(即風險集的大小),讓di代表ti時刻的失效或死亡的數目。

1.3 生存函數的估計

1.3.1 生存函數的Breslow估計

注意:Breslow估計是累計危險函數的負Nelson-Aalen估計的指數。

1.3.2 生存函數的Fleming-Harrington估計

如果頻數值不是整數,就不能計算Fleming-Harrington估計。

1.3.3 生存函數的Kaplan-Meier估計

在ti時刻的生存函數的Kaplan-Meier估計(乘積-極限)是累計乘積:

注意:式(2)、式(3)、式(4)定義的生存函數估計量都是右連續的,也就是說,在ti時刻發生的事件應該被包含在S(ti)的估計之中。

1.4 生存函數的標準誤

由Kalbfleisch和Prentice于1980年提出生存函數標準誤的格林伍德(Greenwood)估計公式如下:

1.5 兩個或多個生存函數相等的檢驗假設

讓K代表組數,Sk(t)代表第k組中的生存函數(k=1,2,…,K)。于是,被檢驗的無效假設和備擇假設分別如下。

H0:S1(t)=S2(t)=…=SK(t),對于所有的t≤τ都成立;

H1:至少有一個Sk(t)是不同的,對于某些t≤τ成立。

2 未分層生存函數相等的假設檢驗計算公式

2.1 似然比檢驗

Lawless于1982年基于各組生存資料服從指數分布的假定,推導出檢驗前述“檢驗假設”的似然比統計量[8],見下式:

在式(6)中,χ2是服從自由度為df=K-1的χ2分布的隨機變量(此處也叫做“檢驗統計量”);Nk為第k組中事件總數(在生存分析中為“死亡”人數);;Tk為第k組中參與檢驗的全部生存時間之和;。

2.2 六種非參數檢驗

2.2.1 六種非參數檢驗的名稱

在SAS/STAT的“LIFETEST”過程中,有六種用于比較兩組或多組生存資料的生存函數是否相等的假設檢驗方法[8],分別是對數秩(Log-rank)檢驗、威爾科克森(Wilcoxcon)檢驗、Tarone-Ware檢驗、Peto-Peto檢驗、修正的Peto-Peto檢驗和Harrington-Fleming(p,q)檢驗。

2.2.2 基本變量的定義

讓(Ti,δi,Xi),i=1,2,…,n,代表具有右刪失生存資料的一個獨立樣本,Ti是一個可能的右刪失的時間;δi是一個刪失的指示變量(δi=0代表Ti是刪失時間,δi=1代表Ti不是刪失時間,即事件發生的時間);Xi=1,2,…,K代表K個不同的組;讓t1<t2<…<tD代表樣本中不同的事件時間。在時刻Tj,讓W(tj)代表一個正權重函數(簡稱“權函數”),讓Yjk和djk分別代表第k組中的風險集的大小和事件的數目,其中,。再分別讓。

2.2.3 六種非參數檢驗對應的權函數

六種非參數檢驗的檢驗統計量無論是在本質上還是在表達形式上都是一樣的,所不同的僅僅是權函數,見表1。

表1 生存資料六種非參數檢驗對應的權函數

2.2.4 六種非參數檢驗的共同檢驗統計量

六種非參數檢驗的共同檢驗統計量見式(7):

在式(7)中,χ2服從自由度為df=矩陣V的秩的χ2分布;v'是v的轉置向量;V-是矩陣V的廣義逆矩陣。式(7)中等號右邊各變量的具體含義如下:

在式(8)中,各分量的計算公式見式(10):

在式(10)中,W(tj)為權函數,其定義參見前面的表1。在式(9)中,V是由vk的方差和vk與vh之間的協方差組成的矩陣,其各元素的定義如下:

2.3 校正的對數秩檢驗

校正的對數秩檢驗的檢驗統計量見式(13):

在式(13)中,χ2服從自由度為K-1的χ2分布,它是對加權的K個樣本的生存函數進行檢驗的檢驗統計量。式(13)中等號右邊各變量的含義和定義如下:

讓 (Ti,δi,Xi,wi),i=1,2,…,n,代表具有右刪失的生存資料的一個獨立樣本,Ti是一個可能的右刪失的時間;δi是一個刪失的指示變量(δi=0代表Ti是刪失時間,δi=1代表Ti不是刪失時間,即事件發生的時間);Xi=1,2,…,K代表K個不同的組;wi是LIFETEST過程的“WEIGHT”語句中指定變量在各觀測上的取值;讓t1<t2<…<tD代表樣本中不同的事件時間,在時刻Tj(j=1,2,…,D),并且,對于每一個1≤k≤K,則有下式:

在時刻tj合并的樣本中,讓和分別代表風險集的大小和事件的數目,讓分別代表風險集中權重的數目和事件的權重數目。于是,在式(13)中,向量v中的各分量和矩陣V=(Vkh)中的各元素(即方差與協方差)分別見式(16)、式(17)、式(18):

在式(17)中,A、B和C的內容分別如下:

在式(18)中,A的內容與式(19)相同;D、E和F的內容分別如下:

3 分層生存函數相等的假設檢驗的計算公式

3.1 何為分層生存函數相等的假設檢驗問題

假定在生存資料中,有一個具有M水平的分層因素,在其各水平下均有一個具有K水平的重要試驗因素。于是,就需要考慮將M層生存函數按那個重要試驗因素分別合并起來,再進行合并后的K個生存函數是否相等的檢驗,這就是分層生存函數相等的假設檢驗問題。

3.2 分層生存函數相等的檢驗統計量

進行分層生存函數相等的假設檢驗,Klein和Moeschberger于1997年提出了如下方法:設分層因素有M個水平、重要試驗因素有K個水平、第s(s=1,2,…,M)層中的檢驗統計量為vs,于是,對合并后的生存函數進行假設檢驗的檢驗統計量見下式:

式(25)中的χ2服從自由度為df=各層中協方差矩陣V的秩的χ2分布;v'是v的轉置向量;V-是協方差矩陣V的廣義逆矩陣。式(25)中等號右邊各變量的具體含義如下:

4 實例及SAS實現

4.1 問題與數據

【例1】(未分層生存資料)將26例白血病患者分為兩組,分別采用化療、化療聯合中藥兩種方法,治療后患者存活數(月)如下,其中帶“+”號的為終檢值。試估計兩組患者的生存率,并比較兩種方法治療白血病患者的生存率差異是否有統計學意義[9]。化療組(A):2+,13,7+,11+,6,1,11,3,17,7;化療聯合中藥組(B):10,2+,12+,13,18,6+,19+,26,9+,8+,6+,43+,9,4,31,24。

【例2】(分層生存資料)某醫院腫瘤科提供的一份關于肺癌患者的失效時間資料[8],因變量為患者治療后的生存時間t(d),當t為刪失數據時,在前面加一個負號表示;考察的協變量(即危險因素或預后因素)如下:①癌細胞的類型,它有4個水平,即腺癌細胞、鱗癌細胞、小細胞肺癌和大細胞肺癌;②治療類型,它有2個水平,即標準的方法和試驗的方法;③療前處理,它有2個水平,即采取了療前處理和未采取療前處理;④患者年齡(歲);⑤從診斷到治療的等待時間;⑥患者的行動狀態用Karnofsky率來度量,其取值用KPS表示,0≤KPS≤10表明患者完全靠醫院護理,40≤KPS≤60表明患者的行動部分受到限制,70≤KPS≤90表明患者的行動可以自理。前3個變量被當作分類變量,后3個變量被當作連續性變量。資料的形式為:各組患者的治療方法、癌細胞類型、同一組中的樣本含量、生存時間、KPS值、等待時間、年齡、與療前處理對應的指示變量PR值(注:PR=0等價于令PRIOR='YES',即表示采取了療前處理;PR=10等價于令PRIOR='NO',即表示未采取療前處理)。(說明:因數據量很大,各變量取值從略,可查閱參考文獻[8])

試按下面兩個要求分析此生存資料:其一,僅按“治療方法”一個因素分層,比較4種癌細胞類型患者的生存曲線差異是否有統計學意義;其二,同時按“治療方法”和“有無療前處理”兩個因素分層,比較4種癌細胞類型患者的生存曲線差異是否有統計學意義。

4.2 基于SAS軟件分析例1資料

【分析與解答】設所需要的SAS程序如下:

【程序說明】在“strata”語句中,選項“test=all”代表選擇六種非參數假設檢驗方法,其中,fleming(ρ1,ρ2)自動設置為:fleming(1),即 ρ1=1、ρ2=0;當特別指定ρ1、ρ2為非負數且不為0時,對應的計算結果會隨著這兩個參數的具體取值而發生改變,例如:給定fleming(1,4)與fleming(2,5)時,對應的χ2值和P值是不同的;如果要求輸出“似然比檢驗”結果,必須加上選項“LR”。

【SAS輸出結果及解釋】

以上輸出結果中,前6行是六種非參數檢驗結果,最后一行是似然比檢驗結果。前6行檢驗結果都得到“P<0.05”的結果;而最后一行的結果為“P>0.05”。當生存資料服從“指數分布”時,應選取“似然比檢驗”結果;當生存資料服從“威布爾分布”時,應選取“對數秩檢驗”結果;否則,可以考慮選取其他非參數檢驗結果。通過查看圖1和圖2,可大致判斷出本例生存時間資料服從何種分布。

圖1 用于判斷生存資料是否服從指數分布的圖形

圖2 用于判斷生存資料是否服從威布爾分布的圖形

在圖1中,兩條折線都不呈直線,說明本例兩組生存資料都不服從指數分布;而在圖2中,兩條折線都近似呈直線,說明本例兩組生存資料都近似服從威布爾分布。由此可知,本例的假設檢驗結果以選擇“對數秩檢驗”結果為宜。為了便于直觀判斷哪一種治療方法所對應的患者生存時間更長,需要呈現出他們的生存率曲線,見圖3。

在圖3中,左邊的生存曲線為“A組(化療組)”;右邊的生存曲線為“B組(化療聯合中藥組)”。

【統計結論與專業結論】因χ2=6.5792,df=1,P=0.0103<0.05,說明兩條生存曲線之間的差異有統計學意義;由于B組(化療聯合中藥組)的生存曲線位于A組(化療組)生存曲線的右邊(見圖3),說明“化療聯合中藥”治療的效果優于“單純化療”的效果。

4.3 基于SAS軟件分析例2資料

【分析與解答】設所需要的SAS程序如下:

因篇幅所限,第1個過程步的主要輸出結果此處從略,僅給出概括性結論。第一層:標準治療組。標準治療的4種癌細胞類型的生存曲線之間的差別所對應的P值均小于0.05,大細胞肺癌患者的生存曲線最長。第二層:試驗治療組。試驗治療的4種癌細胞類型的生存曲線之間的差別所對應的P值均小于0.05,肺鱗癌細胞患者的生存曲線最長。

因篇幅所限,第2個過程步的主要輸出結果此處從略,僅給出概括性結論。第一層:標準治療且未接受預處理,結果顯示,三種方法對應的結果為P>0.05,有4種方法對應的P<0.05。第二層:標準治療但接受預處理,結果顯示,七種方法對應的結果均為P>0.05。第三層:試驗治療且未接受預處理,結果顯示,七種方法對應的結果均為P<0.05。第四層:試驗治療但接受預處理,結果顯示,前六種方法對應的結果均為P>0.05,而最后的似然比檢驗結果為P<0.05。

【統計結論與專業結論】本例資料按“治療方法”與“是否接受預處理”所形成的四層來分別比較4種癌細胞的患者生存曲線,因分析結果不盡相同,故統計結論與專業結論都需要在各層的條件下進行具體描述,因篇幅所限,此處從略。

5 討論與小結

5.1 討論

在SAS/STAT的LIFETEST過程中,介紹了比較兩組或多組生存資料的差異性檢驗方法,包括似然比檢驗和六種非參數檢驗。一般來說,在構建似然比檢驗統計量時,需要假定所研究的變量服從某種概率分布;而非參數檢驗,顧名思義,不假定所研究的資料服從何種概率分布。當各種非參數檢驗用于同一個資料產生出不同的檢驗結果時,如何選取最終的結果就成了一個棘手的問題。通常情況下,可以選擇P值最小的非參數檢驗法給出的計算結果。例如,在例1的計算結果中,對數秩檢驗給出的P=0.0103、χ2=6.5792,而fleming(1,4)的P=0.0052、χ2=7.8139;若進一步嘗試,還可得到fleming(3,6)的P=0.0051、χ2=7.8382。在例2的分析中,因篇幅所限,未分析定量變量(即協變量KPS DIAGTIME AGE)對生存時間的影響。

有一個易于誤解之處:在SAS輸出差異性檢驗結果時,呈現的標題為“層間等效檢驗”,似乎表明:其下方給出的假設檢驗結果是針對“分層因素”各水平計算出來的。其實,標題中的“層間”是指“試驗因素各水平間”。在例2中,試驗因素是“4種癌細胞類型”,第一種情況下的分層因素為“治療方法”,第二種情況下有兩個分層因素,即“治療方法”與“是否接受預處理”。

5.2 小結

本文分別介紹了未分層與分層條件下,兩組或多組生存資料比較的似然比檢驗和六種非參數檢驗方法,通過兩個實例并借助SAS軟件,進行單因素和多因素生存資料的差異性分析,對SAS輸出結果作出解釋,給出統計結論和專業結論。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
可能是方法不對
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 国产欧美日韩91| 亚洲婷婷在线视频| 国产无码高清视频不卡| 黄色a一级视频| 国产经典免费播放视频| 亚洲色大成网站www国产| 伊人激情综合网| 国产午夜人做人免费视频| 茄子视频毛片免费观看| 国产无码高清视频不卡| 中文毛片无遮挡播放免费| 亚洲中文在线看视频一区| 夜夜高潮夜夜爽国产伦精品| 亚洲黄色成人| 欧美va亚洲va香蕉在线| 69精品在线观看| 精品欧美日韩国产日漫一区不卡| 特级毛片免费视频| 亚洲色图综合在线| 亚洲欧美色中文字幕| 999精品免费视频| 精品国产女同疯狂摩擦2| 日韩欧美国产精品| 91成人在线观看| 激情网址在线观看| 91色在线观看| 日韩精品无码一级毛片免费| 九色在线视频导航91| 精品福利视频导航| 天堂久久久久久中文字幕| 中国美女**毛片录像在线| 国产精品自在线拍国产电影| 青青青国产精品国产精品美女| 国产丝袜无码精品| 欧洲极品无码一区二区三区| 91日本在线观看亚洲精品| 欧美不卡二区| 又粗又大又爽又紧免费视频| 无遮挡一级毛片呦女视频| 国产黄色片在线看| 喷潮白浆直流在线播放| www.youjizz.com久久| av午夜福利一片免费看| 亚洲国产成人自拍| 国产精品无码AV中文| 特级毛片免费视频| 日日摸夜夜爽无码| 免费无码在线观看| 亚洲无码37.| 亚洲av成人无码网站在线观看| 亚洲大尺度在线| 国产屁屁影院| 国产第八页| 亚洲精品制服丝袜二区| 91精品啪在线观看国产| 国产欧美日韩在线一区| 又爽又大又光又色的午夜视频| 91娇喘视频| 青青草国产免费国产| 国产91成人| 国语少妇高潮| 精品免费在线视频| 亚洲欧洲日韩国产综合在线二区| 色欲不卡无码一区二区| 国产成人亚洲精品无码电影| 亚洲精品自产拍在线观看APP| 国产91九色在线播放| 国产欧美在线观看精品一区污| 国产精品部在线观看| 日韩色图在线观看| 欧美高清视频一区二区三区| 波多野结衣久久高清免费| 中文国产成人久久精品小说| 亚洲啪啪网| 国产精品一区不卡| 97国内精品久久久久不卡| 91在线国内在线播放老师| 亚洲精品无码在线播放网站| 色有码无码视频| 亚洲女人在线| 99热在线只有精品| 高清精品美女在线播放|