胡純嚴 ,胡良平 ,2*
(1.軍事科學院研究生院,北京 100850;2.世界中醫藥學會聯合會臨床科研統計學專業委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
在生物醫藥學和流行病學研究中,基于橫斷面設計收集的四格表資料是常見的[1-2]。根據資料所滿足的前提條件不同,處理四格表資料的統計分析方法有多種,即“Pearson'sχ2檢驗及其精確檢驗”“校正的 Pearson'sχ2檢驗”“似然比χ2檢驗及其精確檢驗”和“Fisher's精確檢驗”[3],因篇幅所限,本文介紹“Pearson'sχ2檢驗”“校正的 Pearson'sχ2檢驗”“似然比χ2檢驗”3種統計分析方法。
【例1】在文獻[1]中,根據MINI 5.0中文版自殺模塊判斷未治療抑郁障礙患者有無自殺風險,共6個條目,評分范圍0~33分。評分<6分為無自殺風險,評分≥6分為有自殺風險。再將兩組受試者分別按“性別”“婚姻狀況”“有無精神障礙家族史”和“是否伴有精神病性癥狀”進行劃分,可得4個“橫斷面設計四格表資料”,現將其中一個列在表1中。問:未治療抑郁障礙患者“有無自殺風險”與“婚姻狀況”之間是否存在關聯性?

表1 未治療抑郁障礙患者“有無自殺風險”與“婚姻狀況”之間關系的調查結果
【統計分析方法的選擇】兩個屬性變量(本例為“有無自殺風險”與“婚姻狀況”)之間是否存在關聯性,可選用 Pearson'sχ2檢驗、似然比χ2檢驗等方法。由于統計學家依據不同的原理和條件推導出了不同的χ2檢驗統計量,但它們通常都有一個共同的“檢驗假設”,即“兩變量之間互相獨立或無關聯性”;而且,所有的χ2檢驗統計量都必須服從χ2分布。
【例2】在文獻[2]中,為了研究“中山市流動人口與戶籍人口自殺率和自殺方式特征”,研究考察了“戶籍狀況(分為‘戶籍組’與‘流動組’)”與“性別”“民族”“受教育程序”“婚姻狀況”和“職業”5 個屬性變量之間的關系,可得5個列聯表。現將其中一個列在表2中。問:中山市2015年-2017年戶籍組和流動組自殺案例“戶籍狀況”與“民族”之間是否存在關聯性?

表2 中山市2015年-2017年戶籍組和流動組自殺案例“戶籍狀況”與“民族”之間關系的調查結果
【統計分析方法的選擇】回答兩個屬性變量(本例為“戶籍狀況”與“民族”)之間是否存在關聯性,可選用Pearson'sχ2檢驗、似然比χ2檢驗等方法。理由前面已述及,此處從略。
為了便于采用簡單且易于理解的形式呈現橫斷面設計四格表資料的計算公式,特將表達橫斷面設計四格表資料的列聯表抽象成下面的兩種模式,分別見表3和表4。

表3 同時按屬性變量A與B對受試對象進行分組計數的模式一

表4 同時按屬性變量A與B對受試對象進行分組計數的模式二
對于橫斷面設計四格表資料而言,通常假定兩個屬性變量之間的地位是平等的且并存的。也就是說,不認為其中一個是原因變量、另一個是結果變量;也不認為其中一個先出現、另一個后出現。研究者關心的是兩個屬性變量之間是否存在“關聯性”,而與其對立的是“獨立性”。在“兩屬性變量之間具有獨立性”的假設成立的條件下,當基于實際數據和統計學原理計算的結果認為應拒絕此假設,則認為“兩屬性變量之間具有關聯性”。于是,其檢驗假設可表述如下:
H0:兩屬性變量之間相互獨立;H1:兩屬性變量之間不獨立或有關聯性。
基于表3中設定的符號,假定“屬性變量A”與“屬性變量B”之間互相獨立,則依據概率論中計算條件概率的公式可推算出與4個觀察頻數“ɑ、b、c、d”對 應 的 理 論 頻 數如下[4-5]:

K.Pearson于十九世紀末提出用檢驗統計量來測量二維列聯表的各網格中觀測頻數(O)與理論頻數(T)之間的“差異程度”或“吻合度”[6]。如下式:

在式(5)中,Oij、Tij分別為第(i,j)網格中的“觀測頻數”與“理論頻數”,R、C分別代表二維列聯表的“行數”與“列數”,K.Pearson證明了式(5)定義的近似地服從自由度為df=(R-1)(C-1)的χ2分布。
將表3中設定的符號和式(1)~式(4)代入式(5),可得到分析橫斷面設計四格表資料的專用公式,見式(6)。

由式(6)定義的漸近地服從自由度為1的χ2分布。
【前提條件】當四格表資料中n>40且沒有T(理論頻數)<5時,可以選用“Pearson'sχ2檢驗”。
在四格表資料中,只要有一個網格上的理論頻數<5,若直接采用式(6)進行計算,其結果都會明顯偏離χ2分布,故需要采用下式進行校正。

由式(7)定義的漸近地服從自由度為1的χ2分布。
【前提條件】當四格表資料中n>40,但有1<T(理論頻數)<5時,可以選用“校正Pearson'sχ2檢驗”。
2.5.1 似然比統計量

情形1:依據觀測的結果,得似然函數近似表達式:

情形2:依據假設的結果,得似然函數近似表達式:

上面兩式中的“∝”符號代表“呈正比”(例如,A與B呈正比,可表示為A∝B)。
用式(8)除以式(9),得到似然比統計量如下:

2.5.2 對數似然比χ2檢驗統計量
在文獻[3,7]中,介紹了另一種檢驗兩屬性變量關聯性或獨立性的方法,叫做“似然比χ2檢驗”。但實際上,其檢驗統計量是對所構造的“似然比統計量[見式(10)]”取對數后乘以2的結果。因此,其真實的名稱應該叫做“對數似然比χ2檢驗統計量”。于是,對式(10)取自然對數后乘以2,可得下式:

在式(11)中,由所定義的檢驗統計量漸近地服從自由度為1的χ2分布。其中,nij、Tij分別代表四格表中第(i,j)網格上的觀察頻數與理論頻數,i,j=1,2。
【前提條件】當四格表資料中,無論是觀察頻數還是理論頻數中都沒有出現“零”時,可以選用“對數似然比χ2檢驗”。
沿用例1中的“問題與數據”,試進行關聯性或獨立性分析。設所需要的SAS程序如下[3]:


第1行與第3行分別為“Pearson'sχ2檢驗”與“校正 Pearson'sχ2檢驗”的結果,第 2行為“似然比χ2檢驗(嚴格地說,為對數似然比χ2檢驗)”的結果。3種檢驗方法所得的P值都小于0.01,都拒絕“H0:有無自殺風險與婚姻狀況之間互相獨立”,接受“H1:有無自殺風險與婚姻狀況之間存在關聯性”。
【結論】因為“有自殺風險”的“已婚比例為(13/52)×100%=25.00%”,而“無自殺風險”的“已婚比例為(33/65)×100%=50.77%”,這提示“有自殺風險”的未治療抑郁障礙患者的結婚比例明顯低于“無自殺風險”的未治療抑郁障礙患者的結婚比例。
設所需要的R程序如下[8-9]:

【程序說明】“>”代表R軟件運行環境中的“提示符”,上文的R程序中共有4個提示符,說明共有4個R語句;第一句組織第一個“行向量”,代表四格表資料的第1行數據;第二句組織第二個“行向量”,代表四格表資料的第2行數據;第三句和第四句都是調用函數“chisq.test()”進行χ2檢驗,其區別在于:選項“correct=FALSE”代表不進行“校正”,而該選項的默認值為“校正”,等價于寫“correct=TRUE”;而選項“rbind()”是將兩個行向量合并在一起,即構成兩行兩列的四格表數據。
【R主要輸出結果及解釋】

以上為進行了連續性校正的χ2檢驗結果。
以上R輸出結果與SAS輸出的結果是相同的(見上文SAS輸出結果中的第1行與第3行)。
【結論】參見前文SAS輸出結果及結論,此處從略。
4.1.1 橫斷面設計的概念
所謂橫斷面設計,就是依據研究目的確定了一個研究的總體,在一個時點或時段上,研究者對該總體中的全部個體(屬于全面調查或普查)或按某種規則隨機抽取的部分個體進行調查或測量。這種做法就被稱為“橫斷面研究設計”,簡稱為“橫斷面設計”。
4.1.2 橫斷面設計四格表資料的特點
在表1和表2資料中,都有兩個“屬性變量”,通常,研究者同時按兩個屬性變量的水平對受試對象進行分組計數,而且,兩個屬性變量都是從受試對象身上“提取”出來的,換句話說,屬性變量是受試對象“自帶的”屬性(例如性別、民族);在多數場合下,兩個屬性變量之間不存在明顯的“原因變量”與“結果變量”之分,也就是說,它們之間更常見的是“相互關系”,而不是“因果關系”。
若一個變量為“藥物種類(藥物A與藥物B)(研究者施加給受試對象的因素)”,另一個變量為“治療效果(‘有效’與‘無效’)”,此時,前者可視為“原因變量”,后者可視為“結果變量”。一般來說,從患者“服藥”到出現“療效”的時間間隔不長時,可視為一個“時點或時段”,這樣的四格表資料仍可被稱為“橫斷面設計四格表資料”。然而,當前述所指的“時間間隔”很長時,就不適合叫做“橫斷面設計四格表資料”了。
值得注意的是,基于“藥物種類”與“治療效果”而形成的四格表資料與流行病學上常見的“隊列設計四格表資料(例如調查‘是否吸煙’與‘是否患肺癌’之間關系所得的資料)”是十分相似的。二者的區別在于以下兩點:其一,原因變量的來源不同。“藥物種類”是研究者施加給受試對象的影響因素,而“吸煙與否”是受試對象自身的行為習慣;其二,獲得結果變量取值的時間長度不同,通常,“服藥”與“療效”之間時間間隔不會很長;而“吸煙與否”與“患肺癌與否”之間時間間隔通常會比較長。
4.1.3 橫斷面設計四格表資料統計分析方法的合理選擇
在檢驗橫斷面設計四格表資料兩屬性變量之間“獨立性假設”的方法中,除了本文介紹的3種方法(運用時,請檢查前提條件是否滿足)之外,還有Fisher's精確檢驗、Pearson'sχ2檢驗的精確算法、似然比χ2檢驗的精確算法[3],因篇幅所限,此處從略。
在運用SAS/STAT的FREQ過程時,若使用“exact chisq/mc;”語句,輸出結果中會呈現4種精確檢驗的結果[3],其中,除了前面提及的3種精確檢驗結果之外,還給出了“Mantel-Haenszel'sχ2檢驗及其精確檢驗結果”。然而,這種檢驗方法適用于“隊列設計”或“病例對照設計”四格表資料,其對應的檢驗假設為:“H0:RR=1,H1:RR≠ 1”(RR為相對危險度)或“H0:OR=1,H1:OR≠ 1”(OR為優勢比)[10],因這些內容與本文的目的不吻合,故未做介紹。
本文呈現了橫斷面設計四格表資料的實例和模式,詳細給出了3種檢驗橫斷面設計四格表資料“關聯性或獨立性”假設的檢驗方法的原理和計算公式;基于SAS和R軟件實現了對橫斷面設計四格表資料的3種假設檢驗,對軟件輸出的結果做出了解釋,并給出了統計和專業結論。