周 鳳張晉昕唐小江
利用SPSS軟件中M ixed model模塊處理致畸試驗中窩別效應
周 鳳1,2張晉昕1,△唐小江2
目的探討致畸試驗中由于窩別效應存在時,如何利用SPSS軟件正確地進行統計處理。方法本文運用SPSS 20.0軟件分別采用傳統分析方法(忽略窩別效應的t檢驗或χ2檢驗、窩平均法)與多水平模型處理致畸試驗中窩別效應,其中包括定量變量及定性變量的統計分析,并比較其結果。結果傳統分析方法(t檢驗或χ2檢驗)未考慮窩別效應的存在,會增加犯假陽性錯誤的概率;窩平均法可損失樣本的大量信息,會增加犯假陰性錯誤的概率;多水平模型考慮原始數據的內在結構,可有效處理具有層次結構的數據。結論多水平模型可正確處理窩別效應,且SPSS軟件中M ixed model過程操作簡單,易于掌握。
致畸試驗 窩別效應 多水平模型 SPSS
致畸試驗又稱胚體-胎體毒性試驗,是三段生殖毒性試驗中的第Ⅱ階段,它通過動物實驗評價母體自胚泡著床到硬腭閉合期間接觸受試物對妊娠雌體及胚胎-胎體發育的影響[1]。我國主管部門和有關管理機構已把致畸試驗列為食品添加劑、保健食品、農藥、新藥、化妝品以及首次進口化學品的安全性評價程序中不可或缺的項目[2]。
由于遺傳因素、宮內發育環境、致畸物的代謝環境等的相似性,導致了同窩胎仔之間的非獨立性,即存在窩別效應,統計分析中應考慮這個效應。研究者如果不能對仔體數據進行正確的統計分析,就可能導致得出有偏甚至錯誤的結論。衛生部于2003年9月頒布GB 15193.14-2003《致畸試驗》[3],但對數據處理的說明較為含糊,難以切實指導實驗者重視此問題。甘卉芳等[2]探討了常規致畸試驗及其結果判定的規范化問題,但并未提出如何進行規范的統計分析。王炳順等[4]采用了廣義估計方程處理致畸試驗窩效應并采用SUDAAN軟件實現其分析過程,但多數醫學研究者并不了解SUDAAN軟件,導致其推廣受限。以“致畸試驗”作為主題詞,檢索關于“致畸試驗”的期刊論文,發現其中大部分的研究者或對其統計分析方法含糊其辭,或采用“常規統計分析方法(方差分析或χ2檢驗)”來處理致畸試驗中的“非常規數據”(存在窩別效應)。統計學方法的誤用勢必導致結果的可靠性降低。
目前可處理此類具有聚集性數據的方法有廣義估計方程(generalized estimation equations,GEE)、多水平模型(multi-level model)、混合效應模型(mixed effectsmodel)等,可采用多種軟件完成統計分析過程,如SAS、R、MLw in、Stata等,不同的軟件在擬合模型時所用的模型估計方法和計算機算法有所差別,使得模型結果略有不同。本文探討采用多水平模型對致畸試驗仔體數據中窩別效應進行統計處理,并介紹應用廣泛且易于操作的SPSS 20.0軟件的實現過程,以期為正確處理致畸試驗數據提供參考。
1.觀察指標
致畸試驗中,常用孕鼠作試驗對象,將其隨機分為兩組或多組,分別給予可疑致畸物及對照處理,待分娩后,觀察每個孕鼠及所產子代中發生畸形的情況。主要的觀察指標包括兩部分,一是對母體的觀察:體重變化、中毒癥狀、黃體數、著床數(率)、吸收胎數(率)、早死胎數(率)、晚死胎數(率)和活胎數(率)、胎盤重量等;二是對仔體的觀察:性別、體重、身長、外觀畸形、內臟畸形、骨骼畸形和發育(骨化)情況等。
對于母體的觀察指標,由于各孕鼠間獨立,故采用常規的統計分析方法即可。而對于仔體的觀察指標,由于窩別效應的存在,同一窩別的仔鼠的體重、發生畸形的概率趨于相同,而不同窩別仔鼠的體重、發生畸形的概率則趨于不同。這類資料的特點是存在層次結構,即孕鼠-仔鼠。傳統的方差分析或χ2檢驗忽略了數據層次結構的特征,可能導致錯誤的結論。多水平模型是處理這種具有聚集性資料的簡單且有效的統計分析方法[5]。胎仔體重是仔鼠發育的一個重要指標,而“是否畸形”是判斷受試物致畸性的主要指標。本文以上述兩個指標為例,分別介紹兩水平模型、兩水平logistic模型處理致畸試驗中具有窩別效應的定量資料及定性資料。
2.兩水平模型原理
多水平模型是英國教育統計學家H.Goldstein于1986年提出,專門用于處理多層次或多水平結構的資料[6]。致畸試驗的數據具有明顯的層次結構,母鼠為2水平單位(level-2 unit),仔鼠為1水平單位(level-1 unit)。
(1)定量資料的兩水平模型
考慮一個簡單的2水平模型,結局變量為連續型隨機變量,且服從正態分布,只包含一個解釋變量,則

故上述2水平模型又可表示為yij=β0+β1x+(u0j+u1j+εij),該模型由兩部分組成:固定部分和隨機部分。致畸試驗中解釋變量為組別(group),不考慮解釋變量的隨機效應,故模型變為

(2)二分類定性資料的兩水平logistic模型
實際工作中結局變量為定性變量的情況不在少數,如是否發病、藥物是否有效、仔鼠是否有畸形等,此時,一般的線性模型不再適用。廣義線性模型(generalized linearmodel,GLM)被廣泛應用于定性結局變量的數據處理,通過非線性函數(non-linear link function)將反應變量與線性預測指標聯系起來。對于logistic回歸模型,選擇的連接函數為logit函數,即對結局變量進行logit變換,含有一個解釋變量的logistic回歸模型可表示如下形式:

多水平模型也可以推廣到非正態情形。致畸試驗中模型為

下面結合實例來說明如何通過專業統計軟件SPSS實現分析過程。在研究某化學物質的致畸試驗中,將26只孕鼠隨機分為對照組和實驗組,實驗組在孕早期每天給予一定劑量的受試物,對照組給予等量的蒸餾水。待孕鼠分娩后,測量仔鼠體重并且觀察仔鼠某種畸形的發生數。
現在要比較實驗組和對照組仔鼠的發育情況(體重作為測量指標)以及兩組的仔鼠畸形發生率。如果忽略窩別效應,直接進行兩組的比較,如文獻中常采用的t檢驗或χ2檢驗,結果見表1。結果顯示實驗組仔鼠與對照組相比,體重和畸形發生率差異均有統計學意義(P<0.05),且實驗組體重較低,畸形發生率較高。提示受試物可影響胎鼠的生長發育,亦可提高胎鼠的畸形發生率。

表1 忽略窩別效應的統計分析結果
《致畸試驗(GB 15193.14-2003)》中指出“胎鼠身長、體重、窩平均活胎數、子宮連胎重量用t檢驗,胎鼠的數據以窩為單位進行統計。”這種方法可稱之為“窩平均法”,將每個孕鼠作為試驗單位,各指標以每窩均數為基礎來進行統計。如對于仔鼠體重,可先計算每窩胎鼠的平均體重,再進行t檢驗;對于畸形發生率,將每窩比率作平方根反正弦變換后作t檢驗。結果見表2。結果顯示與忽略窩別效應時的結論相反,實驗組與對照組的體重和畸形發生率差異無統計學意義(P>0.05)。

表2 “窩平均法”的統計分析結果
考慮致畸試驗中仔鼠數據的層次特征,即窩別效應,現采用兩水平模型進行分析。檢驗結果見表3。SPSS操作過程見表4。對于體重來講,水平2單位(不同孕鼠間)的隨機效應殘差(即窩別效應)方差為0.1656,標準誤為0.0559,Wald檢驗結果χ2=8.961,P<0.001,認為不同窩別的仔鼠體重總體均數是不同的,即存在“窩別效應”。同樣,對于畸形發生率來講,水平2單位(不同孕鼠間)的隨機效應殘差(即窩別效應)Z檢驗結果Z=2.212,P=0.027<0.05,亦存在“窩別效應”。故采用兩水平模型是合適的。在考慮了“窩別效應”后,體重及畸形發生率在不同組間的差異均無統計學意義(P>0.05)。因此,尚不能認為該受試物會影響仔鼠的生長發育或導致仔鼠畸形發生增加。

表3 兩水平模型的統計分析結果

表4 SPSS軟件處理傳統致畸試驗中仔體資料的操作過程
1.由以上結果可以看出,將每個仔鼠作為試驗單位,忽略窩別效應,簡單采用傳統的分析方法t檢驗或χ2檢驗是不對的,最終會導致統計推斷結論的偏倚。由于同一孕鼠所產m個胎仔之間不獨立,其提供的信息遠遠小于m個來自不同孕鼠所產胎仔的觀測值所提供的信息。窩別效應存在時,均數的標準誤是要比獨立數據的標準誤大,因此,當用傳統方法計算時,會增加犯假陽性的概率。如本文實例中所呈現的情形。
2.窩平均法是將孕鼠作為分析的基本單元,將個體水平的信息整合到群體水平,這樣的做法會低估個體水平的變異,損失了大量樣本數據的信息。而且由于孕鼠水平的觀察單位數通常較少,樣本含量較小,檢驗效能降低,導致參數估計和統計推斷的不可靠,增加犯假陰性的概率。因此,窩平均法在致畸試驗中的應用也不合適。
3.多水平模型是專門用于處理具有多層次或多水平結構資料的分析方法,針對定量資料和定性資料均有相應的模型進行統計分析。目前,已有多種統計分析軟件可實現多水平模型的分析,如MLw iN是用于多水平分析的專用軟件,SAS的M IXED、Glimmix、Nlmixed過程亦可擬合多水平結構的線性或廣義線性模型,Stata統計軟件亦有相應指令。但在實際工作中,研究者或對多水平模型不了解,或對統計軟件不熟悉,或對復雜的編程望而生畏,從而制約了聚集性數據統計分析方法的實際應用。本文中介紹的SPSS軟件操作相對簡單,結果讀取清晰明了,對多數醫學研究者來說易于掌握。
1.王心如,周宗燦.毒理學基礎.人民衛生出版社,2007.
2.甘卉芳,李百祥,剛葆琪.常規致畸試驗及其結果判定的規范化問題.中華預防醫學雜志,2002(2):59-61.
3.中華人民共和國衛生部.GB 15193.14-2003致畸試驗.2003.
4.王炳順,宮麗崑,高爾生等.常規致畸試驗窩效應的統計處理及統計軟件實現.中國衛生統計,2003(4):10-13.
5.楊珉,李曉松.醫學和公共衛生研究常用多水平統計模型.北京大學醫學出版社,2007.
6.饒克勤.衛生統計方法與應用進展.第2卷.人民衛生出版社,2008.
(責任編輯:郭海強)
1.中山大學公共衛生學院(510080)
2.廣東省醫學實驗動物中心(528248)
△通信作者:張晉昕,E-mail:zhjinx@mail.sysu.edu.cn