李運明,路 強,向雪梅,裴家興,3,周鵬飛,3,郭 望,2,張瀚博,楊孝光
1.西部戰區總醫院醫療保障中心信息科,成都 610083; 2.西南交通大學數學學院統計系,成都 611756; 3.西南醫科大學公共衛生學院,四川 瀘州 646000; 4.西部戰區總醫院醫療保障中心基礎醫學實驗室,成都 610083
重復測量設計資料,又稱為縱向觀測資料,是生物醫學研究領域中一類重要的研究設計數據,常見于動物行為學實驗、人群隊列研究、患者隨訪研究等生物醫學研究,包括計量資料、計數資料和等級資料三種類型[1]。各種類型的重復測量設計資料統計分析理論和軟件操作方法在醫學教材、專著和論文已有闡述[2-4],但在生物醫學期刊論著,尤其是國內期刊中,經常發生統計學方法和結果表達上的錯誤[5-6]。筆者從2019年底開始承擔《創傷外科雜志》稿件統計學審稿,也發現類似問題。為提高生物醫學期刊論文統計分析質量,本文選取生物醫學研究生教材實例,介紹重復測量設計計量資料統計分析和結果表達,以期為該類論著相關內容的撰寫提供參考。
選取人民衛生出版社《醫學統計學》第5版[1]第十二章重復測量設計資料的方差分析,例12-3作為本文實例。實例為:某研究者欲比較治療厭食癥的三種不同成分藥物的效果,在已構建的厭食癥模型大鼠中抽取15只成年雌性大鼠,隨機分為3組,每組飼料中添加1種藥物,藥物有效成分含量相同,連續記錄藥物治療前(T0)和治療后1、3、5、7d的大鼠體重,原始數據見表1。該實例為隨機對照實驗研究,干預因素為3種不同成分的厭食癥治療藥物(A、B、C);重復測量因素為時間,共5個時間點,且相鄰時間間隔不全相同;測量指標為計量資料(大鼠體重),因此該研究屬于不等距重復測量設計計量資料[2]。
該實例的研究目的(科學問題)是分析干預因素(藥物)和重復測量因素(時間)對于大鼠體重的影響,轉換為具體研究假設見表2。

表1 不同藥物治療后大鼠體重(單位:g)

表2 不同藥物和時間對大鼠體重影響的研究假設
針對表2中具體研究假設,同時考慮該研究不存在缺失數據,選擇采用重復測量設計資料方差分析構建相應的檢驗統計量(F值),并計算P值。根據藥物和時間是否存在交互作用,下一步統計分析路徑為:
(1)當兩者交互作用不具有統計學意義時,只需進行藥物和時間的主效應分析。①不考慮測量時間點,直接推斷藥物對大鼠體重的影響;若藥物主效應具有統計學意義時,繼續進行兩兩組間比較。②不考慮藥物分組,直接推斷時間對大鼠體重的影響;若時間主效應具有統計學意義時,繼續進行兩兩組間比較。
(2)當兩者交互作用具有統計學意義時,藥物和時間的主效應沒有意義,需要進行單獨效應分析。①固定重復測量因素水平,開展干預因素單獨效應分析,即固定測量時間點,比較3種藥物分組大鼠體重均數的差異,并進行兩兩組間比較。②固定干預因素水平,開展重復測量因素單獨效應分析,即固定藥物分組,比較5個時間分組大鼠體重均數的差異,并進行兩兩組間比較。
采用SPSS 25.0建立例12-03數據文檔,共15行7例數據,見圖1。

圖1 例12-03 SPSS數據文檔
在SPSS Analyze菜單中General Linear Model,調取Repeated Measures…分析窗口,并依次在圖2~5中完成變量選擇和選項設置,兩兩組間比較采用Bonferroni方法。

圖2 設置重復測量因素和研究指標

圖3 選擇研究指標和分組因素

圖4 選擇兩兩組間比較的因素和方法

圖5 設置描述統計和方差齊性檢驗選項
由于SPSS軟件默認結果中不輸出單獨效應分析結果,需要在程序(Syntax)窗口中修改程序[7]。在圖3中,單擊Paste按鈕,將分析程序輸出到程序窗口,按照圖6修改“/EMMEANS=TABLES(藥物*時間)”語句,以進行藥物和時間的單獨效應分析。

圖6 程序(Syntax)窗口修改“/EMMEANS”語句
4.1球對稱檢驗 Mauchly’s檢驗結果(χ2=6.983,P=0.643),表明不同時間點大鼠體重方差協方差矩陣滿足球對稱性,不需要對檢驗統計量進行校正,見表3。

表3 球對稱檢驗結果(Mauchly’s Test of Sphericity)
4.2時間主效應、時間和藥物交互作用方差分析結果 因本例數據滿足球對稱性,時間的主效應、時間和藥物交互作用方差分析結果看“Sphericity Assumed”行對應結果,否則需要看校正結果,其中Lower-bound方法校正結果最保守,見表4。時間和藥物交互作用檢驗結果(F=18.105,P<0.001),表明兩者交互作用具有統計學意義。因此,時間和藥物的主效應無意義,需要進行單獨效應分析。假定本例交互作用無統計學意義,時間因素主效應檢驗結果(F=344.299,P<0.001),表明5個時間點大鼠平均體重不全相等,需要進行兩兩組間比較。

表4 時間主效應、時間和藥物交互作用方差分析表(Tests of Within-Subjects Effects)
4.3藥物主效應方差分析結果 藥物主效應檢驗結果(F=5.527,P=0.020),表明3種藥物分組大鼠平均體重不全相等,需要進行兩兩組間比較,見表5。但表4中,時間和藥物交互作用存在統計學意義,因此藥物主效應無意義,需要進行單獨效應分析。

表5 藥物主效應方差分析結果(Tests of Between-Subjects Effects)
4.4不考慮測量時間點,藥物分組兩兩組間比較結果 藥物主效應具有統計學意義,表明3種藥物分組大鼠體重均數不全相等,具體哪兩組間存在差異,需要進行兩兩組間比較。為控制兩兩組間比較Ⅰ型錯誤膨脹問題,采用Bonferroni方法對P值校正。A組與C組大鼠體重均數差異具有統計學意義(P=0.018),見表6。但表4中,時間和藥物交互作用存在統計學意義,進行藥物分組兩兩組間比較時,需考慮時間因素的影響,因此表6統計結果無意義。

表6 不考慮時間因素,藥物分組兩兩組間比較結果(Pairwise Comparisons)
4.5不考慮藥物因素,時間分組兩兩組間比較結果 時間主效應具有統計學意義,表明5個時間分組大鼠體重均數不全相等,具體哪兩組間存在差異,需要進行兩兩組間比較。治療后3、5、7d的大鼠體重均數,與治療前(T0)比較,差異均具有統計學意義(P<0.001)。另外,表7給出了5個時間分組,全部兩兩組間比較結果。但表4中,時間和藥物交互作用存在統計學意義,進行時間分組兩兩組間比較時,需考慮藥物因素的影響,因此表7統計結果也無意義。

表7 不考慮藥物因素,時間分組兩兩組間比較結果(Pairwise Comparisons)
4.6藥物因素單獨效應分析 時間和藥物交互作用存在統計學意義(表4),需進行藥物因素單獨效應分析,即:固定測量時間點,比較不同藥物分組大鼠體重均數的差異,見表8。治療前和治療后3d,3種藥物分組大鼠平均體重差異無統計學意義(P>0.05);其他時間點,3種藥物分組大鼠體重均數均不全相等(P<0.05),需進行組間兩兩比較。

表8 藥物因素單獨效應分析結果(Univariate Tests)
治療后1d,A組和C組大鼠體重均數差異具有統計學意義(P=0.035);治療后5d,A組與C組,B組與C組大鼠體重均數差異具有統計學意義(P<0.05);治療后7d,A組與B組、A組與C組大鼠體重均數差異具有統計學意義(P<0.05),見表9。

表9 固定測量時間點,藥物分組兩兩組間比較結果(Pairwise Comparisons)
4.7時間因素單獨效應分析 與表8中藥物因素單獨效應分析假設檢驗方法不同,SPSS軟件采用多元方差分析進行時間因素單獨效應分析,即固定藥物分組,比較不同時間分組大鼠體重均數的差異,見表10。分別固定藥物分組A、B、C,5個測量時間點上大鼠體重均數均不全相等(P<0.05),需進行兩兩組間比較。

表10 時間因素單獨效應分析結果(Multivariate Tests)
藥物A分組和藥物B分組,治療后3、5、7d大鼠體重均數,與治療前比較差異均具有統計學意義(P<0.05);藥物C分組,治療后5、7d大鼠體重均數,與治療前比較差異均具有統計學意義(P<0.05),見表11。

表11 固定藥物分組,時間分組兩兩組間比較結果(Pairwise Comparisons)
除以上結果外,重復測量設計資料統計分析,SPSS軟件輸出結果中還包含多元方差分析(Multivariate Tests)、對比檢驗(Tests of Within-Subjects Contrasts)等其他結果,本文不再贅述,可參考其他文獻資料[2-4]。
論著中資料與方法部分需要描述統計學方法,包含:統計分析軟件、統計描述和假設檢驗方法、檢驗水準、樣本量估計等內容。本實例統計學方法表述如下:采用IBM SPSS Statistics 25.0和Microsoft Office Excel 2016進行統計分析。大鼠體重采用均數±標準差(mean±SD),邊際估計均數采用均數±標準誤(mean±SE)進行統計學描述。因本研究為重復測量設計,不同藥物和時間分組大鼠體重均數組間比較采用重復測量設計資料方差分析,兩兩組間比較采用Bonferroni方法。采用Mauchly’s方法進行球對稱檢驗,如不滿足球對稱性,則采用Lower-bound校正。P≤0.05認為差異具有統計學意義。
結果部分是期刊論著的主要內容,需要采用精煉的文字、簡明的統計表和直觀的統計圖,反映研究發現的主要結果。重復測量設計計量資料方差分析結果,根據干預因素和重復測量因素是否存在交互作用,結果表述存在較大區別。
6.1干預因素和重復測量因素存在交互作用 經Mauchly’s檢驗,不同時間點大鼠體重方差協方差矩陣滿足球對稱性(χ2=6.983,P=0.643)。采用重復測量設計資料方差分析,發現藥物分組和時間存在交互作用(F=18.105,P<0.001),需進行藥物和時間因素的單獨效應分析。治療前和治療后3d,3種藥物分組大鼠體重均數差異無統計學意義(P>0.05);其他時間點,3種藥物分組大鼠體重均數不全相等(P<0.05),兩兩組間比較結果見表12和圖7。治療后1d,藥物C組大鼠體重均數(22.14±0.35)g高于藥物A組(20.61±0.79)g;治療后5d,藥物C組大鼠體重均數(26.89±0.83)g高于藥物A組(23.99±0.81)g和B組(24.41±0.90)g;治療后7d,藥物B組和C組大鼠體重均數(26.21±0.75g,25.42±0.64g)高于藥物A組(23.73±0.64)g,以上組間差異均具有統計學意義(P<0.05)。相同藥物分組內,5個時間分組大鼠體重均數均不全相等(P<0.05),與治療前比較結果見表12和圖7。藥物A組和B組,治療后3、5、7d大鼠體重均數均高于治療前;藥物C組,治療后5、7d大鼠體重均數均高于治療前;以上組間差異均具有統計學意義(P<0.05)。

表12 不同藥物治療后大鼠體重(g,mean±SD)

圖7 不同藥物治療后大鼠平均體重變化線圖
6.2干預因素和重復測量因素不存在交互作用
假定例12-3中,藥物和時間不存在交互作用,結果表述如下:經Mauchly’s檢驗,不同時間點大鼠體重方差協方差矩陣滿足球對稱性(χ2=6.983,P=0.643)。采用重復測量設計資料方差分析,發現藥物分組和時間不存在交互作用(F=X.XXX,P>0.05),不同藥物分組大鼠體重均數不全相等(F=5.527,P=0.020),不同時間分組大鼠體重均數也不全相等(F=344.299,P<0.001)。藥物C組大鼠體重均數(23.65±0.30)g,高于藥物A組(22.24±0.30)g,差異具有統計學意義(P=0.018);藥物B組與藥物A組、藥物C組大鼠體重均數差異無統計學意義(P>0.05),見表13和圖8。治療后3、5、7d大鼠體重均數均高于治療前,且差異具有統計學意義(P<0.05),見表13和圖9。

圖8 不同藥物治療后大鼠平均體重

圖9 藥物治療后大鼠平均體重變化線圖

表13 不同藥物治療后大鼠體重(g)
7.1其他類型重復測量設計計量資料統計分析 為便于介紹統計方法和結果表達,本文選取了包含3個水平的干預因素和5個水平的重復測量因素實例。除此之外,重復測量設計計量資料還包括:(1)無干預因素,只有重復測量因素;(2)重復測量因素只有2水平,兩種常見類型。只有重復測量因素的資料,仍需采用Mauchly’s方法檢驗球對稱性,再采用重復測量設計資料方差分析,然后考察時間因素的主效應,如主效應具有統計學意義,再進行兩兩組間比較。重復測量因素只有2水平的資料,除不需檢驗球對稱性外,仍需按照重復測量設計計量資料方差分析方法進行統計分析,不能采用配對(伍)設計方差分析。另外,重復測量設計計量資料統計分析還需注意兩個問題:(1)繪制統計圖時需注意重復測量時間間隔是否相同,SPSS軟件“Profile Plots”是按照“觀測順序”輸出的統計圖,若時間間隔不相等,不能采用該統計圖;(2)當部分樣本某些時間點存在缺失數據時,可以填補缺失數據后,再采用重復測量設計資料方差分析[8],或采用線性混合效應模型(linear mixed model)[9]。
7.2重復測量設計計數資料和等級資料統計分析 與計量資料相比,重復測量設計計數資料和等級資料在生物醫學期刊論著中統計分析方法誤用更為嚴重。首要原因是醫學院校本科生和研究生《醫學統計學》或《衛生統計學》教材中無相關內容,生物醫學研究者不考慮研究設計,遇有計數資料便采用卡方檢驗,等級資料便采用秩轉換的非參數檢驗。研究設計和資料類型,同時決定統計分析方法。重復測量設計計數資料和等級資料常用統計分析方法包括廣義估計方程(generalized estimating equation,GEE)和廣義混合效應模型(generalized linear mixed models),具體方法介紹可參考相關專著[9],以及SPSS、SAS等統計軟件幫助文件和操作手冊。
7.3生物醫學研究者應聯合醫學(生物、衛生)統計學者開展研究 早在1966年,美國醫學會雜志(JAMA)編輯部撰文《醫學的支柱(A Pillar Of Medicine)》指出:生物統計學家不是令人生畏的檢查官,而是生物醫學研究者可貴的盟友;生物統計學遠非一門無關緊要的數學科學,而是現代醫學的一門至關重要的學科,是醫學大廈的支柱[10]。在研究設計階段,生物醫學研究者就應該邀請醫學統計學者參與,協助根據研究目的明確設計類型、納入/排除標準、主要/次要研究指標、樣本量估計、隨機分組/抽樣方法、統計分析方法和計劃等內容;醫學統計學者應全程參與研究過程,檢查采集研究數據質量,完成數據統計分析,制作相關統計表和統計圖,撰寫主要研究結果報告。重復測量設計資料統計分析屬于較為復雜的統計分析,需要具備較高的統計學理論和軟件操作技能,因此生物醫學研究者應積極尋求醫學統計學者的幫助。
作者貢獻聲明:李運明:研究設計、統計分析、論文撰寫;路強、向學梅、張瀚博:論文修改、文獻檢索;裴家興、周鵬飛、郭望:統計分析、論文修改;楊孝光:研究指導、論文修改、經費支持;