劉 暢潘 輝陳梓聰張晉昕△
基于Wald檢驗實現Cox回歸中自變量影響大小的推斷*
劉 暢1潘 輝2陳梓聰1張晉昕1△
目的針對一般研究者在使用Cox回歸時,直接比較標準化偏回歸系數大小的做法,提出借助Wald檢驗進行排序,并用小細胞肺癌患者隨訪研究的實例加以說明。方法借鑒SNK多重比較法的比較策略,以盡可能少的比較次數,使用Wald檢驗對樣本標準化回歸系數進行假設檢驗,從而探討總體標準化回歸系數之間的關系,形成依影響大小排序的若干子集。結果選入模型的4個變量被劃分在2個子集內,可認為第1子集中的自變量(實例中的腫瘤大小、年齡)對預后的影響小于第2子集中的自變量(神經元特異性烯醇化酶),自變量癌胚抗原對預后的影響介于兩個子集之間。結論基于Wald檢驗對自變量進行排序,能夠克服cox回歸模型結果報告中判斷自變量影響大小的主觀性。
標準化偏回歸系數 Wald檢驗 預后 影響程度
Cox回歸模型分析廣泛應用于評估一組自變量對預后的影響[1]。模型分析過程主要有兩個階段,模型選擇和預測變量的解釋[2]。在模型選擇階段,主要目標是尋找正確的模型。模型選定后,對預測變量的意義進行分析和解釋,將自變量按照對生存結局的作用大小進行比較、獲得其排序,在公共衛生、生態學、環境學、心理學等領域均有著廣泛的需求[3]。目前最常使用的指標為標準化偏回歸系數,或對應的風險比(hazard ratio,HR)值。事先通過對變量或偏回歸系數進行標準化,可使量綱不同的變量得以相互比較。
研究者在給出分析報告時,通常將標準化偏回歸系數直接進行比較,以體現自變量對預后的影響大小,這種做法其實不盡合理。原因是標準化偏回歸系數是由樣本估計出的一個統計量,存在抽樣誤差。樣本的標準化偏回歸系數取值有差別,也無法據此直接判斷兩個總體標準化偏回歸系數是否不同。因此,有必要對其進行假設檢驗,以判斷總體偏回歸系數的關系。此外,在考慮自變量對結局的影響程度時,若干個變量間不一定是A大B小的關系,不排除A與B對結局的影響程度同等的情形。本研究旨在針對以上應用問題,提出合理的自變量排序方法。
通過對樣本標準化回歸系數進行假設檢驗,探討總體標準化系數的關系,并將自變量按對預后的影響程度劃分子集,彼此間差異沒有統計學意義的變量放在一個子集內。
1.建立模型 根據資料建立Cox比例風險回歸模型,采用逐步回歸法篩選變量,自變量進入模型的顯著性水準為0.05,剔除的顯著性水準為0.10。
2.比較策略 為了盡可能減少比較次數,本研究探索一種合適的策略對變量進行比較,即借鑒SNK(student-newman-keuls)多重比較法[4-6]的思想,劃分相似性子集。在模型建立以后,將標準化偏回歸系數按從小到大的順序進行排列。第一步,將第一個系數與最后一個系數進行比較,若無差異,則兩個系數之間的所有系數都被視作沒有差異,不必繼續比較;若有差異,則進行下一步。第二步,將第二個系數與最后一個系數,第一個系數與倒數第二個系數進行比較,按第一步的邏輯類推。以下舉例進行說明。
例如,當模型中存在5個變量時,先將系數按大小進行排序,假設β1<β2<β3<β4<β5。
第一步,考察間隔3個變量的情況,將β1與β5進行比較。若無差異,則認為其間隔內的所有變量都沒有差異,不必做后續比較;若有差異,進行第二步。
第二步,考察間隔2個變量的情況,將β1與β4,β2與β5進行比較。若無差異,則認為其間隔內的所有變量都無差異,不必做接下來的比較;若有差異,進行第三步。
依此類推。當所有系數間都存在差異時,完整的比較流程如圖1所示。

圖1 假定5個變量的比較流程示意圖
3.檢驗方法 目前常用于回歸模型中系數比較的檢驗有:F檢驗、似然比檢驗、Wald檢驗、計分檢驗等。本文采用Wald檢驗對系數進行檢驗,其優點是,只需估計無約束模型。其原理是,測量約束和無約束模型間的距離,從而檢驗約束條件是否成立。Wald統計量的計算公式如下:

其中,L為線性約束矩陣,β為系數矩陣,Cov(β)為協方差陣。由公式可以看出,該方法在計算過程中使用了系數間的協方差矩陣,因此可以更好地考慮變量間存在相關性的情況。在檢驗時,通過設置不同的L矩陣,可以考察不同的線性約束是否成立。例如,若要檢驗H0∶β2=β3,則令L=(0 1 -1 0 0),相當于檢驗Lβ=β2-β3=0是否成立。
數據來源于本課題組收集的小細胞肺癌患者生存時間的調查數據,共計275名小細胞肺癌患者。其中男性239例,女性36例;年齡最小33歲,最大86歲,平均年齡(62.6±9.3)歲。
自變量包括年齡、性別、吸煙量(包/年)、腫瘤大小、血紅蛋白、白細胞計數、中性粒細胞計數、淋巴細胞計數、血小板計數、癌胚抗原(carcino-embryonic antigen,CEA)、神經元特異性烯醇化酶(neuron-specific enolase,NSE)、γ-谷氨酰轉肽酶、纖維蛋白酶原和白蛋白共14個可疑的影響因素,除性別外均為連續型變量。結局變量為患者的生存情況。
本研究的全部計算在SAS 9.3軟件環境下實現。
1.模型的建立
建立Cox比例風險回歸模型,對影響小細胞肺癌患者生存時間的因素進行分析,最終模型中選入4個變量:年齡(Age),腫瘤大?。⊿ize),癌胚抗原(CEA),神經元特異性烯醇化酶(NSE)。模型中變量的偏回歸系數及標準化偏回歸系數見表1。

表1 Cox回歸模型參數估計結果
2.標準化偏回歸系數的檢驗
按照上文提出的比較策略,對4個標準化偏回歸系數按照從小到大的順序進行排序,記為分別對應Size、Age、CEA、NSE4個變量,采用Wald檢驗,分別對系數進行檢驗。檢驗結果如表2所示。

表2 標準化偏回歸系數比較結果
3.劃分子集情況
根據檢驗結果,可將自變量劃分為2個子集(見表3),按照從小到大的順序,前3個系數劃分在1個子集內,后2個系數劃分在1個子集內??烧J為腫瘤大小、年齡、癌胚抗原對患者生存時間的影響程度相近,癌胚抗原、神經元特異性烯醇化酶對生存時間的影響程度相近。神經元特異性烯醇化酶對預后的影響大于腫瘤大小、年齡;癌胚抗原對預后的影響介于2個集合之間。

圖2 小細胞肺癌Cox回歸模型中系數比較流程圖

表3 自變量按影響程度劃分子集
標準化偏回歸系數的應用歷史已久,由于其易于計算,便于解釋的特性,使它成為目前使用最為廣泛的、描述自變量對結局影響程度的量化指標。然而,標準化偏回歸系數在結果報告中的解讀往往過于主觀。不時見到的情形是,建立回歸模型后,直接比較兩個變量的標準化回歸系數的大小,得出A指標強于B指標的影響因素的結論[7,11]。也有學者在使用標準化偏回歸系數時,會報告其置信區間[8-10]。
研究資料的獲得通常都是基于隨機抽樣,計算出的標準化偏回歸系數是由樣本估計出的一個統計量,勢必存在抽樣誤差。因此,比較不同自變量對結局的影響大小時,應借助統計推斷(假設檢驗或區間估計)方法。為了指導研究人員正確報告自變量影響大小,統計學家對標準化偏回歸系數的置信區間估計提供了多種方法和建議,包括非中心性區間估計,Delta法,Bootstrap法等[12]。對標準化系數進行假設檢驗的研究則未被足夠重視。
本文提出采用Wald檢驗對Cox回歸模型的標準化偏回歸系數進行假設檢驗,比較總體標準化回歸系數的大小。實際上,該方法并不局限于Cox回歸,還可以應用于多重線性回歸、logistic回歸等線性回歸模型中。若變量間比較次數過多,會致假陽性率上升。本研究借鑒SNK方法的思想,提出分級比較的策略,有效地減少了比較次數。例如,針對一個包含5個自變量的模型,若對全部系數進行檢驗,需要進行C25=10次。采用本文提供的比較流程,比較次數不會超過10次(所有變量均有差異的情況下)。
線性回歸模型建立以后,將自變量對結局變量的影響程度大小進行排序,是醫學研究者都關心的問題,因其對后續干預策略的制訂具有重要指導意義。本文給出的方法對于把握輕重緩急、抓住主要因素,提供了統計學方法支持。
[1]Chao YE,Zhao Y,Kupper L L,etal.Quantifying the Relative Importance of Predictors in Multiple Linear Regression Analyses for Public Health Studies.Journal of Occupational and Environmental Hygiene,2008,5(8):519-529.
[2]Krasikova D,LeBreton J,Tonidandel S.Estimating the relative importance of variables in multiple regression models.International Review of Industrial and Organizational Psychology 2011,Volume 26,2011:119-141.
[3]孫紅衛,王玖,羅文海.線性回歸模型中自變量相對重要性的衡量.中國衛生統計,2012,29(6):900-902.
[4]Abdi H,W illiams LJ.Newman-Keuls test and Tukey test.Encyclopedia of Research Design.Thousand Oaks,CA:Sage,2010:1-11.
[5]Keuls M.The use of the“studentized range”in connection w ith an analysis of variance.Euphytica,1952,1(2):112-122.
[6]Curran-Everett D.Multiple comparisons:philosophies and illustrations.Am JPhysiol Regul Integr Comp Physiol,2000,279(1):R1-R8.
[7]Young TK,Gelskey DE.Is noncentral obesity metabolically benign?Implications for prevention from a population survey.JAMA,1995,274(24):1939.
[8]Cheng S,Rhee E,Larson M,et al.Metabolite Profiling Identifies Pathways Associated W ith Metabolic Risk in Humans.Circulation,2012,125(18):2222-2231.
[9]Baccarelli A,W right RO,Bollati V,et al.Rapid DNA methylation changes after exposure to traffic particles.American journal of respiratory and critical caremedicine,2009,179(7):572-578.
[10]Tanaka K,Ogata S,Tanaka H,et al.The relationship between body mass index and uric acid:a study on Japanese adult twins.Environmental health and preventivemedicine,2015,20(5):347-353.
[11]Tsai A,Aung T,Yip W,et al.Relationship of Intraocular Pressure with Central Aortic Systolic Pressure.Current Eye Research,2015:1-6.
[12]Jones J,Waller N.Computing confidence intervals for standardized regression coefficients.Psychological Methods,2013,18(4):435-453.
(責任編輯:鄧 妍)
Inference of Strengths of Effects between Predictors in Cox Regression Based on W ald Test
Liu Chang,Pan Hui,Chen Zicong,et al
(Departmentof Medical Statistics and Epidemiology,School of Public Health,SunYat-Sen University(510080),Guangzhou)
ObjectiveTo solve the common problem that standardized regression coefficients are compared w ith each other directly by researchers,we propose a rankingmethod based on Wald test,and illustrate it by a example of small cell lung cancer patients.MethodsLearning Strategies from Student-Newman-Keuls test,make hypothesis tests of sample standardized regression coefficients by Wald testw ith comparing times as few as possible,in order to explore the relationship between population standardized regression coefficients and partition subsets of predictors according to theirmagnitude of effects to the dependent variable.ResultsThe four selected predictors are allocated to two subsets,we can consider that predictors in subset 1(size and age)have less effects on prognosis than predictors in subset2(neuron-specific enolase),while the effects of carcino-embryonic antigen stays between the two subsets.ConclusionRanking predictors based on Wald test can overcome subjectivity of effectsmagnitude judgement in result report of regressionmodels.
Standardized regression coefficients;Wald test;Prognosis;Effect
廣東省科學技術廳科技計劃項目(2014A020212713)
1.中山大學公共衛生學院醫學統計與流行病學系(510080)
2.廣州醫科大學附屬第一醫院轉化醫學實驗室
△通信作者:張晉昕,E-mail:zhjinx@mail.sysu.edu.cn