999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Wald檢驗實現Cox回歸中自變量影響大小的推斷*

2017-01-10 03:46:24暢潘輝陳梓聰張晉昕
中國衛生統計 2016年6期
關鍵詞:標準化差異影響

劉 暢潘 輝陳梓聰張晉昕△

基于Wald檢驗實現Cox回歸中自變量影響大小的推斷*

劉 暢1潘 輝2陳梓聰1張晉昕1△

目的針對一般研究者在使用Cox回歸時,直接比較標準化偏回歸系數大小的做法,提出借助Wald檢驗進行排序,并用小細胞肺癌患者隨訪研究的實例加以說明。方法借鑒SNK多重比較法的比較策略,以盡可能少的比較次數,使用Wald檢驗對樣本標準化回歸系數進行假設檢驗,從而探討總體標準化回歸系數之間的關系,形成依影響大小排序的若干子集。結果選入模型的4個變量被劃分在2個子集內,可認為第1子集中的自變量(實例中的腫瘤大小、年齡)對預后的影響小于第2子集中的自變量(神經元特異性烯醇化酶),自變量癌胚抗原對預后的影響介于兩個子集之間。結論基于Wald檢驗對自變量進行排序,能夠克服cox回歸模型結果報告中判斷自變量影響大小的主觀性。

標準化偏回歸系數 Wald檢驗 預后 影響程度

Cox回歸模型分析廣泛應用于評估一組自變量對預后的影響[1]。模型分析過程主要有兩個階段,模型選擇和預測變量的解釋[2]。在模型選擇階段,主要目標是尋找正確的模型。模型選定后,對預測變量的意義進行分析和解釋,將自變量按照對生存結局的作用大小進行比較、獲得其排序,在公共衛生、生態學、環境學、心理學等領域均有著廣泛的需求[3]。目前最常使用的指標為標準化偏回歸系數,或對應的風險比(hazard ratio,HR)值。事先通過對變量或偏回歸系數進行標準化,可使量綱不同的變量得以相互比較。

研究者在給出分析報告時,通常將標準化偏回歸系數直接進行比較,以體現自變量對預后的影響大小,這種做法其實不盡合理。原因是標準化偏回歸系數是由樣本估計出的一個統計量,存在抽樣誤差。樣本的標準化偏回歸系數取值有差別,也無法據此直接判斷兩個總體標準化偏回歸系數是否不同。因此,有必要對其進行假設檢驗,以判斷總體偏回歸系數的關系。此外,在考慮自變量對結局的影響程度時,若干個變量間不一定是A大B小的關系,不排除A與B對結局的影響程度同等的情形。本研究旨在針對以上應用問題,提出合理的自變量排序方法。

基本原理

通過對樣本標準化回歸系數進行假設檢驗,探討總體標準化系數的關系,并將自變量按對預后的影響程度劃分子集,彼此間差異沒有統計學意義的變量放在一個子集內。

1.建立模型 根據資料建立Cox比例風險回歸模型,采用逐步回歸法篩選變量,自變量進入模型的顯著性水準為0.05,剔除的顯著性水準為0.10。

2.比較策略 為了盡可能減少比較次數,本研究探索一種合適的策略對變量進行比較,即借鑒SNK(student-newman-keuls)多重比較法[4-6]的思想,劃分相似性子集。在模型建立以后,將標準化偏回歸系數按從小到大的順序進行排列。第一步,將第一個系數與最后一個系數進行比較,若無差異,則兩個系數之間的所有系數都被視作沒有差異,不必繼續比較;若有差異,則進行下一步。第二步,將第二個系數與最后一個系數,第一個系數與倒數第二個系數進行比較,按第一步的邏輯類推。以下舉例進行說明。

例如,當模型中存在5個變量時,先將系數按大小進行排序,假設β1<β2<β3<β4<β5。

第一步,考察間隔3個變量的情況,將β1與β5進行比較。若無差異,則認為其間隔內的所有變量都沒有差異,不必做后續比較;若有差異,進行第二步。

第二步,考察間隔2個變量的情況,將β1與β4,β2與β5進行比較。若無差異,則認為其間隔內的所有變量都無差異,不必做接下來的比較;若有差異,進行第三步。

依此類推。當所有系數間都存在差異時,完整的比較流程如圖1所示。

圖1 假定5個變量的比較流程示意圖

3.檢驗方法 目前常用于回歸模型中系數比較的檢驗有:F檢驗、似然比檢驗、Wald檢驗、計分檢驗等。本文采用Wald檢驗對系數進行檢驗,其優點是,只需估計無約束模型。其原理是,測量約束和無約束模型間的距離,從而檢驗約束條件是否成立。Wald統計量的計算公式如下:

其中,L為線性約束矩陣,β為系數矩陣,Cov(β)為協方差陣。由公式可以看出,該方法在計算過程中使用了系數間的協方差矩陣,因此可以更好地考慮變量間存在相關性的情況。在檢驗時,通過設置不同的L矩陣,可以考察不同的線性約束是否成立。例如,若要檢驗H0∶β2=β3,則令L=(0 1 -1 0 0),相當于檢驗Lβ=β2-β3=0是否成立。

實例分析

數據來源于本課題組收集的小細胞肺癌患者生存時間的調查數據,共計275名小細胞肺癌患者。其中男性239例,女性36例;年齡最小33歲,最大86歲,平均年齡(62.6±9.3)歲。

自變量包括年齡、性別、吸煙量(包/年)、腫瘤大小、血紅蛋白、白細胞計數、中性粒細胞計數、淋巴細胞計數、血小板計數、癌胚抗原(carcino-embryonic antigen,CEA)、神經元特異性烯醇化酶(neuron-specific enolase,NSE)、γ-谷氨酰轉肽酶、纖維蛋白酶原和白蛋白共14個可疑的影響因素,除性別外均為連續型變量。結局變量為患者的生存情況。

本研究的全部計算在SAS 9.3軟件環境下實現。

1.模型的建立

建立Cox比例風險回歸模型,對影響小細胞肺癌患者生存時間的因素進行分析,最終模型中選入4個變量:年齡(Age),腫瘤大?。⊿ize),癌胚抗原(CEA),神經元特異性烯醇化酶(NSE)。模型中變量的偏回歸系數及標準化偏回歸系數見表1。

表1 Cox回歸模型參數估計結果

2.標準化偏回歸系數的檢驗

按照上文提出的比較策略,對4個標準化偏回歸系數按照從小到大的順序進行排序,記為分別對應Size、Age、CEA、NSE4個變量,采用Wald檢驗,分別對系數進行檢驗。檢驗結果如表2所示。

表2 標準化偏回歸系數比較結果

3.劃分子集情況

根據檢驗結果,可將自變量劃分為2個子集(見表3),按照從小到大的順序,前3個系數劃分在1個子集內,后2個系數劃分在1個子集內??烧J為腫瘤大小、年齡、癌胚抗原對患者生存時間的影響程度相近,癌胚抗原、神經元特異性烯醇化酶對生存時間的影響程度相近。神經元特異性烯醇化酶對預后的影響大于腫瘤大小、年齡;癌胚抗原對預后的影響介于2個集合之間。

圖2 小細胞肺癌Cox回歸模型中系數比較流程圖

表3 自變量按影響程度劃分子集

討 論

標準化偏回歸系數的應用歷史已久,由于其易于計算,便于解釋的特性,使它成為目前使用最為廣泛的、描述自變量對結局影響程度的量化指標。然而,標準化偏回歸系數在結果報告中的解讀往往過于主觀。不時見到的情形是,建立回歸模型后,直接比較兩個變量的標準化回歸系數的大小,得出A指標強于B指標的影響因素的結論[7,11]。也有學者在使用標準化偏回歸系數時,會報告其置信區間[8-10]。

研究資料的獲得通常都是基于隨機抽樣,計算出的標準化偏回歸系數是由樣本估計出的一個統計量,勢必存在抽樣誤差。因此,比較不同自變量對結局的影響大小時,應借助統計推斷(假設檢驗或區間估計)方法。為了指導研究人員正確報告自變量影響大小,統計學家對標準化偏回歸系數的置信區間估計提供了多種方法和建議,包括非中心性區間估計,Delta法,Bootstrap法等[12]。對標準化系數進行假設檢驗的研究則未被足夠重視。

本文提出采用Wald檢驗對Cox回歸模型的標準化偏回歸系數進行假設檢驗,比較總體標準化回歸系數的大小。實際上,該方法并不局限于Cox回歸,還可以應用于多重線性回歸、logistic回歸等線性回歸模型中。若變量間比較次數過多,會致假陽性率上升。本研究借鑒SNK方法的思想,提出分級比較的策略,有效地減少了比較次數。例如,針對一個包含5個自變量的模型,若對全部系數進行檢驗,需要進行C25=10次。采用本文提供的比較流程,比較次數不會超過10次(所有變量均有差異的情況下)。

線性回歸模型建立以后,將自變量對結局變量的影響程度大小進行排序,是醫學研究者都關心的問題,因其對后續干預策略的制訂具有重要指導意義。本文給出的方法對于把握輕重緩急、抓住主要因素,提供了統計學方法支持。

[1]Chao YE,Zhao Y,Kupper L L,etal.Quantifying the Relative Importance of Predictors in Multiple Linear Regression Analyses for Public Health Studies.Journal of Occupational and Environmental Hygiene,2008,5(8):519-529.

[2]Krasikova D,LeBreton J,Tonidandel S.Estimating the relative importance of variables in multiple regression models.International Review of Industrial and Organizational Psychology 2011,Volume 26,2011:119-141.

[3]孫紅衛,王玖,羅文海.線性回歸模型中自變量相對重要性的衡量.中國衛生統計,2012,29(6):900-902.

[4]Abdi H,W illiams LJ.Newman-Keuls test and Tukey test.Encyclopedia of Research Design.Thousand Oaks,CA:Sage,2010:1-11.

[5]Keuls M.The use of the“studentized range”in connection w ith an analysis of variance.Euphytica,1952,1(2):112-122.

[6]Curran-Everett D.Multiple comparisons:philosophies and illustrations.Am JPhysiol Regul Integr Comp Physiol,2000,279(1):R1-R8.

[7]Young TK,Gelskey DE.Is noncentral obesity metabolically benign?Implications for prevention from a population survey.JAMA,1995,274(24):1939.

[8]Cheng S,Rhee E,Larson M,et al.Metabolite Profiling Identifies Pathways Associated W ith Metabolic Risk in Humans.Circulation,2012,125(18):2222-2231.

[9]Baccarelli A,W right RO,Bollati V,et al.Rapid DNA methylation changes after exposure to traffic particles.American journal of respiratory and critical caremedicine,2009,179(7):572-578.

[10]Tanaka K,Ogata S,Tanaka H,et al.The relationship between body mass index and uric acid:a study on Japanese adult twins.Environmental health and preventivemedicine,2015,20(5):347-353.

[11]Tsai A,Aung T,Yip W,et al.Relationship of Intraocular Pressure with Central Aortic Systolic Pressure.Current Eye Research,2015:1-6.

[12]Jones J,Waller N.Computing confidence intervals for standardized regression coefficients.Psychological Methods,2013,18(4):435-453.

(責任編輯:鄧 妍)

Inference of Strengths of Effects between Predictors in Cox Regression Based on W ald Test

Liu Chang,Pan Hui,Chen Zicong,et al
(Departmentof Medical Statistics and Epidemiology,School of Public Health,SunYat-Sen University(510080),Guangzhou)

ObjectiveTo solve the common problem that standardized regression coefficients are compared w ith each other directly by researchers,we propose a rankingmethod based on Wald test,and illustrate it by a example of small cell lung cancer patients.MethodsLearning Strategies from Student-Newman-Keuls test,make hypothesis tests of sample standardized regression coefficients by Wald testw ith comparing times as few as possible,in order to explore the relationship between population standardized regression coefficients and partition subsets of predictors according to theirmagnitude of effects to the dependent variable.ResultsThe four selected predictors are allocated to two subsets,we can consider that predictors in subset 1(size and age)have less effects on prognosis than predictors in subset2(neuron-specific enolase),while the effects of carcino-embryonic antigen stays between the two subsets.ConclusionRanking predictors based on Wald test can overcome subjectivity of effectsmagnitude judgement in result report of regressionmodels.

Standardized regression coefficients;Wald test;Prognosis;Effect

廣東省科學技術廳科技計劃項目(2014A020212713)

1.中山大學公共衛生學院醫學統計與流行病學系(510080)

2.廣州醫科大學附屬第一醫院轉化醫學實驗室

△通信作者:張晉昕,E-mail:zhjinx@mail.sysu.edu.cn

猜你喜歡
標準化差異影響
相似與差異
音樂探索(2022年2期)2022-05-30 21:01:37
是什么影響了滑動摩擦力的大小
標準化簡述
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
找句子差異
生物為什么會有差異?
標準化是綜合交通運輸的保障——解讀《交通運輸標準化體系》
中國公路(2017年9期)2017-07-25 13:26:38
擴鏈劑聯用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
論汽車維修診斷標準化(上)
M1型、M2型巨噬細胞及腫瘤相關巨噬細胞中miR-146a表達的差異
主站蜘蛛池模板: 高h视频在线| 色爽网免费视频| 亚洲精品午夜天堂网页| 亚洲人成网站观看在线观看| 亚洲国产成人精品无码区性色| 九月婷婷亚洲综合在线| 国产精品爆乳99久久| 日本国产一区在线观看| 欧美日韩动态图| 精品国产99久久| 一本大道东京热无码av| 国产女同自拍视频| 蜜桃臀无码内射一区二区三区| 精品伊人久久久大香线蕉欧美 | 国产精品女在线观看| 精品一区二区久久久久网站| 欧美精品成人一区二区视频一| 亚洲毛片网站| 国产拍揄自揄精品视频网站| 欧美色综合网站| 日本免费一区视频| 亚洲午夜片| 狠狠做深爱婷婷久久一区| 国内精品九九久久久精品| 天天躁日日躁狠狠躁中文字幕| 亚洲日韩精品伊甸| 国产精品爆乳99久久| 欧美精品啪啪一区二区三区| 无码国产偷倩在线播放老年人| 国产一级无码不卡视频| 久久久亚洲色| 91久久精品日日躁夜夜躁欧美| 精品欧美一区二区三区久久久| 91年精品国产福利线观看久久 | 成年人视频一区二区| 国产情精品嫩草影院88av| 日韩成人免费网站| 亚洲自偷自拍另类小说| 秘书高跟黑色丝袜国产91在线 | 精品国产电影久久九九| 强奷白丝美女在线观看| 97综合久久| 久久综合色天堂av| 日韩第一页在线| 热九九精品| 亚洲成网站| 亚洲va欧美va国产综合下载| 久久青草视频| 亚洲无线国产观看| 91探花在线观看国产最新| www.91中文字幕| 中文字幕亚洲无线码一区女同| 久久久黄色片| 国产精品手机视频一区二区| 人妻中文字幕无码久久一区| 不卡色老大久久综合网| 三上悠亚精品二区在线观看| 女人av社区男人的天堂| 91在线高清视频| 99热这里只有精品免费| 黄色网站不卡无码| 一本无码在线观看| 国模私拍一区二区| 国内丰满少妇猛烈精品播| 国产成人一区| 91免费国产在线观看尤物| 国产女人在线视频| 亚洲女同欧美在线| 国产欧美网站| 日本免费一区视频| 日韩在线播放中文字幕| 亚洲人成网18禁| 一级毛片不卡片免费观看| 亚洲成aⅴ人片在线影院八| 97人人做人人爽香蕉精品 | a在线亚洲男人的天堂试看| 国产精品香蕉| 99热这里只有成人精品国产| 色精品视频| 成年人免费国产视频| 国产精品久久久久久影院| 波多野结衣第一页|