999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

病例交叉研究中條件Logistic回歸在Python中的實(shí)現(xiàn)

2023-06-06 06:00:38張清煜李培政羅晨曦李湘瑩
關(guān)鍵詞:模型研究

張清煜,李培政,羅晨曦,李湘瑩,馬 露

武漢大學(xué)公共衛(wèi)生學(xué)院(武漢 430071)

病例交叉研究由美國學(xué)者麥克盧爾(McClure)于1991年提出,是一種通過比較研究對象在急性事件發(fā)生前一段時間的暴露情況與未發(fā)生事件的某段時間內(nèi)的暴露情況,來研究短暫暴露對罕見急性病的瞬間影響的流行病學(xué)方法,目前已成為環(huán)境污染相關(guān)健康效應(yīng)研究中應(yīng)用最廣泛的設(shè)計類型之一。病例交叉研究的數(shù)據(jù)中,通常只有病例沒有對照,為了研究暴露與研究對象疾病罹患的關(guān)系,通常以該患者健康效應(yīng)出現(xiàn)時間點(diǎn)前(和/或后)的某幾個時間點(diǎn)該患者的個體暴露狀態(tài)作為其自身對照,形成1 ∶ 1 或者1 ∶ M 的配比[1]。因此在統(tǒng)計方法上通常采用條件Logistic回歸對數(shù)據(jù)進(jìn)行分析。目前常規(guī)統(tǒng)計軟件如R、SAS 等均可完成條件Logistic 回歸分析[2]。相較于傳統(tǒng)數(shù)據(jù)統(tǒng)計工具,Python 作為一款流行的計算機(jī)語言,具有強(qiáng)大的通用性與可拓展性特點(diǎn),特別是在控制其他軟件實(shí)現(xiàn)自動化處理,智能化完成數(shù)據(jù)的采集、清洗、預(yù)處理以及數(shù)據(jù)挖掘等方面擁有明顯優(yōu)勢。但目前將Python 應(yīng)用于流行病學(xué)研究的案例較為少見,因此本文將應(yīng)用病例交叉研究的實(shí)例,探討Python 實(shí)現(xiàn)條件Logistic 回歸的過程,并比較其與R 和SAS 統(tǒng)計軟件在建模以及參數(shù)估計結(jié)果上的異同,以拓展Python 在流行病學(xué)領(lǐng)域中的應(yīng)用。

1 資料與方法

1.1 資料來源

案例資料來源于某地某年的住院首頁資料,根據(jù)國際疾病分類第10 版(ICD-10)對疾病進(jìn)行編碼,選擇肺部感染(ICD-10 代碼:J98.414)的患者作為研究對象。在這項研究中,共有3 216例肺部感染患者納入研究。

氣象數(shù)據(jù)來自中國氣象數(shù)據(jù)網(wǎng),包含該地研究期間的每日平均溫度(℃)和日平均相對濕度(%),NO2濃度(μg/m3)資料來源于當(dāng)?shù)丨h(huán)境監(jiān)測中心。研究對象病例日(部分)溫度、濕度以及NO2濃度數(shù)據(jù)如表1所示。

表1 某地污染物信息Table 1.Pollutant information of a place

1.2 模型構(gòu)建

本研究Python 使用Cox 回歸對條件Logistic回歸進(jìn)行擬合,Cox 比例風(fēng)險模型的基本形式為:

h(t,X)=h0(β'X)=h0(t)exp(β1X1+β2X2+…+βmXm)

h(t,X)是具有協(xié)變量X 的個體在時刻t 時的風(fēng)險函數(shù),t 為生存時間,X=(X1,X2,…,Xm)'是可能影響生存時間的有關(guān)因素。h0(t)是所有協(xié)變量取值為0 時的風(fēng)險函數(shù),稱為基線風(fēng)險函數(shù)。β=(β1,β2,…,βm)為Cox 模型的回歸系數(shù),是待估的回歸參數(shù)[3]。

2 結(jié)果

2.1 數(shù)據(jù)預(yù)處理

根據(jù)病例交叉研究的原理,在原始數(shù)據(jù)的基礎(chǔ)上,需要為每個病例日匹配3 至4 個對照日,使得對照組的特征與病例組的特征相似,以減少潛在混雜因素對研究結(jié)果的干擾。方法為選擇病例日和對照日為同年、同月的同一個星期幾,本研究對應(yīng)選擇了10 995 個對照日。SAS 擬合條件Logistic 回歸有兩種方法,分別為直接使用Logistic 回歸和借用Cox 回歸并定義分層變量后實(shí)現(xiàn),兩者運(yùn)行結(jié)果相同。本文Python 和SAS 均采用分層Cox 風(fēng)險比例模型進(jìn)行擬合,此法需新增一個時間變量(time),令time=1-case(病例日case編碼為1,對照日case編碼為0),設(shè)置原則為:病例日對應(yīng)的值小于對照日對應(yīng)的值即可。新設(shè)置的變量time 可作為Cox 風(fēng)險比例模型中的生存時間變量,case 相當(dāng)于終檢變量[4]。匹配后數(shù)據(jù)信息(部分)見表2。

表2 預(yù)處理后某地污染物信息Table 2.Pollutant information of a place after pretreatment

2.2 模型擬合

條件Logistic 回歸在Python 中的實(shí)現(xiàn)首先需調(diào)用pandas 庫導(dǎo)入病例交叉數(shù)據(jù)并命名為“wb”,“columns.tolist()”為定義新列所用的函數(shù),“col_name.insert(7,'time')”確定新列所在位置以及名稱,“df['time']=1-df['case']”是新列“time”生成的計算方式,本文中原則是time=1-case,最后生成新的數(shù)據(jù)集命名為“base_data”。具體命令如下:

import pandas as pd

wb=pd.read_excel(r"D: case-crossover.xlsx ",sheet_name="Sheet1")

col_name=wb.columns.tolist()

col_name.insert(7,'time')

df=wb.reindex(columns=col_name)

df['time']=1-df['case']

print(df)

base_data=df

print(base_data)

然后調(diào)用lifelines 庫中的CoxPHFitter 函數(shù),“binglimerge.fit(base_data,'time',event_col='case',strata=['ID'])”,依次在括號中放入數(shù)據(jù)集、生存時間變量、終檢變量、分層變量。具體命令如下:

from lifelines import CoxPHFitter

binglimerge=CoxPHFitter()

binglimerge.fit(base_data,'time',event_col='case',strata=['ID'])

binglimerge.print_summary()

reults=binglimerge.summary

round(reults,7)

2.3 模型驗(yàn)證

R 4.2.1 軟件采用survival 包中的clogit 函數(shù)對條件Logistic 回歸模型進(jìn)行擬合,對實(shí)例資料的分析過程為:

library(readxl)

library(survival)

base_data<- read_xlsx("D:/ case-crossover.xlsx ")

options(digits = 8)

mod<-clogit(case ~ no2+temperature+humidity+strata(ID),base_data)

summary(mod)

AIC(mod)

SAS 9.1 版本采用phreg 過程步對條件Logistic回歸模型進(jìn)行擬合。其與Python 類似,在導(dǎo)入數(shù)據(jù)后,首先需對數(shù)據(jù)進(jìn)行預(yù)處理,增加新變量time(time=1-case)。對實(shí)例資料的分析過程為:

libname orange "D:sas data";

data base_data;set orange.binglijiaocha;time=1-case;run;

proc phreg data=base_data;

model time*case(0)= temperature humidity no2/ties=discrete risklimits;strata ID;

quit;

2.4 結(jié)果比較

Python 和SAS 在調(diào)用數(shù)據(jù)后,需要通過特定代碼運(yùn)行新增變量“time”,以方便采用分層Cox風(fēng)險比例模型進(jìn)行擬合。R 則無需進(jìn)行上述操作,可直接通過clogit 函數(shù)實(shí)現(xiàn)模型擬合。與Python和SAS 相比,R 沒有默認(rèn)輸出AIC 值,需另運(yùn)行“AIC()”函數(shù)實(shí)現(xiàn)其結(jié)果輸出。

三款軟件輸出的主要結(jié)果基本相同(表3)。針對P 值的檢驗(yàn)方法上,R 與Python 輸出參數(shù)為z 值,SAS 輸出參數(shù)為χ2值,兩種檢驗(yàn)也是完全等價的(z 值的平方與χ2值相等)。

3 討論

在使用Python 和SAS 這兩款軟件時,本研究均用分層Cox 風(fēng)險比例模型的運(yùn)行代碼來擬合條件Logistic 回歸模型,而R 語言則直接運(yùn)用survival 包中的clogit 函數(shù)進(jìn)行擬合,不用另對始變量進(jìn)行處理。其擬合原理是在分層Cox 模型中,各層的基線風(fēng)險函數(shù)之間完全無關(guān),而且Cox 風(fēng)險比例模型在擬合時并沒有估計基線風(fēng)險函數(shù),只對各協(xié)變量的系數(shù)值β 進(jìn)行了估計,這和條件Logistic 回歸模型只求出系數(shù)值β 的思路一致[5]。有研究對Cox 比例風(fēng)險模型總偏似然函數(shù)和條件Logistic 回歸分析的似然函數(shù)理論公式進(jìn)行推導(dǎo)后,發(fā)現(xiàn)它們完全等同[4]。本研究中三款軟件均采用極大似然估計法對參數(shù)進(jìn)行估計,其運(yùn)行結(jié)果完全相同,證實(shí)了擬合結(jié)果的可靠性。在衡量最優(yōu)模型的標(biāo)準(zhǔn)中,Python 以及SAS 軟件均自動輸出AIC 值,但R 未自動輸出該值,原因是R 調(diào)用的clogit 函數(shù)中不含衡量最優(yōu)模型標(biāo)準(zhǔn)的相關(guān)值的運(yùn)算代碼。另外,三款軟件輸出參數(shù)有z 值與χ2值的差異,其原因是不同軟件的開發(fā)人員在統(tǒng)計檢驗(yàn)傾向上不同,但z 值的平方等于χ2值,可以認(rèn)為Waldχ2檢驗(yàn)是等價于Z 檢驗(yàn)的[6]。

Python 作為一款面向?qū)ο蟮母呒壘幊陶Z言,已經(jīng)成為最受歡迎的程序設(shè)計語言之一,在各行各業(yè)都發(fā)揮著重要的作用,常用于Web 應(yīng)用開發(fā)、人工智能、自動化運(yùn)維、游戲開發(fā)等領(lǐng)域,其價值不可估量[7]。但在統(tǒng)計分析方面,Python的統(tǒng)計功能相對R 來說還比較薄弱,其自帶的處理功能和函數(shù)模型不及R 齊全,本研究中Python得采用Cox 風(fēng)險比例模型去擬合條件Logistic 回歸,并且整個運(yùn)行過程相較另外兩款統(tǒng)計軟件都更復(fù)雜。在增加新變量方面,SAS 的操作步驟比Python 簡潔很多。在可視化方面,Python 擁有Matplotlib 及Numpy 等繪圖庫[8],可滿足可視化需求。R 作為一款為統(tǒng)計分析而設(shè)計的軟件,其可視化功能更為強(qiáng)大,它采用簡潔的函數(shù)就能構(gòu)建各類圖形,并且在默認(rèn)條件下的繪圖品質(zhì)就能達(dá)到出版要求,但是R 在智能化方面以及非統(tǒng)計分析領(lǐng)域的應(yīng)用遠(yuǎn)不及Python。

綜上所述,將Python 應(yīng)用于統(tǒng)計分析領(lǐng)域,憑借其豐富的第三方庫以及快速運(yùn)算大數(shù)據(jù)的優(yōu)勢,能大大提高數(shù)據(jù)的智能化處理與分析效率。本研究使用Python 軟件實(shí)現(xiàn)了條件Logistic 回歸的統(tǒng)計建模,在實(shí)際研究中有一定的參考價值。

猜你喜歡
模型研究
一半模型
FMS與YBT相關(guān)性的實(shí)證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产哺乳奶水91在线播放| 日韩免费无码人妻系列| 久久亚洲中文字幕精品一区| 亚洲嫩模喷白浆| 午夜激情婷婷| 国产一区二区精品高清在线观看| 亚洲综合欧美在线一区在线播放| 国产Av无码精品色午夜| 伊人色综合久久天天| 日韩少妇激情一区二区| 色老头综合网| 欧美午夜理伦三级在线观看| 蜜臀av性久久久久蜜臀aⅴ麻豆| 亚洲成a人片77777在线播放| 91精品国产91久无码网站| 日韩一级二级三级| 超碰91免费人妻| 四虎成人精品| 香蕉蕉亚亚洲aav综合| 国产视频大全| 青青久视频| 午夜福利视频一区| 亚洲爱婷婷色69堂| 国产91高清视频| 免费国产好深啊好涨好硬视频| 欧美亚洲一二三区| 91麻豆精品视频| 无码精油按摩潮喷在线播放| 国产精品第| 欧美性猛交一区二区三区| 嫩草在线视频| 亚洲欧美天堂网| 福利视频一区| 伊人福利视频| 亚洲综合色婷婷中文字幕| 午夜精品一区二区蜜桃| 国产理论最新国产精品视频| www.狠狠| 老司国产精品视频91| 四虎国产成人免费观看| 高清码无在线看| 99久久精品免费看国产免费软件| 久久综合九色综合97网| 欧美成人午夜视频免看| 欧美日韩国产精品va| 在线日韩日本国产亚洲| 天天综合色网| 国内黄色精品| 色亚洲激情综合精品无码视频 | 国产女人在线视频| 免费99精品国产自在现线| 欧美一级夜夜爽www| 这里只有精品在线播放| 精品视频第一页| 99在线观看精品视频| 亚洲色欲色欲www在线观看| 人妻91无码色偷偷色噜噜噜| 欧类av怡春院| 中文字幕亚洲无线码一区女同| 日韩毛片免费观看| 亚洲综合色区在线播放2019| 国产激情无码一区二区APP | 999精品在线视频| 99热这里只有精品在线观看| 91精品国产福利| 国产欧美高清| 欧美激情视频一区二区三区免费| 免费国产在线精品一区| 老司机久久精品视频| 另类综合视频| 久久精品无码国产一区二区三区| 91原创视频在线| 欧美成人手机在线观看网址| 国产人人干| 国产理论精品| 亚洲天堂2014| 4虎影视国产在线观看精品| 免费A级毛片无码无遮挡| 久久精品人人做人人爽97| 午夜精品久久久久久久2023| 日韩亚洲综合在线| 国产青榴视频|