999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

生存分析模型及在交通工程的應用

2020-05-18 02:41:13宮小雯劉鍇
科技創(chuàng)新與應用 2020年14期

宮小雯 劉鍇

摘? 要:交通大數(shù)據(jù)經(jīng)常面對數(shù)據(jù)刪失、截尾、缺失等問題。生存分析模型可以很好地處理該問題,在交通領域逐步推廣。它將事件結果與出現(xiàn)這一結果所經(jīng)歷的時間結合,可以判斷事件發(fā)生或者結束時間的分布或探究解釋變量對生存時間的影響。國內(nèi)外許多研究通過生存分析的靈活應用及拓展,為很多實際交通問題提供了解決方法和指導意見。文章首先介紹了主要生存分析的適用性及擬合優(yōu)度比較方法,并介紹若干交通領域生存模型應用案例。

關鍵詞:生存分析;適用性;擬合優(yōu)度;交通工程

中圖分類號:U491.2? ? 文獻標志碼:A? ? ? ? ?文章編號:2095-2945(2020)14-0022-03

Abstract: The application of big data in transportation has to face various problems such as censor, truncation, and missing data. Survival analysis is a good choice to deal with this phenomenon. It combines the event result with the time elapsed after the occurrence of the result, and can estimate the distribution of survival time or explore the effect of explanatory variables on survival time. Many studies have provided solutions and guidance for practical traffic problems through the flexible application and expansion of survival analysis. This article first introduces the applicability of major survival analysis and comparison methods of goodness of fit, as well as several case studies in transportation field.

Keywords: survival analysis; applicability; goodness of fit; transport engineering

引言

生存分析模型也稱為持續(xù)時間模型,作為基于實驗或調(diào)查數(shù)據(jù)分析生存時間的一種統(tǒng)計方法,近年來已逐步應用于交通領域的擁堵[1],高峰[2]及等待時間[3]等實際問題的研究。研究對象的狀態(tài)可能為兩種以上,抽樣方式和分布往往具有多樣性且一般存在刪失數(shù)據(jù)。本文介紹生存分析的基本概念,主要模型的適用性及擬合優(yōu)度的評判標準,結合現(xiàn)有交通研究進行案例分析。

1 生存分析

1.1 生存時間

交通預測面臨很多動態(tài)預測需求。例如高峰期擁堵開始至結束的持續(xù)時間,行人到達交叉口至開始闖紅燈所經(jīng)歷的等待時間等。這些例子都包括起始事件和結束事件,事件經(jīng)歷的時間即生存時間。

1.2 生存函數(shù)

生存函數(shù)又稱累計生存率,表示單個事件的生存時間T大于時間t的概率,即單個事件在時間t之后仍然存活的概率。如果隨訪數(shù)據(jù)中不存在截尾數(shù)據(jù),生存函數(shù)可以表示為:

1.3 概率密度函數(shù)和風險函數(shù)

生存分析概率密度函數(shù)定義為事件在t時刻結束的概率,概率密度函數(shù)為非負函數(shù),各時刻結束概率繪制成的曲線與時間軸之間的面積為1。公式表示為

2 主要生存分析模型及其適用性

生存分析模型有三種形式:非參、參數(shù)及半?yún)⒛P汀_x擇時主要取決于想要預設的生存函數(shù)類型以及協(xié)變量如何對生存時間產(chǎn)生影響。非參生存方法主要用于對隨訪數(shù)據(jù)進行統(tǒng)計性描述,本文主要介紹半?yún)?shù)和參數(shù)生存模型的適用性及其案例。

2.1 半?yún)?shù)生存模型

2.1.1 模型介紹

半?yún)?shù)生存模型首次提出于1972年[4],它不需要預先設定生存時間的分布,但卻可以最終通過模型反映生存時間的變化以及協(xié)變量對生存時間的影響,近年來已成為最受歡迎的生存模型。

其中,Cox比例風險模型(Cox proportional hazards model)最受歡迎,是“穩(wěn)健”模型,調(diào)整后的生存曲線可以良好的估計各種數(shù)據(jù)并獲得風險比,給出了可靠的擬合結果。在應用于實際問題之前需確保數(shù)據(jù)滿足風險概率假定,即加入模型的協(xié)變量對生存率的影響不隨著時間而改變。其風險函數(shù)表達式為

式中,h0(t)為基礎風險函數(shù),未指定任何分布。不包含時間的X的指數(shù)分布確保了模型始終給出非負的風險估計。PH假定即基準風險h0(t)是t的函數(shù)而與X無關,指數(shù)部分是X的函數(shù),與t無關。半?yún)?shù)模型在滿足PH假定的前提下具有普適性和較高的靈活性,Cox比例風險模型沒有限定生存時間的分布,也就無法得到任意時刻的概率密度值。因此估計協(xié)變量的參數(shù)時,使用偏似然函數(shù)代替極大似然法。

2.1.2 案例分析

半?yún)?shù)生存分析由于其獨特優(yōu)勢而被廣泛應用跟馳時間、救援時間、等待時間研究。趙海月(2018)[5]應用Cox比例風險模型研究特殊天氣下信號交叉口的行人穿越行為,將生存時間定義為行人在紅燈期間到達道路交叉口等待區(qū)至離開等待區(qū)的時間跨度,將行人選擇遵守法規(guī)等待至綠燈時離開的數(shù)據(jù)定義為“刪失”。該研究探討了出行時段、個人特征、行為變量三類因素對行人忍耐時間的影響,分析結果對提升行人過街安全具有一定現(xiàn)實意義。

楊茜(2018)[6]使用Cox比例風險模型對相同問題展開研究,呈現(xiàn)了較好地模型擬合效果且結構完整。在進行PH假定檢驗的過程中,該論文指出若某些協(xié)變量不滿足要求,可以考慮將其從比例風險中剔除。但事實上在許多實際問題研究中,可以通過對Cox比例風險模型地適當變形來解決。張彥寧(2020)[7]等人在對駕駛員跟馳反應延遲時間的研究中就使用了分層Cox模型進行分析。近年來,為應對隨訪數(shù)據(jù)中協(xié)變量的多種問題,研究中經(jīng)常被使用的半?yún)?shù)生存模型還包括分層Cox模型,Cox共享脆弱模型,帶有時間相關變量的Cox風險模型等。

2.2 參數(shù)生存模型

2.2.1 模型介紹

當生存時間的分布明確,參數(shù)模型是最佳選擇。參數(shù)生存模型需要給出生存時間服從特定的參數(shù)分布。若某生存分析中僅有協(xié)變量性別(女性=0,男性=1),而在任何特定時間內(nèi)受訪者均處于“存活”,半?yún)?shù)模型無法像參數(shù)模型一樣完成Kaplan-Meier估計。

非參數(shù)和參數(shù)方法比較了在“死亡”發(fā)生節(jié)點的受訪者,參數(shù)方法不基于結果進行此類比較,而是使用概率描述了在給定的時間范圍內(nèi),受訪者在整個時間間隔中發(fā)生的情況。參數(shù)生存分析同樣具有分層、脆弱等多種變化以適應數(shù)據(jù)和變量的復雜性,主要的參數(shù)分布有指數(shù)分布、Weibull分布、對數(shù)Logistic分布、伽馬分布等,風險函數(shù)和生存函數(shù)的表達形式如表1所示。

其中λ為尺度參數(shù),決定分布的離散程度;ρ為形狀參數(shù),決定分布的整體形態(tài)。

2.2.2 案例分析

參數(shù)生存模型相對于半?yún)?shù)生存模型來說可以獲得更好的數(shù)學形式。李明(2015)[8]定義生存時間為從零點開始至居民出發(fā)去購物為止所經(jīng)歷的時間段,引入了個人特征、家庭結構和出行方式三類變量研究購物出發(fā)時間的影響因素。在利用赤池信息準則、Cox-snell殘差法比較擬合優(yōu)度后,最終選擇log-logistic模型進行預測并制定了相應的交通管理措施。

生存分析中的脆弱因子為不同個體或群體間的異質(zhì)性提供了很好的解決方案。該概念由Vaupel等人在1979年提出,將隨機效應引入模型可以解決未觀測到的因素對模型結果產(chǎn)生的影響。生存分析中的脆弱因子一般服從伽馬或逆高斯分布。何清廉(2018)[9]在對信號交叉口黃燈期間停車行為的研究中將脆弱因子引入對數(shù)正態(tài)模型中,打破了駕駛員均質(zhì)性的假設,使模型結果更加可靠。

3 擬合優(yōu)度評估

3.1 赤池信息準則和貝葉斯信息準則

赤池信息準則(AIC;1973)和貝葉斯準則(BIC;1978)是現(xiàn)階段應用最廣泛的模型選擇標準,利用似然估計值比較不同分布模型的擬合程度,都兼顧了模型簡單性和擬合優(yōu)度之間的平衡,并帶有懲罰項以防止過度擬合。從Raftery(1995)[10]對AIC和BIC的比較中認為當樣本量足夠大時,BIC選擇正確的模型而AIC選擇了比真實模型更復雜的模型。參數(shù)和半?yún)?shù)生存分析之間無法使用AIC、BIC進行橫向比較。

3.3 Harrell's C指標

Harrell's C指標(Harrell,1982)[12]針對右刪失的比例風險模型開發(fā),后逐步擴展至Cox比例風險模型等。基于生存模型預測的較早“死亡”受試者生存時間較短,反之亦然這一特性,該統(tǒng)計量通過所預測的受訪者死亡順序與實際一致的概率C來比較半?yún)?shù)生存分析的擬合效果。對任意t>0,一致性的表達形式為

其中i,j表示樣本中的任意一對觀測者;Ti,Tj表示真實的“死亡”時間;? ? ?表示預測的死亡時間。當C=0.5時,模型不足以基于隨訪數(shù)據(jù)進行預測;當C=1時,模型具有完全預測能力,可以很好的擬合生存數(shù)據(jù)。

4 結束語

生存分析利用統(tǒng)計學相關理論,在探究生存時間影響因素的過程中將事件結果與所經(jīng)歷時間相結合,這種獨特性使其成為了現(xiàn)代統(tǒng)計學的一個重要分支而被廣泛研究。本文首先介紹了生存分析的基本概念,回顧了生存模型的主要類型和適用性,最后總結了不同類型生存分析所適用的擬合效果評估準則和指標。在探究生存模型在交通領域具體應用的過程中,本文發(fā)現(xiàn)了現(xiàn)有研究的不足并結合實例進行案例分析,希望能為后續(xù)研究提供理論基礎。

參考文獻:

[1]熊勵,陸悅,楊淑芬.城市道路交通擁堵預測及持續(xù)時間研究[J].公路,2017,62(11):125-134.

[2]石莊彬.基于生存分析的軌道交通客流高峰持續(xù)時間區(qū)間預測[A].中國智能交通協(xié)會.第十二屆中國智能交通年會大會論文集[C].中國智能交通協(xié)會:中國智能交通協(xié)會,2017:251-260.

[3]李志銀.信號交叉口行人穿越行為建模與分析[D].北京交通大學,2017.

[4]Cox DR. Regression models and life-tables. Journal of the Royal Sta- tistical Society. Series B,1972,34(2):187-220.

[5]趙海月.下雨天氣對信號交叉口行人穿越安全行為的影響分析[D].北京交通大學,2018.

[6]楊茜.信號交叉口行人過街忍耐時間建模及應用[D].重慶交通大學,2018.

[7]張彥寧,郭忠印,高坤,等.基于分層COX模型的跟馳反應延遲時間生存分析[J].交通運輸系統(tǒng)工程與信息,2020,20(01):54-60.

[8]李明.基于風險模型的城市居民購物出發(fā)時間分布規(guī)律分析[D].北京交通大學,2015.

[9]何清廉.考慮駕駛員異質(zhì)性的信號交叉口黃燈期間停車行為研究[D].北京交通大學,2018.

[10]Raftery A E. Bayesian Model Selection in Social Research[J]. Sociological Methodology, 1995,25:111-163.

[11]Cox D R, Snell E J. A General Definition of Residuals[J]. Journal of the Royal Statistical Society. Series B: Methodological, 1968,30(2):248-275.

[12]Harrell F E J, Califf R M, Pryor D B, et al. Evaluating the Yield of Medical Tests[J]. JAMA The Journal of the American Medical Association, 1982,247(18):2543-2546.

主站蜘蛛池模板: 国产精品视频猛进猛出| 91免费观看视频| 亚洲成年网站在线观看| 成人av专区精品无码国产| 亚洲日韩精品综合在线一区二区| www.日韩三级| 国产一区三区二区中文在线| 国产精品人成在线播放| 亚洲中文精品人人永久免费| 色婷婷在线播放| 国产欧美高清| 亚洲男人在线| 精品少妇人妻无码久久| 天天干天天色综合网| 国产无码精品在线播放| 无码精品一区二区久久久| 久久婷婷国产综合尤物精品| 久久人人妻人人爽人人卡片av| 亚洲资源站av无码网址| 人妻无码一区二区视频| 精品福利网| 国产一区二区福利| 色欲不卡无码一区二区| 国产精品欧美日本韩免费一区二区三区不卡| 欧美午夜精品| 免费99精品国产自在现线| 日韩av电影一区二区三区四区| 国产第一页第二页| 欧美成人综合在线| 亚洲人免费视频| 欧美性色综合网| 久久夜色精品国产嚕嚕亚洲av| 中文字幕色在线| 日韩东京热无码人妻| 2021最新国产精品网站| 精品国产www| 97国产成人无码精品久久久| 色成人亚洲| 麻豆精品在线| 免费播放毛片| 亚洲国产成人无码AV在线影院L | 久久久久亚洲精品成人网| 91青青视频| 免费人成视网站在线不卡| 五月激情婷婷综合| 日本一区二区不卡视频| 暴力调教一区二区三区| 国产一区二区三区免费观看| 亚洲黄色成人| 久久午夜影院| 久久国产高潮流白浆免费观看 | 国内精品免费| 中文字幕波多野不卡一区| 免费观看无遮挡www的小视频| 亚洲人成色在线观看| 欧美成在线视频| 伊人久久大香线蕉综合影视| 国产尤物视频在线| 中文字幕在线不卡视频| 亚洲综合第一区| 欧美一区二区三区国产精品| 波多野结衣二区| 91亚洲视频下载| 中文字幕人成乱码熟女免费| 国产成人AV综合久久| 精品成人一区二区三区电影 | 狠狠色丁香婷婷| 色爽网免费视频| 91视频99| 国产在线观看精品| 无码国内精品人妻少妇蜜桃视频| 亚洲日韩国产精品综合在线观看| 99久久精彩视频| 色天天综合久久久久综合片| 91人妻日韩人妻无码专区精品| 91麻豆国产视频| 中文字幕乱码中文乱码51精品| 精品久久久久成人码免费动漫| 国内熟女少妇一线天| 国产精品网址在线观看你懂的| jizz亚洲高清在线观看| 国内熟女少妇一线天|