潘義勇,管星宇
(南京林業(yè)大學(xué) 汽車與交通工程學(xué)院,江蘇 南京 210037)
速度-密度關(guān)系基本圖模型是交通流理論的基礎(chǔ),挖掘兩者之間的關(guān)系有利于在交通狀態(tài)識(shí)別、交通擁堵分析等領(lǐng)域發(fā)揮重要的作用[1-2]。現(xiàn)有的研究主要集中在速度-密度關(guān)系確定基本圖模型,由于交通流具有固有的隨機(jī)特性和異質(zhì)特性,確定性的速度-密度關(guān)系限制了其表征實(shí)際交通流的能力,導(dǎo)致在交通控制策略建模中產(chǎn)生誤差[3]。因此需對(duì)交通流速度-密度關(guān)系隨機(jī)基本圖模型問(wèn)題進(jìn)行研究。
針對(duì)速度-密度關(guān)系確定基本圖模型研究很多,自從Greenshields模型首次提出以來(lái),其缺點(diǎn)是密度值較大或較小時(shí),模型擬合效果較差,在此基礎(chǔ)上改進(jìn)的模型有:Greenberg模型,Underwood模型,Northwestern模型,Newell模型,這些模型都是單階段確定性模型[4],多階段模型這里不再闡述。在對(duì)速度-密度確定關(guān)系模型參數(shù)進(jìn)行擬合過(guò)程中,主要存在兩個(gè)問(wèn)題:數(shù)據(jù)點(diǎn)低密度狀態(tài)下的分布較為密集,導(dǎo)致均值回歸受異常點(diǎn)影響較大;實(shí)測(cè)的速度、密度值具有隨機(jī)性,在對(duì)數(shù)據(jù)進(jìn)行均值回歸時(shí),難以滿足方差齊性和正態(tài)性的假設(shè)要求[5]。
針對(duì)速度-密度關(guān)系隨機(jī)基本圖模型的研究非常少,S.E.JABARI等[6]、S.FAN[7]分別針對(duì)特定的交通流模型推導(dǎo)了速度概率分布函數(shù)和密度的關(guān)系模型,但是該方法不能推廣到其他交通流模型;X.QU 等[8]提出基于不同百分位的交通流速度-密度關(guān)系基本圖模型,根據(jù)不同的百分位點(diǎn)采用加權(quán)最小二乘法對(duì)不同的百分位點(diǎn)進(jìn)行參數(shù)擬合獲得關(guān)系模型,但是該方法從根本上還是采用最小二乘法進(jìn)行參數(shù)擬合,異常值對(duì)擬合效果影響較大。
針對(duì)以上問(wèn)題,引入分位數(shù)回歸獲得速度-密度關(guān)系隨機(jī)基本圖模型[9],分位數(shù)回歸在計(jì)量經(jīng)濟(jì)學(xué)中已經(jīng)獲得了廣泛的應(yīng)用,分位數(shù)回歸采用最小一乘法進(jìn)行參數(shù)擬合,對(duì)異常值具有更好的魯棒性,更能反映數(shù)據(jù)整體的分布狀況,更全面的反映數(shù)據(jù)信息,適用性更廣,有利于對(duì)交通流數(shù)據(jù)的深度挖掘,這是筆者研究的出發(fā)點(diǎn)。首先,基于分位數(shù)回歸建立交通流速度-密度關(guān)系隨機(jī)基本圖模型;其次,利用分位數(shù)回歸對(duì)實(shí)際交通流數(shù)據(jù)進(jìn)行速度-密度曲線參數(shù)擬合,獲得不同分位數(shù)水平的速度-密度曲線簇;第三,對(duì)參數(shù)值進(jìn)行了假設(shè)檢驗(yàn)和置信區(qū)間的計(jì)算,并對(duì)擬合結(jié)果進(jìn)行數(shù)值分析;最后,總結(jié)了筆者的研究成果以及進(jìn)一步研究的方向。
分位數(shù)回歸在高級(jí)計(jì)量經(jīng)濟(jì)學(xué)中已經(jīng)獲得了廣泛的應(yīng)用,根據(jù)不同的分位點(diǎn)得到對(duì)應(yīng)的回歸方程,可以直觀的描述自變量對(duì)因變量分布的變化[10]。式(1)表示在第τ分位點(diǎn)下得到的回歸方程,即分位數(shù)回歸模型的基本定義為:
(1)

(2)

基于分位數(shù)回歸構(gòu)建交通流速度-密度關(guān)系隨機(jī)基本圖模型,充分挖掘數(shù)據(jù)中隱含的信息。以Greenshields模型為例,基于分位數(shù)回歸模型改進(jìn)的Greenshields模型可以表示為:
(3)


表1 基于分位數(shù)回歸的速度-密度關(guān)系隨機(jī)基本圖模型
文中的數(shù)據(jù)來(lái)源于美國(guó)德克薩斯州圣安東尼奧市的高級(jí)交通管理系統(tǒng)TransGuide,從中選取了2條公路進(jìn)行分析:東行單向三車道的I-10公路(中間車道,傳感器編號(hào):L2-0010E-562.581)以及西行單向二車道的Loop-1604公路(第2條左車道,傳感器編號(hào):L2-1604W-034.326),數(shù)據(jù)點(diǎn)在24 h內(nèi)每隔20 s統(tǒng)計(jì)一次。在非線性模型的擬合中,為了避免數(shù)據(jù)在對(duì)數(shù)轉(zhuǎn)化中出現(xiàn)無(wú)窮大值,保證數(shù)據(jù)分析的可靠性,對(duì)數(shù)據(jù)進(jìn)行了整理,刪去數(shù)據(jù)集中密度值為0的點(diǎn)(I-10公路第22和第628個(gè)觀測(cè)值),共獲取I-10公路3 526對(duì)樣本值、Loop-1604公路3 258對(duì)樣本值。整理后的數(shù)據(jù)情況如表2,表2中分位差偏態(tài)測(cè)量(QSK)用于分析數(shù)據(jù)的偏態(tài)特征,QSK>0表示右偏,QSK<0表示左偏,QSK=0表示正態(tài)分布。其公式為:
(4)
式中:QSK(τ)為第τ分位點(diǎn)的分位差偏態(tài)測(cè)量值;Q(τ)、Q(1-τ)分別為數(shù)據(jù)第τ和(1-τ)分位點(diǎn)處的分位值。
表2中數(shù)據(jù)顯示,I-10公路在[0.3,0.7]分位點(diǎn)區(qū)間的數(shù)據(jù)呈現(xiàn)近似正態(tài)分布的特點(diǎn)(QSK=0),整個(gè)數(shù)據(jù)點(diǎn)的分布則呈現(xiàn)左偏分布(QSK<0),說(shuō)明收集到的低速數(shù)據(jù)較少。與I-10公路相比,Loop-1604公路的數(shù)據(jù)分布呈現(xiàn)出更為復(fù)雜的關(guān)系,但是2條公路從整體總體上都為左偏分布,圖1為2條公路速度觀測(cè)值的概率密度曲線,可以直觀地看出2個(gè)數(shù)據(jù)集的左偏特性。圖2、圖3表示基于馬氏距離的二維變量異常值檢測(cè)分布圖,考慮變量之間的相關(guān)性和數(shù)據(jù)之間的馬氏距離,根據(jù)圖形展示的信息,I-10公路的異常值為402個(gè)(占觀測(cè)值12.3%),主要集中于密度為[40,100]的區(qū)域;Loop-1604公路的異常值為125個(gè)(占觀測(cè)值3.8%),主要集中于密度為[60,120]的區(qū)域。結(jié)果顯示:2條公路在高密度區(qū)間產(chǎn)生了較多的異常值,在真實(shí)的交通狀況下,需要考慮這些異常值對(duì)速度變量的影響。結(jié)合分位數(shù)回歸模型以及均值回歸模型對(duì)異常值的魯棒性,采用分位數(shù)回歸模型更能反映速度與密度之間的關(guān)系。

表2 數(shù)據(jù)基本信息

圖1 概率密度分布

圖2 異常值分布(I-10)

圖3 異常值分布(Loop-1604)
結(jié)合R語(yǔ)言中quanterg包中的rq函數(shù)進(jìn)行線性擬合以及nlrq函數(shù)進(jìn)行非線性的擬合[11],對(duì)數(shù)據(jù)的0.05、0.1、…、0.95共計(jì)19個(gè)分位點(diǎn)進(jìn)行回歸分析,并對(duì)回歸系數(shù)進(jìn)行T檢驗(yàn)得到P值,P值表示回歸系數(shù)無(wú)效的概率值,用于驗(yàn)證回歸系數(shù)是否顯著(P<0.05,系數(shù)顯著)。


表3 Greenshields模型的擬合參數(shù)值(I-10公路)

圖4 Greenshields模型擬合(I-10)

圖5 Greenshields系數(shù)比較(I-10)


圖6 Northwestern模型擬合(I-10)

圖7 Northwestern系數(shù)比較(I-10)

圖8 Northwestern模型擬合(Loop-1604)

圖9 Northwestern系數(shù)比較(Loop-1604)


圖10 Newell模型擬合(I-10)

表5 Newell模型的擬合參數(shù)值(I-10公路)
擬合結(jié)果如圖11~圖14,對(duì)擬合結(jié)果進(jìn)行分析,得出:


圖11 Greenshields模型對(duì)比(0.5分位點(diǎn))


圖12 Greenshields模型誤差值(I-10)

圖13 Northwestern模型誤差值(I-10)

圖14 Newell模型誤差值(I-10)


表4 Northwestern模型的擬合參數(shù)值
針對(duì)交通流速度-密度關(guān)系基本圖問(wèn)題,首次引入分位數(shù)回歸獲得交通流速度-密度關(guān)系隨機(jī)基本圖模型,利用分位數(shù)回歸對(duì)速度-密度曲線進(jìn)行參數(shù)擬合,獲得不同分位數(shù)水平的速度-密度曲線簇,對(duì)參數(shù)值進(jìn)行了假設(shè)檢驗(yàn)和置信區(qū)間的計(jì)算,并對(duì)擬合結(jié)果進(jìn)行數(shù)值分析。數(shù)值試驗(yàn)結(jié)果表明:相比于已有模型,筆者提出的模型可以反映不同分位數(shù)水平下交通流速度和密度的關(guān)系,更能反映數(shù)據(jù)整體的分布狀況,更全面的反映數(shù)據(jù)信息,其中Northwestern分位數(shù)回歸模型的誤差值最小,擬合效果在上述模型中效果最好;提出的方法能夠反映不同數(shù)據(jù)集的特點(diǎn),適用性更廣,有利于對(duì)交通流數(shù)據(jù)的深度挖掘;該模型可以應(yīng)用于對(duì)交通流的建模和仿真中,不同密度值在不同的分位點(diǎn)對(duì)應(yīng)不同的速度和加速度值,有利于提高仿真的維度和靈活性;所提出的方法為交通流基本圖隨機(jī)模型構(gòu)建提供了一個(gè)方法論,可以推廣到其他未來(lái)交通流模型。本研究只考慮了單一交通流狀態(tài)下模型參數(shù)的擬合,而不同交通流狀態(tài)對(duì)參數(shù)擬合結(jié)果存在很大影響,需要進(jìn)一步進(jìn)行研究。