999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于車流速度的混合Gaussian分布模型

2016-11-28 02:08:00諶業(yè)文胡堯王旭琴李麗
統(tǒng)計與決策 2016年20期
關(guān)鍵詞:模型

諶業(yè)文,胡堯,王旭琴,李麗

(貴州大學理學院,貴陽550025)

基于車流速度的混合Gaussian分布模型

諶業(yè)文,胡堯,王旭琴,李麗

(貴州大學理學院,貴陽550025)

為了更好的描述城市道路車流運行狀態(tài),文章利用χ2檢驗、核密度估計、Gaussian分布和EM算法,提出了基于交通流速度的混合Gaussian分布模型。利用χ2檢驗驗證了不同車道占用對道路通行影響程度存在顯著差異;對混合模型速度數(shù)據(jù),采用核密度方法估計獨立子Gaussian分布數(shù)目,并利用所建模型描述不同車道占用引起的車流速度變化差異;最后利用該模型進行了城市道路混合車型識別。實踐表明,混合Gaussian分布模型在擬合數(shù)據(jù)與展現(xiàn)車流狀態(tài)方面具有良好效果,為道路設(shè)計與交通組織管理提供了一定的理論依據(jù)。

交通工程;混合Gaussian分布;χ2檢驗;核密度估計;EM算法

0 引言

交通流模型將車流視為大量車輛構(gòu)成的可壓縮連續(xù)流體,通過速度、密度、流量等參數(shù)構(gòu)建顆粒流動力學方程,既描述了交通流空間分布,又反映了隨時間變化規(guī)律,基于速度、密度、流量等參數(shù)關(guān)系及其變化規(guī)律的研究得到了廣泛應(yīng)用[1]。研究表明交通速度參數(shù)通常服從Gaussian分布,但由于受道路條件、坡度、混合車型等因素影響,其分布也會發(fā)生變化,呈現(xiàn)偏態(tài)、多峰等特性。道路交通實際是由不同狀態(tài)的交通流組合而成,對于某時刻的特定道路,自由流速度能表示成多個獨立自由流速度分布加權(quán)和[2]。Ko和Guensler[3]按速度建立分布模型,針對分布特征,Dey等[4]提出了車輛速度混合分布模型,通過若干有限獨立Gaussian分布線性加權(quán)平滑逼近[5]。研究表明,速度數(shù)據(jù)集是能由多個Gaussian分布擬合的。

然而,城市道路交通流屬于間斷交通流[6],存在一定的分割效應(yīng),駛離信號交叉口的車輛常被分成某種特定隊列。此外,對于不同的駕駛條件,行駛速度存在差異,小型車速度較快、大型車較慢,有時會出現(xiàn)特定路段,交通擁擠時有利于穿插的車輛(如摩托車)其速度則較快,反之則較慢。因此,研究混合Gaussian分布模型展現(xiàn)城市道路混合車流交通狀態(tài),具有一定的現(xiàn)實意義。在已有研究基礎(chǔ)上,本文構(gòu)建了基于車流速度的混合Gaussian分布模型,利用χ2檢驗表明不同車道占用對道路通行影響程度存在顯著差異,模型也驗證了混合Gaussian分布辨別交通狀態(tài)差異、識別車型具有一定的效果。實踐表明,混合Gaussian分布模型在擬合數(shù)據(jù)、展現(xiàn)城市道路交通狀態(tài)具有良好效果,為道路設(shè)計與交通組織管理提供一定的參考依據(jù)。

1 模型建立

1.1 指標選取

交通流速度作為反映交通流狀態(tài)和交通運行特征的基本參數(shù)之一,在交通安全、事故鑒定、道路交通狀態(tài)與運行效率等分析中均具有重要地位,利用它研究交通運行已得到了比較理想的效果。文獻[7]研究表明速度變量能較好反映交通擁堵強度的變化情況;相對于交通密度和流量而言,文獻[8]得出了速度在交通流分類中有作用最大且效果最好的結(jié)論。

基于以上考慮,本文選取速度指標來研究城市因道路施工、交通事故等原因造成車道被占用引起的交通流變化,以及道路暢通情況下利用速度變量的混合Gaussian分布對道路車型進行類型識別。

1.2 不同車道被占用對道路交通狀態(tài)影響程度的差異顯著性

為了檢驗不同車道被占用對道路通行情況的影響是否存在顯著差異,本文采用非參數(shù)統(tǒng)計量(1)式進行χ2檢驗判定。理論證明,當樣本量足夠大時,該統(tǒng)計量近似服從:

式中n表示不同條件的車道被占用數(shù)目,fi表示第i個條件下車道被占用時實際觀察到的當量小客車輛數(shù)(PCU,Passenger Car Unit),f0表示不同車道被占用理論上應(yīng)該觀察到的車輛數(shù)目。

1.3 混合Gaussian分布模型

2 模型求解

2.1 Gaussian子分布數(shù)確定

通常并不知道城市道路不同條件下數(shù)據(jù)源到底來自多少個獨立子Gaussian分布,因此進行EM算法求解模型參數(shù)的前提是確定數(shù)據(jù)源的子Gaussian分布數(shù),在此按以下步驟進行確定。

第一:繪制原始數(shù)據(jù)頻率直方圖通過頻率直方圖觀察到頻率分布情況,確定子分布數(shù),一般波峰的數(shù)量就是子Gaussian分布個數(shù)。但有時頻率直方圖并不容易判斷波峰個數(shù),則可進一步借助核密度估計方法,使該問題能得到較好的解決。

第二:對原始數(shù)據(jù)進行核密度估計設(shè)X1,X2,…,Xn是來自一元連續(xù)總體的隨機樣本,任意點x處的概率函數(shù)f(x)的核密度估計為:

其中,Φ(x)為核函數(shù),h為窗寬。根據(jù)(3)式選取恰當?shù)膆并描繪關(guān)于x與其密度估計式的平面曲線圖,通過觀察波峰數(shù)即可對模型子分布數(shù)給出合理估計。

2.2 混合Gaussian分布參數(shù)估計的EM算法

混合模型結(jié)構(gòu)確定以后,選擇合適的參數(shù)估計方法是逼近速度真實分布的關(guān)鍵,混合Gaussian分布參數(shù)估計通常采用最大期望即EM(EXpectation-MaXimization)算法。EM算法本質(zhì)是在(2)式中尋找參數(shù)最大似然估計或者最大后驗估計的算法,是求解參數(shù)期望(E步)和最大值(M步)不斷交替的優(yōu)化過程,算法如下。

上式兩邊取對數(shù)

對于(4)式,用一般似然估計尋求極值點的方法是行不通的,因此,在這里采用分步迭代期望最大化算法。v是非完全數(shù)據(jù),則有完全數(shù)據(jù)yi=(xi,vi),Θ為參數(shù)向量以及f(xi,vi; Θ)為yi的概率密度函數(shù),其中xi的邊緣概率為P(xi=k)=wk, k=1,2,…,M。此時f(vi|xi=k,Θk)=φk(v;Θk),關(guān)于完全數(shù)據(jù)求其似然函數(shù)得:

其中

由(5)式與(6)式得完全數(shù)據(jù)的似然函數(shù):

所以,EM算法的具體迭代步驟如下。

第1步參數(shù)初始化

方法1模型權(quán)重相等

方法2利用多元統(tǒng)計K均值聚類算法通過對樣本進行聚類得到各類均值可作為,并計算,之后通過聚類結(jié)果利用各類樣本占總樣本的比例作為權(quán)值。

第2步E步(求期望)

設(shè)Θ(r)為第r次迭代值,則:

所以

式中Pik為xk的后驗概率。

第3步M步(求最大值)

第4步收斂判斷

3 實證分析

3.1 車速服從混合Gaussian分布模型的實例驗證

3.1.1 數(shù)據(jù)源

模型實驗數(shù)據(jù)采集于貴陽市中心城市區(qū)主干道延安中路(紫林庵至噴水池方向)三車道斷面(圖1所示)。

表1、表2分別統(tǒng)計了不同車道被占用和道路暢通狀態(tài)時同一斷面的通過車輛數(shù)以及平均速度。其中表1指標解釋:Situation1(或Situation2)表示車道1、車道2(或車道2、車道3)處于封閉狀態(tài),此時,車輛只能從車道3(或車道

圖1 數(shù)據(jù)采集地點

1)正常通過;Situation3表示斷面正常通行。

表1 不同車道被占用與道路暢行時斷面通過標準車當量數(shù)

表2 車輛速度樣本數(shù)據(jù)(單位:km/h)

3.1.2 標準車當量總數(shù)差異性的χ2檢驗

(1)考慮“暢通狀態(tài)”時的情況

在這里,f0為表1中三種情況下通過斷面的標準車當量數(shù)1353 pcu,而f1、f2、f3分別表示Situation1、Situation2與Situation3條件下通過斷面的當量車輛總數(shù)。由(1)式可知,當f0越大,近似效果越好。顯然fi與f0相差越大,χ2值就越大;反之,χ2值就越小。因此,χ2統(tǒng)計量能夠用來表示fi與f0相差程度。

由χ2檢驗思想與(1)式得:

χ2=由于,因此,認為表1中的三種情況對交通流的影響程度存在顯著差異。

(2)不考慮“暢通狀態(tài)”時的情況

由于加入了暢通情況,很自然的就會懷疑,表1中的三種情況會存在差異(這與(a)情況下的檢驗結(jié)果一致)。那么,為了驗證Situation1和Situation2對交通影響“顯著差異”,將暢通狀態(tài)即Situation3的數(shù)據(jù)排除。類似(a)方法得:

由于χ2=12.84>(2)=7.879,表明Situation1和 Situation2對交通流量所帶來的影響程度也是不一樣的。

不同車道被占用對路段影響程度存在顯著差異,三種情況的車流速度樣本源數(shù)據(jù)來自不同總體,且不同源數(shù)據(jù)進行的正態(tài)K-S(Kolmogorov-Smirnov)檢驗表明均來自正態(tài)總體。因此,以下基于混合車流速度數(shù)據(jù)估計混合Gaussian分布模型參數(shù),并將進行驗證分析。

3.1.3 車速服從混合Gaussian分布模型

通過分析,不同車道被占用對交通狀況(特別是速度)的影響程度是不一樣。圖2給出了表1中三種情況下的車輛平均速度頻率直方圖,呈現(xiàn)多峰分布特點,這是由于不同條件速度存在的較大差異所致。以下利用混合Gaussian分布考察Situation1和Situation2交通狀況影響程度的差異性。

在利用EM算法估計未知混合Gaussian模型參數(shù)之前,首先確定子Gaussian分布數(shù)目。雖由圖可看出原始數(shù)據(jù)源于三個Gaussian分布,為了驗證核密度估計算法與頻率直方圖峰值近似的特點,對數(shù)據(jù)進行核密度估計,這是因為在觀察頻率直方圖不能明確判斷子Gaussian分布個數(shù)情況下,應(yīng)用核密度估計來判斷子Gaussian分布數(shù)目是行之有效的。本文均選取核函數(shù)為標準正態(tài)密度函數(shù),核密度估計曲線如圖2所示。

圖2 三種情形車輛速度頻率直方圖和核密度估計圖

因此,混合模型(2)式的子Gaussian分布數(shù)為三,通過R語言利用EM算法估計混合Gaussian模型參數(shù)。進一步利用K-S(Kolmogorov-Smirnov)對模型進行擬合優(yōu)度檢驗,所得結(jié)果如表3所示。

表3 三種情形下混合Gaussian分布EM算法參數(shù)估計結(jié)果

K-S檢驗的P值為0.9935,故沒有理由拒絕速度數(shù)據(jù)服從混合Gaussian分布模型。其中Situation1、Situation2和Situation3分別服從于Gaussian分布I、Gaussian分布II與Gaussian分布III,三種情況的權(quán)重ω占有率分別為28.08%、30.04%和41.88%。比較表1,此處運用的EM算法判斷混合模型中各個子Gaussian分布所占比重較接近實際(如圖3所示)。

圖3 三種情形混合Gaussian分布的EM算法估計圖

3.1.4 不同車道被占用引起的交通狀態(tài)差異性分析

(1)對比分布Gaussian I、Gaussian II與Gaussian III。首先,從表3得到,道路暢通狀態(tài)下的平均速度63.40km/h大于車道1、車道2被占用時的30.13km/h與車道2、車道3被占用時的15.44km/h,從圖3可清晰看出三種情況下車速的變化情況及其相互之間的聯(lián)系,表明任何兩條車道被占用對交通正常運行所帶來的影響是顯著的,相關(guān)部門應(yīng)加強類似行為和相關(guān)事件的強行管制。其次,分布Gaussian III的標準差9.46km/h大于前面8.05km/h和2.19km/h,表明道路在暢通狀態(tài)下,車輛的速度變化范圍比其他兩種情況偏大。

(2)通過將Gaussian分布I與Gaussian分布II對比,發(fā)現(xiàn)前者的平均速度30.13km/h大于后者的15.44km/h,表明車道2、車道3被占用對交通流的影響大于車道1、車道2被占用對交通流帶來的影響。從表3與圖3發(fā)現(xiàn),Situation1時的車速變化范圍比Situation2車速變化范圍大。

(3)上述實例驗證表明,混合Gaussian分布模型對于描述多正態(tài)總體的交通流速度規(guī)律是非常方便有效的,而將EM算法應(yīng)用于混合Gaussian分布參數(shù)估計,不僅對參數(shù)估計有效而且還能較好的估算出子Gaussian分布所占比重,這對于分析交通流狀態(tài)是非常適用的。應(yīng)用該模型可進一步了解特定交通流狀態(tài),以下針對Situation3進行車輛類型識別。

3.2 車速服從混合Gaussian分布模型應(yīng)用—城市道路交通車型識別

3.2.1 數(shù)據(jù)源

表4數(shù)據(jù)采集同樣基于貴陽市中心城區(qū)主干道延安中路(紫林庵至噴水池方向)路段斷面的928輛不同車型平均速度,描繪其頻率直方圖(如圖4所示)。

表4 該路段暢通狀態(tài)下“三個車道”的多類型車輛速度樣本數(shù)據(jù)(單位:km/h)

圖4 三車道多類型車輛速度頻率直方圖和核密度估計圖

從圖4可以看出,三車道多類型車輛由于自身特性所致的速度呈現(xiàn)多峰特點,不同類型的車速通常是不一樣的,本文具體包括小轎車、公交車以及其它車種(如摩托車、三輪車)等三種類型。若采用傳統(tǒng)的對數(shù)正態(tài)、Gaussian、Gamma以及Weibull等單峰分布模型去擬合速度都不能很好的呈現(xiàn)真實交通現(xiàn)象,因此,混合Gaussian分布模型對該類交通現(xiàn)象進行分析是有現(xiàn)實意義的。

3.2.2 參數(shù)估計

若僅從源數(shù)據(jù)圖形仍無法判定源總體,子Gaussian分布數(shù)目難以確定。可以借助類似前面核密度估計算法,擬合核密度估計曲線(如圖4所示)。圖中看到視頻數(shù)據(jù)來自三個Gaussian分布,利用EM算法估計混合Gaussian模型未知參數(shù),估計結(jié)果見表5。

表5 道路暢行時混合Gaussian分布EM算法參數(shù)估計結(jié)果

在表5中,給定置信水平0.95,由于K-S檢驗P值0.0803大于0.05,因此,沒有充分理由拒絕源數(shù)據(jù)(視頻)是來自表5中所得的混合Gaussian分布模型,各類車型擬合曲線如圖5所示。

圖5 道路暢通狀態(tài)下高斯混合分布的EM估計圖

3.2.3 結(jié)果分析討論

(1)從表5可知,混合交通流中小轎車、大型車和其他車型所占比例分別為59.69%、28.61%與11.70%。由于城市道路中摩托車搶道、三輪車及大型車(如公交車)的存在,從而導致交通流速降低。通過源數(shù)據(jù)對路段混合交通流車型比例估計以及速度分布的確定,有助于了解交通壓力源,進而制定道路交通組織管理策略。

(2)從期望μ即速度平均值可知,小轎車的速度(61.56km/h)高于其它車種(18.82km/h)及大型車(30.76km/h),圖5也清晰展現(xiàn)三種車型的速度變化分布情況。通過混合Gaussian分布模型能夠有效得到并且區(qū)分不同類型車輛的速度分布規(guī)律,為不同車型的強制交通管理提供了一定的參考依據(jù)。

(3)小轎車由于自身優(yōu)勢,最大速度一般高于大型車和其他車型,但盡管在道路暢通狀態(tài)下,仍然可能遇到擁擠堵塞等車輛排隊現(xiàn)象(如車輛超車、搶道,行人橫穿道路等造成),因此,它的最低速度與大型車、其它車型相差不大,導致其方差比較大。因而,表5中小轎車車速的標準差11.1km/h大于大型車的6.17km/h、其他車型的2.23km/h。

(4)模型檢驗結(jié)果顯示,由于混合交通流速度中含有多種類型的車輛運行數(shù)據(jù),導致車流速度呈現(xiàn)出多峰或偏正態(tài)現(xiàn)象。因此,在研究類似問題時,無論在交通還是其他領(lǐng)域,對于來自多源樣本數(shù)據(jù),充分利用混合Gaussian分布模型多峰特點,能夠較好的反映真實場景,解決問題能達到理想效果。

4 結(jié)語

本文以χ2檢驗、核密度估計算法、混合Gaussian分布與EM算法為基本研究方法對道路交通參數(shù)(速度)進行了分析探討。首先,通過利用χ2檢驗表明不同車道被占用對交通流的影響是顯著的,并實例驗證,為交管部門正確誘導車輛行駛、審批占道施工、道路設(shè)計渠化、路邊停車和非港灣式車站等組織管理措施的制定提供了一定的參考依據(jù)。其次,核密度估計算法對確定混合Gaussian分布模型中獨立子分布數(shù)目簡單易行。最后,基于城市道路交通流間斷性、復雜性、混合性與非均衡性等特點,建立了基于車流速度服從混合Gaussian分布的交通流狀態(tài)模型,對判定路段混合交通流的車型數(shù)目是有效的,為交通組織管理區(qū)域或路段交通狀況并制定相關(guān)措施提供了可行合理的理論參考依據(jù)。

[1]Kerner B S.Three一phase Traffic Theory and Highway Capacity[J]. PhysicalA:StatisticalMechanicsand Its Applications,2004,(333).

[2]王曦,祝付玲.基于高斯混合分布的交通擁堵評價模型[J].公路交通科技,2011,28(2).

[3]Ko J,Guensler R.Characterization of Congestion Based on Speed Di一stribution:A Statistical Approach Using Gaussian Mixture Model [C].w ashington D.C:The Proceeding of the 82nd Annual Meeting of the Transportation Research Board.Transportation Research Board. 2005.

[4]DEy P P.Chandra S,Gangopadhaya S.Speed Distribution Curves Under Mixed Traffic Conditions[J].Journal of Transportation Engineeri一ng,2006,132(6).

[5]袁禮海,李釗,宋建社.利用高斯混合模型實現(xiàn)概率密度函數(shù)逼近[J].無線電通信技術(shù),2007,33(2).

[6]巫威眺,沈旅歐,靳文舟.假設(shè)速度服從截斷正態(tài)分布的公交車隊密度離散模型[J].華南理工大學學報(自然科學版),2013,(2).

[7]任其亮,肖裕民.城市路網(wǎng)交通擁堵H一Fuzzy評判方法研究[J].重慶交通大學學報(自然科學版),2008,27(5).

[8]楊祖元,黃席樾,杜長海等.基于FFCM聚類的城市交通擁堵判別研究[J].計算機應(yīng)用研究,2008,25(9).

(責任編輯/易永生)

U491

A

1002-6487(2016)20-0087-05

國家統(tǒng)計局重點項目(2014LZ46);貴州省自然科學基金資助項目(黔科合J字[2014]2058號)

諶業(yè)文(1989—),男,貴州貴陽人,碩士,研究方向:應(yīng)用統(tǒng)計。胡堯(1971—),男,貴州貴陽人,教授,研究方向:應(yīng)用統(tǒng)計。王旭琴(1991—),女,貴州貴陽人,碩士,研究方向:應(yīng)用統(tǒng)計。李麗(1991—),女,貴州貴陽人,碩士,研究方向:應(yīng)用統(tǒng)計。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 激情视频综合网| 全裸无码专区| 免费99精品国产自在现线| 日韩精品亚洲一区中文字幕| 国产精品3p视频| 国产伦精品一区二区三区视频优播| 欧美成人午夜影院| 中文字幕欧美日韩高清| 国产成人福利在线| 国产成人福利在线视老湿机| 欧美在线一二区| 97在线碰| 成人在线不卡| 国产中文一区a级毛片视频 | 欧美精品高清| 精品欧美日韩国产日漫一区不卡| 超碰91免费人妻| 亚洲 成人国产| 无码AV日韩一二三区| AV天堂资源福利在线观看| www.99在线观看| 亚洲天堂在线视频| 一级做a爰片久久毛片毛片| 毛片免费观看视频| 日韩国产亚洲一区二区在线观看| 激情爆乳一区二区| 制服丝袜亚洲| 欧美成a人片在线观看| 亚洲人成电影在线播放| 亚洲欧美综合在线观看| 久久综合激情网| 欧美视频在线观看第一页| 欧美另类精品一区二区三区| 九九视频免费看| 69精品在线观看| аⅴ资源中文在线天堂| 天天激情综合| 欧美97欧美综合色伦图| 草草影院国产第一页| 欧美a级在线| 国产欧美在线| 国产精品主播| 日韩无码白| 久草视频福利在线观看| 久久96热在精品国产高清| 日本亚洲成高清一区二区三区| 亚洲色欲色欲www在线观看| 亚洲男人的天堂视频| 亚洲Av激情网五月天| 久青草网站| 亚洲精品无码在线播放网站| 九九视频在线免费观看| 国产精品制服| 伊人色综合久久天天| 在线无码九区| 日韩专区第一页| 91无码人妻精品一区| 国产亚洲欧美日本一二三本道| 久久精品嫩草研究院| 日本www在线视频| 国产成人精品男人的天堂下载| 91啪在线| 天堂成人av| 91在线播放国产| 久久熟女AV| 97视频免费看| 九九精品在线观看| 国产91高清视频| 欧美第九页| 欧美在线视频不卡第一页| 国产毛片高清一级国语 | 免费人成视网站在线不卡| 岛国精品一区免费视频在线观看| 亚洲成人黄色在线| 日韩高清一区 | 精品无码国产自产野外拍在线| 中文无码精品A∨在线观看不卡| 欧洲高清无码在线| 国产又粗又爽视频| 2021国产精品自产拍在线观看| 天天视频在线91频| 国产网站免费观看|