金夢媛
(西南交通大學,四川 成都 611756)
某省公路網OD調查是一項浩大復雜的系統工程,從調查的組織實施到數據獲取及處理分析等各個環節,需要花費大量的人力、物力、財力。如何從調查中獲得高精度的OD表并得到較好擬合效果,以便更加科學合理地為交通決策服務,是近年來OD調查及數據處理的重點。由于OD調查具有工作量大、費用高、數據處理難度大等特點[1],因此研究科學合理的方法來獲取和處理OD數據具有重要的現實意義。繼2004年該省第一次全省公路OD調查之后,2010年該省開展了第二次全省公路網OD調查,調查主要采用基于視頻牌照檢測技術的車牌照調查法。筆者在某單位實習,參與了OD調查,并對OD調查報告進行分析研究。筆者認為此次調查從OD數據獲取到數據處理分析等過程均取得了一定的創新和突破。
車輛在調查區域的公路網行駛過程中,以公安監控設備調查點、連續式觀測站調查點、間歇式觀測站調查點、收費站(主線收費站和互通黃道收費站)調查點和其他普通調查點為車牌照數據采集點,對車輛的行駛軌跡進行跟蹤,利用車牌照圖像識別技術,生成公路OD原始數據庫;以原始數據庫為基礎,利用原始車輛軌跡處理法,對原始數據進行分析和處理,最終得到整個調查區域的公路OD情況。同時,為了得到真實的OD數據,有必要在省界調查點處,進行補充停車詢問調查。利用視頻牌照檢測進行公路OD調查的實現過程分為四個步驟,分別是交通小區的劃分、調查點的布設和優化、數據分析和處理和公路網OD的生成。利用車牌照圖像識別技術進行公路OD調查的機理如圖1所示[2]。

圖1 公路網OD獲取方法機理圖
數據處理工作是非常細致、難度非常高的工作,需要結合公路網的拓撲情況進行車輛出行軌跡分析,并對異常數據進行踢除、修補,進而生成公路網OD表。
海量數據處理國內首次運用車輛軌跡法,即:從全部原始車牌調查數據中可以統計出路網中相異車牌號數量,以及每輛車所經過的調查點,將調查點按時間順序排序,即可得到每輛車出行所經過的調查點序列。假設車輛的在公路上的出行都遵守最短路徑優先原則,對調查點序列中的相鄰兩個調查點,利用最短路徑搜索算法得到這全部相鄰調查點之間的最短路徑(最優路徑)。按照調查點序列順序,將所有的最短路徑連接起來,即可得到每輛車出行的詳細信息。通過統計全部車輛起點、終點,可得到全路網的OD分布矩陣;通過統計全部車輛的出行路徑,可得到全路網所有路段的交通量。圖2所示為車牌照調查法的車輛運行軌跡[3]。

圖2 車輛軌跡示意圖
基于視頻牌照檢測的公路網OD獲取中的異常數據主要有:路徑缺失數據、字形識別錯誤和路徑無效數據。一條車牌數據包括:序號、日期、車牌號、車型、調查點編號、速度、通過時間、備注。基于車牌識別技術的原始車牌調查數據庫中的數據在使用前需對不符合規范的異常數據進行校驗和修正,以最大限度地滿足數據處理的基本需求。
2.2.1 路徑上缺失數據處理方法
對于路徑上丟失的車牌數據,把當前采集的交通變量看作時間序列,并結合歷史數據對丟失的數據進行預測估計,采用基于遺傳算法的組合模型來處理。基于遺傳算法的組合模型[5]的思想是:對于同一缺失數據進行處理,可以用多種方法,例如遺傳算法、神經網絡算法等,每種方法都有各自的優點和缺陷及適用性,為了充分利用各種模型的優點,同時對其缺點進行修正,本文將不同的方法進行組合,只要選好權重便可得到較好的處理結果。為使模型簡化,只針對一個缺失數據進行修補,大量的數據缺失可以采用循環的辦法同理解決。其算法描述如下:
Step1建立組合模型:
假設同一缺失數據現象,可以采用m種不同修補類型,各模型的修補結果為Y=(y1,y2,…,yi,…,yn)T,其中:yi為第i種模型的修補值。組合模型如式(1)和(2)所列。

式中:X為組合模型的最優修補值;Pi*為第i種模型在組合模型中的最優權重。
暢談過后,毛澤東交代兩位遠道而來的弟弟:“你們在北京住上幾天,還是早點回湖南去。”并解釋說,“我當主席了,是革命的需要,要替人民辦事。我們是革命者,不能搞‘打虎親兄弟’那一套,要為人民服務,為大多數人謀福利。”
Step2建立求解模型:
設車牌數據矩陣A=(aij)nxs的行表示行程時間,列表示車牌屬性,akl表示缺失車牌數據。其求解數學模型如式(3)和式(4)所列。

式中:Pi為第 i種模型在組合模型中的權重;yij為第 i種模型對ajl的預測值;m為不同模型數。
Step3基于遺傳算法[6]對其求解。
2.2.2 字形識別錯誤數據的處理方法
針對字形識別錯誤數據情況,基于最近鄰聚類算法[7]對其進行處理。最近鄰聚類算法的主要思路是將空間R中的每一點和與之最近的點屬于同一類的可能性最大的情況找出來。假設兩個距離最近的點之間的距離小于設定的距離閾值d,那么就把它們歸為同一類。其算法描述如下:
給定數據集 Z={Z1,Z2,…,Zi,…Zn}∈Rm,為數據集的任意一點,N(k)保存每類的數據點數,A(k)保存每類的數據點信息,k為聚類數量。
Step1從第一個樣本點Z1(x1,y1)開始,令其自成一類,聚類中心為C1(x1,y1),k=1,N(1)=1,將樣本點Z1放入到A(1)中。
Step3考慮第i個樣本點,已經存在k個聚類中心C1(x1,y1),C2(x2,y2),…,Ck(xk,yk),計算Zi(xi,yi)到 k個聚類中心的距離dji(j=1,2…k),找出其中最小的一個距離dji,如果dji≤r,則Ck為Zi的最近聚類,將Zi放入到A(j)中,并將聚類中心調整為新的聚類中心Ck[(xk+xi)/2,(yk+yi)/2],類數k不變,N(j)加1;如果d>r,則將Zi作為一個新的聚類中心Ck+1(xk,yk),k加 1,N(j)=j,將樣本點 Zi放入到 A(j)中。
Step4重復第三步的操作,直到所有的樣本點都歸類完畢為止。
Step5形成初始聚類集 C={c1,c2,…,ck}。
2.2.3 無效數據的處理方法
針對無效數據情況,基于格拉布斯統計法[8]的基本思想,其實質是給定一個置信系數,并找出相對應的置信區間,判斷標準是只要落在置信區間以外的數據,就可以認為是無效車牌數據,并將無效數據從測定值數列中刪除,然后再對無效數據進行修補。Zi(t)其算法描述如下:
Step1計算樣本均值:

Step2計算樣本標準差:

Step3剔除無效數據。
比較‖Xi(t)(t)‖與2S,剔除‖Xi(t)(t)‖≥2S的Yi(t),然后根據檢測值的個數及給定的顯著性水平a(一般取a=0.05),用查表法查出格拉布斯統計量的臨界值T(n,a),然后與統計量T進行對比分析。按照小概率事件不發生和在Xi(t)服從高斯分布時不出現的原則,若 T≥T(n,a),則認為統計量T的分布存在顯著性差異性,對應的Xi(t)含有數據誤差,應予以舍棄。

Step4重復以上三步的操作過程,直至所有的測量數據都滿足準則。
基于視頻牌照檢測數據,采用上述軌跡處理法及異常數據處理等方法,結合區域公路網拓撲結構,以及調查點的布設情況,構建區域公路網ArcGIS地理信息平臺,并在該平臺上開發了一套面向該項OD調查的車牌照法數據處理程序,程序中包含了由多種車輛出行軌跡模式組成的軌跡模式庫和軌跡判別機制,可對各類的車輛軌跡進行全面、系統的分析,以調查點OD數據為基礎,最終得到公路網OD數據,同時還可以派生為地市級OD數據、縣級OD數據和鄉鎮級OD數據等,使公路網OD數據更加符合工程師的需要。圖3是基于ArcGIS地理信息系統的軌跡分析界面,圖4是車牌數據處理程序工作界面,最終生成的全省公路網OD表見表1所列。

圖3 基于ArcGIS地理信息系統的軌跡分析圖示

圖4 視頻牌照數據處理程序工作界面圖示
采用軌跡處理法和異常數據處理方法對825萬條車牌數據進行了統計分析處理,得到路網中車輛數量為1 792 581 veh,原始的完整車輛軌跡數量為1 303 428 veh(擴樣后的車輛出行軌跡為1 916 526 veh),單車牌(車牌出現一次)車輛數為489 153 veh。此次OD調查的全部數據結果都是通過對擴樣后191多萬條的車輛出行軌跡進行統計分析得到的。由以上數據計算可知利用軌跡處理法擴樣率是6.91%;調查點分布與OD配對的成功率是72.71%;最初得到的130萬條軌跡所對應的交通量分布情況與實際調查中的交通量分布情況具有較小的相對誤差。因此,軌跡計算交通量與實際調查交通量的吻合性說明了:(1)調查中獲取的大量的車牌數據樣本量在數據處理中發揮了重要的作用,確保了數據的準確度;(2)軌跡處理法和異常數據處理方法在處理海量的車牌數據時,可以將車牌還原成車輛出行軌跡,且準確度較高;(3)130萬條原始的車輛出行軌跡與實際路網中全部車輛的出行軌跡情況基本吻合,為數據擴樣的準確度提供了保障。

表1 利用視頻牌照檢測得到的基礎OD表
公路網OD數據的獲取方法和處理分析直接關系到調查結果的精確度,本文以2010年某省公路網OD調查為例,對基于視頻牌照檢測技術的車牌照調查法進行了闡述,分析了軌跡分析法和異常數據的處理方法。基于此,結合區域公路網拓撲結構,以及調查點的布設情況,構建區域公路網ArcGIS地理信息平臺,并在該平臺上開發了一套面向該項OD調查的車牌照法數據處理程序。程序中包含了由多種車輛出行軌跡模式組成的軌跡模式庫和軌跡判別機制,可對各類的車輛軌跡進行全面、系統地分析,以調查點OD數據為基礎,最終得到公路網OD數據,從而更好的為全省公路網規劃、公路網交通管理與控制、交通信息發布及路線誘導、建設和管理智能化服務平臺等服務,同時也為其他省市開展此類研究提供了指導。
[1]王圓圓,郭江輝,侯周文.公路區域OD數據庫更新技術探討[J].交通科技,2010,(6):79-81.
[2]周繼彪.基于視頻牌照檢測的公路網OD獲取及更新模型研究[D].西安:長安大學,2012.
[3]徐岸.車輛牌照信息調查法在公路OD調查中的應用[J].交通工程,2012,(12):47-49.
[4]楊兆升.基礎交通信息融合技術及其應用[M].北京:中國鐵道出版社,2005.
[5]史峰等.MATLAB智能算法30個案例分析[M].北京:北京航空航天大學出版社,2011.
[6]陸林花.遺傳聚類算法在污水處理異常數據分析中的應用[J].計算機應用與軟件,2011,28(6):199-201.
[7]Jian Sun,Yu Feng.A Novel OD Estimation Method Based on Automatic Vehicle Identification Data[J].Intelligent Computing and Information Science Communications in Computer and Information Science,2011,135(10):461-470.