周 濤,裴劍平,唐 強
(1.中設設計集團股份有限公司,江蘇 南京 210014 ;2.蘇州大學 軌道交通學院,江蘇 蘇州 215131)
交通調查是進行交通規劃和交通預測的基礎,江蘇省規劃2018~2020年間新建9座過江通道,然而自2007年開展“江蘇省主要公路機動車OD調查”以來,近10年全省性交通調查數據未跟新,因此,開展了本次全省過江OD調查。隨著交通和信息化的快速發展,本研究結合大數據技術,充分利用行業數據、手機數據和微信問卷進行OD調查,并結合調查數據,采用大數據手段對數據進行聚類分析,形成以出行OD對為基礎的出行鏈,分析各種出行屬性的關聯性。
本次結合江蘇省的實際情況,調查主要采用高速公路聯網數據、汽渡票根數據、行業統計數據、調查問卷數據和電信手機信令等5種數據。5種不同類型的數據均從特定的角度反映了真實的過江特征,本次調查需對獲得的多源異構數據進行整合,形成具有法定效用的出行特征參數,供規劃建設單位使用。本次調查綜合各種調查方法的優勢,采用取長補短,結合實際情況結合,針對全省23處過江調查采取不同調查方法。8處過江大橋(全部收費)分別指南京長江第二大橋、南京長江第三大橋、南京長江第四大橋、潤揚大橋、泰州大橋、江陰大橋、蘇通大橋和崇啟大橋,采用高速公路聯網收費數據進行調查;13處汽渡(全部收費)分別指板橋汽渡、鎮揚汽渡等汽渡,采用票根數據進行調查;2處隧道分別為揚子江隧道和南京長江隧道(全部免費),采用隧道監控數據。
多源數據融合主要分為三類:數據層融合、特征層融合和決策層融合。本次研究主要在特征層和決策層進行融合,采用集中式分布體系,通過對比分析不同數據源的出行特征、OD結果進行融合擴樣,數據融合技術路線如圖1所示。
本次獲得的交通行業數據較全,基本滿足過江OD出行分析及主要的出行頻次、出行時間、載重等參數分析,因此,本次數據融合采用對比擴樣法,以交通行業數據為主,以微信調查數據和手機信令數據為擴樣對象,以每個過江通道的OD對小區為擴充對象,按照不同OD小區對交通量的差值進行出行特征擴樣,并形成完整的出行特征表(包含OD出行對)。
多源數據處理首先要對數據進行清洗,包含無效數據剔除、數據自校核和數據對比校核;其次數據融合包含數據的融合和擴樣。本次融合與擴樣均以各通道的區縣OD對為基礎,首先,將客運單位統一歸并到人,貨運單位統一歸并到t,完成單位歸一化處理;其次,依據各通道各區縣OD對的比例,對非全樣本數據(微信問卷數據和手機信令數據)進行擴樣,對應的其他出行特征相應進行擴樣;然后,以各通道區縣OD對為唯一標示碼,用Python語句的Join功能將不同數據源進行連接,將問卷數據中出行目的、載貨貨種、載客人數、出發時間等信息鏈接到OD數據對后;最后對數據按照通道、和全省三各維度進行數據合并。最后,根據融合后的數據進行出行特征分析和可視化展示。

圖1 多源數據融合體系框架圖
為了深入分析過江出行規律,更好地建立過江出行模型,本次在完整的出行屬性表之后,加入了時間、距離和費用參數。本次通過Python語句,調用高德地圖的API接口,按照Driving模式,最短時間模式提取任何兩個區縣OD對之間的出行時間、距離和費用;并且,通過各區縣的統計局統計各自的經濟GDP數據,并將二者GDP鏈接到OD對屬性表后面,建立了OD交通量、出行特征、時間費用以及經濟參數一一對應的屬性表,該屬性表將為建立過江出行模型提供詳實的數據基礎。
經過OD數據對進行融合擴樣后,將得到客貨完整的出行屬性表如表1所示。

表1 長江二橋客運出行屬性表(整理后)
相比于以往的交通調查,本次調查不僅獲得了真實完整的OD出行矩陣,并獲得了完整的出行特征,并且建立了OD對與出行特征一一對應的關系;同時,加入的時間、距離和經濟參數更加豐富了調查結果,理解任意兩個OD對間過江量具有重要的意義。圖2為出行特征畫像。

圖2 出行特征畫像
根據調查,獲得全省過江量約84.6萬pcu/d,其中客車占63.3%,貨車占36.7%;全省8座大橋機動車過江標準車約為54.5 pcu/d,約占總量的64.5%;兩處南京隧道過江機動車當量數約為21.1萬/d,約占總量的25.0%,其余13處汽渡過江量約9萬pcu/d,占比10.5%。在橋梁過江中,蘇通大橋通過車輛約13.0萬pcu/d,江陰大橋約9.9萬pcu/d,南京長江二橋約9.4萬pcu/d,此三座大橋擁堵已成為常態;節假日中,潤揚大橋、長江三橋也加入了擁堵行列。跨江大橋主要解決長江南北城市間區域出行,而地處南京兩座隧道解決江北新區與南京主城區之間通勤出行。融合分析手機信令數據和隧道流量監控數據,發現江北新區與主城區(江蘇省南京市秦淮區、建鄴區、鼓樓區等) 、江寧區之間流量占比超過81%。
從板塊來看,全省區域過江出行形成了兩頭重中間輕的空間格局,南京和(滬)蘇通過江出行占比超過50%,鎮揚和無錫過江占比較低,常州過江出行成為洼地。從OD出行結構來看,一帶兩軸的過江通道特征明顯,沿江兩岸區縣之間過江出行旺盛,占比超過54%,其次表現為沿我省中部通道和沿海通道沿線分布,通道特征與全省客流走廊基本一致。
從區域客運來看,呈現沿江城市連綿化發展趨勢,省內客運出行約占81%,省內貨運出行約占73%, 全省過江出行,以省內為主。省內出行占70.9%(隧道占全省25%),內外交通量(一端在省內,一端在省外)占23.9%,過境交通量出行(兩端均占省外)只占5.2%。從對外出行結構來看,安徽和上海與我省聯系密切,內外出行占比超過90%,說明我省是沿江大通道上核心省份,東西向交流十分密切;山東和浙江與我省聯系較強,內外出行占比約占71%,過境交通約占29%,說明我省是沿海大通道上重要省份,貫通南北。
過江隧道高峰小時位于早7∶00—8∶00,高峰小時系數約為8.8%,大橋客運高峰小時系數約為9%;貨運出行無明顯高峰特征。受益于南京大力建設江北新區,擁江發展,南京市通勤高頻次過江出行遠高于全省水平。全省來看,區域出行以公務出差為主,但各個區段又各有特色。全省客車平均載客率為3.5人/輛,其中南京區段最高為4.2人/輛,蘇通區段最低為2.6人/輛。全省貨種運輸中,農副產品、食品比例最高,達到16.5%,其次為金屬及制品,其他貨種占比較均勻。全省過江平均載重24.5 t/輛(含車輛自重),南京最高,為26.7 t/輛,錫常泰區段最低,為22.1 t/輛。
采用大數據技術對各屬性進行相關性分析,得到各相關性結論如下所示:①江蘇過江出行在通道選擇時,偏好選擇出行時間短的過江通道;而且傾向同一通道往返;②客運交通量、載客人數與經濟勢差之間有明顯的正比關系,而且兩城市間經濟差越大,二地間客流量越大;③出行時間越短,其交通占比越大,出行頻次也越高,上班、上學等通勤出行特征更明顯;數據顯示,50%以上的過江出行的出行時間均小于1h,江蘇省過江出行高頻次特征明顯;④貨運量運輸對出行費用更加敏感,客運出行對出行時間更加敏感;⑤通勤出行越明顯,載客率越高;運輸距離越近,載客率越高;商務出行和個人出行載客率較低;⑥城市的產業分布與貨種密切相關,南京區段的運輸設備、機械、電子通訊、石油、礦建等占比較高,鎮揚區段各產業在全省占比較低,錫常泰區段的金屬制品、物流快遞占比較高,蘇通區段的紡織原料、物流、農副產品、家具等占比較高。
圖3為利用過江隧道及全省過江出行期望線圖。

(a)兩隧道總OD圖

(b)板塊熱力圖

(c)江蘇省中區總量OD圖
按照區縣間OD對的屬性表,對過江交通量進行模擬分析。數據顯示,客運交通量主要與出行目的、出行頻次、時間、費用、兩地的經濟相關以及過江通道數量有關;而貨運交通量主要與兩地經濟、貨種、出行時間、費用、過江通道數量以及貨運政策相關。影響過江出行人數的因子主要有:起終點出行時間、出行距離、經濟、人口、費用、出行目的等。對全省數萬個OD對樣本進行綜合分析,過江人數與出行目的的相關顯著性sig為0.029,與時間相關性最高,而距離、時間和費用三者自相關系數大于0.98,與人口與經濟這兩個因素的相關系數高達0.926。考慮影響因素之間的相關性后,發現可用出行目的、人口、經濟以及出行時間模擬出行人數。
出行目的與人數相關,但相關不強;研究發現,分目的進行相關性分析之后,不同目的人數與人口、經濟以及時間的相關性有所提升。本次研究選擇按不同目的的出行人數W和人口P、經濟G、時間T進行了4種組合,組合1為人口、經濟和時間的線性組合;其他參照引力模型,分別建立3種組合,組合2為:W2=P起×E起/T2,組合3為W3E=E起×E/T2,
組合4為W4=E起×E中×P起×P/T4。其中P起代表起點人口,P終代表終點人口,
式中,E起為起點經濟,E終為終點經濟,Wi為第i種組合。
根據分析,采用引力模型較線性模型能更好地反映過江人數;而在引力模型的三種組合中,組合2(起點人口×終點人口)/時間2相關性最高,相關系數為0.098,sig小于0.01;本次研究選擇組合2的方式進行數據分析。
通過區分出行目的進行人數分析,整體相關性明顯提高,本次研究選擇通勤出行、公務出差和休閑旅游三種出行目的分別進行出行人數模擬,得到出行各出行目的的方程如下。
上班上學:Y=3872.298×X+150.512,t檢驗變量之間顯著性sig=0.004
休閑旅游:Y=46.666×X+301.427,其中t檢驗變量間sig=0.001
公務出差:Y=684.616×X+238.63,其中t檢驗變量間sig=0.0001
其中:W2=P起*E起/T2
以上結果說明自變量可以有效預測因變量,回歸模型顯著,得到的回歸方程有效。
通過過江人數分析發現,過江人數與起點城市相關性最大,與起點城市的經濟、人口因子呈正相關,與時間呈負相關,整體呈現以起點城市為核心的圈層結構。從不同出行目的來看,區縣間基礎過江人數約200~300人;城市人口與經濟的發展,通勤出行的人數增長最快,其次是休閑旅游,區域公務出差人數增長最慢。
本次基于多源數據融合調查方法成功應用于區域OD調查實踐中,按照交通特征層融合制定了詳細的融合擴樣規則,以區縣OD對為標識碼的出行屬性表更加科學、高效,便于存入數據庫中;加入出行時間、經濟和費用等參數后,方便利用機器學習深入分析各出行特征與交通量的關系,通過區分出行目的進行過江人數擬合,得到的模擬方程更準確。數據表明,過江出行主要和起點城市相關,未來隨著城市的發展,以通勤出行為目的的交通出行會快速增長,而區域增長相對較小。
[ID:010561]