廖 勇
(中國民用航空飛行學院 空中交通管理學院,四川 廣漢 618307)
我國區域經濟一體化、城市化進程的加快、城市群都市圈的形成、城鄉一體化的推進,促進了區域一體化的形成。在區域一體化進程中,交通運輸系統則是區域最重要的組成部分,是區域各項產業發展的基礎條件,是區域社會經濟發展的支撐系統。為了滿足區域一體化的要求,首先必須實現區域交通一體化,構建區域綜合交通運輸體系,充分發揮交通運輸在經濟發展中的能動作用。在區域綜合交通運輸體系中,綜合運輸通道是建設的關鍵,它不僅是整個綜合運輸體系效益得以發揮的前提,還影響著投資效率的高低。綜合運輸通道中出行方式的分擔率是綜合運輸通道結構研究的重點,是實現交通運輸資源優化配置、運輸日常運營管理的關鍵。
目前出行方式選擇模型主要的研究方法分為三類:經變換后的四階段法、Logit 模型和啟發式模型。變換后的四階段法缺乏足夠的理論基礎,啟發式算法發展不夠完善。在實際的應用中,Logit 模型最為廣泛。如王爽,趙鵬[1]以鐵路旅客為研究對象,模擬客運專線建成后的情景,調查旅客在客運專線建成后對高速列車和高頻率列車換乘方式的選擇偏好。馬波濤,張于心等[2]采用運輸產品效用函數值代替傳統的多元線性回歸求解的特征函數值,運用logit 模型對高速鐵路與航空客流之間的分擔率進行估計。Benedikt Mandel 等[3]通過加入方式屬性強化了Logit選擇模型的定義,同時考慮社會經濟變量,提高模型的質量。雖然Logit 模型理論比較完善,在各行各業中都得到了廣泛的應用,但同時還存在如下問題:
(1)Logit 模型屬于非集計模型,模型進行參數標定后,是以簡析式的形式表達出來的,而實際交通規劃中,規劃師關心的是各種交通方式具體的分擔率。因此,非集計模型處理后需要再次集計,而對非集模型標定后集計的方法較少,不夠完善,限制了非集計模型在實踐中的應用。
(2)樣本中含有大量的無效數據,會降低參數標定成功的機率。而目前對如何有效的剔除無效數據還沒有成套適用的技術手段和方法。
(3)Logit模型的參數完全依賴于樣本數據,在應用非集計模型時,通常采用SP 調查收集數據,但SP 調查中調查對象做出的選擇與實際選擇相左,會導致Logit模型得到錯誤的參數,導致預測結果偏差較大。
由以上的分析可知,Logit 模型采用樣本數據對參數進行標定,并在此基礎上進行分析,對于已有的歷史資料和專家信息不予考慮。在實際中,這兩種信息不僅易于收集而且可靠性較大。如果能在出行方式選擇模型中應用這兩種信息,將大大提高預測精度。
在進行Bayes分析前需要明確總體、樣本、先驗分布、后驗分布的概念。總體為研究對象的全體,總體中的每一元素稱為個體。樣本是由有限個體組成的集合,為總體的子集。先驗分布指的是在對樣本總體進行抽樣前就已經具備的概率分布,主要來自于經驗或歷史統計資料。樣本信息為通過對總體進行抽樣從樣本中獲得的信息。后驗分布為通過樣本信息對先驗分布進行修正后的概率分布。在采用貝葉斯理論進行出行方式選擇估計時,需要解決兩個方面的問題:樣本信息的提取和先驗分布的建立。
設試驗E的樣本空間為S,A為E的事件,B1,B2,…,Bn為S的一個劃分,且P(A)>0,P(Bi)>0(i=1,2,…,n),則全概率公式和貝葉斯定理如下[5]:

式中:P(Bj|A)為給定樣本信息A后,事件Bj的后驗分布;P(Bj)為事件Bj的先驗分布;P(A|Bj)為樣本信息提供的在事件Bj下A的條件分布。貝葉斯分析過程如圖1所示。

圖1 Bayes分析過程
旅客對出行方式選擇的影響因素主要有出行需求特征和出行供給特征。出行需求特征為不同的出行者在選擇出行方式時表現為不同的偏好,反映的是出行過程的主觀特性。出行供給特征表現為各出行方式向社會提供運輸服務的水平,反映的是出行過程的客觀特性。本文建模的總體思路為:實現需求特征與供給特征之間的分離,即實現出行過程主觀特性和客觀特性的分離。用專家信息結合出行供給特征數據對出行的客觀特性進行標定,作為先驗信息。用抽樣獲得的樣本數據來描述出行需求特征(主觀特性),將其作為樣本信息。以Bayes分析為手段,將先驗信息和樣本信息綜合后得到后驗分布。最后采用全概率公式進行綜合,得到各出行方式的分擔率。
簡言之,首先根據先驗信息和專家知識獲得各方式分擔率的估計,然后通過數據抽樣對估計值進行修正。當樣本數據全面反映總體時,修正后的分擔率更加準確。即使樣本數據反映總體的能力較差,但估計值具有較高的精度,兩者在Bayes分析的作用下,預測值也不會偏離太遠。正是該機制使得基于Bayes分析的出行方式選擇模型具有較強的魯棒性。
(1)先驗分布的確定。先驗分布的確定采用多項logit 模型(MNL),出行方式分擔率的多項Logit模型估計為[4]:

式(3)中:n為出行方式的數量,Uj為效用函數。
在MNL模型的應用中,效用函數Uj根據樣本數據采用最大似然函數參數估計方法估計。參數標定時,只采用樣本數據,并未考慮先驗信息。在進行參數標定時,本文采用各種出行方式的效用值代替效用函數,且效用值的確定是由專家標定的,即專家根據個人經驗結合各出行供給特征數據,給出各種運輸方式的效用值。出行供給特征主要考慮安全性(Sj)、舒適性(Cj)、快速性(Fj)、經濟性(Ej)、方便性(Coj)。
快速性(Fj)用在乘時間進行量化,經濟性(Ej)采用出行方式的票價進行量化,安全性(Sj)用通道所在地區出行方式在事故中傷亡人數與運量之比進行量化。量化并標準化的處理公式如下:

式中:fj、ej分別表示第j種出行方式的在乘時間和票價;Caj為地區內第j種出行方式事故傷亡數,CAj地區內第j種出行方式的運量。
方便性(Coj)和舒適性(Cj)屬于定性指標,涉及的影響因素較多,較難量化,可采用AHP法進行量化,關于AHP的理論研究和應用研究文獻較多,在此不做過多累述。假設通過AHP 標定并標準化后的取值為采用乘法原理和加法原理進行綜合后,第j種出行方式的效用值Uj為:

(2)樣本信息的獲取。出行需求特征的影響因素較多,如旅客的年齡、性別、收入、出行目的、是否具有私家車等。在進行交通調查時對可能的影響因素一一進行調查,但在進行分析時需要選擇幾個影響較大的因素。考慮到目前我國經濟不是很發達,旅客的收入水平(In)和出行目的(De)是影響出行需求特征的主要因素,本文以此作為基礎進行分析。按照收入高低將旅客劃分為高(In1)、中(In2)、低(In3)三個層次。出行目的劃分較多,為了便于分析,根據區域綜合運輸的特點,將出行目的劃分為公務商務流De1、探親訪友購客流De2、其他客流De3。在獲得樣本數據后,根據In和De劃分為9類即IDpq,p=(1,2,3),q=(1,2,3),稱為組合特征。對樣本進行處理后可得到在第j 種出行方式TMj下組合特征IDpq的條件分布P(IDpq|TMj)為:

式(8)中,Nj為樣本中選擇第j 種出行方式TMj的數量;為選擇出行方式TMj中滿足組合特征IDpq的人數。
(3)Bayes 綜合。在獲得先驗分布和條件分布后,采用Bayes定理進行修正,得到后驗分布P(TMj|IDpq):

在出行方式的選擇中,關心的不是在IDpq條件下選擇TMj的概率,而是選擇TMj的概率P(TMj) 。因此,在獲得P(TMj|IDpq)后,采用全概率公式可得P(TMj):

式(10)中:P(IDpq)為組合特征IDpq的分布。
由概率的乘法定理有:

假設收入水平(In)和出行目的(De)相互獨立,即有P(Deq|Inp)=P(Deq),P(Inp|Deq)=P(Inp),代入式(11)可得:

將式(12)代入式(10)中可得出行方式TMj的分擔率為:

(4)計算步驟
Step1:按式(4)-式(6)和AHP 對各出行方式的效用值進行標定。
Step3:采用RP和SP進行交通調查,獲得樣本數據后采用式(8)計算在第j種出行方式下TMj組合特征IDpq的條件分布P(IDpq|TMj)。
Step4:采用Bayes 定理和先驗分布P(TMj0)計算在出行特征IDpq條件下第j種出行方式TMj的后驗分布P(TMj|IDpq),見式(9)。
Step5:采用全概率公式結合歷史統計的出行特征In和De的分布P(Inp)和P(Deq)計算經過樣本修正后的出行方式分擔率,見式(13)。
需要特別注意的是:根據Bayes 的學習原理,在第k(k>1)次抽樣條件下的條件分布為,則以第k-1次修正后的分擔率為先驗概率,代入式(9)中計算在第k 次抽樣的條件下的后驗分布,再代入式(13)中計算經過第k次抽樣修正后的出行方式分擔率。不斷循環的過程保障了出行方式分擔率計算精度的不斷提高。基于Bayes 分析的出行方式分擔率計算過程如圖2所示。

圖2 基于Bayes分析的出行方式分擔率計算過程
考慮一區域綜合運輸通道兩主結點AB 間現階段存在三種出行方式:高速公路、普通公路、普通鐵路。現需要論證是否需要建設城際鐵路,為了預測城際鐵路的運量,首先需要確定城際鐵路的分擔率。并且已知P(In1)=0.15,P(In2)=0.35,P(In3)=0.5,P(De1)=0.25,P(De2)=0.4,P(De3)=0.35。按照本文提出的求解算法,其過程如下:
Step1:按照效用值的標定函數和AHP對各出行方式的效用值進行標定,見表1。
Step2:采用MNL 計算各出行方式的初始先驗分布分別為:高速公路0.176,普通鐵路0.26,普通公路0.147,城際鐵路0.417。

表1 基于先驗信息的參數標定
Step3:采用RP結合SP進行交通調查,獲得樣本數據后采用式(8)計算在第j種出行方式TMj下出行特征IDpq的條件分布,見表2。

表2 基于樣本數據的條件分布
Step4:采用Bayes定理和先驗分布計算在出行特征IDpq條件下第j種出行方式TMj的后驗分布,見表3。

表3 基于Bayes分析的后驗分布
Step5:采用全概率公式結合歷史統計的出行特征In和De的分布P(Inp)和P(Inp)。采用全概率公式(式(13)),計算得出各出行方式分擔率分別為:高速公路0.175,普通鐵路0.279,普通公路0.153,城際鐵路0.393。
進行修正后高速公路的分擔率降低了0.1個百分點,普通鐵路增加了1.9 個百分點,普通公路增加了0.6 個百分點,城際鐵路降低了2.4 個百分點。不難看出先驗分布在總體上確定了各出行方式分擔率,經過后驗信息修正后,分擔率更加精確化。
本文將影響出行方式選擇的因素分為出行的需求特征和出行的供給特征,建模時實現兩者的分離,分別采用抽樣和專家標定對其進行計算,然后采用Bayes定理和全概率公式對兩者進行綜合,求得各出行方式的分擔率,對本文研究成果進行分析后可得到如下結論:
(1)因為Bayes理論是采用先驗分布結合抽樣信息進行建模的,先驗分布具有部分的先驗信息,已逼近真實信息,樣本數據發揮的是修正功能。因此,可采用小樣本數據。
(2)Bayes 分析具有學習功能,對于前后兩次不相關的抽樣可進行綜合,提高估計精度。
(3)本文的模型免去了復雜的參數標定過程,在簡化模型計算復雜度的同時,降低了由于參數標定過程不能成功帶來的風險。
[1]王爽,趙鵬.基于Logit模型的客運專線旅客選擇行為分析[J].鐵道學報,2009,31(3):6-10.
[2]馬波濤,張于心,趙翠霞.運用Logit模型對高速客流分擔率的估計[J].北方交通大學學報,2003,27(2):66-69.
[3]Mandel B,Gaudry M,Rothengatter W.A disaggregate Box-Cox logit mode choice model of intercity passenger travel in Germany and its implications for high-speed rail demand forecasts[J].The Annals of Regional Science,1997,31(2):99-120.
[4]關宏志.非集計模型—交通行為分析的工具[M].北京:人民交通出版社,2004.
[5]李裕奇,何平.概率論與數理統計[M].北京:國防工業出版社,2001.
[6]Chieh-Hua Wen,Koppleman.The generalized nested logit model[J].Transportation Research Part B,2001,35:627-641.