999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

城市公共交通監管博弈建模與仿真

2016-10-28 00:52:52張亞平宋成舉程紹武
哈爾濱工業大學學報 2016年9期
關鍵詞:公共交通懲罰策略

張亞平, 宋成舉,2, 程紹武, 鄭 柯

(1.哈爾濱工業大學 交通科學與工程學院,哈爾濱150090;2.黑龍江工程學院 汽車與交通工程學院,哈爾濱150050;3.福州大學 土木學院,福州350116)

?

城市公共交通監管博弈建模與仿真

張亞平1, 宋成舉1,2, 程紹武1, 鄭柯3

(1.哈爾濱工業大學 交通科學與工程學院,哈爾濱150090;2.黑龍江工程學院 汽車與交通工程學院,哈爾濱150050;3.福州大學 土木學院,福州350116)

針對城市公共交通存在違規運營的問題,對管理部門與城市公共交通企業間的博弈關系展開研究。根據公交企業和管理部門相應的策略集建立雙方博弈關系的收益矩陣,給出了不同策略下雙方的期望收益和整體平均收益,利用復制動態方程描述雙方策略的變化速度,給出了納什均衡,利用系統動力學理論構建城市公共交通監管問題的博弈模型,并對模型進行了仿真分析。分析結果表明:采用靜態懲罰策略時,博弈雙方除納什均衡外不存在演化穩定策略,波動難以控制;采用動態懲罰策略時,博弈雙方存在演化穩定策略,演化時間和幅值與最大懲罰收益正相關,且博弈的穩定態與初始狀態無關。

城市公共交通;監管;系統動力學;博弈;納什均衡;動態懲罰策略

為了保證城市綜合客運交通系統結構的穩定發展,國家和各級地方政府均相繼出臺了多項鼓勵公共交通發展的法律與規范,但在實際實施過程中,由于存在監管力量薄弱、公交服務部門違規運營、違規成本較低等諸多問題,在實踐中往往很難達到預期的目標. 這就使得城市常規公共交通運營的有效監管成為一個突出的問題. 國內外學者對于公交管理與仿真方面開展了積極嘗試,如DEFLORIO F P[1]通過仿真模擬公交系統隨機最短路徑對于出行者出行路徑的影響,以期為資源合理利用提供支持;Li X等[2]以出行時間最小化為目標,確定了公交系統構建的邊界客流密度,對于公交服務水平的改善具有積極意義. 陳寬民等[3]分析了城市快速軌道交通與常規公共交通之間的定價博弈,給出了二者定價的動態調整過程;王煒等[4]從網絡服務供給與需求的協調關系出發,給出了公共交通系統服務水平的模糊聚類分析方法;劉惠玲等[5]建立了城市公交系統模型,給出了北京市公交系統的政策建議;唐旭南等[6]分析了城市公交系統的能源消耗結構,給出了結構調整合理化建議. 韓烈等[7]分析了早高峰單起點多訖點公共交通系統乘客乘車行為,建立了等價的數學優化模型描述均衡狀態. 當前的研究主要集中在路經選擇、公交服務水平改善、服務信息交換、公交監控系統、公交定價等方面,在公交監管博弈分析與仿真方面有待深入開展研究.

1 公交監管問題博弈分析與建模

目前,我國現行的常規公共交通管理體制以企業自主運營方式為主,同時常規公交企業接受來自管理部門的監督與管理. 假設常規公交企業均具有逐利的本能,其進行生產活動或服務行為的最終目的是實現利益的最大化,但受制于管理部門的監管,公交企業的行為策略選擇需考慮實際管理約束. 為此,公交企業在實際運營管理過程中存在兩種策略:一是嚴格按照相關規定組織公交運營活動;二是違規操作,通過降低發車班次等方法獲取額外收益.

管理部門的職能是在保證公交運營有序進行的同時,盡量減少監管成本,假定管理部門在監管過程中能夠嚴格執法,發現公交企業的違法行為能夠嚴格按照規定處理,不存在權力尋租的情況,管理部門對公交企業的監管同樣存在兩種策略:一是嚴格檢查,對公交企業的每次運營活動均進行監管;二是不檢查,對公交企業的運營活動監管不進行監管.

此時,管理部門、公交企業形成了一個管理博弈,每一個參與方在進行策略選擇時均需考慮到對方的行動策略,而博弈雙方的策略選擇具有一定的隨機性. 因此,可以假定參與者均以某種概率分布選擇自身的策略,采用混合策略博弈描述管理部門與常規公交企業之間的均衡策略進行選擇.

假定政府管理部門以概率θ(0≤θ≤1)對常規公交企業進行檢查,檢查所需支付的成本為c1,當發現公交企業存在違規運營行為時,管理部門要對公交企業進行罰款處罰,處罰收益為c2,且管理部門還應承擔公交企業違規運營而造成的間接社會損失,其大小為c3,當管理部門檢查時發現公交企業不存在違規運營時,應對公交企業進行一定的獎勵,其大小為c4.

常規公交企業以概率ω(0≤ω≤1)采取違規運營策略,公交企業正常的收益為e1,當采取違規運營策略時,公交企業可獲得額外收益e2.

根據上述假定,可求出不同策略組合下,各參與方的收益函數. 對于博弈參與者而言,其收益值取決于博弈雙方的策略組合.

當管理部門采取檢查策略,常規公交企業采取違規運營時,管理部門的收益值由3部分組成,即檢查所需支付成本c1,對常規公交企業的懲罰收益c2和由于公交企業違規運營而造成的間接社會損失c3;而常規公交企業的收益也包括3部分:公交企業正常收益為e1,額外收益e2,和被管理部門的罰款c2. 則該策略組合下的雙方收益可以表示為

(1)

同理,可得其他策略組合下博弈雙方的收益值,匯總管理部門與公交企業之間的收益矩陣,見表1.

對于公交企業而言,當管理部門進行檢查的時候,公交企業的最優策略應該是遵規運營,即遵規運營的收益值應大于違規運營收益值. 可得

(2)

整理后可得

(3)

表1 常規公交監管收益矩陣

同理,當管理部門采取不檢查策略時,公交企業的最優策略是違規運營,顯然公交企業的違規運營收益大于遵規運營收益.

而當管理部門遇到公交企業違規運營的情況時,需要對違規公交企業進行罰款處理,只有罰款收益高于違規所得時,才能有效約束公交企業的違規行為,則可知

(4)

為了便于計算,不妨假設Vθ為管理部門采取檢查策略時,公交企業的期望收益,V1-θ為管理部門采取不檢查策略時,公交企業的期望收益,Uω為公交企業采取違規運營策略時,管理部門的期望收益,U1-ω為公交企業采取遵規運營策略時,管理部門的期望收益. 根據定義可得

(5)

管理部門和公交企業的期望效用函數分別為V和U. 則可根據期望效用的計算公式得

(6)

公交企業在與管理部門博弈的同時,公交企業之間并不是相互獨立的[8]. 每個公交企業所選擇的策略不僅僅要考慮到管理部門的策略選擇,同時也會受到其他公交企業策略選擇的影響. 同樣,對于管理部門也是如此. 因此,本問題可以看作是在兩類有限理性的大群體中隨機配對進行博弈的進化博弈問題[9].

根據生物進化復制動態的思想,采用收益較低策略的博弈方往往會改變自身策略,模仿有較高收益策略的對手. 博弈雙方采取某種策略動態變化速度為可以用復制動態方程表示,其數學表達式可以寫成為

(7)

根據支付最大化理論,可以得到管理部門與出租車除邊界外的唯一Nash均衡,記為(θ*,ω*),即

(8)

2 仿真環境構建

系統動力學理論創立于20世紀50年代,是一門用來認識系統問題和解決系統問題的交叉綜合學科[10]. 根據前文的博弈分析及模型參數選擇,應用系統動力學仿真軟件Vensim PLE繪制系統動力學流圖,如圖1所示.

圖1 管理部門與公交企業的系統動力學流圖

2.1參數初始化

在仿真環境中,假定initial time=0,final time=100,time step=0.5. 博弈雙方的模型參數還應該滿足一定的邏輯約束,以常規公交企業為例,違規的高收益顯然是其違規行為的源動力,故必然有e2>e1,且違規所獲得收益應明顯小于對社會造成的整體損失,則e2+e1

根據前文分析,管理部門與公交企業之間存在復雜的博弈關系,但經過一段時間的博弈行為之后,雙方的策略選擇會逐漸趨于一個穩定點,但在傳統博弈論中并沒有解釋如何達到穩定均衡的問題.

根據下式可計算出博弈過程除邊界外唯一的納什均衡,即

2.2穩態分析與仿真

由定性分析可知,當管理部門采取檢查策略時,常規公交企業的最佳策略顯然是遵規運營,即策略1:θ=1,ω=0,當管理部門采取不檢查策略時,對于常規公交企業而言,其最佳策略應為違規運營,即策略2:θ=0,ω=1.

而對于邊界點θ=0,ω=0或者θ=1,ω=1時,顯然與常規策略選擇相悖,對比分析策略3:θ=0,ω=0.01;策略4:θ=1,ω=0.99. 運行仿真環境,策略對比如圖2所示.

從式(7)可以得知,策略1和策略2顯然均處于穩定狀態,從圖2可以看出,策略3和策略4是一種臨界穩定,但經過博弈后,其策略迅速調整,這是因為在該博弈過程中,常規公交企業之間存在著新策略的學習,一旦某一參與者的策略可以獲得較大收益,則原有的博弈平衡被打破,其余參與者能夠迅速調整自身策略,以獲取更大收益,從而達到新的穩定狀態,即管理部門的檢查策略與常規公交企業遵規運營策略組合,或者管理部門的不檢查策略與常規公交企業違規運營策略組合.

圖2 博弈雙方不同策略初值對穩定態的影響

在實際博弈過程中,參與雙方的策略選擇具有隨機性,假定當博弈過程中一方的初始策略為納什均衡,而另一方隨機的以(0,1)中任何一個非納什均衡比例參與博弈. 本文擬定管理部門以納什均衡θ*=0.5作為策略選擇初始值,分別對比常規公交企業以ω1=0.3,ω2=0.5,如圖3所示,可以看出,當博弈雙方的策略初值隨機選擇時,除邊界值與納什均衡值外,其余取值都使得博弈雙方在策略選擇上存在一定波動,且隨著策略初值與納什均衡值差值的增大,波動幅值逐漸增大,波動的頻率呈現衰減,直至波動達到最大值,使得博弈過程變得難以控制.

3 公交監管策略仿真

為了提高常規公交的服務水平,保證公共交通在居民出行中的主體地位,管理部門需要采取各種切實可行的策略對公交企業的違規行為進行監管,經濟策略是比較常用的管理策略之一.

3.1改變懲罰收益

在經濟策略里,最常用的策略就是增加對違規企業的懲罰收益. 假設在初始模型仿真的第10天加大對違規企業的懲罰力度,即違規收益c2取值由3變為6,則博弈雙方策略變化曲線如圖4所示.

(a)管理部門策略變化

(b)公交企業策略變化

圖4 不同懲罰收益條件下違規策略的變化曲線

從圖4可以看出,在第10天增大了對違規行為的懲罰力度,使得違規概率的波動頻率在短期內呈現一定程度的減小,但很快又達到新的振蕩狀態,即僅僅通過增加違規罰款的方式并不能有效約束公交企業的違規行為.

3.2信息延遲博弈建模及仿真

假定在實際情況下博弈參與者對于檢查及策略學習信息的獲取具有一定延遲. 假定信息延遲量為5,在其他參數不變的條件下,博弈仿真結果如圖5所示. 結果表明,隨著時間的增加,雙方策略呈現出較大范圍的波動,但波動頻率明顯降低,很難達到均衡值. 因此,需要有效地管理策略來保證博弈過程快速達到均衡點或者有效縮小博弈過程的波動范圍.

3.3動態懲罰策略仿真

通過前文中靜態管理策略的分析可以看出,簡單的增大懲罰收益并不能有效地抑制違規波動,而且會對管理策略的實施帶來一定的影響,使得管理部門對于管理策略的選擇更加困難. 因此,本文考慮公交企業違規懲罰力度與違法概率相關時的動態管理策略.

圖5 延遲環節下雙方策略變化曲線

假設管理部門采取檢查策略時,公交企業分別采取違規運營和遵規運營策略的收益差主要為額外收益e2. 因此,假設對公交企業的懲罰收益與公交企業違規概率間時正相關的,則可以用公交企業違規概率ω來描述公交企業違規收益,即當公交企業采取違規運營,管理部門采取檢查策略時,公交企業的額外收益e2由原來的常數變成了違規運營概率ω的函數,其函數關系可以采用線性關系式

(9)

式中m為管理部門對于公交企業違規運營的最大懲罰收益.

根據前文假設,分別取m=2和m=4,對比分析博弈雙方策略變化,如圖6、7所示.

圖6 不同最大懲罰收益條件下管理部門策略變化Fig.6 The management strategy changing with different punishment   從圖6、7可以看出,當采用動態懲罰策略時,即違規運營額外收益值與違規運營概率相關時,此時博弈雙方達到博弈均衡的時間可以得到有效縮短,同時也可以有效抑制博弈過程的波動性. 此外,在動態懲罰策略下,隨著m值的增大,博弈雙方達到博弈均衡的時間將縮短,波動的幅值也減小. 管理部門的檢查策略的均衡值則呈現增加的趨勢,即需要管理部門加大檢查力度才能保證管理效果. 在m=2時,雙方策略的博弈演變過程如圖8所示.

圖7 不同最大懲罰收益條件下公交企業違規策略變化

圖8 m=2時博弈雙方策略演變曲線

從圖8可以看出,動態懲罰策略條件下,雙方策略博弈曲線很快收斂到穩定值. 雙方策略的波動得到了很好的抑制,即縮短了收斂時間,取得了較好的管理效果.

4 結 論

1)通過對公共交通企業和管理部門在實際中的策略選擇問題進行研究,以策略選擇概率為研究對象,分析了博弈雙方在不同策略下的演化過程. 考慮了博弈參與方的收益矩陣,建立了城市公共交通企業和管理部門間的博弈模型來描述城市公共交通管理過程中的博弈關系,給出了在有限理性條件下各方策略變化過程的求解方程.

2)根據復制動態方程,給出了雙方策略變化的解,參照博弈模型建立了基于系統動力學的仿真模型,并進行了不同懲罰策略的仿真分析.

3)當管理部門采用靜態懲罰策略時,納什均衡值是雙方除邊界值外的唯一穩定解,其他初始值均使得博弈過程不存在演化穩定策略,且波動的峰值隨著初始值與納什均衡值間差值的增大而增大.

4)當采用動態懲罰策略時,博弈過程存在明顯的演化穩定策略,能夠較好地抑制博弈過程中的波動狀態,隨著最大懲罰收益的增大,博弈波動過程的收斂時間和波動幅值都減小.

[1] DEFLORIO F P. Simulation of requests in demand responsive transport systems[J]. Intelligent Transport Systems, IET, 2011,5(3): 159-167.

[2] LI X, QUADRIFOGLIO L. Feeder transit services: choosing between fixed and demand responsive policy [J].Transportation Research Part C: Emerging Technologies,2010,18(5): 770-780.

[3] 陳寬民, 羅小強. 城市快速軌道交通合理票價的博弈分析[J]. 長安大學學報(自然科學版), 2005,25(4): 52-55.

CHEN Kuanmin, LUO Xiaoqiang. Game-theory of reasonable ticket price for urban railway transport[J].Journal of Chang’an University(Natural Science Edition), 2005,25(4): 52-55.

[4] 王煒,楊新苗, 陳學武. 城市公共交通系統規劃方法與管理技術[M]. 北京: 科學出版社, 2006: 165-170.

WANG Wei, YANG Xinmiao, CHEN Xuewu. Urban public transport system planning and management technology[M]. Beijing Science Press, 2006: 165-170.

[5] 劉惠玲, 關偉. 基于系統動力學的城市公交系統模型[J]. 城市公共交通, 2007(6): 24-28.

LIU Huiling, GUAN Wei. Urban public transportation system model based on system dynamics[J]. Urban Public Transport, 2007(6): 24-28.

[6] 唐旭南, 張秀媛, 孫浩. 城市常規公交子系統能耗模型研究[J]. 交通運輸系統工程與信息, 2012,12(1): 160-165.

TANG Xunan,ZHANG Xiuyuan,SUN Hao. Energy consumption models for urban bus transport[J]. Journal of Transportation Systems Engineering and Information Technology, 2012,12(1): 160-165.

[7] 韓烈, 張寧. 單起點多訖點公共交通系統早高峰乘車均衡性質研究[J]. 系統工程理論與實踐, 2014,34(7): 1847-1856.

HAN Lie, ZHANG Ning. Equilibrium properties of the morning peak-period commuting in a one-to-many mass transit system[J]. Systems Engineering—Theory & Practice, 2014,34(7): 1847-1856.[8] 孫廣林, 王健, 姜成福. 城市公交價格聯動策略的演化博弈[J]. 交通運輸系統工程與信息, 2013,13(4):164-170.

SUN Guanglin,WANG Jian,JIANG Chengfu. Evolutionary game of urban public traffic pricing linkage strategy[J]. Journal of Transportation Systems Engineering and Information Technology, 2013,13(4):164-170.

[9] 陳榮欽, 林君煥, 陳月芬. 一種基于Q學習的有限理性博弈模型及其應用[J]. 系統仿真技術, 2013, 10(3): 203-210.

CHEN Rongqin, LIN Junhuan, CHEN Yuefen. A limited rational game model based on Q-learning and its application[J]. System Simulation Technology, 2013, 10(3): 203-210.

[10]宋成舉, 張亞平, 姜莉. 城市公共交通系統發展策略的系統動力學建模與仿真[J]. 黑龍江工程學院學報(自然科學版), 2014,28(1):15-19.

SONG Chengju, ZHANG Yaping, JIANG Li. Modeling and simulation for the development strategy of urban public transit system using system dynamics[J].Journal of Heilongjiang Institute of Technology, 2014,28(1):15-19.

(編輯魏希柱)

Game modeling and simulation of urban public transport supervision

ZHANG Yaping1, SONG Chengju1,2, CHENG Shaowu1, ZHENG Ke3

(1.School of Transportation Science and Engineering, Harbin Institute of Technology, Harbin 150090, China;2.School of Automotive and Transportation Engineering, Heilongjiang Institute of Technology, Harbin 150050, China;3.College of Civil Engineering, Fuzhou University, Fuzhou 350116, China)

Against the problem of urban public transport operation irregularities, the research was carried out to study the game relationship between management departments and public transport enterprises. The profit matrix of the game relations was established according to the corresponding strategy sets of public transport enterprises and management departments. Both expected profit and overall average profit under the different strategies are obtained. Nash equilibrium was obtained using replicator dynamics function to describe the changing rate of both strategies. The paper also establishes the game model of public transport supervision problem by using system dynamics theory, and simulation analysis to the model was carried out. The analysis results show that, when using static penalty strategy, there is no evolutionary stable strategy except Nash equilibrium on both sides, and fluctuations are difficult to control; while using dynamic penalty strategy, there exists evolutionary stable strategy on both sides, the evolution time and amplitude are positively correlated with maximum punishment revenue, and game steady-state is independent of the initial state.

public transport; supervision; system dynamics; game; Nash equilibrium; dynamic penalty strategy

10.11918/j.issn.0367-6234.2016.09.005

2014-12-27

黑龍江省自然科學基金(QC2014C060);黑龍江省交通運輸廳科技項目(HJK2012A032);黑龍江工程學院博士基金(2015BJ03)

張亞平(1966—),教授,博士生導師

張亞平,zxlt0905@163.com

U121

A

0367-6234(2016)09-0024-06

猜你喜歡
公共交通懲罰策略
《城市公共交通》雜志社簡介
例談未知角三角函數值的求解策略
神的懲罰
小讀者(2020年2期)2020-03-12 10:34:06
我說你做講策略
懲罰
趣味(語文)(2018年1期)2018-05-25 03:09:58
高中數學復習的具體策略
數學大世界(2018年1期)2018-04-12 05:39:14
基于計算實驗的公共交通需求預測方法
自動化學報(2017年1期)2017-03-11 17:31:10
公共交通一卡通TSM平臺研究
真正的懲罰等
Passage Four
主站蜘蛛池模板: 丁香婷婷综合激情| 国产网站黄| 8090成人午夜精品| 国产美女精品一区二区| 亚洲色图欧美一区| 国内精自视频品线一二区| 国产欧美精品一区aⅴ影院| 六月婷婷精品视频在线观看 | 免费无遮挡AV| 五月婷婷亚洲综合| 少妇人妻无码首页| 精品久久久无码专区中文字幕| 国产一级视频在线观看网站| 九色91在线视频| 伊人久久青草青青综合| 国产福利拍拍拍| 国产91av在线| 亚洲无码视频一区二区三区| 国产一级二级在线观看| 热99re99首页精品亚洲五月天| 激情成人综合网| 精品伊人久久久香线蕉| 无码高潮喷水专区久久| 国产成人一二三| 亚洲an第二区国产精品| 91视频免费观看网站| 人妻少妇久久久久久97人妻| 欧美va亚洲va香蕉在线| 最新精品国偷自产在线| 亚洲精品麻豆| 久久亚洲精少妇毛片午夜无码| 996免费视频国产在线播放| 亚洲欧美人成电影在线观看| 在线精品视频成人网| 无码免费视频| 女人18毛片一级毛片在线 | 99在线免费播放| AV片亚洲国产男人的天堂| 国产一在线观看| 日本爱爱精品一区二区| 高清免费毛片| 亚洲成综合人影院在院播放| 99久久精彩视频| 亚洲av日韩综合一区尤物| 无码中文AⅤ在线观看| 日韩欧美国产成人| 在线观看欧美精品二区| 成人夜夜嗨| 亚洲综合久久成人AV| 亚洲欧美综合在线观看| 99色亚洲国产精品11p| 亚洲精品日产AⅤ| 亚洲精品欧美日本中文字幕| 欧美翘臀一区二区三区 | 国产女人喷水视频| 欧洲精品视频在线观看| 日韩午夜片| 久久免费精品琪琪| 国产成人在线小视频| 国产精品人成在线播放| 免费a级毛片18以上观看精品| 亚洲一区黄色| 久久亚洲国产一区二区| 91精品久久久无码中文字幕vr| 国产制服丝袜无码视频| 女人毛片a级大学毛片免费| 久久semm亚洲国产| 无码乱人伦一区二区亚洲一| 亚洲中文字幕av无码区| 亚洲女同一区二区| 色婷婷电影网| 亚洲动漫h| 99re这里只有国产中文精品国产精品 | 69av免费视频| 性色一区| 国产人免费人成免费视频| 99视频在线看| 国产打屁股免费区网站| 日韩成人在线视频| 亚洲福利一区二区三区| 久久综合九九亚洲一区| 亚洲一区二区三区在线视频|