房立波,鐘曉敏
(1.浙江財經大學中國政府管制研究院,浙江 杭州 310018;2.杭州市發(fā)展和改革委員會,浙江 杭州 310020;3.浙江財經大學財政稅務學院,浙江 杭州 310018)
2016年《國務院辦公廳關于深化改革推進出租汽車行業(yè)健康發(fā)展的指導意見》(國辦發(fā)〔2016〕58號)發(fā)布后,客運出租市場由此迎來重要的發(fā)展機遇期。隨著經濟體制改革不斷深化和人民生活水平日益提高,不斷增長的出行需求與服務供給不平衡不充分之間的矛盾逐漸凸顯出來。作為城市公共交通的重要補充,客運出租成為滿足差異化出行需求的重要途徑。然而,從監(jiān)管實踐看,雖然2016年7月中央七部委聯(lián)合發(fā)布的《網絡預約出租汽車經營服務管理暫行辦法》結束了網約車市場混亂的局面,但網約車市場仍需進一步完善監(jiān)管政策,優(yōu)化政府監(jiān)管機構與網約車平臺之間的關系,調整網約車市場體制機制。從社會福利的視角出發(fā),完善監(jiān)管政策、理清市場內部競爭關系成為下一階段推動網約車市場健康發(fā)展亟需解決的問題。
研究網約車市場發(fā)展路徑問題需重點關注政府監(jiān)管和內部競爭兩個方面。對此,不同專業(yè)研究的重點有所差異。本文認為要想提升研究成果的理論水平,首先,遵循經濟規(guī)律,把握正確的研究方向;其次,基于法理構建嚴謹、合理的制度體系框架;最后,基于技術層面提出高效率的實施路徑。目前,運用技術方法提高網約車運營效率和科學設計客運出租政府監(jiān)管法制框架兩方面的研究比較充分,而依托管理學和經濟學的研究大多集中在政策層面,缺乏對市場參與主體行為動機的客觀分析,鮮見針對網約車市場參與主體相互作用的研究。本文運用博弈理論分析網約車市場參與主體之間的行為選擇邏輯,重點探討政府監(jiān)管機構與網約車平臺的監(jiān)管博弈和網約車平臺之間的競爭博弈。一是利用“小偷守衛(wèi)”博弈模型,強調政府監(jiān)管是交替選擇策略的重復博弈,政府監(jiān)管需統(tǒng)籌考慮具體監(jiān)管措施的短期效果和長期影響,并重視監(jiān)管對象針對具體監(jiān)管措施采取向前展望和向后推理的效果。二是利用伯特蘭德模型和古諾模型,分析網約車平臺在不同市場階段的帕累托最優(yōu)策略并解釋“價格戰(zhàn)”的原因,預測未來競爭格局、指出提高經濟效率的有效路徑。
網約車在促進客運出租行業(yè)發(fā)展的同時也對巡游出租車市場的穩(wěn)定造成一定的沖擊。為此,相關學者從不同的視角展開研究并取得豐碩的文獻成果。(1)利用政府監(jiān)管理論研究網約車的政府監(jiān)管問題。王俊豪(2021)認為需根據(jù)監(jiān)管實踐需求構建監(jiān)管有據(jù)、運行高效、精準有效、公開透明、激勵約束的中國特色政府監(jiān)管理論體系[1]。唐要家(2021)認為數(shù)字經濟監(jiān)管體制創(chuàng)新應堅持審慎包容原則,以促進開放共享和鼓勵創(chuàng)新為目標,以維護市場競爭為主要任務[2]。劉長玉等(2019)基于政府、企業(yè)與消費者三方協(xié)同監(jiān)管模式構建博弈模型,研究影響三方策略選擇的相關因素,建議提高政府監(jiān)管效率、保障企業(yè)產品質量、發(fā)揮消費者監(jiān)督優(yōu)勢[3]。曲國華等(2020)利用三角模糊數(shù)構建博弈模型,分析策略選擇的影響因素,強調政府引導消費者和懲罰企業(yè)的影響[4]。(2)在此基礎上,學者從不同視角研究客運出租的政府監(jiān)管問題。有文獻對現(xiàn)行監(jiān)管政策進行梳理和歸納總結。馬亮和李延偉(2018)依據(jù)監(jiān)管政策條款構建監(jiān)管嚴格程度的評價指數(shù),并以此評價地方政府的監(jiān)管政策差異[5]。李金龍和喬建偉(2019)通過梳理規(guī)制政策,基于倡議聯(lián)盟框架建議增強市場主導聯(lián)盟競爭力,構建“前瞻性”的政府治理機制,以緩解聯(lián)盟沖突[6]。也有文獻重點研究監(jiān)管路徑和體系構建。蔣巖波和黃娟(2020)認為網約車行政規(guī)制存在信息不足、效率低下的問題,建議通過明確產權邊界、完善規(guī)制體系等措施建立網約車司法規(guī)制框架[7]。此外,還有文獻研究網約車的屬性和特征。費威(2018)從質量問題、公共資源、信息、信任、社會福利等方面闡釋網約車共享經濟的兩面性[8]。郝麗華和曹永勝(2018)在肯定網約車共享經濟屬性的積極作用的同時,著重分析資源浪費、成本增加、風險擴大等問題[9]。其中,運用博弈理論研究網約車的政府監(jiān)管的文獻對本文具有較高的借鑒價值。付淑換和石巋然(2020)分析網約車平臺行為及監(jiān)管策略選擇的影響因素,建議引入第三方監(jiān)督制度,以打破政府無效監(jiān)管和平臺消極管理的均衡,促進行業(yè)良性發(fā)展[10]。陳璟濤(2017)從博弈論視角分析百色市網絡預約出租汽車行業(yè)監(jiān)管問題,利用收益矩陣建立完全靜態(tài)博弈模型,分析網約車平臺與監(jiān)管部門、監(jiān)管部門相互之間的行動策略,提出制定實施細則、創(chuàng)新監(jiān)管思維、完善監(jiān)管機制等建議[11]。
網約車平臺之間相互關系的研究主要集中在定價策略方面??祫P等(2021)構建兩個網約車平臺的Stackelberg博弈模型并分析平臺定價策略,建議劣勢平臺低競爭強度時效仿占優(yōu)平臺采取中等定價,競爭強度適中時采取低價策略,高競爭強度時應著重提升服務質量[12]。倪玲霖和王澤(2020)利用變分不等式構建網約車市場競爭網絡均衡模型,得出成本增加后價格提高且出行量下降、市場主體增加后競爭加劇且價格下降及出行量提升、準入管制導致司機減少且均衡價格增加的結論,驗證了模型的有效性[13]。孫中苗和徐琪(2021)運用最優(yōu)控制論方法構建網約車平臺動態(tài)定價模型,并利用哈密頓函數(shù)及模型推導,得出最優(yōu)價格可有效調控平臺供應能力、乘車需求市場的競爭有助于拉低平臺最優(yōu)價格而乘運市場的競爭將推高價格等結論[14]。盧珂、周晶和林小圍(2019)基于雙邊市場理論,從交叉網絡外部性的視角研究網約車平臺的市場定價問題,得出交叉網絡外部性降低平臺定價、時間敏感系數(shù)對平臺的影響因歸屬屬性不同而存在一定的差異等結論[15]。
學者們從不同角度分析網約車發(fā)展存在的問題,但基于經濟學和管理學的分析尚不多見,對監(jiān)管策略、內部競爭行為動機的分析也有待深化,缺少數(shù)量競爭的研究成果。本文在已有理論研究的基礎上,以提高理論與實踐的耦合性為研究目標:從行業(yè)的政府監(jiān)管實踐出發(fā),利用博弈模型探討網約車平臺和政府監(jiān)管機構的動態(tài)策略選擇,討論政府監(jiān)管機構對網約車行業(yè)實施監(jiān)管的制約因素,為網約車平臺的政府監(jiān)管實踐提供理論指導;從行業(yè)發(fā)展的維度,梳理網約車市場競爭格局演變規(guī)律,在揭示市場競爭現(xiàn)象的同時分析影響網約車平臺收益的因素,從增進社會福利的視角為政府干預市場競爭明確方向。
1.建立“小偷守衛(wèi)”博弈模型,分析政府監(jiān)管機構與網約車平臺之間的博弈策略[16]。設定政府監(jiān)管機構的群體策略集為{G1(強監(jiān)管),G2(弱監(jiān)管)},網約車平臺的群體策略集為{W1(守法),W2(違法)}。政府監(jiān)管機構選擇強監(jiān)管的概率為p、弱監(jiān)管的概率為(1-p),網約車平臺選擇守法的概率為q、違法的概率為(1-q)。其中,強監(jiān)管是指政府監(jiān)管機構監(jiān)管成本較高、嚴格執(zhí)法等積極監(jiān)管,弱監(jiān)管包括玩忽職守、以犧牲公共利益獲取私利、大幅減少監(jiān)管投入等。
2.建立完全信息靜態(tài)博弈模型,分析網約車平臺內部的博弈策略。設定在一個由兩個網約車平臺組成的市場中,服務價格P與供給量Q具有線性函數(shù)關系。在市場發(fā)展的第一階段,網約車平臺的價格策略集為A={0,Pmax},博弈策略為同時選擇價格水平;在第二階段,網約車平臺的產量策略集為B={0,Qmax},博弈策略為同時選擇產量水平。具體變量定義見表1。

表1 符號的意義及說明
假設1:政府監(jiān)管機構的目標是監(jiān)督管理網約車平臺的行為,以確保價格、服務質量和安全保障等符合規(guī)定要求[17]。網約車平臺的行為動機是根據(jù)政府監(jiān)管策略權衡違法的成本和收益來選擇最優(yōu)策略,以實現(xiàn)收益最大化。不同網約車平臺的服務差異很小,高度相互替代,價格-數(shù)量函數(shù)的參數(shù)相同且具有連續(xù)函數(shù)特征。博弈雙方具有完全理性,均基于成本-收益和“以牙還牙”原則選擇最優(yōu)策略[18]。
假設2:網約車平臺的固定成本和邊際成本均為0,守法只能獲得正常利潤且凈收益為0。違法行為如果不被查處,則能獲得風險溢價V;一旦被查處,則需承擔額外損失L。網約車市場屬于寡頭壟斷市場,單個網約車平臺調整價格或服務供給規(guī)模都對競爭對手的收益產生影響。
假設3:政府監(jiān)管機構與網約車平臺之間存在信息不對稱,只能以一定的概率發(fā)現(xiàn)后者的違法行為。政府監(jiān)管機構強監(jiān)管可提高發(fā)現(xiàn)網約車平臺違法行為的概率,保持較高水平的社會收益,承擔較高成本且凈收益為0;弱監(jiān)管且網約車平臺不違法,則可節(jié)約監(jiān)管成本S;弱監(jiān)管且網約車平臺違法,則承擔較大的損失D。
假設4:監(jiān)管技術水平相對穩(wěn)定,政府監(jiān)管機構的監(jiān)管力度是影響網約車平臺成本的主要因素。隨著監(jiān)管投入不斷增加,未被懲處的違法行為數(shù)量減少且更隱蔽,發(fā)現(xiàn)并懲處的成本更高,且不管投入多少資源都不可能完全消除違法行為。因此,政府監(jiān)管機構強監(jiān)管的概率p與監(jiān)管投入C呈正相關,且增加C對提高p的邊際效應遞減[19](1)這里,忽略效率因素。。
假設5:外部環(huán)境相對穩(wěn)定,增加違法的額外凈收益能誘導守法意識薄弱的網約車平臺違法。隨著違法的額外凈收益的增加,守法的網約車平臺的平均守法意識水平也在提高。增加違法額外凈收益對具有較強守法意識的網約車平臺的效用較小。即使違法的額外凈收益很高,強守法意識的網約車平臺也能抵擋住誘惑,因此守法的概率始終大于0。網約車平臺違法行為發(fā)生的概率與違法的額外凈收益V呈正相關,則守法的概率q與V呈負相關,且增加V對降低q的邊際效應遞減[20]。
假設6:政府監(jiān)管機構與網約車平臺的博弈初始處于混合策略納什均衡狀態(tài),V和S為外生變量,L和D為政府可調節(jié)和控制的自變量(2)V由違法行為的性質決定,S由監(jiān)管行為的技術條件等外部環(huán)境決定,政府監(jiān)管機構可調節(jié)L中的F1和D中的F2。。短期內,一方因自變量變化而偏離均衡水平,另一方的概率分布保持不變;長期內,一方變化導致另一方的概率分布聯(lián)動調整,并最終實現(xiàn)新的均衡。
假設7:網約車市場遵循由粗放向集約發(fā)展的客觀規(guī)律。在粗放競爭階段,主要的競爭方式是降低價格、擴張規(guī)模,通過兼并減少市場主體數(shù)量;在集約競爭階段,市場結構相對穩(wěn)定,主要通過調整供給規(guī)模和降低生產成本來實現(xiàn)利潤最大化。消費者對價格變化反應敏感,低價策略能使網約車平臺迅速、完全占領市場。
1.建立“小偷守衛(wèi)”博弈模型
基于以上假設,我們構建兩人的非對稱非零和博弈,其得益矩陣如圖1所示。令V=R1+C1、D=S+F2、L=C1+F1,簡化后的得益矩陣如圖2所示。

政府監(jiān)管機構弱監(jiān)管強監(jiān)管網約車平臺違法守法(R1+C1,S+F2)(C1+F1,0)(0,S)(0,0)圖1 完全信息靜態(tài)“小偷守衛(wèi)”博弈的得益矩陣

政府監(jiān)管機構弱監(jiān)管強監(jiān)管網約車平臺違法守法(V,D)(L,0)(0,S)(0,0) 圖2 簡化的完全信息靜態(tài)“小偷守衛(wèi)”博弈的得益矩陣
根據(jù)模型假設,令政府監(jiān)管機構的強監(jiān)管和弱監(jiān)管策略的期望得益及平均期望得益分別為E(G1)、E(G2)和E(G),網約車平臺守法和違法策略的期望得益及平均期望得益分別為E(W1)、E(W2)和E(W),其計算過程如下:
令E(G1)=E(G2),E(W1)=E(W2),我們得到混合策略納什均衡條件為式(7)、(8)。引入行為策略的影響因素,擴展后的博弈模型為式(9)、(10)?;诩僭O,C是影響p的主要因素,二者的關系如圖3所示;V是影響q的主要因素,二者的關系如圖4所示。

圖3 政府監(jiān)管機構強監(jiān)管的概率與監(jiān)管成本的關系

圖4 網約車平臺守法的概率與違法額外凈收益的關系
將式(9)、(10)分別代入式(7)、(8),可得:
2.建立價格博弈模型
接下來,我們構建伯特蘭德雙主體完全信息靜態(tài)博弈模型,其價格-數(shù)量函數(shù)和博弈得益分別為:
對式(15)、(16)求偏導數(shù),得到反應函數(shù)為式(17)、(18)(如圖5所示)。聯(lián)立反應函數(shù),我們得到納什均衡解和雙方的得益分別為式(19)、(20)、(21):

圖5 伯特蘭德模型的反應函數(shù)


甲合作不合作乙合作不合作(UH,UH)(0,UB)(UB,0)(UL,UL) 圖6 完全信息靜態(tài)削價競爭博弈的得益矩陣
定義雙方采用“以牙還牙”策略,合作均衡為串謀均衡,不合作均衡為納什均衡。一方合作、另一方不合作時,不合作方獨占市場獲得的利潤略低于串謀的雙方利潤之和(這里,以串謀的市場總利潤簡化表示,即UB=2UH)。因此,甲對乙觸發(fā)策略的最佳反應策略的后半部分與觸發(fā)策略的后半部分一樣。問題的關鍵在于確定甲在第一階段的最優(yōu)選擇。在第一階段,如果乙合作、甲不合作,根據(jù)模型設定,其后雙方均不合作,甲的得益現(xiàn)值為式(22);如果乙合作、甲合作,則第二階段將重復第一階段的選擇。假定W為甲在該博弈中每階段均采用最佳策略的總得益現(xiàn)值,重復博弈中總收益是否包含第一階段不影響結果。第二階段及以后的得益在第一階段看來現(xiàn)值均為Wδ,總收益現(xiàn)值為式(23)。由于對稱性,乙具有相同的收益。
(22)
(23)
3.建立產量博弈模型
根據(jù)假設,我們構建古諾雙主體完全信息靜態(tài)博弈模型,設定價格-數(shù)量函數(shù)為P=P(Q)=a-bQ(a為常數(shù),b為系數(shù),Q=Q1+Q2),博弈主體的得益為:
對式(24)、(25)求偏導數(shù),可得反應函數(shù)為式(26)、(27)(如圖7所示)。聯(lián)立反應函數(shù),我們得到博弈納什均衡解為式(28)、(29)、(30):

圖7 古諾模型的反應函數(shù)

從甲偏離合作策略的下一階段開始,雙方將保持古諾產量,不確定結束時點的有限次重復博弈的第一階段偏離的總得益現(xiàn)值為:
(33)
上述博弈矩陣的四個策略組合都不穩(wěn)定,該博弈沒有純策略納什均衡。任意一個策略組合,博弈的任一方都有單方面改變策略的動機。當一方改變策略后,對方繼而單方面改變策略,雙方的交替行動導致博弈策略組合不斷變化而沒有穩(wěn)定最優(yōu)解。一方如果知道對方的策略或了解其策略選擇規(guī)律,則能相應地調整自己的策略以增加收益(或減少損失)。因此,雙方均努力確定對方的策略或策略選擇規(guī)律,同時極力防止自己的策略或策略選擇規(guī)律被對方發(fā)現(xiàn)。這一結論揭示了在打擊犯罪、污染治理、防治腐敗等實踐中政府監(jiān)管力度和監(jiān)管效果此消彼長的原因[21]。政府監(jiān)管機構加大監(jiān)管投入導致網約車平臺因違法風險增加而減少違法行為,同時少數(shù)違法行為得到懲處,相關工作取得顯著成效。面對較好的工作成績,政府監(jiān)管機構傾向于逐漸減少監(jiān)管投入,繼而因違法風險降低誘導違法行為增多,行業(yè)發(fā)展再次陷入困境,直至政府監(jiān)管機構重新增加監(jiān)管投入。因此,建議政府監(jiān)管機構保持監(jiān)管投入力度的穩(wěn)定,以促進市場的持續(xù)健康發(fā)展。
如果博弈雙方均以一定的概率隨機選擇策略,則四種策略組合均有可能出現(xiàn)。如果雙方的策略選擇概率分布均不給對方可乘之機,那么在一方概率分布既定的前提下,對方以一定的概率選擇兩種策略的期望得益相同,從而沒有改變策略概率分布的動機。也就是說,雙方均在對方概率分布已知的條件下,通過調整自己的概率分布實現(xiàn)不同策略的相同期望得益,從而實現(xiàn)得益最大化。此時,博弈雙方均沒有動機單方面調整策略概率分布。p*、q*滿足式(7)、(8)的條件時,政府監(jiān)管機構與網約車平臺的博弈實現(xiàn)混合策略納什均衡,且具有自動向均衡水平回歸的特性。如果q 0,根據(jù)式(6),網約車平臺降低q能增加收益。如果網約車平臺降低q,則E(G2)<0,根據(jù)式(3),政府監(jiān)管機構提高p能減少損失。網約車平臺守法的概率大于q*時,理性的最優(yōu)策略是降低守法概率;小于q*時,理性的最優(yōu)策略是提高守法概率;等于q*時,此時實現(xiàn)均衡,期望收益達到最大值0,政府監(jiān)管機構的策略概率分布不影響其收益。q偏離q*后將自動向q*回歸,最終使E(G2)、E(W2)趨向于0。政府監(jiān)管機構強監(jiān)管的概率大于p*時,理性的最優(yōu)策略是降低強監(jiān)管概率;小于p*時,理性的最優(yōu)策略是提高強監(jiān)管概率;等于p*時,此時實現(xiàn)均衡,期望收益達到最大值0,網約車平臺的策略概率分布不影響其收益。p偏離p*后將自動向p*回歸,最終使E(G2)、E(W2)趨向于0。該博弈的混合策略納什均衡如圖8所示。 圖8 混合策略納什均衡 政府監(jiān)管機構以p*概率隨機選擇強監(jiān)管,網約車平臺以q*概率隨機選擇守法,雙方的期望得益均為最大值0,均沒有單方面調整策略概率分布的動力。因此,以p*×q*概率實現(xiàn)得益(0,0),以p*×(1-q*)概率實現(xiàn)得益(L,0),以(1-p*)×q*概率實現(xiàn)得益(0,S),以(1-p*)×(1-q*)概率實現(xiàn)得益(V,D)。此時,網約車市場實現(xiàn)整體均衡,違法未被懲處而獲得額外凈收益V,選擇守法的則沒有額外收益,違法被懲處時承擔成本L。始終存在一定比例的違法行為,但整體平均收益為0。從時間維度來說,具體的網約車平臺違法有時獲得收益V、有時承擔成本L,守法則沒有額外收益,長期平均收益為0。政府監(jiān)管機構從成本-收益角度綜合考慮增加監(jiān)管成本、提高監(jiān)管強度的投入-產出效率。此時,政府監(jiān)管機構實現(xiàn)整體均衡,低監(jiān)管投入而未被懲處的節(jié)約成本S,低監(jiān)管投入但被懲處的承擔凈損失D,恪盡職守的則沒有額外收益。始終存在一定比例的弱監(jiān)管,但整體平均收益為0。從時間維度來看,政府監(jiān)管機構低監(jiān)管投入有時節(jié)約成本S、有時承擔凈損失D,高監(jiān)管投入則沒有額外收益,長期平均收益為0。政府監(jiān)管機構監(jiān)督管理網約車平臺的目的不是徹底消除違法行為,而是將違法水平控制在可承受的范圍內。監(jiān)管行為存在成本,需根據(jù)邊際成本等于邊際收益的原則實現(xiàn)收益最大化。 根據(jù)假設,政府調整處罰力度的長期和短期效果截然不同,存在激勵悖論。根據(jù)假設6,提高F1可增加L,短期內政府監(jiān)管機構強監(jiān)管的概率仍為p*,根據(jù)式(5),E(W2)<0,根據(jù)式(6),網約車平臺提高q有助于減少損失。提高F2可增加D,短期內網約車平臺違法的概率分布仍為q*,根據(jù)式(2),E(G2)<0,根據(jù)式(3),政府監(jiān)管機構提高p有助于減少損失。根據(jù)式(7),p*與V呈正相關、與L的絕對量呈負相關,與D無關,通過提高F1后增加L將導致p*下降。根據(jù)式(8),q*與D的絕對量呈正相關、與S呈負相關,與P無關,通過提高F2后增加D將導致q*上升。因此,短期內加大對違法行為的處罰有助于網約車平臺守法,加大對失職瀆職行為的處罰有助于政府監(jiān)管機構加強監(jiān)管;長期內加大對網約車平臺違法行為的懲罰將誘導政府監(jiān)管機構弱監(jiān)管而并不能抑制違法行為,加大對政府監(jiān)管機構的懲罰有助于網約車平臺守法而并不能促使政府監(jiān)管機構積極執(zhí)法。在新的均衡點,雙方得益恢復為0并根據(jù)新的均衡概率分布選擇混合策略(如圖9所示)。 圖9 政府監(jiān)管機構和網約車平臺的混合策略 納什均衡具有穩(wěn)定性,串謀則面臨“囚徒困境”。在兩人博弈的基礎上增加反應函數(shù)的數(shù)量并聯(lián)立方程組求納什均衡解,可將研究結論擴展到多主體博弈。由于UB>UH>UL,雙方均清楚串謀是帕累托最優(yōu)結果,但都無法信任對方,難以抵制利用對方信任單獨降價而獨占市場的誘惑。雙方在價格博弈中面臨“囚徒困境”,不管對方的具體策略如何,降價總是占優(yōu)策略,最終博弈將穩(wěn)定在(UL,UL)的策略組合。 進一步地,我們擺脫“囚徒困境”的嚴苛條件。如果W>U,則甲的最優(yōu)策略為合作,反之則不合作。實現(xiàn)合作策略需滿足的條件為: (34) 因為無限次重復博弈是否從第一階段開始并不影響結果,剔除已發(fā)生的,則需做出選擇的階段均可視為第一階段,所以δ滿足式(34)能保障博弈維持合作均衡。由于博弈的對稱性,保證乙維持合作的δ需滿足相同的條件。 δ的實際值與市場利率、通貨膨脹預期、博弈時長等因素呈負相關。當δ的實際值大于δ的閾值時,隨機結束的有限次重復博弈有望走出“囚徒困境”,反之則深陷其中。δ的閾值越大,δ的實際值高于閾值的概率越小,走出“囚徒困境”越困難,反之則相對容易。δ的實際值越大,高于既定閾值的概率越大,合作的未來收益現(xiàn)值越大,現(xiàn)階段自己合作而對方不合作給自己造成的損失與雙方均保持合作而獲得未來收益的現(xiàn)值相比越無足輕重,走出“囚徒困境”越容易,反之則相對困難。自己選擇不合作雖能獲得一次性收益UB,但與合作保留持續(xù)獲得UH收益的潛在可能相比,δ越大,合作的吸引力越大。因此,走出“囚徒困境”的概率與δ的閾值呈負相關、與δ的實際值呈正相關。根據(jù)無限次重復博弈的民間定理,在雙寡頭削價競爭的重復博弈中,由(0,UB)、(UH,UH)、(UB,0)、(UL,UL)四點合圍區(qū)域內的點表示所有可實現(xiàn)得益,其中斜線部分點的坐標對應的得益組合均可通過子博弈完美納什均衡實現(xiàn)(如圖10所示)。 圖10 雙寡頭削價競爭無限次重復博弈的民意定理 此外,如果動搖博弈雙方完全理性的基礎條件(即博弈的信息不完美甚至不完全,至少博弈一方不再擁有追求個體利益最大化的“個體理性”或完美分析判斷選擇能力的“完全理性”),則“極大化極小策略”將影響納什均衡的結果。當雙方均意識到行動的風險并懷疑對方的理性時,為降低風險傾向于根據(jù)風險上策均衡做出選擇,從而實現(xiàn)與帕累托上策均衡結果差異明顯的其他均衡結果。由于風險上策均衡具有自我強化的反饋機制,最初只是懷疑對方可能采取風險上策均衡策略,最終將推動相對低效率的風險上策均衡成為現(xiàn)實。如果博弈為多主體博弈,隨著博弈主體的數(shù)量增加,基于風險上策均衡達成合作的概率將以幾何級速度降低。 與上述的價格博弈一樣,在兩人博弈的基礎上增加反應函數(shù)的數(shù)量并聯(lián)立方程組求納什均衡解,也可將研究結論擴展到多主體博弈。同價格博弈類似,數(shù)量博弈也面臨“囚徒困境”。雙方均清楚串謀是帕累托最優(yōu)結果,但都無法信任對方,難以抵制利用對方信任單獨增產搶占市場份額而增加利潤的誘惑。對雙方而言,不管對方的具體策略如何,增產總是占優(yōu)策略,最終博弈將穩(wěn)定在古諾均衡水平。 同樣地,我們擺脫“囚徒困境”的嚴苛條件。如果W>U,則甲的最優(yōu)策略為合作,反之則不合作。聯(lián)立式(32)、(33),可得ε>9/17。由于博弈的對稱性,保證乙維持合作的ε亦需滿足上式。當ε的實際值大于9/17時,博弈雙方的串謀是最優(yōu)策略;反之,古諾產量是最優(yōu)策略。ε越大,合作的未來收益現(xiàn)值越大,現(xiàn)階段自己合作而對方不合作造成的損失與雙方均合作時獲得未來收益的現(xiàn)值相比越無足輕重,合作的概率越大。自己選擇不合作雖能獲得一次性收益9a2/64b,但與合作保留持續(xù)獲得a2/8b收益的潛在可能相比,ε越大,合作的吸引力越大。ε的閾值為常數(shù),ε的實際值與市場利率、通貨膨脹預期、博弈時長等因素呈負相關,因此合作的可能性與上述因素呈負相關。 與伯特蘭德模型一樣,雙方雖然都清楚合作對雙方最有利,但均有增加產量以獲得額外利潤的沖動,最終串謀限產協(xié)議因相互猜忌而破產。雖然理論上無法明確結束時點的有限次重復博弈有望在ε滿足一定條件時可通過“以牙還牙”策略保持合作均衡,但實踐中很難具備完全理性的條件。在信息不完美甚至不完全的條件下,質疑博弈雙方的“個體理性”或“完全理性”,風險上策均衡策略有可能取代帕累托上策均衡策略。由于風險上策均衡具有自我強化的反饋機制,增加網約車平臺數(shù)量將可大幅降低成功串謀的概率。 本文運用“小偷守衛(wèi)”博弈模型研究政府監(jiān)管機構與網約車平臺的博弈過程,考察博弈雙方策略選擇的路徑,分析博弈混合策略納什均衡的穩(wěn)定性及博弈策略長短期的效果差異。在此基礎上,通過引入監(jiān)管資源投入和違法凈收益等變量擴展“小偷守衛(wèi)”博弈模型,為政府根據(jù)實際監(jiān)管需要通過調整相應變量來提高監(jiān)管效果指明了路徑?;谑袌霭l(fā)展規(guī)律建立兩階段博弈模型,利用伯特蘭德模型分析市場擴展階段的價格競爭、古諾模型分析市場穩(wěn)定階段的產量調整,并將兩個完全信息靜態(tài)博弈擴展為不確定結束時點的重復博弈,闡述網約車平臺價格戰(zhàn)難以避免的原因及相應措施存在的局限性。 第一,與政府監(jiān)管機構博弈的網約車平臺不是具體企業(yè),而是整個行業(yè)。網約車平臺與政府監(jiān)管機構的博弈是一個交替采取行動的過程。從發(fā)現(xiàn)對方的策略選擇到調整己方的策略選擇的時間周期較長,特別是政府監(jiān)管機構調整監(jiān)管強度需經過前期調研、內部研究、逐級上報、決策審批、資源籌集、組織實施、效果評估等階段。但從短周期看,雙方依然表現(xiàn)為純策略博弈。 第二,存在混合策略納什均衡的研究結論要求政府監(jiān)管具有前瞻性,注意區(qū)分長短期效果,重視博弈參與主體對具體博弈策略向前展望和向后推理產生的持續(xù)影響。短期內具有較強針對性的政策措施在長期將因監(jiān)管對象的適應性調整而失效。 第三,引入影響變量,從而明晰監(jiān)管策略調整路徑。雖然混合策略納什均衡在實踐中很難實現(xiàn),但根據(jù)均衡概率分布可確定政府監(jiān)管機構最優(yōu)資源的投入規(guī)模。即使不知道均衡概率分布,但從可觀測、可調整的監(jiān)管資源投入入手,確定對網約車平臺的懲罰力度。實際上,圖3中強監(jiān)管的概率與監(jiān)管成本曲線上的任意點都可作為均衡概率分布,只是對應的監(jiān)管成本和對網約車平臺違法行為的懲罰力度存在差異。網約車平臺的均衡守法概率因違法行為的額外凈收益不同而存在差異,因而需根據(jù)違法性質實施分類監(jiān)管。由違法凈收益的大小確定守法概率,進而調整對政府監(jiān)管機構的懲罰力度。將二者綜合起來考慮,網約車平臺高違法凈收益的違法行為的守法概率較低,長期內需對政府監(jiān)管機構配套實施較大力度的懲罰。因為違法凈收益較大,如果受監(jiān)管資源限制能達到的政府強監(jiān)管均衡概率較小,則需大幅提高對網約車平臺的懲罰力度才能保持平衡;如果能實現(xiàn)較高水平的強監(jiān)管概率,則對網約車平臺的懲罰力度可相應降低。反之亦然。 第五,在網約車市場發(fā)展初期,網約車平臺存在為搶占市場展開補貼大戰(zhàn)的行為動機。在滴滴與優(yōu)步合并前的價格戰(zhàn)中,政府干預這一不正當競爭后,競爭主體采取差異化競爭策略而暫時告一段落,意味著競爭格局趨于穩(wěn)定,競爭將由價格轉向數(shù)量和質量。為增進社會福利,政府仍需努力鞏固數(shù)量博弈“囚徒困境”的穩(wěn)定性:一是根據(jù)貼現(xiàn)系數(shù)的影響因素,通過延長博弈時長、增加未來的不確定性等方式降低貼現(xiàn)率:二是建立由政府主導的網約車平臺并發(fā)揮其“鯰魚效應”,促進市場主體之間的競爭:三是干擾市場信號的傳遞,塑造市場主體不具有“個體理性”和“完全理性”的形象,發(fā)揮“極大化極小策略”在數(shù)量決策中的作用。q*,則E(G2)>0,根據(jù)式(3),政府監(jiān)管機構降低p能增加收益。如果政府監(jiān)管機構降低p,則E(W2)>0,根據(jù)式(6),網約車平臺降低q能增加收益。如果p>p*,則E(W2)<0,根據(jù)式(6),網約車平臺提高q能減少損失。如果網約車平臺提高q,則E(G2)>0,根據(jù)式(3),政府監(jiān)管機構降低p能增加收益。如果p



(二)網約車平臺之間的價格博弈


(三)網約車平臺之間的數(shù)量博弈
五、結 語
