基于三方演化博弈的網絡貨運動態發展機制及仿真研究

2022-11-26 02:49:06李成杰

公路交通科技 2022年10期

楊揚，李成杰

(昆明理工大學交通工程學院，云南昆明 650500)

0 引言

運輸服務合同委托實際承運人完成道路貨物運輸，承擔承運人責任的道路貨物運輸經營活動。我國自《網絡平臺道路貨物運輸經營管理暫行辦法》頒布后，大力發展網絡貨運平臺，但由于我國物流業采起步較晚，存在科學技術應用較少、信息化程度不高、管理水平較為落后等現狀，總體發展緩慢[1]。為解決這些現狀，我國近幾年開展了一批無車承運人試點，并取得了出色的成績，但也存在一些弊端，如平臺的運輸主體信息和運輸業務不真實等問題。如何解決網絡貨運平臺構建過程中存在的問題，還需要細致研究和探討。本研究將通過演化博弈中的理論分析及仿真分析對該問題進行研究。

隨著網絡貨運平臺在我國的大力發展[2]，我國學者對網絡貨運平臺的研究也日益深入。王丹丹[3]分析了如何經營網絡貨運平臺，總結出組建自己的技術團隊、發展多式聯運、制訂標準化流程等方法。陳煜婧等[4]分析了影響無車承運人策略的因素，證明了單一的運價競爭不再是道路運輸市場核心競爭力，信譽水平和信息利用率對發貨人選擇承運商起到重要作用。金忠旭等[5]基于“互聯網+”的無車承運人物流模式，建立了一站式運輸服務平臺，實施精細化專業運輸,拓展增值服務等措施。賈艷麗等[6]通過建立車貨匹配系統的節能評價模型將平臺與綠色物流連接起來。劉薇等[7]從優化稅收方面提出平臺增值稅稅制優化建議。國外發達國家從20世紀90年代便已開始發展網絡貨運平臺，特別是對平臺的算法設計研究頗為全面與深入。 Unnikrishnan等[8]提出了一種自適應路由策略，通過相應信息更新來幫助托運人和承運人節省成本，解決了新型貨運網絡分配問題。Geng等[9]根據現有的退貨運費保險，開發了利潤最大化模型，并計算了包括保險費和賠償金在內的最優定價策略。Miller等[10]通過在線貨物交換平臺(OFEX)的力量，將OFEX路由問題描述為一個Markov決策問題，通過在每個可能的地點和時間尋找使期望利潤最大化的競價策略來解決。

網絡貨運機制的構建實質上是一個內外部監管問題，針對運用博弈方法解決相關監管問題，我國學者的研究也日益深入。不少學者均認為，政府的監管和干預行為對整個市場來說十分必要[11-3]。盧艷秋、張莉等[14-15]學者發現，政府監管尤其是監管力度會影響企業創新行為。李泊洲等[16]通過設置懲罰閾值來研究政府監管的有效性。朱立龍等[17]通過設置政府懲罰與用戶反饋機制得出了政府是監管最后的最后一道關卡的結論。從政府層面來說，監管成本越小，是否監管的社會影響力越大，政府越傾向嚴格監管[18]。楊揚等[19]依據古諾模型構建博弈模型，得出企業聯盟穩定發展的前提是有足夠及時止損者還有少數合作者。

可以發現，目前國外學者針對網絡貨運平臺的研究主要集中于平臺的算法設計，國內學者主要對網絡貨運平臺的經營模式進行研究，而國內外學者對網絡貨運平臺形成的機理和演化特征的形成亟需進一步研究。且在研究上述相關監管問題時對多政策聯合監管的研究較少，均是單一政策研究，說服力不強。基于此，本研究總結相關文章的優點與不足，運用演化博弈論進行理論分析，并通過計算機仿真，將政府單一政策與聯合政策的監管效果進行對比，以證實政府政策的重要性。

1 模型建立及參數假設

假設1：政府監管門為參與方1，網絡貨運平臺為參與方2，平臺上的第三方物流企業為參與方3。3方均是有限理性的參與主體，策略選擇隨時間逐漸演化穩定于最優策略。

假設2：政府有“嚴格監管”和“寬松監管”2種策略。當政府選擇嚴格監管時，會設立相應的監管部門，要求網絡貨運平臺將每個月的營業數據上傳到政府監管部門的數據庫中，監管部門通過分析相應數據來決定賞罰。即政府監管門的策略空間a=(a1，a2)=(嚴格監管，寬松監管)，并以概率x選擇a1，以概率1-x選擇a2，x∈[0,1]。當政府選擇嚴格監管時，會要求網絡貨運平臺將每個月的營業數據上傳到政府監管部門的數據庫中，監管部門通過分析相應數據來決定賞罰。

網絡貨運平臺會有“提供高質量的服務”和“提供低水平服務”2種策略。當提供高質量服務時，平臺會利用相關技術設備來實現車貨匹配的最優化。即網絡貨運平臺的策略空間b=(b1,b2)=(提供高質量的服務，提供水平服務)，并以概率y選擇b1，以概率1-y選擇b2，y∈[0,1]。

第三方物流企業的策略空間c=(c1,c2)=(加入平臺，不加入平臺)，并以概率z選擇c1，以概率1-z選擇c2，z∈[0,1]。

假設3：當政府嚴格監管時，如果網絡貨運平臺提供低水平服務，會被罰款Q；若平臺提供高質量的服務，政府會獎勵其M；若第三方物流企業加入平臺，政府會補貼S。當政府寬松監督時，則無法得知平臺與企業的策略選擇信息，不做獎懲。政府嚴格監管的成本為Cg。

假設4：網絡貨運部平臺提供高水平服務時的成本為C1，收益為W1；提供低劣服務時的成本為C2，收益為W2。C1>C2，W1>W2。當平臺提供高水平服務時會吸引第三方物流企業加入，促進市場發展，為政府帶來社會收益Ag。

假設5：當平臺提供高水平服務，第三方物流企業加入時，企業會獲得收益Vt；若平臺提供低水平服務，第三方物流企業加入，企業會獲得收益Vm，但因服務水平低，會造成損失P；企業選擇自己單干時，會獲得收益I。I>Vt>Vm。

總的參數如表1所示。

表1 模型參數及含義

假設以上參數大于0。由以上假設，可得到三方博弈的支付表如表2所示。

表2 三方博弈支付矩陣

2 博弈模型分析

2.1 政府、網絡貨運平臺、物流企業博弈均衡分析

2.1.1 政府博弈均衡分析

設政府分別選“監督”、“不監督”獲得的期望收益是πx1和πx2，計算公式為：

(1)

政府的復制動態方程為：

[Q-Cg-y(M+Q)-zS]。

(2)

為便于分析，令zc為使F(x)=0的點：

(3)

(1)若z=z0，則F(x)≡0，意味著所有水平都是穩定狀態，即政府以何種比例選擇“嚴格監管”策略均為穩定策略。

(2)若z≠z0，令F(x)=0，可得2個穩定點為x=0,x=1。

對式(2)求導得：

(M+Q)-zS]。

(4)

演化穩定策略(ESS)要求F′(x)<0，此時有2種情況：

①若z0，F′(1)<0，可知x=1為演化穩定策略；

②若z>z0，可知F′(0)<0,F′(1)>0，可知x=0為演化穩定策略。

由以上分析可知，政府策略選擇的演化不僅會受到網絡貨運平臺策略選擇的影響，還會受到第三方物流企業策略選擇的影響。政府監管的策略演化相位圖如圖1所示(圖1、圖2、圖3中x，y，z軸含義相同，分別為政府嚴格監管的概率、平臺提供高質量服務的概率、企業加入平臺的概率)。

圖1 政府監管的策略演化相位圖

圖2 網絡貨運平臺的策略演化相位圖

圖1中虛線部分將空間分為2部分(v1和v2)，當政府監管部門初始狀態處于空間v1時，x=1是均衡點，即政府會趨向嚴格監管。當政府監管部門初始狀態處于空間v2時，x=0是均衡點，即政府會趨向寬松監管。進一步分析可知，減小S或增大Q時，z0會增大，導致空間v1增大而空間v2減少，說明減少對加入平臺企業的補貼或增大對不良平臺的罰款時，將提高政府嚴格監管的積極性。

2.1.2 網絡貨運平臺博弈分析均衡

設網絡貨運平臺分別選“提供高水平服務”、“提供低水平服務”獲得的期望收益為πy1何πy2，計算公式為：

(5)

網絡貨運平臺的復制動態方程為：

[x(M+Q)+W1-W2+C2-C1]。

(6)

為便于分析，令x0為使F(y)=0的點：

(7)

(1)若x=x0，則F(y)≡0，意味著所有水平都是穩定狀態，即網絡貨運平臺以何種比例選擇“提供高質量服務”策略均為穩定策略。

(2)若x≠x0，令F(y)=0，可得3個穩定點為y=0,y=1。

對(6)式求導得：

W2+C2-C1]。

(8)

演化穩定策略(ESS)要求F′(y)<0，此時有2種情況：

①若x0，可知y=0為演化穩定策略；

②若x>x0，可知F′(0)>0，F′(1)<0，可知y=1為演化穩定策略。

由以上分析可知，網絡貨運平臺策略選擇的演化僅會受到政府策略選擇的影響。

網絡貨運平臺的策略演化相位圖如圖2所示。圖2中虛線部分將空間分為2部分(v3和v4)，當網絡貨運平臺的初始狀態處于空間v3時，y=1是均衡點，即平臺趨于提供高質量的服務。當網絡貨運部平臺的初始狀態位于空間v4時，y=0，即平臺趨于提供低水平服務。進一步分析，當減小Q和M時，x0會增大，導致空間v3減少而空間v4增大。即政府減少對平臺的罰款、獎勵時，將促使網絡貨運平臺向提供低水平服務轉變。

2.1.3 第三方物流企業博弈平衡分析

設物流公司分別選“加入網絡貨運平臺”、“不加入網絡貨運平臺”獲得的期望收益πz1和πz2為：

(9)

第三方物流企業復制動態方程為：

xS+Vm-P-I]。

(10)

為便于分析，令y0為使F(z)=0的點：

(11)

(1)若y=y0，則F(z)≡0，意味著所有水平都是穩定狀態，即第三方物流企業以何種比例選擇“加入網絡貨運平臺”策略均為穩定策略。

(2)若y≠y0，令F(z)=0，可得2個穩定點為z=0,z=1。

對(10)式求導得：

xS+Vm-P-I]。

(12)

①若y0，可知z=0為演化穩定策略；

②若y>y0，可知F′(0)>0,F′(0)<0，可知z=1為演化穩定策略。

由以上分析可知，第三方物流企業策略選擇的演化不僅會受到政府策略選擇的影響，還會受到網絡貨運平臺策略選擇的影響。

第三方物流企業的策略演化相位圖如圖3所示。虛線部分將空間分為2部分(v5和v6)，當第三方物流企業的初始狀態處于空間v5時，z=1是均衡點，即企業趨于加入網絡貨運平臺。當第三方物流企業的初始狀態位于空間v6時，z=0，即企業趨于自己單干。進一步分析，當增大Vt和S時，y0會減小，導致空間v5增大而空間v6減少,即企業加入平臺獲得的收益及獲得政府補貼增大時，企業會趨于加入網絡貨運平臺。

圖3 第三方物流企業的策略演化相位圖

2.2 三方演化策略分析

微分方程系統的演化穩定策略可由該系統的雅可比局部穩定性分析得到，由式(1)、式(4) 和式(7)可得到系統的雅可比矩陣：

(13)

利用李雅普諾夫(Lyapunov)間接法：雅克比矩陣的所有特征值均具有負實部，則均衡點為漸進穩定點；雅克比矩陣的特征值至少有1個具有正實部，則均衡點為不穩定點；雅克比矩陣除具有實部為零的特征值外，其余特征值都具有負實部，則均衡點處于臨界狀態，穩定性不能由特征值符號確定。分析各均衡點的穩定性，如表3所示。

表3 均衡點穩定性分析

由表3可知，當E2，E3，E6的特征值均小于0時為穩定點，則表4給出了穩定性條件。

表4 穩定性條件

2.3 穩定條件分析

2.3.1 情形1

當滿足Vm+S-P

2.3.2 情形2

當滿足W2-C2

2.3.3 情形3

當滿足S+Cg

當政府罰款力度較大但對于良心平臺獎勵力度較小時，根據3方策略選擇初始點的不同，策略組合演化穩定于“嚴格監管，提供低水平服務，加入網絡貨運平臺”。此時，平臺選擇高質量服務得到的收益小于提供低劣服務的收益，故會不選擇提供高質量服務。為避免上述現象出現，政府應適當提高獎勵力度，激勵網絡貨運平臺自身整改升級。

由以上分析可以得出結論：當政府補貼力度不足或懲罰力度不足都會導致平臺提供低質量的服務，而企業的選擇策略主要取決于平臺的選擇策略，即在高質量還是低質量的平臺中獲益更多。因此，政府的監管是否有效是網絡貨運機制能否穩定發展的前提條件。

3 博弈數值分析

隨著網絡貨運平臺在我國蓬勃發展，加快了傳統物流企業的轉型升級。但目前還存在較大問題。平臺型無車承運人, 特別是車貨匹配型、物流技術型互聯網平臺仍以傳統車貨交易、信息撮合為主要模式，以收取會員費和信息費用作為主要盈利點, 這與無車承運人賺取運費差價的模式還存在一定差距，行業缺乏較為成熟的、適合無車承運模式的貨運責任險等保險產品，對企業身份轉換、責任承擔和可持續發展帶來不小的壓力和挑戰。而且一些物流企業思想保守，缺乏相應的管理人才，轉型十分困難。

針對以上問題，并根據2.3得出的結論，要求政府加強對平臺的監督管理，適當提高獎懲力度。根據實際情況，對支付矩陣中的參數初始值給出如下假設，單位統一為百萬元。

取Cg=2,Q=3,S=3,P=2,I=10,Vm=4,Vt=6,C1=8,C2=1,W1=9,W2=8,M=2。在這種情況下，M，S，Q相對較小，即政府的罰款、獎勵力度均很小，不能有效行使監督作用。現實中，政府的初始參與意愿值一般大于平臺和企業，設3方參與者選擇策略(x,y,z)的初始值為(0.6, 0.4, 0.4)，在此種狀態下進行模擬，得到該博弈模型的ESS策略的演變趨勢，如圖4所示。

圖4 初始狀態下的演化平衡

由圖4可知，如果政府的參與度很低，不能起到很好的監督作用，最終的演化結果為(1, 0, 0)，符合情形2.3中情形1的分析。政府選擇嚴格監管的概率先稍有下降，后上升至1，并保持穩定；網絡貨運平臺與第三方物流企業的收斂速度較快，最終都下降至0并保持穩定。

3.1 初始參與意愿的仿真分析

圖5是假定其他參數不變，3方初始參與意愿同時變化對演化結果的影響，同時取較高和較低的初始意愿值(0.8和0.3)，假設3方初始參與意愿相同。可以發現，無論3方初始參與意愿是否大于0.5，最終收斂都于(1,0,0),即政府嚴格監管，網絡貨運平臺提供低劣服務，第三方物流企業不加入平臺。可以觀察到，3方的初始意愿值越大，收斂速度越慢，且x=0.8時政府選擇嚴格監管的概率會有一段大幅度下降，這是因為當初始意愿值很大時，政府會認為其他參與方會向理想的結果演化，故先會向寬松監管演化。

圖5 初始意愿不同對演化結果的影響

圖6(a)是假定其他參數不變，網絡貨運平臺、第三方物流公司取中等初始意愿值(即0.5)，政府初始意愿值改變對其他參與者的影響。可以看出，當x0增大時，y和z的收斂速度會減慢，但結果并未改變。這說明當政府沒確定有效的獎懲制度時，其初始意愿值的上升并不能帶動網絡貨運平臺、第三方物流企業的演化結果發生變化。

圖6 政府在初始意愿值不同下對演化結果的影響

3.2 政府對網絡貨運平臺獎勵力度M的仿真分析

取Cg=2,Q=3,S=3,P=2,I=10,Vm=4,Vt=6,C1=6,C2=4,W1=9,W2=8。

令W1-C1+M≥W2-C2，即網絡貨運平臺在選擇提供高質量服務時有利可圖。分別取M=1,4,7，演化結果下圖所示。由圖7可知，政府對網絡貨運平臺的獎勵力度并非越大越好。政府過大的投入，會使網絡貨運平臺選擇提供高質量服務的概率先增后減至0，而物流企業一直選擇不加入平臺，且收斂速度較快。究其原因，當政府投入過大時，會導致平臺坐享其成，缺少自己探索發展的動力，進而會滋長平臺發展的惰性，此時系統會演變成為策略“寬松監管，提供低水平服務，不加入網絡貨運平臺”的不良狀態，不利于我國無車承運人的良好發展局面。

圖7 不同程度的補貼對演化結果的影響

3.3 政府對網絡貨運平臺的懲罰力度Q的仿真分析

取Cg=2,S=3,P=2,I=10,Vm=4,Vt=6,C1=8,C2=1,W1=9,W2=8,M=2。此時取較大的懲罰力度Q=5&7，結果如圖8所示。可以看出，政府與網絡貨運平臺的選擇是處于一種波動、不穩定的狀態，更符合實際情況。隨著Q的增大，網絡貨運平臺選擇提供高質量服務的概率會略有上升、變化幅度減小，且更加穩定；政府實施嚴格監管策略的概率有所下降，也會更加穩定；不論Q如何變化，第三方物流企業都會選擇不加入平臺。究其原因，當Q增大時，網絡貨運平臺提供低質量服務被政府查到的罰款遠遠大于其獲得的利潤，因此便提高了選擇提供高質量服務的概率，此時政府選擇嚴格監管的概率便會下降。物流企業知道平臺提供高水平服務、政府選擇嚴格監管是不穩定的，且Vm+S

圖8 懲罰力度不同對演化結果的影響

3.4 政府對第三方物流企業補貼力度S的仿真分析

取Cg=2,Q=3,P=2,I=10,Vm=4,Vt=6,C1=8,C2=1,W1=9,W2=8,M=2。S取3和10，結果如圖9所示。可以觀察到，政府只增大對第三方物流企業的補貼力度并不能使得演化結果向理想方向發展。根據網絡貨運管理辦法，一家物流企業想要正式轉型網絡貨運平臺，從系統開發、技術儲備、資料整理、與政府部門溝通對接到獲得網絡貨運許可證，完全按此流程跑1遍，時間大約需要3～6個月。此時，政府對不良平臺罰款較少，平臺服務質量低，導致企業轉型時間顯著增長，雖然政府增大對企業的扶持，但對企業來說，其付出的時間成本遠高于此。

圖9 政府對第三方物流企業補貼力度對演化結果的影響

3.5 政府聯合政策監管的仿真分析

取Cg=2,Q=7,P=2,I=10,Vm=4,Vt=6,C1=8,C2=1,W1=9,W2=8,M=2,S=10。此時政府獎勵、懲罰力度都較為嚴格，并且3方均取較高初始參與度(0.8)。結果如圖10所示。可以觀察到，當政府采取聯合政策監管策略且3方初始參與度較高時，政府、平臺、企業都會向理想結果演化，但無法趨向一個穩定點，整個市場處于周期震蕩狀態。同時也可發現，平臺的敏感程度略大于企業的敏感程度。這說明政府采取聯合政策監管的效果十分顯著，而周期震蕩的原因主要是我國網絡貨運平臺治理中往往采用運動式治理模式，諸如每年“6·18”、“雙11”等物流量激增的重大節日對網絡平臺進行全面強化監管，這導致了特定時期監管過度，更多時候監管不足。

圖10 政府采取聯合監管策略對演化結果的影響

4 結論

通過構建政府、網絡貨運平臺和物流公司3方演化博弈模型,系統分析了3方的決策演化過程,并運用Matlab模擬參數不同取值情形下博弈策略變動及演化趨勢。主要研究了政府實行不同政策時對平臺和企業演化結果造成的影響，得出以下結論：

(1)加入平臺的企業獲得的補貼減少或政府增大對不良平臺的罰款時，政府將傾向“嚴格監督”；政府對提供低劣服務平臺的懲罰力度增大時，平臺趨向“提供高質量服務”；企業加入平臺獲得的收益及獲得政府補貼增大時，企業會趨向“加入平臺”。

(2)政府單一政策監管下，3方主體的初始參與意愿值、政府對平臺的罰款、政府對企業的補貼對系統趨于構建良好網絡貨運模式方向演化均有一定作用，但結果并不理想。當僅增加初始參與意愿值或政府對企業的補貼時，平臺和企業仍會向“提供低水平服務，不加入平臺”演化，但收斂速度會減慢，且網絡貨運平臺的敏感程度要大于第三方物流企業。

(3)對于網絡貨運平臺來說，政府對平臺的獎勵對系統的演化方向影響隨情況而定。地方政府若能固定對符合認定的網絡貨運平臺提供一定的獎勵補貼，確實可以緩解在發展初期此類企業的財政壓力。但是當地方政府過度提高補貼額度時，政府、平臺均會向不利方向演化，且獎勵越高，收斂為0的速度越快。網絡貨運平臺應當加強技術研發，提升供給服務效率，以高質量的服務來吸引物流企業的加入。

(4)政府采取聯合監管策略時，系統會出現“嚴格監管，提供高質量的服務，加入平臺”的良好局面，但處于周期震蕩狀態，且3方變動趨勢基本一致。說明政府應當加強對平臺和企業的懲罰和獎勵力度，在建立健全有效監管體制的同時，加大激勵懲罰機制的力度，堅持長期嚴格監管,且需多從營業環境、人才引進等軟實力方面對平臺進行幫扶。