□文/魏浩宇 張濤嘉 董進全
(內蒙古工業大學 內蒙古·呼和浩特)
[提要]本文基于不完全信息和有限理性假設,構建合作激勵機制下“醫療機構-企業-政府”三方醫療廢物逆向供應鏈博弈模型,利用演化博弈復制動態方法,分析各利益主體的行為關系及最優穩定策略選擇。
2020年,新冠肺炎疫情大規模爆發,醫療廢物急劇增加。據生態環境部數據顯示,截至2020年3月14日,全國醫療廢物處置能力為6,058.8t/d,相比疫情前的4,902.8t/d增加了1,156.0t/d,激增的醫療廢棄物使大量本可重新回到生產序列的資源被浪費,同時引起了嚴重的環境問題。
目前,我國已初步構建醫療廢物逆向供應鏈,但實施效果還未達到預期,究其原因是在醫療廢物逆向供應鏈中主體的異質性、對政府依賴嚴重,使得各主體間難以形成協同發展。因此,根據醫療廢物在循環經濟中的特點,深入分析其各主體的行為與策略選擇,設計合理的合作激勵機制,對于確定各主體的權利與責任邊界,實現醫療廢物逆向供應鏈良性發展,具有一定的實踐價值。

表1模型主要參數及解釋一覽表
現有關于醫療逆向供應鏈的研究主要聚焦在醫療廢棄物網絡設計優化、研究收集點的選址規劃及廢棄物的運輸規劃等方面。趙佳虹和凌雅婷基于疫情環境下,設計時變“環境-人口”風險度量模型,建立風險最小和成本最小的多目標選址-分配模型。賀政綱等為實現全面覆蓋醫療廢物產生源,提出醫療廢物三層回收網絡結構,構建三層回收網絡優化模型。蒲松等認為回收需求為固定值的醫療廢棄物回收路徑優化模型與實際需求不匹配,在兩種不確定性集合的基礎上,建立了以總成本最小為目標、帶時間窗的、變化單位運營成本的醫療廢棄物回收路徑魯棒優化模型。值得注意的是,對于醫療廢物逆向供應鏈博弈行為的研究較少。劉婷對三個主體(政府、藥品生產企業和消費者)的行為和收益做出分析,建立了基于不完全信息和有限理性假設下的三方博弈模型,但其僅將政府政策作為調控激勵,并未考慮其他成員之間的合作激勵。鑒于此,本文運用演化博弈分析方法,設計企業和醫療機構的合作機制,給出醫療
廢物逆向物流良性發展視域下的策略選擇。
激勵機制設計需要考慮利益相關者的收益,醫療廢物逆向供應鏈的利益主體包括醫療機構、企業和政府。
醫療機構是醫療廢物產生的源頭,為逆向供應鏈輸入基礎價值,其承擔醫療廢物的分類、收集和與企業交接的職責。企業是醫療廢物逆向供應鏈建設的主力軍,其職能不僅涵蓋醫療廢物回收和處置,還包括激勵醫療機構參與逆向供應鏈。政府作為整體環境的維護者,是醫療廢物逆向供應鏈建設的主要推力,通過法律法規和市場監管對各方利益相關者調節,以實現公共利益和經濟利益的對立統一。
(一)模型假設
1、利益主體均為有限理性,博弈方會在過程中學習,通過試錯來調整自身策略以達到利益均衡。
2、只有醫療機構和企業同時合作參與廢物處理,雙方才能獲取合作收益I,并實現整體社會經濟效益R。
(二)策略分析。醫療機構考慮經濟收益,有兩種策略行為:與企業合作參與(稱“合作”),或違規外流牟取暴利(稱“不合作”)。企業考慮市場收益和社會責任,有兩種策略行為:激勵醫療機構參與實施醫療廢物的運輸和再處置(稱“激勵實施”),或僅參與運輸但不進行處理(稱“不激勵實施”)。政府考慮社會和經濟效益,有兩種策略行為:有效監督其他主體是否實施醫療逆向物流處置,并給予相應獎懲(稱“全面監管”),或因管理成本等未實施合理監管(稱“部分監管”)。三方在不同訴求下選取的策略有所不同,相互制約、相互影響,具體參數及解釋如表1所示。(表1)
醫療機構合作參與逆向供應鏈的概率、企業激勵醫療機構參與逆向供應鏈的概率、政府有效監管的概率分別用表示x、y 、z表示,概率區間為[0,1]。
根據以上假設及三方策略的依存性,利用博弈收益矩陣建立演化模型,如表2所示。(表2)
(三)博弈均衡模型求解。在醫療廢物逆向供應鏈中,各主體策略的變化是博弈分析的核心,而變化速度是關鍵。因此,需分別構造參與主體的復制動態方程,描述各主體策略被選擇的頻率。
1、醫療機構收益期望函數與復制動態方程。根據表2分析可知,醫療機構選擇合作策略的期望收益Ux1為:

醫療機構選擇非合作策略的期望收益Ux2為:

根據相關理論研究,醫療機構復制動態方程如下:

2、企業的復制動態方程。根據表2分析可知,企業策略選擇的復制動態方程為:

3、政府的復制動態方程。根據表2和政府復制動態方程計算可知,政府策略選擇的復制動態方程為:

(四)博弈均衡穩定性分析
1、醫療機構穩定性分析
(2)相反,上述等式不成立時,x=0、x=1是醫療機構的演化穩定策略,這時要分情況進行討論。
情況1:當C1+E2-y·I-E1>0,企業激勵實施概率小于臨界值,由于演化穩定策略要求F'(x)<0,首先當0<z<時:①C1+E2-y·I-E1>S1+P1時,F'(x=0)<0,故x=0是其演化穩定策略,企業激勵實施的概率和政府建立監管體系的概率均低于臨界值,且醫療機構參與合作的期望收益低于違規流出的收益,說明此時處于無序狀態,醫療機構選擇不參與;②C1+E2-y·I-E1<S1+P1時,F'(x=0)<0,故x=0是其演化穩定策略,此時醫療機構參與的預期收益雖大于違規處理收益,但受企業合作行為及政府監管影響,理性的醫療機構認為企業激勵實施和政府建立監管體系的概率均低于臨界值,難以獲取政府補 貼,選 擇 不 參 與。其 次 當C1+E2-y·I-E1<S1+P1,且時,F'(x=1)<0,故x=1是其演化穩定策略,此時E1+y·I+S1-C1>E2-P1,醫療機構合作的預期收益大于違規處理收益,雖然企業激勵實施的概率低于臨界值,但政府監管概率高于臨界值,醫療機構選擇參與合作。

表2三方博弈收益矩陣

表3各空間內均衡狀態一覽表
情況2:當C1+E2-y·I-E1<0時,企業激勵實施概率大于臨界值,此時只有故x=1是其演化穩定策略,此時醫療機構合作的預期收益大于違規處理收益,同時政府和企業參與的概率均大于臨界值,政府支持力度大,企業足夠重視,由此形成循環經濟的良性發展。
2、企業穩定性分析


當醫療機構或企業參與/激勵實施醫療逆向供應鏈的預期收益低于不參與/激勵實施,不論其他主體如何決策,醫療機構和企業均會選擇退出逆向供應鏈。本文重點分析醫療機構和企業參與的收益大于不參與情況下的均衡狀態。當醫療機構和企業參與合作的預期收益高于不參與時,初始情況落在不同的空間內可得不同均衡狀態,如表3所示。(表3)
結合不同利益主體的動態趨勢可得:x*=0,y*=0,z*=1和x*=1,y*=1,z*=0是逆向物流博弈系統中演變穩定策略(ESS)。當初始情況落在其他區域時,由于各方利益主體策略的微小改變也會收斂到上述兩個穩定策略點。
(0,0,1)是一個相對穩策略,此時各方決策行為分別是不合作、激勵實施、全面監督,此時,企業將逆向供應鏈僅看作廢品回收,醫療機構對醫療廢物的環境危害認識不足,企業和醫療機構的參與度低,致使逆向供應鏈體系滯后,即便是政府積極干預,逆向供應鏈的實施仍十分困難。因此,為了發展我國醫療回收逆向物流,政府應采取強有力的政策,使醫療機構和環保企業的參與度提高,只有這樣,才能使醫療廢物的逆向物流實現“躍遷”。
(1,1,1)是一個過渡策略,此時各方決策行為分別是合作、激勵實施、全面監督,此時,政府大力推動直接影響醫療逆向物流運作的積極性,明確主體責任劃分,清晰交易費用分攤和利益分配,合適的激勵懲罰政策才能促使醫療機構和企業參與醫療逆向物流。
(1,1,0)是一個相對穩策略,此時各方決策行為分別是合作、激勵實施、部分監督,長期來看,醫療機構和企業最終會在無政府干預下實現積極參與,當企業參與意愿達到較高水平后,都會達到(1,1,0)的均衡狀態。由此可見,企業是逆向物流中的主體,如何激發企業在醫療逆向物流的核心推動力是值得思考的問題。(通訊作者:董進全)