(福州大學 福建 福州 350108)
近年來,隨著社會經濟的發展不斷加速,暴露出越來越多的信用問題,嚴重阻礙了社會主義現代化發展進程。加強信用管理,構建社會信用體系的重要性日益凸顯。2014年6月,國務院發布了我國第一部國家級社會信用體系建設專項規劃《社會信用體系建設規劃綱要(2014-2020)》,明確將商務信用納入社會信用體系建設的四大領域之一。同年9月,商務部頒布的《關于加快推進商務誠信建設工作的實施意見》也明確提出加快推進商務誠信建設工作。由此,商務誠信被賦予了推進全社會信用體系建設的重要意義。然而,雖然有了大量的頂層設計提供制度保障,但商務誠信在建設推進過程中仍然面臨著諸多困局:現有法律法規對失信生產經營行為懲罰力度不夠,難以對失信企業形成有效約束[1];失信經營的高利潤和低違規成本形成鮮明對比,誘使企業采用破壞性的生產經營方式謀取暴利;政府監管部門監管資源有限,不斷拓寬的監管范圍使得政府監管部門難以對所有企業進行全方位的實時監控[2]。因此,對政企博弈的研究,有助于進一步明晰政企關系,為政府制定企業監管政策提供科學合理的依據。
政企博弈的本質是政府的企業政策從出臺到執行過程中政府與企業的博弈行為。政府和企業的目標差異是政企博弈形成的原因,一項政策最終的實施效果在很大程度上取決于政企博弈的結果與政策目標是否吻合[3]。因此如何使博弈結果向政策目標靠攏就成了研究者們需要考慮的問題。洪璐等探討了企業排污處理情景下的政企博弈,認為政府可以通過提高監管概率或者加大獎懲力度,從而提升政府的監管效果[4]。這也與近年來政府監管部門所采取的實際措施相吻合,事中監管和事后獎懲成了解決政企博弈問題的關鍵環節,也成為廣大學者研究的熱點問題。雖然大量研究得出了增加企業失信成本和提高監管頻率可以促使企業依法守信經營的結論[5][6][7]。但一方面,單個部門的懲罰始終難以有效增加企業失信成本,不足以對機會主義失信企業形成足夠的威懾。另一方面,監管資源的有限性決定了監管頻率不能無限制地提高。那么,實現對有限監管資源的合理分配則成了提升監管效率的另一途徑。李亙等運用多階段進化博弈的方法,討論了在乳制品生產的各個階段政府監管資源的分配,認為對于多階段的生產活動中,政府監管資源應當盡量向源頭階段偏移[8]。然而,傳統規制手段下對監管資源的分配都是基于企業同質化這一前提來進行的,監管資源在企業間多是均等分配的。但現實中企業是異質的,不同企業守信經營的主觀意愿是不同的,這也就意味著對監管資源分配的研究還有進一步改進的空間。其中,最主要的問題便是政府和企業之間信息不對稱,且政府各部門之間的信息共享程度低。政府各監管部門不清楚不同企業的守信經營意愿大小,因此難以對監管資源進行合理分配。可見,解決信息不對稱和信息孤島問題,構建多部門協同監管體系是推進商務誠信建設進程的突破口,聯合獎懲應運而生。
雖然早在2007年3月國務院辦公廳出臺的《關于社會信用體系建設的若干意見》便提出要建立失信行為聯合懲戒機制,但是直到2016年5月國務院發布《關于建立完善守信聯合激勵和失信聯合懲戒制度加快推進社會誠信建設的指導意見》后“聯合獎懲”才真正開始進入公眾視野。聯合獎懲,就是在有關部門和社會組織依法依規對本領域違法違規失信行為進行處理或者給出信用分類評價,對嚴重守信/失信行為列入紅/黑名單之后,通過信息共享,推動其他部門和社會組織依法依規采取聯合激勵或者聯合懲戒的措施[9]。由此不難看出聯合獎懲的兩大作用:一方面通過信用信息共享,使得監管部門可以提前知曉企業信用狀況,從而可以將監管資源向守信經營意愿低的企業傾斜,迫使其開展守信經營,提升企業群體的整體守信經營程度。另一方面,通過多個部門的聯合獎勵和聯合懲戒,增大企業的失信成本和守信收益,擴大守信經營企業和失信經營企業的收益感知差距,從而促使更多的企業守信經營。本文也將從這兩個角度,對聯合獎懲視角下的政企博弈展開研究。
(一)參與者。博弈參與者分別是企業和政府(泛指與企業生產經營活動相關的監管部門),博弈雙方都為有限理性。
(二)行為策略及概率。企業有“守信經營”和“失信經營”兩種策略。選擇“守信經營”的概率為x,選擇“失信經營”的概率為1-x。這里的“守信經營”是指企業嚴格遵照我國法律法規,積極執行相關部門頒布的行業政策。“失信經營”指企業為使自己經濟收益最大化而違法、違規經營,對相關行業政策消極執行或不執行。政府也有“監管”和“不監管”兩種策略。選擇“監管”的概率為y,選擇“不監管”的概率為“1-y”。
(三)成本收益參數設置。當企業選擇守信經營時,能夠獲取經濟收益R,但同時需要付出經營成本C1。當企業選擇失信經營時,能夠獲取經濟收益R’,需要付出經營成本C1’。
當政府選擇監管時,需要付出的監管成本為C2。由于監管資源有限,存在著監管成功率Q,即以Q的概率監管到企業的守信或失信經營行為。
由于政府和企業扮演的社會角色不同,區別于企業追求經濟利益最大化,政府的目標是追求社會整體收益最大化,包括經濟收益和社會收益兩部分。若被監管企業為守信經營,則政府的經濟收益為αR,社會收益為H,此時政府給予企業獎勵J,其中α為政府經濟收益系數。若被監管企業為失信經營,則政府的經濟收益為αR',社會收益為H’,并對企業收取罰款F。當政府選擇不監管時,只被動地獲取企業“守信經營”或者“失信經營”帶來的經濟收益和社會收益,不產生監管成本、獎勵和罰款。由此可得出博弈雙方的收益矩陣如表1所示。

表1 傳統監管機制下的政企博弈收益矩陣
通過演化博弈的方法求解出企業和政府的復制動態方程:
結合實際情況來看,本節只考慮0 表2 系統均衡點局部穩定性分析 由于點(x0,y0)對應的特征根λ1,λ2為一對純虛根,故(x0,y0)為穩定的中心點,但不是漸進穩定點。系統的演化軌跡為圍繞著中心點(x0,y0)的閉環曲線,政企雙方表現出周期性行為,系統無法達到Nash均衡。 圖1 傳統監管機制下政府與企業策略演化軌跡 聯合獎懲機制下的監管成功率不再是固定的,令動態監管成功率為g(x)=(1-x)Q0,其中Q0為最大監管成功率。此外,一旦政府檢查到企業守信或者失信經營,聯合獎懲機制還將在原來的政府獎勵J和懲罰F的基礎上,增加由其他部門給出的聯合獎勵M和聯合懲戒P。由此,可得到新的政企博弈收益矩陣: 表3 聯合獎懲機制下的政企博弈收益矩陣 此時的復制動態方程為: 聯合獎懲機制下政府和企業的演化博弈軌跡螺旋地向內趨近于焦點,系統具有漸進穩定性,能夠達到Nash均衡(如圖2) 綜上,聯合獎懲可以通過信用信息共享實現監管資源動態分配,將監管資源向守信意愿較低的企業傾斜,促使這部分企業開展守信經營,提升企業群體的整體守信經營程度,同時還使原來的周期性博弈行為達到均衡狀態。同時,多個部門共同施加的聯合獎勵和聯合懲戒措施,能夠增大企業守信/失信的感知收益差異,有利于企業群體向守信經營轉變。由此,聯合獎懲對于促使企業守信經營、推進商務誠信的建設確有積極意義。 圖2 聯合獎懲機制下政府與企業混合策略演化過程



二、聯合獎懲機制下的政企演化博弈

三、結論
