滕 宇
(山東工商學院,山東 煙臺 264005)
隨著經濟的增長和社會的進步,工業化進程也越來越快。在過去,為了經濟的發展而忽視了對環境的治理,而現在人們在享受工業化帶來的便捷時,隨之而來的環境問題也越來越開始引起政府監管部門的重視。但是在實際情況中,監管部門與企業排污的環境破壞者之間存在著信息不完全的情況。如果環境執法問題得不到有效解決,我國的環境質量很難有實質性改善。因此以博弈論中經典博弈模型來分析環境保護過程中的策略均衡問題,為環境保護提供一些微末的建議。
政府監管部門與排污企業之間一直存在著博弈。由于博弈論可以比較深刻地反映出問題各參與方利益的沖突與一致、競爭與合作關系,可以作為政策制定和政策分析的有力工具。現以博弈論中的經典博弈—守衛抓小偷的激勵悖論為模型,來分析政府監管部門與企業排污者之間的博弈情況。排污企業可以選擇兩種策略:超額排放(記為A)和達標排放(記為B);政府監管部門也有兩種對應的策略選擇:處罰(記為C)和不處罰(記為D)。若排污企業選擇超額排放污染物,并且政府選擇不處罰,企業可以得到正效用(包括節約治理污染的成本等等)記為p;若政府做出處罰,企業將會降低利潤(例如額外罰款,停業整頓等等)而得到負效用記為-q;政府在企業超額排放污染物時,如果不處罰會得到負效用(例如人們對政府滿意度下降或政府執法人員得到處罰等)記為-m;若企業達標排放污染物且政府不監管不處罰,可視為政府得到正效用(例如工作人員可以得到更多的休息時間等)記為n;若企業達標排放污染物,政府部門進行合理的監管,可視為博弈雙方都各盡其責,恪盡職守,無得也無失[1]記為0。

圖1 排污企業與政府的博弈得益矩陣
這是典型的完全信息靜態博弈的混合策略博弈。假設企業選擇超額排放的概率為P(A),選擇達標排放的概率為P(B);政府選擇不監管不處罰的概率為P(C),選擇監管處罰的概率為P(D)。排污企業選擇A策略和選擇B策略的概率P(A)和P(B)一定要使政府監管部門選擇C策略的期望得益和選擇D策略的期望得益相等。即:P(A)*(-m)+P(B)*n=P(A)*0+p(B)*0且P(A)+P(B)=1。由此可以得到排污企業以P的概率選擇策略A,以P的概率選擇策略B。同理:政府選擇C策略和選擇D策略的概率P(C)和P(D)一定要使排污企業選擇A策略的期望得益和選擇B策略的期望得益相等。即:P(C)*p+P(D)*(-q)=P(C)*0+p(D)*0且P(C)+P(D)=1。由此可以得到政府監管部門以P(C)的概率選擇策略C,以P的概率選擇策略D。在這個博弈中,排污企業以的隨機概率選擇策略A和策略B;政府管理部門以的概率選擇策略C和策略D。由于該博弈雙方單獨改變隨機選擇各個純策略的概率分布都不能保證增加利益,因此,該策略是一個混合策略的納什均衡。也是該博弈的唯一的納什均衡。
首先來討論排污企業會不會超額排放污染物。繪制函數圖像,橫軸表示排污企業超額排污的概率P(A),它分布在0到1之間,那么,排污企業標準排污的概率為1-P(A);縱軸則反應對應排污企業超額排污還是標準排污的概率下,政府管理部門采取不監管不處罰的策略的期望得益。從n到-m連線的縱坐標就是在橫坐標對應下的排污企業超額排放污染物的概率下政府部門采取不監管不處罰的策略的期望得益函數為n(1-PA)+(-m)PA。

由圖可看出,得益函數曲線與橫軸的交點PA*就是排污企業超額排放污染物的最佳概率,標準排放的最佳概率就是1-PA*。假設,排污企業超額排放污染物的概率大于PA*,政府監管部門采取不監管不處罰的期望得益小于0,基于利益最大化原則,政府監管部門一定要采取措施,進行處罰。排污企業超額排放污染物一次就會被處罰一次。因此排污企業超額排放污染物的概率大于PA*的概率是不可取的。反過來,如果排污企業超額排放污染物的概率小于PA*,那么政府監管部門選擇不監管的期望得益大于0,政府監管部門不監管不處罰更合算。即使排污企業超額排放污染物的概率提高一些,但是只要不超過PA*,那么政府監管部門都會選擇不監管不處罰,污染排放企業就不用害怕被處罰。在不被處罰的前提下,排污企業超額排放污染物的概率越大,收益越大,因此,會讓排污企業超額排放污染物的概率趨近于PA*,均衡點就是排污企業以PA*的概率選擇超額排放污染物和1-PA*的概率選擇標準排放污染物。政府監管部門不論選擇處罰還是不處罰的期望得益都是0。選擇純策略的“處罰”或“不處罰”,或者混合策略的期望得益都相同。但為了讓排污企業沒有可乘之機,政府監管部門也要相應地選擇混合策略。
用相同的分析方法來分析政府監管部門采取“處罰”與“不處罰”的混合策略概率分布。
繪制函數圖像,橫軸表示政府管理部門不監管不處罰的概率P(C),它分布在0到1之間,政府管理部門處罰的概率為1-P(C);縱軸則反應對應政府管理部門在處罰還是不處罰的概率下,排污企業超額排放污染物的策略的期望得益。從-q到p連線的縱坐標就是在橫坐標對應下的政府管理部門不管理不處罰的概率下污染排放企業超額排放的策略的期望得益函數為Pc*P+(1-Pc)*(-q)。

由圖像可看出,期望得益函數曲線與橫軸的交點Pc*就是政府管理部門不管理不處罰的最佳概率,處罰的最佳概率就是1-Pc*。假設,政府管理部門不管理不處罰的概率大于Pc*,排污企業超額排放污染物的期望得益大于0,這會使得排污企業有超額排放污染物的動力,可能會造成環境污染嚴重。因此政府管理部門不會采取此種措施。相反,如果政府管理部門不管理不處罰的概率小于Pc*,雖然短期使排污企業超額排放污染物的期望值小于0,排污企業將標準排放污染物;但是長期情況下,排污企業遵紀守法,會使政府管理部門不管理不處罰的概率上升,重新達到Pc*。均衡點就是政府管理部門以Pc*的概率不管理不處罰,以1-Pc*的概率處罰。此時,排污企業超額排放污染物和標準排放污染物的期望得益都是0。
通過分析排污企業與政府及管理者之間的博弈,假設政府有關部門為了抑制排污企業超額排放污染物而加重對超額排污的企業的懲罰,如果政府管理部門不改變原均衡的混合策略概率分布,此時,排污企業超額排放污染物的期望得益就會變成負值,排污企業超額排放污染物的的行為就會停止。但是,在長期決策行為中,排污企業會降低超額排放污染物的概率會使得政府管理更多選擇不管理不處罰,最終政府管理部門不管理不處罰的概率會提高到Pc′,達到新的均衡。排污企業超額排放污染物的期望得益又會恢復到0,會重新和選擇混合策略。由于排污企業排放污染物的混合策略概率分布圖是由政府是否采取監管的期望得益決定,所以不受Pc值的影響。因此,在長期行為決策中,政府有關部門加重對排污企業超額排放污染物的處罰最多只能抑制排污企業超額排放污染物的短期發生率,對長期排污企業超額排放污染物的發生率沒有影響。長期作用來看,只會讓政府管理部門不管理不處罰的概率增加。
如果使政府監管部門不處罰會導致其管理人員受到處罰,如果排污企業超額排污的概率不變,那么,政府管理部門的期望得益將會變成負值,因此政府監管部門就會選擇處罰這一決策,而不是不監管不處罰。政府管理部門選擇處罰這一決策就會導致排污企業超額排放污染物的概率降低,直到將PA*下降到PA′,此時,政府監管部門又會恢復到混合策略。因此,加重對政府管理部門的工作人員的處罰,短期效果是使政府監管部門真正盡職盡責,但在長期中并不能使政府監管部門更盡職,政府監管部門的盡職程度不是由m決定。
經濟增長靠企業,在我國現行的政治經濟體制下,中央政府和地方政府在處理經濟和環境的關系上具有不同的傾向,地方政府在處理經濟和環境的關系上更傾向于發展經濟而忽視環境[2-3]。單一的環境保護政策往往沒有多項政策共同促進環境改善的影響大。一項合理政策的出臺與實施要制定對象輔助政策來為其查漏補缺。單一的激勵或抑制政策在現行的國情下并不適用,并且,實施結果往往可能沿著與本來意愿相反的方向去發展,導致政策失靈。我國在現行環境治理問題上,往往會加大對環境破壞者的處罰力度。在短期來看,這項政策是行之有效的,但從長期發展來看,這并不能從根本上來解決環境污染的問題。甚至會造成難以管控的情況出現。因此,政府在出臺環境保護政策的同時,還應該對執法人員進行監督,提高理性意識,預防不可控的情況出現。黨的十六大以來,我國政府高度重視環境保護工作,堅持將保護環境作為一項基本國策,采取了一系列政策措施推進環保工作。為響應習近平總書記倡導的“綠水青山就是金山銀山”、決不能以犧牲生態環境為代價換取經濟的一時發展治國理念,政府監管部門一定要采取措施來保證治理污染與政府監管政策的平衡。
環境的治理政策離不開黨的指導,隨著各種保護環境政策的出臺,生態環境有了明顯的提高與改善。天更藍了,水也更清了。生態環境是人類賴以生存和發展的基礎,也是經濟和社會發展的基礎。保護好生態環境,實現經濟與環境可持續發展,是我國在現代化建設進程中要始終堅持的一項基本政策。好的生活環境和自然環境是人民幸福、國家富強、社會文明的基本保障,也是我們留給后人的寶貴財富。因此,政府主管部門應不斷完善環境法律法規體系,杜絕或削弱排污企業偷排偷放的動力和機會。