(新疆大學經濟與管理學院,烏魯木齊 830046)
環境規制是指國家為了保護環境而采取的對經濟活動具有限制性的一切法律、政策、措施及其實施過程[1],根據執行方式可分為命令控制型、市場激勵型與自愿傳遞型[2]。命令控制型對企業而言多為費用型成本,難以起到提高競爭力與盈利能力的作用;市場激勵型對企業而言多為投資型成本,在一定條件下可幫助企業獲得更高的盈利能力[3]。目前我國的自愿傳遞型環境規制政策并不成熟,在適用度和普遍性上都不具有代表性,故本文重點研究命令控制型與市場激勵型規制政策[4]。

表1 環境規制類型及內容
如何合理地制定政策并使其達到預期效果是一項十分困難的工作,因為政策的結果有時是不可預測的,針對同一項政策的效果研究也可能得出相悖的結論[5]。以本文研究的企業治污創新為例,企業投入成本研發創新的驅動力在很長一段時間內都被認為是市場的需求和技術的普及,很少涉及環境方面的法律法規[6]。古典經濟學觀點認為增加的環境規制對于企業屬于額外成本,而經濟損失最終會導致企業競爭力的下降[7]。 波特[8,9]于1995年提出了著名的 “波特假說”:設計合理的環境監管可以促進企業從事創新活動,從而部分或完全抵消因環境規制所帶來的成本增加,而且這些 “創新補償”效應可能會使企業更具備競爭優勢。近年來諸多國內外學者就 “波特假說”的正確性進行了大量論證:Testa等[10]通過研究發現環保標準可以刺激企業進行技術研發,Rassier和Earnhart[11]通過對化工企業的研究發現監管體系會促進企業新技術研發并對經營績效有積極影響,國內學者景維民和張璐[12]與沈能和劉鳳朝[13]的研究也印證了這一點;但同時也有諸多學者得出了相反的結論:Lanoie等[14]通過對制造業的研究指出其付出的環境規制成本遠高于 “創新補償”,Rexhaeuser和 Rammer[15]也指出環境規制會導致企業盈利能力的下降,“波特假說”是否成立或在何種條件下及多大程度上可以成立,一直是環境經濟學持續討論的話題。
經濟社會是一個非線性的復雜系統,當來自不同視角的不同政策作用于同一個系統時,旨在促進某一特定方面的措施往往會產生意想不到的結果[16]。前人的研究大都著眼于通過相關數據的顯著性特征論證不同環境規制政策對企業的影響,本文從微觀企業出發,構建多Agent主體模型,探究一段時期內微觀Agent主體 (企業)相互之間及微觀Agent主體與市場環境的交互作用,以模擬和評估不同政策所帶來的結果,試圖為政府在環境規制方面的政策制定帶來新的研究思路與觀察視角。
大量的文獻證明,只有在 “建立靈活和動態的監管框架”的前提下, “波特假說”的情況才能成立:Sartorius和 Zundel[17]指出在進行環境規制的過程中政府要給予市場中的企業相對寬裕的“演化時間”使其做出行為選擇并進行創新活動,這對于正確評估環境規制手段的影響是非常重要的;Ramanathan等[18]指出企業在面臨必須強制執行的命令控制型規制手段和可以發揮逐利特性的市場激勵型規制手段時,其選擇會有較大的差異與不確定性,Bergquist等[19]的研究同樣證實了這一點;張平等[20]的研究表明費用型環境規制政策對企業的自主研發投入產生了擠出效應,而投資型環境規制政策并未出現這一趨勢;謝喬昕[21]的研究證明我國的環境規制強度正逐年提高,且有一定的波動性,這種趨勢不利于我國企業的自主創新投入,Blyth等[22]也認為環境規制政策的變動與不確定性提升了企業進行創新研發的風險溢價。
基于上述研究,我們將在模型中重點考察3方面內容:
(1)演化時間:市場內的Agent主體能否在一定時期內實現預期的演化結果?如果能,需要多久達到預期,達到預期的時間與環境規制政策有什么樣的關系?如果不能,會處于什么樣的結果,無法實現理想預期的原因是什么?
(2)固定性與不確定性 (主要對于費用型環境規制政策而言):固定成本與不斷增加的成本對于Agent主體的行為選擇有什么樣的影響?更高強度的漸進規制能否取得更為顯著的效果?
(3)費用型與投資型:對企業而言,多為費用型成本的強制命令與多為投資型成本的市場激勵環境規制政策的效果有何不同?哪一種更能達到預期?兩種環境規制手段是否會相互干擾?
與其他建模方法 (如系統動力學模型)相比,基于Agent主體的模型并不要求存在確定的函數關系,取而代之的是多個可以根據環境選擇行為決策的Agent主體,通過設定Agent之間的關系 (如競爭、合作)、Agent與市場環境的交互關系 (如Agent的平均報價會影響市場交易價格)可以觀測到各項因素之間的相互影響隨著時間的推移如何改變Agent的經濟行為,并研究多個Agent的行為決策構成的總體特征,多Agent模型已被廣泛應用于包括經濟在內的多個領域以評估政策影響[23]。
根據上述相關研究,結合多主體模型的算法原則,本文對Agent主體進行建模:
(1)模型對污染物總量恒為10000的社會進行時長7300天 (20年)的政策評估模擬;
(2)假定排污處理的市場是準入的:不產生污染物的企業也可以作為排污處理Agent進入排污處理市場;產生污染物并進行排污處理的企業既是污染物生產企業,同時也可選擇成為排污處理Agent;
(3)排污處理Agent分為兩類:僅付出費用型成本的非創新Agent,與既付出費用型成本又付出投資型成本的創新Agent,在環境規制政策僅涉及費用型成本時,創新Agent數量恒為0;
(4)排污處理Agent的行為規范:在供給總量為10000的污染物交易市場購入污染物 (因非創新Agent與創新Agent的生產方式不同,故兩類Agent購入污染物的價格不同),付出一定成本處理污染物,其中創新Agent額外獲得市場激勵型環境規制政策的經濟獎勵;
(5)排污處理Agent具有逐利性,僅當有盈利能力時才進入市場;并設置 “資產余額”,即進入市場后的所有資產虧空為0時退出市場;
(6)模型所需的其他基礎設定:資產余額的核算周期=1天,Agent最大連接數=4,Agent進入或退出市場的頻率=15 天/個, 突變率=0 等[24,25]。
本文在未引入市場激勵時,對政府采用固定強度 (本文參數設定恒為20)與漸進強度 (本文參數設定由20遞增至100)的強制性命令下的環境污染進行模擬;之后引入市場激勵,并沿用上文的漸進強度進行環境污染仿真,更符合現實情況。
無論是固定強度或漸進強度,未經處理的污染物數量均隨著時間的推移由初始的總量逐漸下降,并逐漸各自趨于一個均衡值 (見圖1),文中的參數設定總量為10000,均衡值約為6000,其具體數值與實際環境規制強度有關。

圖1 強制命令下的未處理污染物數量
但是,從未處理污染物的數量來看,更高的環境規制強度并沒有起到很明顯的效果,其主要原因:(1)在總量固定的前提下,已處理污染物的數量取決于污染物的交易價格,而后者是由污染物的供應者與排污處理Agent共同決定的市場價格。故當供應者有意交易更多的污染物時,便會降低其所要付出的成本,因污染物的交易價格為負,即會表現為污染物交易價格的上升 (見圖2)。而在未引入市場激勵的前提下,排污處理A-gent唯一的收入來源即為交易污染物時的收入,交易價格的上升會使得排污處理Agent的交易意愿下降;(2)初始的環境規制強度一定程度上決定了初始的污染物交易價格,而初始較低的交易價格會使得逐利的排污處理Agent數量快速上升,進而拉低了排污處理Agent的利潤空間 (見圖3)。排污處理Agent的交易意愿下降,最終表現為未處理污染物數量處于均衡值。

圖2 強制命令下的污染物交易價格

圖3 強制命令下的處理污染物Agent數量
從圖2與圖3的時間對比中,我們可以看到,排污處理Agent的數量變動大致與污染物交易價格變動相一致,且有一定的遲滯性。其主要原因:(1)在未引入市場激勵的前提下,排污處理A-gent唯一的收入來源即進行污染物的交易,故污染物的交易價格決定了未進入市場的排污處理A-gent是否有意愿進入市場及已進入市場的排污處理Agent是否有經濟收益; (2)排污處理Agent在進入市場后, “資產余額”的存在使其在退出市場時具有一定的延遲性:在盈利時期積累的資產可用于彌補蕭條時期的虧損,使得排污處理A-gent不會在價格下降時立刻退出市場,這有助于Agent在短期無法盈利時仍存活于市場,也有助于一個市場的成熟、穩定與發展。
從污染物交易價格來看,漸進強度的環境規制下交易價格波動幅度更大,排污處理Agent數量變動幅度也更大,其主要原因:(1)環境規制強度在短期內降低了污染物交易價格,導致排污處理Agent迅速增加,這一定程度上也導致了未處理污染物數量的快速減少與污染物交易價格的大幅變動;(2)市場進出壁壘、不對稱信息、交易成本等因素以及 “資產余額”的存在使得市場內的排污處理Agent數量變動滯后于價格變動并繼承了其更大的波動幅度。
由上文可知,在僅實行強制命令的前提下,漸進強度的效果與固定強度差距并不明顯,且會帶來一定的意外效應,如加劇交易價格波動情況與增加Agent相互競爭使排污處理Agent更頻繁地進入或退出市場;且實際情況中,大多數排污處理Agent都是相似的,其進入市場的時間、生產規模、盈利能力、抗風險能力、行為決策具有很高的相似度,這意味著一旦市場條件惡化到一定程度,排污處理Agent的數量及相關指標的變動是非線性或難以用確切的方程表示的,這進一步印證了基于多主體模型探究多個微觀決策主體行為的宏觀擴散效應的優勢。
對上文各項數據分析可得,未處理污染物數量、排污處理Agent數量、污染物交易價格等均在第1000天 (3年)前后到達均衡值,并在此后圍繞均衡值波動。故本文選擇于第1001天引入市場激勵環境規制政策,并根據激勵強度的不同,設立對于進行自主創新排污處理的市場激勵系數μ=1、2、3、4(μ=0即為上文中未引入市場激勵的漸進強度仿真結果),激勵系數越高,表明企業從創新活動中取得的收益越高。
因引入創新市場激勵,排污處理Agent現可分為進行創新Agent與非創新Agent。其中前者享受創新市場激勵,但因生產方式不同,進行創新處理所需污染物的交易價格為μ=1、2、3、4的價格;后者不享受創新市場激勵,因生產方式不變,故污染物的交易價格仍與μ=0時保持一致。
在模擬的前1000天內,仿真結果與上文中無市場激勵的結果相同:隨著漸進強度的實施,污染物的交易價格升高,非創新Agent數量隨著價格滯后波動,使得未處理的污染物數量持續下降。隨著創新市場激勵的引入,創新Agent也開始出現 (見圖4)。

圖4 引入市場激勵下的創新Agent數量
隨著時間的推移,創新Agent數量在μ=1時持續為0,與不引入市場激勵 (μ=0)時相同,μ=2及以上時則情況不同,說明市場激勵強度存在門檻值,較低的激勵強度下并不能增加社會對污染物的自主創新處理;μ=3與μ=4時的創新A-gent數量增長趨勢大致相同,均在較短時間內達到了市場能容納的最大數量;μ=2時情況與前兩種略有不同,雖然在足夠長的時間后能夠達到預期的規制效果,但其是否能滿足環境規制計劃的時效性有待商榷。
現對于污染物交易價格進行考察 (見圖5),在μ=0即不引入市場激勵時,僅存在非創新A-gent,而非創新Agent的唯一收入來源為交易污染物時的收入,故μ=0時的交易價格始終為負;但當引入市場激勵后,污染物一定程度上成為了創新Agent用于創新處理并獲得市場激勵的生產資料,故其交易價格一度出現了正值,這意味著產生污染物的企業在將污染物轉移給創新Agent時不但不需要向創新Agent支付處理費用,甚至可以通過產生污染物而獲利。原計劃為促進污染處理技術、提升污染處理水平的措施反而使得各企業更有意愿加大排污力度,這種意外效應在μ=3、μ=4等市場強度較高的情況下尤為明顯。此后污染物交易價格的持續升高使得創新Agent失去盈利能力,一部分創新Agent在資產余額為0時退出市場,引起了創新Agent數量的下降與之后污染物交易價格的下降,可見污染物交易價格與市場內創新Agent數量將長時間處于周期較長的波動中。

圖5 引入市場激勵下的污染物交易價格
在繼續假定社會污染物總量為10000的前提下,考察不同的市場激勵強度對社會未處理污染物總量的影響 (見圖6)。我們同樣可以看到較為明顯的門檻效應:低激勵強度μ=1時,未處理污染物數量與未引入市場激勵μ=0時變化不大,均為在原均衡值附近波動;而在較高的激勵強度μ=3、μ=4下,社會未處理污染物數量明顯下降,而且變動幅度更小,均衡狀態為平穩;μ=2時情況與前兩種略有不同,在模擬周期的前半段 (前3600天),污染物數量與變動情況與μ=0、μ=1大致相同,但在足夠長的演化時間后,其最終結果與μ=3、μ=4相近。這說明適中的激勵強度μ=2可以達到預期結果,但需要相當長的見效周期。

圖6 引入市場激勵下的未處理污染物數量
最后考察引入市場激勵對非創新Agent數量的影響 (見圖7)。結果與上文多項指標的變動情況大致相同:低激勵強度μ=1時與不引入市場激勵幾乎一致;高激勵強度μ=3、μ=4時,創新A-gent對非創新Agent產生擠出效應,非創新Agent在較短時間內退出市場,此時市場內Agent類型全部成為創新Agent;激勵強度適中μ=2時的情況與前兩種略有不同,短期內非創新Agent數量依然保持一定水平,但在足夠長的演化時間后,非創新Agent全部退出市場。

圖7 引入市場激勵下的非創新Agent數量
由上文可知,在引入市場激勵后,其政策效果根據激勵強度的不同呈現門檻效應并具有最優區間:在低激勵強度μ=1下,該政策沒有造成意外效應,但同時也無法達到政策預期效果,更廣泛地說,一個較低水平的激勵強度可能不足以促進特定市場的建立與發展;在高激勵強度μ=3、μ=4下,該政策能在較短時間內達到預期效果,但會引起意外效應,如鼓勵企業產生更多的污染物、創新Agent將同樣對污染處理有積極作用的非創新Agent擠出市場等問題。所以,就政府而言,以較小的意外效應和財政支出來建立污染物交易市場,理論上是可行的,但要嚴格把控政策強度的最優區間 (如控制在本文參數中μ=2),且要有足夠長的時間使其中的各類Agent演化出政策預期的結果,并使該市場成熟、穩定地發揮預定的作用。
本文通過多Agent主體模型的構建與仿真對不同的強制命令型與市場激勵型環境規制政策及其組合的影響結果進行研究,通過對演化時間、規制強度的確定性、規制政策的類型3個方面的考察,得出以下結論:
(1)以較少的政府投入促進特定市場的建立和發展是可行的,但因為市場激勵存在一定的門檻效應,要避免無效的低強度激勵。且即使激勵強度被證明是有效的,市場內的微觀主體仍然需要相對寬裕的演化時間做出選擇并予以行動,這就導致了政府在預計政策效果時要有時間概念,特定市場的建立與成熟可能要經過數十年或以上的時間,對其的激勵行為要有一定的持續性。
(2)高強度激勵會縮短微觀主體行為選擇的擴散時間,能更快速地達到預期成效,但高強度的政策往往會帶來意外效應:以強制命令型與市場激勵型環境規制政策為例,更高強度的命令手段有利于減少社會污染物排放總量,但會破壞自主創新的市場環境;較強的市場激勵會提高企業的創新排污處理意愿,但同時會鼓勵污染物生產者排放更多的污染物以獲取利益,還會因競爭關系而從市場擠出非創新排污處理主體。
(3)政策的不確定性與變動性會影響微觀主體的決定,而且會放大市場內交易價格與微觀個體的波動情況。頻繁的激勵變動旨在能夠靈活地調整政策主要作用領域的情況,雖然從宏觀視角上,更大幅度的波動能夠更快地達到預期效果,但這也意味著市場上的微觀主體可能會面對不切實際的交易價格以及有可能出現的資產虧空,不利于一個市場的建立、成熟與穩定。
從政策設計角度來看,我們無法對一項環境規制政策或任何宏觀政策在多個領域的影響進行全面預測[26],這有可能會導致作用于多個領域的政策或作用于同一領域不同目標的政策相互掣肘,通過社會復雜系統內部的聯系相互干擾,使多項政策產生意外效應或無法達到預期的成效[27],所以合理地制定政策并使其達到預期效果是一項十分困難的工作,我們需要更為微觀與復雜的研究思路與觀察視角。