基于最優反應動態機制的森林保險投保行為博弈分析

2020-11-10 04:43:53馬鋒梅馮祥錦

科技經濟市場 2020年9期

馬鋒梅馮祥錦

摘要：與兼業農戶相比，森林培育企業和森林培育專業戶具有理性層次較高且具有快速學習能力的特征，其森林保險投保決策行為的動態調整過程可以采用進化博弈理論中的最優反應策略進行分析。博弈的收斂性和擾動性分析表明，森林經營者都采取（投保，投保）策略的均衡和所有經營者均采取（不投保，不投保）策略的均衡，均是博弈的進化穩定策略，但（投保，投保）策略均衡比（不投保，不投保）策略均衡更加趨于穩定。本文還提出了提升森林保險參保率的幾種辦法。

關鍵詞：森林保險;最優反應動態機制;博弈

1 有限理性條件下森林保險投保行為分析框架

現實生活中人們決策時常表現出各種行為能力方面的不完美，即有限理性，比如意識非理性、記憶衰退、邏輯推理能力不足、識別判斷能力較弱等等，而且不同個體中，有的理性層次較高，有的理性層次較低。進化博弈理論是有限理性群體決策行為分析框架之一，它結合博弈理論和動態演化過程，以整個有限理性群體為研究對象，強調系統達到均衡的動態調整過程。該理論認為個體決策是個逐步調整達到最優的動態過程，個體之間存在相互模仿、相互學習的行為。在進化博弈理論當中，最優反應動態機制與生物進化復制動態機制是兩種最常見的動態調整機制，理性程度較高。具有快速學習能力的個體之間的重復博弈與策略進化適合運用最優反應動態機制分析，相反，理性程度低、個體策略調整速度較慢的博弈，則可運用生物進化復制動態機制進行剖析。

受中國傳統文化和制度性文化的影響，森林經營者較多呈現出有限理性狀態，主要表現為風險意識低下、對保險的本質特征及功能認識存在偏差、偏愛尋求銀行儲蓄等保險以外的方式規避風險、保險購買決策過程簡單或者盲目跟隨他人購買、過度依賴政府救濟等等。森林經營主體有三類，分別是森林培育企業、森林培育專業戶以及兼業農戶，這三類經營主體的理性層次依次遞減。森林培育企業內部管理機構與制度相對完善，經營管理組織者較為專業和獨立，決定其學習能力強、糾錯能力也強;森林培育專業戶盡管不具備森林培育企業的管理機構和制度，但他們屬于植樹造林經驗豐富或具有較強資源支配能力的村民，而且專業戶的林業收入占家庭總收入比重大，經營過程中資源投入大，因此其決策失誤的糾偏及調整速度與森林培育企業相比不相上下，還有可能更快捷;而兼業農戶因投資少、種植面積也小，林地甚至彼此分散不連片，林業收入占家庭總收入比重也較小，其森林經營活動是臨時性的和季節性的。與此同時，林區地處偏僻，信息閉塞，交通也不便，兼業農戶大多文化程度較低，學習能力低，策略調整速度慢，處于較低的理性層次。依有限理性條件下進化博弈理論分析框架，可采用最優反應動態機制剖析森林培育企業和森林培育專業戶的森林保險投保行為，而兼業農戶的森林保險投保行為則用生物進化復制動態模型來分析。本文通過構建博弈模型，運用最優反應動態機制分析理性層次較高且具有快速學習能力的森林經營者森林保險投保行為。

2 森林保險投保行為博弈模型構建

首先，假定博弈群體較小，只有5位森林經營者，其經營狀況基本相似。雖然屬于有限理性個體，但學習能力強，能進行事后評估，策略調整速度快。但由于各博弈方均表現為有限理性狀態，缺乏對策略的預估能力，只能根據前期策略作出最優反應。

其次，假定各博弈方位置呈現圓周分布，彼此相鄰，即所有博弈方的林地首尾相接。每個經營者都與各自的左右鄰居反復博弈（見圖1）。

第三，每個個體均有兩個策略選擇：投保（用字母A表示）、不投保（用字母B表示）。

這里需要說明2點：

（1）若博弈雙方一方選擇“投保（A）”，另一方選擇“不投保，則得益均為0。之所以這樣假定，主要考慮不投保一方會因為投保一方投保后的“道德風險”行為使得森林經營風險大增，而森林經營風險的外部性特征又非常明顯，“城門失火殃及池魚”。

（2） a>b，可以理解為若博弈雙方均選擇“不投保（B）”策略，為了規避森林經營風險，必然會尋求其他風險分散機制，如更為精心的種植與科學的管理或者建設防火隔離帶等，這將增大森林經營者的成本支出，導致最終得益b小于均參加投保時的得益a。

3 森林經營者投保策略調整過程分析

根據森林經營者所面臨的得益矩陣，純策略納什均衡為（A，A）和（B，B）。但因a大于b，顯然（a，a）帕累托優于（b，b），博弈均衡策略為（A，A）。若博弈雙方或者某一博弈方因各種原因選擇B策略，則（B，B）策略屬于風險上策均衡。在首次博弈過程中，每個個體既有可能采用A策略，也有可能采用B策略。因所分析的對象為森林培育企業或森林培育專業戶，他們學習能力強，能依據事后結果快速糾偏。因此，各有限理性的博弈方遵循的策略調整機制為最優反應動態機制。

假設xi（t）為在第t時期與i相鄰的博弈方選擇策略A的數量，xi（t）可能取值為：0、1、2。選擇策略B相鄰博弈方的數量則為2-xi（t），可能取值為：0、1、2。因此，博弈方i選擇策略A的得益可計算為，即;采用B策略則得益為，即。因此，根據最優反應動態機制的策略調整法則，當時，經營者i在t+1時期會采取A策略，即當時，森林經營者i將在第t+1時期采取A策略。而當時，經營者i在第t+1時期會采取B策略，即當時，博弈方i將在第t+1時期選擇策略B。

因可能取值只有0、1、2等3個整數值，且a>b，故如果博弈方i和選擇策略A的博弈方相鄰，則滿足，依據最優反應動態機制，博弈方i在第t+1時期采取策略B;如果博弈方i與選擇策略A的1個博弈方相鄰，則滿足，依據最優反應動態機制，博弈方i在第t+1時期選擇策略A;同理，如果博弈方i與兩個采取A策略的博弈方相鄰時，滿足，觸發最優反應動態機制，博弈方i將在第t+1時期選擇策略A。由于博弈方i在第t+1時期與在第t時期的策略選擇無必然聯系，且這5個博弈方是相似博弈主體，因此均適用上述最優反應動態法則。

因5個博弈方被假定為有限理性，初次博弈時各博弈主體的策略選擇既可能選擇策略A，也有可能選擇策略B。依據其圓周分布的位置假設，總共存在0個策略A、1個策略A、不相鄰2個策略A、相鄰2個策略A、3個策略A、不相鄰3個策略A、4個策略A、5個策略A等8種情況，具體如下：

（1）首次博弈有0個策略A。首次博弈時，若所有博弈方均一致選擇策略B，滿足，則根據最優反應動態機制，只要不出現意外擾動，整個博弈的均衡策略組合將不變。

（2）首次博弈只有1個博弈方選擇策略A，策略調整全過程（見圖3），5個博弈方經過4個時期的反復策略調整，收斂至所有博弈方均選擇策略A的穩定狀態。

以此類推，初次博弈中有2個相鄰經營者采用A策略、初次博弈中有2個不相鄰經營者采用A策略、初次博弈中有3個相鄰經營者采用A策略、初次博弈中有3個不相鄰經營者采用A策略、初次博弈中有4個經營者采用A策略等情況的策略調整過程（見圖4-8）。

（3）初次博弈中所有森林經營者都采用A策略的情況，根據最優反應動態機制可知，此為該博弈的穩定均衡策略，不會改變。

故除了初次博弈時所有個體都選擇B策略外，其余狀況，經過最優反應動態法則的調整，將最終收斂到所有個體均選擇A策略的穩定狀態，只是策略調整所經歷的時期有的多、有的少。即便初次博弈時所有個體均選擇B策略，若在任一期間發生微小的擾動，則博弈最終將收斂于所有個體均選擇A策略的均衡狀態。

4 結論與討論

運用最優反應動態機制對森林培育企業和森林培育專業戶等有限理性群體進行森林保險投保行為的博弈分析，可以得出如下3個結論。

（1）在初次博弈的所有狀態中，最終博弈均衡策略要么為穩定于所有博弈方均選擇不投保（B）策略的狀態，要么為穩定于所有博弈方均選擇投保（A）策略的狀態。所有博弈方均選擇投保（A）策略和所有博弈方均選擇不投保（B）策略均為有限理性博弈主體重復博弈的均衡策略，只是策略組合（A，A）比（B，B）更常見、更重要，因為其出現的概率要大大高于后一種情況。

（2）如果所有經營者通過學習、模仿都已經收斂到采取A策略后，某個經營者犯錯誤而偏離A策略，根據以上分析，最優反應動態機制會使該經營者的策略快速收斂至所有博弈方均選擇A策略的狀態。故所有經營者均選擇A策略的穩定狀態是穩健的。類似的，所有經營者都采取B策略的均衡狀態也是穩健的，因為一旦某個經營者偏離B策略，那么最優反應動態機制會使該經營者的策略收斂到所有經營者均采取B策略的均衡狀態。

博弈的收斂性和擾動性分析表明，所有經營者都采取A策略的均衡和所有經營者均采取B策略的均衡，均是博弈的進化穩定策略。

（3）通過對理性程度相對較高的森林培育企業和森林培育專業戶的進化穩定策略分析表明，要想提升森林保險參保率，至少必須能說服某個森林經營者先行投保，可采用的辦法有很多，如給予政府財政補貼、稅收實質性支持、某個村干部（或某個森林經營大戶）帶頭參保、與林權抵押貸款捆綁或者加大森林保險的宣傳力度，提高他們的風險意識水平等。

參考文獻：

[1]謝識予.經濟博弈論（第3版）[M].上海：復旦大學出版社，2007.

[2]馮祥錦，黃和亮，楊建州.森林保險市場投保主體與行為差異性的理論分析[J].東南學術，2012（02）：176-181.

科技經濟市場2020年9期

科技經濟市場的其它文章: 基于系統動力學的建筑工程項目質量管理研究; 商業零售連鎖企業內部控制管理分析; 中小企業成本控制管理存在問題及對策研究; 網絡營銷模式下品牌推廣策略探析; 淺談建立以客戶需求為導向的不銹鋼營銷策略研究; 網絡營銷平臺對運動品牌的推廣影響及應用研究