路 云 鄧玉林 吳應宇 花 磊
(1東南大學公共衛生學院,南京210096)
(2河海大學商學院,南京 210098)
(3東南大學經濟管理學院,南京210096)
社會醫療保險基金是指國家為保障人民的基本醫療,由醫療保險經辦機構按國家有關規定,向單位和個人籌集,用于職工基本醫療保險的專項基金.近年來,由于社會醫療保險基金規模越來越大,出現了政府委托商業保險公司參與醫療保障經辦管理的趨勢.由于醫保基金的政策目標是“收支平衡,略有結余”,因此,政府委托保險公司代管醫保基金的目的并非是基金收益越高越好,而是在滿足一定結余率的基礎上,將醫保基金用于參保人群的醫療費用報銷[1].傳統的H-M模型中委托人期望收益為線性函數的情況在此處不再適用[2].關于委托代理模型中放松其線性期望假設的研究陸續出現.Ecker等[3]采用橢球算法對非線性的委托代理模型進行了建模與求解.Dempe[4]利用雙層規劃建立了一個凸代理模型,但并沒有從數學上給出最終解決方案.Cecchini等[5]采用雙層規劃方法從數理上解決了非線性契約問題,并對比了線性假設情況,認為非線性假設能夠得到最優解.郭曉明[6]將企業的線性成本函數調整為非線性成本函數,研究了委托代理的模式.然而,這些研究均不能準確描述中國醫保基金的代管模式.
本文基于傳統的H-M委托代理模型,設計了能夠描述中國醫保基金產出期望的非線性函數,構建了保險公司代管醫療保險基金的委托代理模型.在此基礎上,利用仿真計算研究最優的激勵機制,并給出了相應的政策建議.
本文模型是基于H-M委托代理模型的調整.傳統的委托代理模型假定委托人是經濟人,其目標是使得自身收益最大化.本文中,由于政府是非營利性組織,醫保基金現收現付的性質決定了其目標并非是收益越大越好,而是存在一個年度最佳結余率,在保證最佳結余率的前提下最大限度使用基金,以滿足參保人群醫療費用的報銷.因此,傳統的H-M模型中委托人期望收益為線性函數的情況在此處不再適用.
政府自行管理醫保基金時,由于專業經驗缺乏、業務人員不充足等原因,實際的結余率往往低于或高于年度最佳結余率,政府委托保險公司代管基金,最終目標是為了獲得基金的年度最佳結余率.政府對保險公司的考核按月進行,隨著保險公司努力程度的不斷提高,基金的實際結余率應與年度最佳結余率的誤差越來越小,從而越來越接近于政府設定的最佳結余率.因此,將委托人的產出函數設計為
(1)
式中,π為政府獲得的目標產出;a為商業保險公司的行動變量;θ為政府期望的醫療保險基金年度最佳結余率;ε為外生的自然因素(如市場的穩定性或政策的變化),服從N(0,σ2)分布,其中σ2反映了自然因素的不確定性.該函數曲線如圖1所示.從曲線的變化趨勢可以看出,隨著時間的推移,實際結余率越來越趨近于最佳結余率θ.
假設政府為風險中性,則政府的期望效用可表示為

圖1 委托人產出函數
(2)
式中,v表示政府效用.
假定政府考慮基于貨幣激勵的線性合同為S=α+β[1-(π-θ)2].其中,S為政府的激勵成本;α為政府給予保險公司的固定報酬;β為政府對保險公司的激勵政策,反映保險公司享受的浮動報酬和激勵機制要求其承擔的風險(風險分擔).
保險公司的效用函數為E(u)=u(s(π)-c(a))[7].其中,u為保險公司獲得的效用;c(a)為保險公司努力工作的成本.該效用函數具有不變絕對風險規避特征,即u=-e-ρω.其中,ρ為絕對風險規避度,反映保險公司的風險偏好,ρ越大表示越不喜歡風險,本文假定保險公司為風險厭惡者,即ρ>0;ω為保險公司實際貨幣收入.
假定保險公司成本為c(a)=ba2/2.其中,b為保險公司行動的成本系數,b>0,則保險公司的期望收入為E(ω)=s(π)-c(a).保險公司的風險成本為ρβ2σ2/2[7].因此,保險公司效用函數為[8]


(3)
由此可得,保險公司的參與約束(IR)為
(4)

設a′為保險公司相對于最優行動a的另一行動,則保險公司的激勵約束(IC)為


(5)
政府的行為是在約束條件下選擇合適的α和β,以獲得最佳的a,達到最優的結余率[9].模型如下:

(6)
目標函數是非線性的,且形式較為復雜,無法進行解析求解.下面通過仿真分析以討論政府應采取何種激勵政策來影響保險公司的行為以及保險公司的特征對其自身行為的影響.仿真內容包括:① 政府行為對保險公司行為的影響,即α,β如何影響a;② 外界風險對政府行為的影響,即σ2如何影響β;③ 保險公司的成本特征對其行為的影響,即b如何影響a;④ 保險公司的風險偏好與外界的風險程度的相關關系以及該相關關系對政府行為的影響,即ρ與σ2的關系以及該關系對α,β的影響.
當b=1,ρ=1,σ2=0.01時,公司行為a隨β的變化趨勢見圖2.

圖2 a-β關系圖
由圖2可知,保險公司行為不隨固定收益α的變化而變化,其努力程度隨β的增加而不斷增加.這是因為α僅是決定代理人是否參與代理的關鍵因素,而與參與后代理人的行為無關.因此,政府可以通過提高β來激勵保險公司不斷提高自身的努力程度[10].
命題1固定收益α決定保險公司是否參與契約.一旦保險公司參與契約,其后期行為不再受固定收益的影響,只受浮動收益β的影響.因此,只要保險公司參與契約,政府即可通過調整浮動收益β來對保險公司進行激勵.
增加β的同時也會提高保險公司所承受的風險.當保險公司風險成本過高時,參與約束就會起作用,導致保險公司拒絕委托而不是參與委托.下面通過仿真來驗證β和σ2的關系.
當α=0,b=1,ρ=1時,假定0≤β≤200,外界風險σ2與政府行為β的關系曲線見圖3.

圖3 σ2-β關系圖
由圖3可知,β的取值受到外界風險σ2的影響.這種影響不是漸變式的,而是突變式的,即σ2存在一個閾值.本次仿真中該閾值等于1.當σ2<1時,β取其最大值100;當σ2≥1時,β取其最小值0.由此表明,當σ2<1(即外部風險較小)時,保險公司參與委托代理的意愿更強,此時政府可以完全采用浮動收益的方式進行激勵;當σ2≥1(即外部風險較大)時,保險公司參與委托代理的意愿減弱,此時政府為了滿足參與約束條件(即式(4)),就必須設置一定的固定收益,采用固定收益和浮動收益相結合的激勵機制,以保證保險公司在參與代理的前提下最大限度地達到政府期望.因此,政府需要根據不同的外部風險來制定不同的激勵方式.
下面探討在不同的外部風險下政府應采取的具體激勵方案.
1) 外部風險較小時政府的激勵政策

2) 外部風險較大時政府的激勵政策

命題2外部風險會影響政策的激勵政策.當外部風險低于閾值時,政策可采用固定收益為0、僅通過與風險相掛鉤的浮動收益措施進行激勵,即可獲得最大期望收益.當外部風險高于閾值時,政府就必須采用固定收益和浮動收益并用的激勵方法,以保證保險公司參與契約,其付出的總代理費用則更高.
當α=1,β=10,ρ=1,σ2=0.01時,保險公司的行為隨其成本特征的變化趨勢見圖4.

圖4 a-b關系圖
作為企業的成本特征系數,b決定了企業在特定努力水平下的成本大小.圖4顯示,保險公司的努力程度a與成本系數b呈反向變化關系,即在其他條件不變的情況下,隨著內部成本的不斷增大,保險公司愿意付出的努力程度不斷降低.當b不斷增大至某一閾值b*時,無論政府如何激勵,保險公司也不會增加其努力程度(即a=0).因此,政府需要選擇內部成本系數較小的保險公司,以保證在同樣的激勵制度下保險公司的努力程度較高.一般而言,管理經驗豐富、規模較大、人員流動性較低的公司,其內部成本系數較小.
命題3保險公司的努力程度與其內部成本系數呈反比.在其他條件不變的情況下,隨著內部成本的不斷增大,保險公司愿意付出的努力程度不斷降低.因此,政府應該選擇內部成本系數較小,即管理經驗豐富、規模較大、人員流動性較低的保險公司參與代理.
當α=1,β=10,b=1,σ2=0.01時,保險公司的風險偏好ρ與外界風險σ2的閾值γ的關系曲線見圖5.

圖5 ρ與γ的變化圖
圖5顯示,ρ與σ2的閾值是此消彼長的,即保險公司的風險規避度越大,其所能忍受的外部風險的閾值就越小.由2.2節可知,此時政府需要采取固定收益與浮動收益相結合的方式來進行激勵,其付出的代理費用總額較高.反之,當保險公司的風險規避度越小,其所能接受的外部風險的閾值就越大,此時政府只需采取浮動收益的方式來進行激勵,其總代理費用較低.因此,在政府進行委托代理時,應該側重于選擇那些風險規避度小的保險公司,以保證能夠以最小的代理費用獲得最大的產出.一般而言,資產規模較大、成立時間較長、財務狀況穩健的公司,其風險規避度較小.
命題4保險公司的風險規避度與其所能忍受的外部風險的閾值呈負相關關系.政府應選擇風險規避度較小、資產規模較大、成立時間較長、財務狀況穩健的保險公司,以保證能夠以最小的代理費用獲得最大的收益.
本文采用非線性產出函數研究了政府對保險公司代管社會醫療保險基金的激勵機制,在仿真計算的基礎上得到一系列的命題.目前由于我國醫保基金代管體制不規范,導致外部風險較大,因此政府應采取固定收益和浮動收益相結合的激勵機制,既保證保險公司的參與約束,又能不斷提高其努力程度.待市場逐步穩定、法律法規健全、風險降低的時候,政府可以轉變至完全采用浮動收益的激勵機制.政府應盡量選擇內部成本系數較低(即管理經驗豐富、規模較大、人員流動性較低)的保險公司來參與代理,以保證在同樣的激勵制度下保險公司的努力程度較高.此外,還應盡量選擇風險規避度小、成立時間較長、財務狀況穩健的保險公司,以保證能夠以最小的代理費用獲得最大的產出收益.關于醫療機構的行為對醫保基金運行平衡的影響機制以及對醫療機構的激勵機制,將在后續工作中進一步研究.
)
[1] Aksha V. A study of PPP models for social health care insurance [R]. New Delhi, India: Centre for Public Policy Research, 2012.
[2] Holmstrom B, Milgrom P. Aggregation and linearity in the provision of intertemporal incentives [J].Econometrica, 1987,55(2): 303-328.
[3] Ecker J G, Kupferschmid M. A computational comparison of the ellipsoid algorithm with several nonlinear programming algorithms[J].SIAMJournalonControlandOptimization, 1985,23(5): 657-674.
[4] Dempe S. Computing optimal incentives via bilevel programming[J].Optimization:AJournalofMathematicalProgrammingandOperationsResearch, 1995,33(1): 29-42.
[5] Cecchini M, Ecker J, Kupferschmid M,et al. Solving nonlinear principal-agent problems using bilevel programming[J].EuropeanJournalofOperationalResearch, 2013,230(2): 364-373.
[6] 郭曉明.非線性成本函數條件下委托-代理模式研究[D].廣州:暨南大學經濟學院,2008.
[7] 張維迎.博弈論與信息經濟學[M].上海:上海人民出版, 1996:399-441.
[8] Kyle A S, Ouyang H, Xiong W. Prospect theory and liquidation decisions[J].JournalofEconomicTheory, 2006,129(1): 273-288.
[9] Demski J S, Fellingham J C, Lin H H. Useful additional evaluation measures[J].JournalofManagementAccountingResearch, 2008,20(S1): 165-173.
[10] 陳斐,鄧玉林, 達慶利.基于展望理論的知識型員工激勵機制[J].東南大學學報:自然科學版,2012,42(5):1016-1020.
Chen Fei, Deng Yulin, Da Qingli. Incentive mechanism for knowledge workers based on prospect theory[J].JournalofSoutheastUniversity:NaturalScienceEdition, 2012,42(5): 1016-1020. (in Chinese)