□文/徐德會 包秀莉 蘇 瑩
(重慶青年職業技術學院經濟管理學院 重慶)
[提要] 本文從研發動力角度,利用博弈論模型分析虛擬現實關鍵共性技術研發動力系統中企業、高校和科研院所以及政府間的利益關系,明確虛擬現實關鍵共性技術研發內、外部動力發揮的阻礙原因。
虛擬現實產業是中國經濟發展新時期的重要產業方向和技術領域,具有非常廣闊的應用前景。研發虛擬現實關鍵共性技術對推動新一代信息技術與制造技術融合發展,貫徹落實《中國制造2025》重要工作部署有重要意義。然而,虛擬現實關鍵共性技術的研發具有研發投入大、周期長、經濟效益低等特點,容易陷入研發市場失靈的困境。因此,研究多主體合作下的虛擬現實關鍵共性技術研發問題,對于推動國家創新驅動發展有重要的理論和實踐意義。
虛擬現實關鍵共性技術研發的內外部動力來源于多個方面,然而關鍵共性技術研發存在的外部性是削弱這些力量的重要因素。虛擬現實技術創新戰略聯盟內部成員既有資金充足的企業,也有技術力量強大的高校和科研院所。因此,聯盟組織內部成員進行合作研發是消除外部性的有效手段,但由于在合作研發的動力系統中,企業與企業、學校和科研院所、政府間存在著博弈行為,各個主體理性行為的存在是實現關鍵共性技術合作研發的重要阻礙。因此,對系統中三方主體博弈行為進行分析,推進行業關鍵共性技術的合作研發有效性。
(一)無政府狀態下企業與高校和科研院所間的博弈。在無政府參與狀態下,企業與高校和科研院所之間是否進行關鍵共性技術合作研發的博弈屬于“囚徒困境”問題。進行關鍵共性技術合作研發要投入較大的成本,而企業、高校和科研院所作為一個理性主體,在無政府狀態下,它的行為存在著不確定性,會因為信任而選擇合作行為或是因為自私而選擇背叛行為。因此,博弈模型建立在以下幾個假設條件下:
假設1:博弈主體為企業與高校和科研院所,兩者是理性主體,每個主體都有選擇“合作”和選擇“背叛”兩種決策行為
假設2:雙方選擇最優策略時,以對手的可能策略預測為參考
假設3:雙方在選擇“合作”策略時,所需要投入的成本(人力、物力、技術和資源等要素)折算為貨幣c,若是選擇“背叛”策略,則投入成本為0。由于投入較大,短期內收益不明顯,因此各主體收益比不合作時減少c,即,r 1、支付矩陣(表1) 表1 無政府狀態下企業與高校和科研院所間的博弈支付矩陣 由支付矩陣可知,企業與高校和科研院所間的博弈一共出現四種情形: 情形一:當企業選擇“合作”時,高校和科研院所也選擇“合作”,則企業、高校和科研院所的收益為rE-c,rS-c。 情形二:當企業選擇“背叛”,高校和科研院所依然選擇“合作”時,則企業獲得收益為rE,高校和科研院所獲得收益rS-c,(rS-c) 情形三:同情形二,僅有企業選擇“合作”策略,那么企業獲得收益為rE-c,高校和科研院所獲得收益為rS,(rE-c) 情形四:當兩者都選擇“背叛”策略時,他們的收益分別是rE和rS。 2、策略選擇。當企業選擇“合作”策略時,高校和科研院所有兩種策略,“合作”或“背叛”,“合作”時則與企業一樣,獲得平均收益,但選擇“背叛”策略時,高校和科研院所就會獲得高于平均收益的利潤。因此,選擇“背叛”策略是高校和科研院所的最優策略。 當企業選擇“背叛”策略時,高校和科研院所將不會改變策略,繼續選擇“背叛”,因為選擇“背叛”會獲得行業的正常收益水平,選擇“合作”策略則會獲得比平均收益水平低的利潤。因此,無論企業選擇何種策略,高校和科研院所的策略都選擇“背叛”策略以獲得超額收益或避免低收益。同樣的,無論高校和科研院所選擇何種策略,企業都選擇“背叛”。此時,博弈的納什均衡為:(背叛,背叛),博弈的雙方陷入“囚徒困境”的狀態。 3、結論。在無政府狀態下,企業與高校和科研院所間關于是否進行合作研發博弈的納什均衡是都會選擇“背叛”策略。這種情況形成的主要原因是,選擇“背叛”的主體可利用信息不對稱的條件“搭便車”,這將使得博弈向(背叛,背叛)的結果演化。 (二)無政府參與下企業與企業間的博弈。兩企業間關于是否進行關鍵共性技術合作研發的博弈同樣屬于“囚徒困境”問題。選擇合作研發需要投入較大的成本,而企業作為一個追逐利益最大化的理性主體,當政府規制行為不存在時,企業間在是否進行合作研發的問題上就存在博弈。博弈模型建立在以下假設條件上: 假設1:博弈主體為兩個企業,企業主體是理性的,都可自由選擇是否進行合作研發 假設2:雙方選擇自己最優策略時,可以對手的可能策略作為參考 假設3:企業選擇合作研發后,研發周期較長,投入成本較大,短期收益不明顯,利潤降低,即(p1-c1)<(p2-c2) 1、支付矩陣(表2) 表2 無政府參與下企業與企業間博弈支付矩陣 兩個企業間的博弈同樣出現四種情形: 情形一:兩個企業都選擇“合作”策略,則兩個企業所得到的收益都是p1-c1,是合作研發情況下正常的行業利潤。 情形二:若企業A 選擇“背叛”策略,企業B 依然選擇“合作”策略,則企業A 獲得收益為p2-c2,企業B 獲得收益為p1-c1,(p1-c1)<(p2-c2),選擇“背叛”策略的企業獲得了更高的收益,選擇“合作”策略的企業利潤受損,低于行業正常的平均收益。 情形三:與情形二相同,僅有企業A 選擇“合作”策略,企業B 選擇“背叛”策略,那么企業A 利潤受損。 情形四:兩個企業都選擇“背叛”策略,那么利潤都為p2-c2。 2、策略選擇。當企業A 選擇“合作”策略時,企業B 有兩種選擇,“合作”或者“背叛”,“合作”時收益和企業A 一樣,當選擇“背叛”時,則會獲得高于行業平均水平的收益。因此,選擇“背叛”策略是企業B 的最優策略。 當企業A 選擇“背叛”策略時,企業B 不會改變策略,將繼續“背叛”,因為此時可以獲得行業正常的收益。因此,無論企業A 選擇何種策略,企業B 的最優策略是“背叛”,以獲得超額利潤或者避免收益受損。同樣的,無論企業B 選擇何種策略,企業A 的最優策略都是“背叛”。此時,博弈的納什均衡為:(背叛,背叛),博弈雙方處于“囚徒困境”的狀態。 3、結論。在無政府參與狀態下,兩個企業關于是否進行合作研發博弈的納什均衡是雙方都選擇“背叛”。雙方策略選擇行為受到競爭方的影響,會改變最初的策略,向(背叛,背叛)的結果演化。 (三)政府參與下企業與高校和科研院所間的博弈。由上述研究可知,在無政府參與狀態下,企業與企業間、企業與高校和科研院所間都沒有充分的動力開展關鍵共性技術合作研發。因此,為了引導企業、高校和科研院所能夠實現生產、研發方式的轉變,解決市場中“搭便車”與信息不對稱的問題,政府需要進入企業、高校和科研院所間的博弈,通過政府干預,幫助企業、高校和科研院所走出“囚徒困境”的局面。 政府干預的手段是給選擇“合作”策略的企業、高校和科研院所補貼t,給選擇“背叛”策略的企業、高校和科研院所實施懲罰f。補貼和懲罰都將直接影響企業、高校和科研院所的收益。在政府參與狀態下,企業與高校和科研院所間的博弈模型基于以下假設: 假設1:企業或者高校和科研院所選擇“合作”策略后,兩者收益會減少d 假設2:政府的補貼和懲罰具有一定的約束力,企業、高校和科研院所需要根據政府制定的規則調整自己的策略,但是兩者均以利潤最大化為決策目標 1、支付矩陣(表3) 表3 政府參與下企業與高校和科研院所間博弈支付矩陣 由支付矩陣可知,政府參與狀態下企業與高校和科研院所間的博弈一共有四種情形: 情形一:企業與高校和科研院所都響應政府號召,兩者均選擇“合作”策略,則兩者的收益都在原有利潤的基礎上,減少一個合作成本,增加一個合作補貼,即企業與高校和科研院所最終獲得的收益分別為rE-d+t,rS-d+t。 情形二:企業選擇“背叛”策略,高校和科研院所選擇“合作”策略,那么高校和科研院所的收益與情形一相比不變,企業的收益則變為rE-f,即在原有收益下減去一個背叛的懲罰。 情形三:與情形二類似,只是角色互換,企業選擇“合作”,高校和科研院所選擇“背叛”。那么,企業的收益為rE-d+t,高校和科研院所的收益為rS-f。 情形四:兩者都選擇“背叛”策略,則兩者都會受到懲罰,即收益分別為rE-f,rS-f。 2、策略選擇。兩者均選擇合作策略時,政府補貼大于選擇背叛時的收益,此時政府參與是有效的;當雙方選擇背叛時,政府懲罰的力度小于選擇背叛時的收益,那么此時,政府參與是無效的。 3、結論。政府參與下企業與高校和科研院所間博弈的納什均衡與f+t 的大小有關,當政府管制力度越大,即政府對于合作研發的鼓勵程度越大,給予的補貼越高,則企業或者高校和科研院所就越有選擇“合作”策略的動力。 (四)政府參與下企業與企業間的博弈。在同樣的條件下,政府參與狀態下企業與企業間的博弈結果與企業與高校和科研院所間博弈結果相同。即,政府參與下企業與企業間博弈的納什均衡與f+t 的大小有關,當政府管制力度越大,即政府對于合作研發的鼓勵程度越大,給予的補貼越高,則企業就越有選擇“合作”策略的動力。 (五)政府參與下企業、高校和科研院所與政府間的博弈。政府雖然可以對企業、高校和科研院所進行監管,為推動關鍵共性技術合作研發實行激勵或者約束政策,但政策的制定與執行需要人力、物力、資金的支持,因此政府也需要根據其監管成本的大小決定是否實行監管。所以,企業、高校和科研院所與政府間也存在著博弈的行為,他們之間的博弈模型需要滿足以下假設條件: 假設1:企業、高校和科研院所有“合作”與“背叛”兩種策略,政府有“監管”與“不監管”兩種策略,雙方均為追求利益最大化的理性主體 假設2:企業、高校和科研院所與政府間互不清楚雙方可能采取的策略,但清楚對方的收益函數 1、支付矩陣(表4) 表4 政府參與下企業、高校和科研院所與政府間的博弈支付矩陣 從表4 可知,政府與企業、高校和科研院所間的博弈支付有四種情形: 情形一:政府實施“監管”策略,企業與高校和科研院所選擇“合作”策略,那么企業與高校和科研院所獲得正常的行業平均收益r(E,S)-d,政府的監管成本為-g。 情形二:政府選擇“監管”,企業與高校和科研院所選擇“背叛”策略。那么,政府對其進行罰款f,同時也付出監管成本-g,政府最終收益為f-g,企業與高校和科研院所利潤為r(E,S)-f。 情形三:政府選擇“不監管”,企業、高校和科研院所選擇“合作”。此時,政府收益0,企業、高校和科研院所收益為r(E,S)-d。 情形四:政府“不監管”,企業、高校和科研院所“背叛”,則企業收益為r(E,S),政府收益為0。 2、策略選擇。在政府參與狀態下,政府與企業、高校和科研院所間不存在純策略納什均衡。當政府選擇“監管”策略時,因為r(E,S)-d>r(E,S)-f,企業、高校和科研院所會選擇“合作”策略;當政府選擇“不監管”策略時,因為r(E,S)-d 3、混合策略均衡。假設政府對企業、高校和科研院所采取抽查的方式,即企業、高校和科研院所被“查處”的概率為x(x∈[1,0]),企業、高校和科研院所選擇“合作”策略的概率為y(y∈[1,0])。π1 為政府的期望收益,π2 為企業的期望收益,因此政府與企業、高校和科研院所的目標函數如式(1)、式(2)所示: 將式(1)、式(2)分別對x、y 求偏導,并令其等于0,得到均衡解: 利用博弈論模型分析了虛擬現實關鍵共性技術研發動力系統中企業、高校和科研院所以及政府間的利益關系,明確了虛擬現實關鍵共性技術研發內、外部動力發揮的阻礙原因。通過對無政府參與下的企業與企業、企業與高校和科研院所的簡單博弈分析,得出由于信息不對稱現象的存在,導致企業、高校和科研院所對待關鍵共性技術研發多采用“搭便車”的方式,受益企業、高校和科研院所往往選擇不合作研發關鍵共性技術。因此,關鍵共性技術研發的外部成本內部化就需要政府的介入,通過政府管控的方法進行調整。在政府參與情形下,分析了企業與企業、企業與高校和科研院所以及企業、高校和科研院所與政府的博弈關系,得出政府監管下,關鍵共性技術合作研發是能夠走出“囚徒困境”的。



二、結論