任立肖 - 宋 宣 張 麗 周 娜
(1. 天津科技大學食品安全管理與戰略研究中心,天津 300222;2. 天津科技大學經濟與管理學院,天津 300222)
食品溯源體系的建立能夠實現食品信息來源可查、去向可追、責任可究,一旦發現問題,能夠根據溯源信息進行有效的控制和召回,從源頭上保障消費者的合法權益。傳統的溯源系統數據都集中存儲在服務器端,不能保證溯源信息的真實性問題[1],而區塊鏈技術的開放性、可靠性及不可篡改性特點,與供應鏈的多主體相結合,具有形成安全可靠的食品溯源體系的天然優勢。
現有關于食品追溯體系的研究,主要涉及主體有企業、政府和消費者3類,分別從企業行為驅動因素、政府行為以及消費者的認可度等角度展開研究。側重企業視角的研究,山麗杰等[2]研究表明企業實施可追溯體系有助于提高食品行業的總體質量安全水平。側重政府視角的研究,朱立龍等[3]分析認為影響政府監管部門、農產品生產加工企業和第三方檢測機構策略選擇的關鍵因素分別為懲罰力度、尋租收益和尋租成本;劉長玉等[4]構建政府、企業、消費者的三方博弈模型,認為政府監管概率和消費者維權概率越大,企業生產合格產品的概率越大。側重消費者視角的研究,吳林海等[5]運用Nlogit5.0分析工具證明了消費者對可追溯信息屬性具有最高的支付意愿;曹裕等[6]基于消費者行為理論,研究溯源信息摻假與否時企業的最優定價策略;孫勝楠等[7]進一步將消費者支付意愿和溯源系統成本收益結合,研究食品供應鏈最優采購策略,并對政府監管的影響進行了分析;朱桂菊等[8]將消費者溯源偏好和參考價格效應納入統一分析框架,分析食品供應鏈溯源投入的最優動態決策與協調問題。
采用傳統數據存儲方式實現食品質量管理及追溯的研究已展開多年,且成果頗豐。Chen等[9]研究發現對食品質量管理有限投入會導致食品的低產出、低質量、高價格;Allata等[10]提出冰淇淋加工的HACCP和追溯系統,可以控制食源性安全隱患,最大程度地減少不安全或劣質產品的生產和分銷; Chen等[11]用二維碼技術,實現了豬肉從源頭到餐桌的追溯;趙訓銘等[12]研究了射頻識別(RFID)技術在食品溯源中的應用。傳統溯源信息真實性不能有效保證,于是對于區塊鏈在食品供應鏈的應用,業界與學界也分別展開了實踐及研究。在業界,沃爾瑪于2016年宣布與IBM達成戰略合作,而后又聯合清華大學和京東,四方聯手打造基于區塊鏈技術的安全食品區塊鏈溯源聯盟。在學界,劉宗妹[13]闡述了大數據時代利用區塊鏈技術和射頻識別技術構建的“區塊鏈+RFID”兩位一體協同共享模式,Kim等[14]將區塊鏈技術應用到農業,食品企業、農戶和融資機構通過區塊鏈,提高食品加工各環節的安全性、透明性以及效率;Kshetr[15]探討了區塊鏈技術對供應鏈管理中成本、質量、速度、風險控制和可持續性等主要目標的影響;還有學者[16]探討了區塊鏈技術應用于芒果的追溯方案。
綜上,區塊鏈技術應用于食品溯源極具意義,學界已有研究證明其有效性,但在實際的應用中如何調動食品企業參與的能動性,消費者對于可追溯食品的溢價接受度如何,食品企業對于區塊鏈技術投入成本和遠期利益應該如何平衡等問題鮮有研究。研究擬選取食品供應鏈中的食品企業、政府和消費者3個關鍵主體,運用演化博弈方法進行分析,探討初始狀態、區塊鏈接入成本、溢價系數以及溯源信息真實度對三方主體演化博弈結果的影響,以期為食品安全治理提供新的可行思路。
參與博弈的三方主體為食品企業、政府和消費者,三方均為有限理性,因此各方最初的選擇并非是最優策略,而是隨著時間推移互相影響并調整自身策略才能達到最優狀態。食品企業的策略選擇為(上鏈,不上鏈),“上鏈”策略是指食品企業愿意將食品在生產、加工、運輸過程的信息接入區塊鏈,“不上鏈”是指食品企業不會將相關食品信息接入區塊鏈。政府的策略選擇為(積極規制,消極規制),“積極規制”是指政府極力促成區塊鏈應用于食品溯源體系,鼓勵食品企業將信息上鏈,并給予相關激勵政策,當食品企業選擇不上鏈時,可能上傳虛假追溯信息,此時政府積極規制會給予懲處,“消極規制”是指政府不干預食品企業的溯源信息是否上鏈行為。消費者的策略選擇為(購買,不購買),“購買”是指消費者對于帶有追溯信息的食品認可并愿意支付一定的溢價來購買,“不購買”即由于溢價存在,消費者不購買帶有追溯信息的食品。以上分析的邏輯關系圖如圖1所示。

圖1 三方博弈模型邏輯關系圖Figure 1 Logic diagram of tripartite game model
三方博弈模型的假設:
假設1:食品企業選擇上鏈的概率為x,選擇不上鏈的概率記為1-x;政府選擇積極規制的概率為y,選擇消極規制的概率為1-y;消費者選擇購買的概率為z,選擇不購買的概率為1-z。
假設2:食品企業基本收益為R,食品企業接入區塊鏈的成本為C1,由于區塊鏈的不可篡改性,食品企業上鏈時提供食品信息為真實的,消費者購買到優質真實的食品后產生認可和信任,給食品企業帶來聲譽收益I,政府獲得公信力的提升S,此時政府選擇積極規制時,會給予食品企業一定的補貼A,消費者買到真實溯源信息的食品時效用為U,帶有溯源信息食品的溢價系數為μ,價格為Q,消費者購買到溯源信息真實的食品時收益為U-μQ。
假設3:食品企業不上鏈時,其提供的食品信息的真實度有待考量,虛假信息會帶來短期的利益ΔR,假設食品企業不上鏈時溯源信息真實度為θ,則食品企業上傳失真的溯源信息時獲得的收益為(1-θ)ΔR,消費者購買到溯源信息失真的產品會產生一定的損失L,當政府積極規制時,政府檢測到食品企業的溯源信息失真情況因而對食品企業收取罰金P。政府積極規制成本為C2,政府積極規制帶來安全的食品環境,因此獲得消費者的信任帶來公信力的提升S。在以上假設的基礎上,構建參數,見表1。
基于以上假設,構建食品企業、政府和消費者三方主體間關于食品溯源的博弈矩陣,混合策略博弈矩陣見表2。

表1 三方演化博弈模型參數

表2 三方主體博弈矩陣
根據表2的三方博弈矩陣,可進一步分析三方主體的期望收益及穩定演化策略。
食品企業選擇上鏈的期望收益:
EA=yz(R+I+A-C1)+y(1-z)(A-C1)+(1-y)z(R+I-C1)+(1-y)(1-z)(-C1)=yA+z(R+I)-C1。
(1)
食品企業選擇不上鏈的期望收益為:
(2)
平均期望收益為:
(3)
由此可得食品企業的復制動態方程為:
(4)
對食品企業選擇上鏈的概率的復制動態方程求偏導可得:
(5)

政府選擇積極規制的期望收益:

圖2 食品企業演化相位圖Figure 2 Phase diagram of food enterprise evolution
EB=xz(S-A-C2)+x(1-z)(-A-C2)+(1-x)z(S+P-C2)+(1-x)(1-z)(P-C2)=P-C2-x(A+P)+zS。
(6)
(7)
由此可得政府選擇積極規制的策略概率復制動態方程為:
(8)
對政府選擇積極規制概率的復制動態方程求偏導可得:
(9)

消費者選擇購買期望收益:
EC=xy[U-(1-μ)Q]+x(1-y)[U-(1-μ)Q]+(1-x)y[-(1-μ)Q-(1-θ)L]+(1-x)(1-y)[-(1-μ)Q-(1-θ)L]=-(1-μ)Q-(1-θ)+x[U+(1-θ)L]。
(10)

圖3 政府演化相位圖Figure 3 Phase diagram of government evolution
(11)
(12)
由此可得消費者選擇購買的策略概率復制動態方程為:
(13)
對消費者選擇購買概率的復制動態方程求偏導可得:
(14)

根據李雅普諾夫判別法可知,在線性定常系統中,所有的特征值都非正,即是穩定的,若是有一個特征值大于零,或者有零的重根存在,不穩定。在非對稱演化博弈中可知考慮純策略均衡的穩定性,因此只需討論8個均衡點的穩定性。構建雅克比矩陣并求得穩定點和特征值:

圖4 消費者演化相位圖Figure 4 Consumer evolution phase diagram
(15)
為使穩定性分析簡單且不失一般性,初始參數的設置要符合A+P+I-(1-θ)ΔR-C1>0,S-C2-A>0,U-(1+μ)Q>0。由于模型參數設置較為復雜,下面分兩種情況進行討論。兩種情形下對應的穩定點均衡性分析如表3和表4所示。
情形1:當P-C2<0時,政府積極規制食品企業獲得的罰金低于其積極規制的成本時,由表4穩定點均衡性分析可知,均衡點E1(0,0,0)和E8(1,1,1)對應的雅克比矩陣特征值均為負值,因此(不上鏈,消極規制,不購買)和(上鏈,積極規制,購買)為演化穩定策略,演化穩定相位圖如圖5所示。
情形2:當A+P-C1<0,P-C2>0時,食品企業上鏈獲得的補貼與不上鏈獲得的罰金之和低于上鏈時的投入成本,政府積極規制食品企業獲得的罰金高于其積極規制的成本,由表4穩定點均衡性分析可知,均衡點E3(0,1,0)和E8(1,1,1)對應的雅克比矩陣特征值均為負值,因此(不上鏈,積極規制,不購買)和(上鏈,積極規制,購買)為演化穩定策略,演化穩定相位圖如圖6所示。
由于博弈主體的有限理性,部分博弈方不能選擇完全理性的均衡策略,隨著時間的推移,三方博弈主體相互影響不斷調整策略,最終達到均衡。通過以上漸進穩定性分析可知,在三方演化博弈中,任一博弈主體策略的均衡狀態會隨其他兩方策略的變化而變化。運用Matlab2018b軟件模擬不同的初始狀態、接入成本、溢價系數和溯源信息真實度對三方主體策略選擇的影響。參數設定:R=2,ΔR=0.6,C1=0.2,C2=0.5,P=0.8,A=0.32,I=0.32,S=3,Q=0.2,L=0.4。初始狀態、區塊鏈接入成本、溢價系數及溯源信息真實度分別取0.2,0.5,0.8代表低、中、高3種力度。

表3 穩定點及其特征值

表4 穩定點均衡性分析

圖5 P-C2<0的相位圖Figure 5 Phase diagram of P-C2<0

圖6 A+P-C1<0,P-C2>0的相位圖Figure 6 Phase diagram of A+P-C1<0,P-C2>0
由圖7可知,在初始值為(0.2,0.8,0.2),(0.5,0.5,0.5)和(0.8,0.2,0.8)時,不同初始值會影響三方主體最終的策略選擇,即系統的穩定狀態與初始策略人群占比有關。當消費者選擇購買的比例較小時,消費者會向著不購買的方向演化,食品企業的策略選擇呈先上升后下降的趨勢,隨著時間的延長,消費者不購買行為最終導致食品企業選擇不上鏈,政府穩定于消極規制策略;當消費者選擇購買的人群比例居中時,消費者的策略選擇呈先下降后上升的趨勢,短期內消費者不夠認可,但是隨時間的延長溯源信息得到消費者的肯定后消費者穩定于購買策略,食品企業穩定于上鏈,政府穩定于積極規制策略;當消費者選擇購買的人群比例較高時,三方主體以較快的速率演化穩定于(上鏈,積極規制,購買)的理想狀態。
由圖8可知,當食品企業接入區塊鏈的成本較小時,食品企業向著上鏈的策略方向演化,政府向著積極規制的方向演化,消費者一開始向著不購買的趨勢演化,后轉為購買并最終穩定于購買策略。最初帶有溯源信息的食品價格要高于普通食品,消費者對于追溯信息的認可度不夠而選擇不購買,隨著時間的推移,具備真實追溯信息食品的價值逐漸得到認可,消費者則會逐漸傾向于購買策略;而隨著接入成本的增加,三方主體演化穩定策略為(不上鏈,消極規制,不購買)。區塊鏈應用食品溯源體系初期,設備采購布置、信息收集的成本較高,食品企業或看中短期利益或負擔不起成本放棄采用區塊鏈技術。
由圖9可知,當溢價系數為中低力度時,三方博弈主體的策略選擇穩定于(上鏈,積極規制,購買);當溢價系數較高時,食品企業和政府最初仍然向著(上鏈,積極規制)的方向演化,消費者最先出現策略的變化:由購買轉為不購買,隨著時間的延長,食品企業和政府策略選擇也轉變為(不上鏈,消極規制),最終三方博弈主體的策略選擇穩定于(不上鏈,消極規制,不購買)。消費者對于追溯信息具有一定的認可度也愿意為追溯食品支付一定的溢價,但是當溢價系數過高時,消費者對價格的敏感超過對食品溯源信息的需要,寧愿承擔虛假信息的風險,消費者選擇不購買策略,市場上也出現劣幣驅逐良幣的現象,導致含有真實溯源信息的食品失去市場份額,食品企業和政府也轉變為消極策略,影響區塊鏈技術在食品安全溯源體系的應用和推廣。

圖7 不同初始狀態對演化路徑的影響Figure 7 Influence of different initial states on evolution path

圖8 不同區塊鏈接入成本取值下各參與主體的行為演化趨勢Figure 8 Behavior evolution trend of participants under different block link in costs

圖9 不同溢價系數取值下各參與主體的行為演化趨勢Figure 9 Behavior evolution trend of participants under different premium coefficients
由圖10可知,消費者對溯源信息是否真實的敏感度最高,在演化的初始階段消費者向著不購買的方向演化,而食品企業和政府一直向著積極的方向演化,這是由于初始階段消費者對于食品溯源信息認識不夠深入而認可度較低。隨著時間的推移,消費者逐漸認識到真實溯源信息食品的重要性,從而轉向購買的方向演化并穩定于購買策略。可見,溯源信息真實度不影響三方主體最終的穩定策略,但是影響三方主體達到均衡的時間,而區塊鏈技術的不可篡改性可以提高食品溯源信息的真實度,溯源信息的真實度越高,三方主體達到(上鏈,積極規制,購買)的均衡狀態的速率越快。

圖10 溯源信息真實度不同取值下各參與主體的行為演化趨勢Figure 10 Behavior evolution trend of participants under different values of traceability information authenticity
基于區塊鏈技術應用于食品溯源的優越性,構建了食品企業、政府和消費者應用區塊鏈技術的三方博弈模型,模擬不同的初始狀態、接入成本、溢價系數以及溯源信息真實度對三方主體的演化行為的影響。通過分析,得出區塊鏈技術需要在合適的情境中才能推出,當消費者達到一定認可度時才能促使企業采用區塊鏈技術。因采用區塊鏈技術能提高食品溯源信息的真實性,可有利企業積極采用區塊鏈技術實現食品信息溯源,政府采用積極的規制制度,消費者傾向于購買該類食品。但是過高的接入成本會影響企業采用區塊鏈技術的積極性,同時會造成相關食品溢價過高影響消費者購買,所以初期需要各方采用相關推動措施。在以上結論的基礎上,為了更好推進區塊鏈技術的應用,提出如下建議。
(1) 合理控制可追溯食品溢價,提高消費者對可追溯食品的接受度。政府可以通過補貼獎勵等形式調動消費者購買的積極性,提高消費者的購買意愿,進而增強對追溯食品的認可度,消費者認可進而作用于食品企業,提高食品企業溯源體系建設的積極性。
(2) 企業應通過多種形式合作構建區塊鏈食品溯源體系。區塊鏈接入溯源體系的建立必然帶來成本的提升,而企業單獨構建成本尤其高昂,食品企業可以通過合作構建或者PPP等模式構建,在保證溯源信息真實性的前提下降低可追溯食品溢價程度的價格,從而提高消費者的認可度。
(3) 發揮政府主導作用,建立科學的獎懲機制。影響食品企業策略選擇的關鍵因素是區塊鏈的接入成本,政府可以通過補貼、減稅等方式提高食品企業溯源信息共享、溯源體系共建的積極性,與食品企業攜手保證食品安全質量,減少信息不對稱。同時政府在引導消費觀念,提升消費者認可度方面也應發揮主導作用,形成三方合力,盡快推動區塊鏈技術的應用,從根本上解決食品溯源信息的真實性問題。
研究僅考慮了政府、食品企業、消費者三方主體,但實際生活中,新媒體、電商平臺對于食品溯源體系的建設、提高食品溯源信息的真實性也各自發揮著不同的作用。因此,構建多主體的博弈模型是今后的研究方向。