伍 岳, 朱 霞, 李 寧
(1. 后勤工程學院基礎部, 重慶 401311; 2. 駐西安鐵路局軍代處, 陜西 西安 710054)
軍品包裝生產質量的演化博弈模型與仿真分析
伍 岳1, 朱 霞1, 李 寧2
(1. 后勤工程學院基礎部, 重慶 401311; 2. 駐西安鐵路局軍代處, 陜西 西安 710054)
分析了軍品包裝生產參與主體,構建了監管人員與生產廠家之間交互過程演化博弈模型,利用數值仿真對不同參數下系統演化穩定策略(Evolutionarily Stable Strategy,ESS)的演化趨勢進行了仿真分析。研究結果表明:通過調整生產廠家和監管人員的激勵與處罰策略,拓展反饋渠道,可有效地影響系統的收斂結果,從而引導生產廠家和監管人員的行為選擇朝著期望的方向和預定的目標進行,為促進軍品包裝生產質量和軍品防護能力的提升提供參考。
軍品包裝; 包裝生產質量; 演化博弈模型
軍品種類眾多,生產地分布范圍廣,不同軍品包裝生產廠家的自身技術條件和管理水平存在較大的差異,對生產廠家的監管力度也不盡相同,使得軍品包裝生產質量良莠不齊,嚴重影響了軍品包裝的防護能力及軍品的完好性和可靠性。
目前,針對軍品包裝生產質量的研究較少,且主要集中于通過評價選擇生產廠家、通過制度約束生產廠家行為等方面,對于部隊監管方尋求自身利益的可能性缺乏考慮,且多為靜態的局部性探討,少有動態的關聯性分析。
筆者結合目前軍品包裝生產監管實際,考慮部隊監管方和生產廠家行為間的相互影響,基于演化博弈理論建立軍品包裝生產質量的演化博弈模型,并通過仿真分析對不同策略下的軍品包裝質量情況進行預測和分析。
從軍品包裝生產過程來看,參與主體主要有4個方面:1)同時進行軍品生產和軍品包裝的廠家或者專門從事配套軍品包裝生產的廠家群體(統稱生產廠家),負責軍品包裝的生產并隨軍品交付部隊使用;2)軍代表或軍方委托的監管人員群體(統稱監管人員),負責對從事軍品包裝生產的廠家進行監管[1-2];3)進行統籌管理和決策的軍隊業務主管部門,通過制定相應政策對監管人員進行激勵和約束,通過與生產廠家簽訂合同對其提供資金并對出現違約劣質產品的情況收取違約金[3];4)對軍品包裝中出現的問題和意見向業務主管部門反饋的部隊用戶。各參與主體之間的關系如圖1所示。

圖1 各參與主體之間的關系
軍品包裝生產質量演化博弈模型主要涉及生產廠家和監管人員2個群體,按照不完全信息及有限理性等演化博弈的一般假設,將生產廠家的行動集限定為生產合格軍品包裝產品和生產劣質軍品包裝產品,監管人員的行動集限定為積極監管和消極監管。
2.1 假設條件
由于軍品包裝生產工藝相對簡單,對生產和監管的技術性沒有過高的要求,因此假設如下:1)假定生產廠家按照標準生產的軍品包裝產品都能滿足質量要求;2)只要監管人員進行積極監管,就能查出存在的劣質軍品包裝產品;3)生產廠家生產劣質軍品包裝產品被監管人員查出與被部隊用戶反饋所需繳納的違約金相同;4)每次博弈均為1個生產廠家與1個監管人員進行隨機配對。
2.2 演化博弈得益矩陣
設u為積極監管的人員比例,1-u為消極監管的人員比例,v為生產合格軍品包裝產品的廠家比例,1-v為生產劣質軍品包裝產品的廠家比例,且u,v∈[0,1];C1為生產合格軍品包裝產品的成本,C2為生產劣質軍品包裝產品的成本,C0為軍品包裝產品的采購價,P為被查出或反饋生產劣質軍品包裝產品后生產廠家需繳納的違約金;S為監管人員監管所需耗費的成本(監管成本),F為劣質軍品包裝問題被部隊用戶反饋后對監管人員的處罰,E1為監管人員進行積極監管獲得的收益(監管收益),E2為監管人員進行消極監管獲得的收益(固定收益),E3為監管人員進行積極監管并查出劣質軍品包裝產品可獲得的收益(查獲收益);θ為生產的劣質軍品包裝產品交付部隊用戶后的反饋率,θ∈(0,1)。
由實際意義可知:生產合格軍品包裝產品的成本C1應大于生產劣質軍品包裝產品的成本C2,即C2 綜上可得:監管人員與生產廠家在不同行為選擇下的演化博弈得益矩陣,如表1所示[4]。 表1 監管人員與生產廠家的行為選擇及得益矩陣 2.3 演化博弈收益分析 (1) (2) 根據Malthusian動態方程原理[5-6],當策略的增長率與其相對適應度相等時,只要該策略的個體適應度高于群體的平均適應度,該策略就會增長。故監管人員與生產廠家策略交互的復制者動態方程為 (3) 3.1 均衡點及其穩定性分析 由雅可比(Jacobi)矩陣(記為J)的局部穩定性判定準則[7]可知:應使局部均衡點detJ>0和trJ<0兩個條件同時成立,方為系統的演化穩定策略(Evolutionarily Stable Strategy,ESS)[8]。即 條件2:trJ=j11+j22<0。 (4) 式中:j11=(1-2u)[(1-v)(E3+θF)+v(E1-E2)-S]; j12=u(1-u)(E1-E2-E3-θF-S); j21=v(1-v)(1-θ)P; j22=(1-2v)[uP(1-θ)-C1+C2+θP]。 綜上所述,可得系統中5個局部均衡點處j11、 j12、 j21和j22的取值,如表2所示。 表2 局部均衡點處j1、 j12、 j21和j22的取值 其中:M、N分別為 (E1-E2-E3-θF-S); 由表2可以看出:在點(u*,v*)處,由于j11+j22=0不滿足條件2,故該局部均衡點不是系統的演化穩定策略。 3.2 數值模擬和結果分析 考慮參數E1、E3、P的取值變化,應用MATLAB軟件對各變化情況下的博弈演化趨勢進行仿真分析。 1)S 表3為S 表3 S 圖2 E1=3,E2=0.5,E3=5,P=10,S=2,θ=0.4,F=1,C1=8,C2=2,u0=0.8,v0=0.8時的博弈演化趨勢 由表3和圖2可以看出:若S 2)S>E3+θF且P<(C1-C2)/θ 表4為S>E3+θF且P<(C1-C2)/θ時ESS點分析結果??梢姡狐c(0,0)為ESS,相應的博弈演化趨勢如圖3所示。 表4 S>E3+θF且P<(C1-C2)/θ時ESS點分析結果 圖3 E1=1,E2=0.5,E3=1.5,P=10,S=2,θ=0.4,F=1,C1=8,C2=2,u0=0.8,v0=0.8時的博弈演化趨勢 由表4和圖3可以看出:若S>E3+θF且P<(C1-C2)/θ,則因監管激勵太低且監管失職處罰太小,監管人員會趨于消極監管;同時,生產廠家在劣質軍品包裝產品被部隊反饋需繳納違約金期望不高的背景下,一旦察覺監管力度不大時,也將趨于生產劣質軍品包裝產品。 3)E1-E2 表5為E1-E2 表5 E1-E2 圖4 E1=1,E2=0.5,E3=5,P=10,S=2,θ=0.4, F=1, C1=8,C2=2,u0=0.8,v0=0.8時的博弈演化趨勢 由表5和圖4可以看出:若E1-E2 4)S 表6為S 表6 S 圖5 E1=3,E2=0.5,E3=5,P=20,S=2,θ=0.4,F=1, C1=8,C2=2,u0=0.8,v0=0.8時的博弈演化趨勢 由表6和圖5可以看出:若S 5)S>E3+θF且P>(C1-C2)/θ 表7為S>E3+θF且P>(C1-C2)/θ時ESS點分析結果??梢姡狐c(0,1)為ESS。相應的博弈演化趨勢如圖6所示。 表7 S>E3+θF且P>(C1-C2)/θ時ESS點分析結果 由表7和圖6可以看出:若S>E3+θF且P>(C1-C2)/θ,則因監管激勵太低且監管失職處罰太小,監管人員會趨于消極監管,但當生產廠家面對劣質軍品包裝產品被部隊反饋后需繳納高昂的違約金時,仍然會趨于生產合格的軍品包裝產品。 圖6 E1=1,E2=0.5,E3=1.5,P=20,S=2,θ=0.4,F=1, C1=8,C2=2,u0=0.8,v0=0.8時的博弈演化趨勢 6)E1-E2 表8為E1-E2 表8 E1-E2 這是因為:盡管提高查獲收益后其與消極監管出現劣質軍品包裝產品被反饋的期望處罰之和>監管成本,但由于生產廠家基本都生產合格的軍品包裝產品,依舊不能改變監管人員消極監管的趨勢。 綜合以上分析可得各種情況下的演化穩定策略,如表9所示。 表9 各類情況下的演化穩定策略 監管人員和生產廠家分別趨于積極監管與生產合格軍品包裝產品、消極監管與生產劣質軍品包裝產品、消極監管與生產合格軍品包裝產品時均有可能成為系統的演化穩定策略,故制定合理的激勵和處罰機制十分必要。 結合分析結果,可得如下結論: 1)可通過增加生產劣質軍品包裝產品所需繳納的違約金和拓寬部隊用戶反饋渠道的方式,促使生產廠家趨于生產合格軍品包裝產品,以減少監管力量的投入,提高監管效益。同時,由于軍品包裝生產的附加值不高,應避免因過多地增加違約金而導致生產廠家的運營風險急劇提升。 2)對于監管人員的激勵機制要根據監管情況和監管成果進行細化,使監管人員更趨于積極監管。同時,應極力避免出現生產廠家因監管人員消極怠工和生產劣質產品所需繳納的違約金過低而整體趨于生產劣質軍品包裝產品,導致軍品包裝質量下降,嚴重影響軍品的使用性能。 3)在軍品包裝生產監管過程中,要避免出現時緊時松的運動式監管模式,要使監管措施常態化,同時相關激勵和約束制度的制定也要具有一定的前瞻性和持續性,以保證軍品包裝生產質量的長期穩定。 [1] 王立功,尹安治.地區軍代室配套產品質量監督工作探討[J].中國軍轉民,2012(11):70-72. [2] 劉谷云,陳新軍,金曉海.抓好民營企業生產軍品的質量監督[J].國防科技工業,2012(7):72-73. [3] 曾安安.淺談軍工企業外包產品質量控制[J].國防技術基礎,2008(9):31-34. [4] 洪開榮.經濟博弈論[M].北京:經濟科學出版社,2014:58-65. [5] Jumarie G.New Stochastic Fractional Models for Malthusian Growth,the Poissonian Birth Process and Optimal Management of Populations[J].Mathematical & Computer Modelling,2006,44(s3/4):231-254. [6] 田心,鄭旭媛.生物建模仿真[M].北京:清華大學出版社,2010:71-73. [7] Resendis-Antonio O.Jacobian Matrix[M].New York:Springer,2013:1061-1062. [8] Tomkins J L,Hazel W.The Status of the Conditional Evolutionarily Stable Strategy[J].Trends in Ecology & Evolution,2007,22(10):522-528. (責任編輯:王生鳳) An Evolutionary Game Model on Production Quality of Military Package and its Simulation WU Yue1, ZHU Xia1, LI Ning2 (1. Department of Fundamental Courses, College of Logistic Engineering, Chongqing 401311, China;2. Military Representative Office Stationed in Xi’an Railway Bureau, Xi’an 710054, China) The major participants of military packaging production are analyzed, the evolutionary game model of interaction process between regulators and manufacturers is constructed, and numerical simulation is used to simulate and analyze the evolution trend of ESS (Evolutionarily Stable Strategy) under different parameters. Research results show that by adjusting the incentive and punishment strategy of the manufacturer and the supervisor, and expanding the feedback channels, the results of the system convergence can be effectively affected, so that the behavior of manufacturers and regulators can be guided towards the desired direction and target, and the production quality of military packaging and the protection of military products can be promoted. military packaging; packaging production quality; evolutionary game model 2016-09-07 軍隊科研計劃項目 伍 岳(1990-),男,博士研究生。 E257 :ADOI:10.3969/j.issn.1672-1497.2016.06.006 1672-1497(2016)06-0026-05


3 仿真分析







0且trJ<0的要求,故沒有ESS,相應的博弈演化趨勢如圖4所示。





(C1-C2)/θ(C1-C2)/θ時ESS點分析結果??梢姡狐c(0,1)點為ESS。相應的博弈演化趨勢與圖6相同。
(C1-C2)/θ時ESS點分析結果
4 結論