鄭 飛,葉智勇,鄧鳳珠 (佛山開放大學,廣東 佛山 528000)
面對復雜的市場競爭和動態的市場需求,紡織服裝企業之間被視為競爭對手關系,因而在進行生產與銷售時,往往僅從本企業出發追求自身利益的最大化,未考慮上下游企業之間的協調關系,從而造成紡織服裝供應鏈各節點在資源或利益方面的沖突,協商是解決供應鏈中節點沖突的有效方法。在人工智能領域的多Agent系統因其主動性、交互性、自主性等特點而廣泛應用于多個領域,將多Agent技術應用于服裝供應鏈協商中,能確保服裝企業供應鏈系統靈活、敏捷,同時降低成本,提高產品質量。
在服裝供應鏈各節點的協商過程中,由于信息不對稱以及動態的市場環境等因素增加了協商的難度,導致協商成功率低、協商時間長、效果不理想。本文提出的基于多Agent服裝供應鏈并發協商模型,通過建立多Agent的服裝供應鏈協商模型框架,以單個服裝經銷商和多個服裝制造商為研究對象,為提高服裝經銷商和服裝制造商之間協商的效率,增大服裝經銷商和服裝制造商協商成功的可能性提供了可靠的理論依據。
假設服裝供應鏈是由服裝經銷商和服裝制造商組成的協同網絡,服裝制造商提供服裝,服裝經銷商購買服裝,一個服裝經銷商Agent和多個服裝制造商A-gent進行并發協商模型框架如圖1所示。

圖1 多Agent服裝供應鏈并發協商模型框架
由圖1可見,服裝經銷商與服裝制造商都具有各自獨立的協商信息。服裝經銷商Agent由協調器和多個子服裝經銷商Agent構成。根據服裝制造商Agent的數量,協調器創建相同數量的協調線程,并提出相應的協商策略對各個子服裝經銷商Agent進行調控,實時處理協商線程信息和其他子服裝經銷商Agent的及時更新。協調線程由子服裝經銷商Agent和與之對應的服裝制造商Agent構成,保留了服裝經銷商Agent的協商信息,接收、拒絕提議或生成反提議。
如圖2所示為單個線程的協商過程。在協商的過程中,根據服裝制造商Agent的個數,協調器對協商線程進行初始化,為每個協商線程設置初始參數(如議題保留值、最大協商時間以及協商策略參數等),創建初始提議,發出協商請求,并由制造商A-gent做出響應。在進行下輪提議前,對協調器發送來的提議進行評估,看是否為最佳提議,若不是,按協商策略提出反提議,若是,則按流程進行相應的處理。無論子服裝經銷商Agent與服裝制造商A-gent協商結果如何,每個線程都會將協商結果送到協調器,保證所有協商線程連續進行。

圖2 單線程協商過程
令:
T:Agent a截止時間;
Tm、Tri:分別表示服裝制造商Agent和服裝經銷商Agent協商截至時間;
ωai:Agent a對議題i的權重,且
A:協商響應,且A∈ {接受提議,拒絕提議,提出提議};
Ag:表示一個經銷商Agent r與多個制造商Agent mi(i=1,2,…,)的集合,即Ag={r,m1,m2,…,mn},且 a∈Ag;
S:協商策略;
C:協調策略;
U:效用函數。
則議題vi可以用直線公式求得其評價函數uavi(),議題的整體效用函數為:

于是,最終效用函數可表示為:

其中:Ur、Um分別表示服裝經銷商Agent的效用和服裝制造商Agent的效用。
所以,多Agent供應鏈并發協商模型可表示為:

提議策略由提議評價策略和提議生成策略組成。為了進行下一輪協商決策,必須對協商對手的提議做出評價,因此需要相應的協議評價策略。隨著協商環境的變化,根據當前協商策略生成反提議的工作由提議生成策略來完成。提議生成策略又分為讓步型和學習型兩種。
1.3.1 提議評價策略
對單個協商線程而言,提議評價流程如圖3所示。
在時刻t,服裝經銷商Agent r收到某服裝制造商Agent m的提議時,判斷是否超過協商時間:若在有效期內,則將本提議的效用與該服裝經銷商Agent r準備發送的提議的效用進行比較,若前者大于后者,表明服裝經銷商Agent r接受服裝制造商Agent m的提議,協商成功,將協商結果發送給協調器;否則,在截至時間以前,服裝經銷商Agent r向服裝制造商Agent m提出反提議。
1.3.2 提議生成策略

圖3 提議評價流程
為了對多個并發協商線程進行管理,在協調器中要嵌入提議生成算法,尋找最優提議,同時協調器進行確認并發送給未完成協商任務的協商線程,從而更新服裝經銷商Agent的協商策略,提高協調器工作效率。
提議生成策略分為讓步型提議生成策略和學習型提議生成策略兩種。
讓步型提議生成策略是提議生成策略中較為基礎但很有效的策略。由Farantin提出的基于時間的讓步策略認為時間是決定讓步幅度的因素之一;人們根據Parzen窗估計法提出了基于對手議題保留值估計的提議策略。這兩種策略具有一定互補性,為了彌補彼此的不足,人們采用動態線性加權的方法提出了線性加權的提議策略。下面重點介紹一類學習型提議生成策略:粒子群優化的協調策略。
粒子群優化(PSO)算法是1995年由美國學者Kennedy和Eberhart提出的,由于參數少、記憶性好以及收斂快等特點,受到廣泛關注。該算法屬于進化算法的一種,其思想源于鳥群捕食,通過對適應度的評價來獲取解的質量。最優化問題的解被抽象為一些無質量與體積的微粒,通過群體行為尋找整個搜索空間的最優解。粒子群算法如下:
D維空間中,有N個粒子,適應值函數為f(·);粒子i的位置為xi=(xi,1,xi,2,…,xi,n),將xi代入適應函數f( xi)求適應值;粒子 i的速度為 vi= ( vi,1, vi,2,…,vi,n),粒子i經歷過的最好位置為pbesti=(pi,1, pi,2,…,pi,n),種群所經歷過的最好位置為gbesti= ( gi,1, gi,2,…,gi,n)。則粒子i的速度和位置更新公式分別為:

其中:j=1,2,…,n;ω為慣性權重,調節搜索范圍,本文取1;c1,c2為加速度常數或學習因子,調節學習最大步長;r1,r2為[0,1]區間的隨機數,以增加搜索的隨機性。
通過式(4)和式(5)的迭代,比較相鄰粒子的適應值,求出粒子的局部最優解,然后對所有局部最優值進行比較,其中的最小值即為當前的全局最優值。即:

為將粒子群優化算法應用于服裝供應鏈并發協商模型中,就服裝經銷商Agent而言,令協商線程為粒子,線程間的相互提議為粒子的當前位置,則某個線程協商成功的提議即是粒子的個體最優解,全局最優解就是當前所有協商成功的線程中效用最大的那個提議,效用函數Ur為適應度函數,提議值的變化量是速率。根據圖3,基于粒子群的服裝供應鏈并發協商過程如下:
Step1:根據服裝經銷商Agent的數量,協調器創建相應的線程,對協調線程的提議策略及PSO的參數進行初始化,如服裝制造商Agent的數量n,議題個數N,制造商Agent對議題的權重協商截至時間T,對第i個議題的最小值和最大值及讓步率β,算出當前最佳提議并發送到其他子服裝制造商Agent。
Step2:初始時刻,服裝經銷商Agent與服裝制造商Agent分別采用基于時間的協商策略進行協商。
Step3:子服裝經銷商Agent收到的協商結果的效用若比己方提議效用值小則保留,否則調整讓步策略。若協商成功,則轉入下一步,否則繼續Step3。
Step4:若協商活動的結果為成功,協調器會對從協商線程收到的協商成功結果進行評估,看是否為最佳提議,若是,將此提議發送給其他協商線程,否則保持,直到其他進程協商結束。
在服裝生產與銷售環節,服裝生產商與經銷商常會對生產——銷售情況進行協商。就佛山服裝生產商而言,在其生產能力限度內,往往追求訂單充裕、交貨時間合理、價格合理、產品新穎、型號齊全等,而經銷商往往期望存貨少、交貨及時、款式新穎、價格適中等,代表消費能力。本文以一個服裝經銷商Agent和n個服裝制造商Agent i( i=1,2,…,n)為仿真實驗對象,對N個議題的協商(這里對產品價格、訂購數量和交貨時間3個議題進行協商,即N=3)。實驗參數的設置及協商議題如表1、表2所示。
根據粒子群算法,得到制造商Agent從5到35時,聯合效用、協商時間和協商成功率如表3所示。
從表3可以看出,在不咯率成本的情況下,隨著制造商的增多,效用值也增大,說明和越多制造商進行協商,所得效果越好,同時隨著制造商數量的增多,平均協商時間縮短,協商成功率增長速率降低。
在服裝供應鏈環境中,以服裝經銷商和服裝制造商為對象,建立了多Agent供應鏈并發協商模型,利用PSO優化算法求出最佳提議,并通過協調器將其發送給其他線程,結合基于時間的讓步策略和基于Parzen窗對手議題保留值估計的提議策略,對不同數量制造商時的聯合效用、平均協商時間以及協商成功率進行了分析,證明模型與實際系統基本相符。以后的研究重點將是Agent之間的信任關系以及供應鏈外部環境對協調結果的影響。

表1 實驗參數的設置

表2 協商議題及取值范圍

表3 不同數量制造商Agent時的聯合效用、平均協商時間與協商成功率
[1] 蔣國瑞,等.多Agent制造業供應鏈管理[M].北京:科學出版社,2013.
[2] Trelea I.The particle swarm optimization algorithm:convergence analysis and parameter selection[J].Information Processing letters,2003,85(6):315-317.
[3] 路健,等.供應鏈環境下產能優化配置問題的混合粒子群算法[J].計算機集成制造系統,2012,18(11):2537-2545.
[4] 劉小華,林杰.基于遺傳粒子群混合算法的供應鏈調度優化[J].控制與決策,2011,26(4):501-506.
[5] 鄭飛.閉環供應鏈環境下紡織服裝業組織運作模式[J].物流技術,2015,34(7上):224-226,284.
[6] 汪胡林,馬金平.基于多Agent的BTO供應鏈的動態構建方法研究[J].物流工程與管理,2013,35(6):123-127,155.
[7] 金坤,薛耀文.供應商參與產品創新的供應鏈協調研究[J].物流科技,2012,35(2):12-17.
[8] 馬慧民,等.基于粒子群算法的供應鏈生產、配送集成計劃研究[J].計算機工程與應用,2008,44(30):206-209.
[9] 蘇生,等.供應鏈協商調度模型與算法[J].軟件學報,2014,24(1):12-24.
[10]董晴,戴更新.競爭模式下利他偏好的供應鏈協調[J].物流科技,2017,39(9):114-117.
[11]鄧汝春.服裝業供應鏈管理[M].北京:中國紡織出版社,2005.
[12] Kennedy J,Eberthart R C.A discrete binary version of the particle swarm optimization[J].Proceedings of the Conference on System,Man and Cybernetics,1997,97:4104-4109.
[13]楊以雄.服裝物流管理教程[M].上海:東華大學出版社,2013.
[14]胡小建,陳啟萍.面向供應鏈基于博弈的并發協商模型研究[J].中國機械工程,2013,24(2):163-168.