吳 磊
(合肥市食品藥品檢驗中心,安徽 合肥230088)
互聯網的普及使得消費者與企業或企業與企業間利用電子商務進行協商交易已成必然,通過代理人就可以自動快速、無距離限制完成交易。代理人協商是兩個或多個軟件代理人之間,通過不斷重復地提出提議值,達成相互可接受協議的過程,要求代理人具有智慧學習能力,可學習動態協商戰略。假設代理人在協商前已經擁有與其他使用時間依賴策略(Timedependent Tactic,TDT)[1]為協商戰略的代理人的協商經驗,進而建立規則庫幫助協商,根據其中的規則猜測對方的態度,再配合修正的TDT來建構一種協商模式。選擇判定樹來建立規則庫,判定樹是人工智能領域里的分類和預測工具,是以樹形圖為基礎的最簡單明了的歸納式學習方法,通過分類已知的某些例子來建構判定樹,從中可歸納出某些規律性。產生出來的判定樹,也能應用來對未知的結果做預測。相較其他方法,判定樹具備良好的解釋能力,可以幫助用戶建立其專業知識。并且以協商次數、聯合效用與效率作為績效指標,發現所提的協商戰略能有效地改善協商結果。
常用的協商決策函數[2]包括時間依賴策略(TDT)、資源依賴策略與行為依賴策略。在此以TDT為協商雙方使用的策略。在協商過程中,TDT依協商時間調整提議值,該策略行為主要受態度參數β的影響。時間依賴的提議值為式(1)、式(2)。其中xja→b(tn)為代理人α對代理人b在時間tn對議題j的提議值,tmax表代理人的協商期限,因此t0≤t≤tmax,而αaj(tn)為隨時間變動的函數,其中kja為常數,表示代理人a對議題j提出的初始值。

β值是影響收斂速度的主要因素,根據β的大小,TDT可分為兩類函數,分別是Boulware(B)和Conceder(C)[3],兩類函數在讓步程度上存在差異。當β<1時,為Boulware策略,代理人將會盡力保持初始值,直到接近協商期限時,才會開始大幅收斂。當β>1時,提議值會很快逼近保留值。式(3)與式(4)為代理人的評分函數,其功能為評估自身與對方代理人所提的提議值,給1個分數,然后利用方程式(5)來判斷是否接受對方代理人的提議值。

可通過很多績效指標來測量協商結果的公平性與合理性。如協商次數、效率與公平性等[4]。各績效指標如圖1所示。在此采用協商次數、聯合效用與效率作為評估協商結果的協商指標。
(2)聯合效用:此績效指標測量雙方的社會福利。以協商雙方的效用和作為計算式,見公式(6),其中x為協商的協議;Ua(x)與Ub(x)為代理人a與b的效用:

(3)效率:效率在圖1中表示為曲線“效率協議”。當協議越靠近該曲線,表示越有效率。而在該曲線上必定會有一個以上的點相對于其他的點聯合效用最大,此點稱為“柏拉圖最佳解”。

圖1 效率、聯合效用與公平性
因協商空間龐大,特設定以下假設條件:
(1)協商議題為價格與數量,價格議題的協商區間固定為60,數量議題的協商區間固定為100。
(2)Boulware策略以β=0.3代表,Conceder策略以β=3.0代表。
(3)協商期限固定為50。
(4)賣方先出價。
表1為建立推測模型學習例的雙方的實驗參數組合,議題以間隔10為一個實驗條件,權重以間隔0.4為1個實驗條件,策略有Boulware和Conceder兩種選擇。雙方以TDT為協商戰略,共進行20 736組實驗,如果協商次數在50次前結束的實驗則不列入實驗數據,因此實驗數據共有20 731組數據。根據方程式(7),選取每組協商時間t為9、19、29、39與49時,雙方的提議值加上計算雙方提議值在整個協商區間的比例R(tn)。t*為t9、t19、t29、t39、與t49。因此判定樹的輸入屬性為賣方的β值、R(t9)、R(t19)、R(t29)、R(t39)與R(t49),輸出屬性則為買方的β值。


表1 建立推測模型學習例的實驗參數組合
在協商過程中,一旦賣方代理人猜測出買方代理人的態度(β值),為了保持出值過程的單調性,如果賣方代理人須改變自己的態度(β值),賣方代理人的協商戰略即從方程式(2)修正為MTDT,如方程式(8)。

在此設計的協商架構如圖2所示,實線表示每回合都進行的動作,而虛線表示不是每回合都有回傳值。相較于買方,賣方有兩種出價戰略,一為TDT,二為MTDT。每回合中,買賣雙方都會通過TDT提出提議值,但賣方同時會將協商的數據傳入推測模型,期望能猜出對手的態度,一旦猜出對手的態度,則賣方可選擇使用TDT或MTDT。協商流程如圖3所示,賣方先提出提議值后,買方使用方程式(4)與方程式(5)計算雙方的評分值,再使用方程式(6)判斷是否接受對方的提議值。如果接受對手的提議值,則代表買方代理人協商成功,則此次協商會立刻結束,反之則會繼續協商。賣方在接收到買方所提出的反提議值后,也會判斷是否接受買方所提的提議值。當雙方都不滿意對方的提議值時,就會一直進行協商,如此反復協商直到有一方接受協商,或是超出協商時間,才會結束本次協商。然而賣方與買方不同的是賣方有猜測對方協商態度的機制與MTDT,賣方會在每回合根據推測模型里的規則猜測對方的協商態度,假設已符合某規則,則賣方會決定協商戰略是否變更,直到協商結束。

圖2 協商架構

圖3 協商流程
為了驗證在賣方猜出買方的態度后,是否愿意改變自身態度,將協商決策函數(NDF)與之前提出的協商模式進行比較,并以(I)賣方態度為Boulware,買方態度為Boulware;(II)賣方態度為Boulware,買方態度為Conceder;(III)賣方態度為Conceder,買方態度為Boulware;(IV)賣方態度為Conceder,買方態度為Conceder為實驗,試圖找出賣方較好的決策。表2為協商條件,得出的結果如表3所示。

表2 協商實驗條件

表3 協商結果
所有戰略組合的協商結果見表3,粗體字為賣方在改變自身的態度與否的情況比較下較佳的結果。在實驗(I)與實驗(IV)中,也就是買方態度為Boulware戰略時,賣方改變自身的態度會得到較短的協商次數與較佳的效率,而聯合效用不變。在實驗(IV)中,因為雙方都使用Conceder戰略,因此協商在賣方尚未判斷出買方的態度即協商結束,在此情形下賣方只能采取TDT。在實驗(II)使用TDT會得到較佳的聯合效用與效率,但若使用判定樹則是可以縮短協商時間。由上述實驗可得賣方的最適協商態度與戰略。
電子商務代理人協商模型的構建具有重要的應用價值,假設賣方代理人在協商前擁有與其他使用TDT為協商戰略的買方代理人的協商經驗,以此經驗建立推測買方態度的判定樹,進而利用此判定樹建立推測買方態度的推測模型,準確推測到買方的協商態度,賣方可根據買方的態度決定是否變更自己的態度與戰略,以期達到較佳的協商結果。實驗結果發現,不論買方的態度為何,使用判定樹與所對應的最適協商態度與戰略,都可在維持原有聯合效用不變下,顯著降低協商次數。