林燁婷,陳忠輝,馮心欣,鄭海峰
(福州大學 物理與信息工程學院,福建 福州 350116)
移動群智感知是一種新的感知模式,它將普通用戶的移動設備作為基本感知單元,利用網絡媒介,通 過有意識或無意識的協作,實現感知任務的分發以及感知數據的收集,完成大規模的、復雜的社會感知任務[1]。受限于感知任務參與者數量不足和提供數據質量不高,群智感知的發展受到了嚴重的影響,因此需要設計任務分配機制和激勵機制[2]。而在實際的激勵機制選擇中,云平臺遇到了新的問題?,F實生活中參與群智感知的用戶類型和能力存在差異,例如出租車與公交車,其日常行駛路線有很大不同,前者行駛路線分散,且熱門地點出現的頻率高,后者行駛路線跨度大,且僅在幾條固定的路線行駛。于是在收集數據時,兩種類型的車輛上傳的數據有很大的特征差異。在設計激勵機制時,要考慮到用戶類型差異,才能使用戶利用率提高,云平臺收益最大化。激勵機制的設計是群智感知研究的關鍵,可以利用如博弈、拍賣、契約理論等方法來設計激勵機制[3]。
信息采集過程依據一種群智感知模式,如圖1所示。具體步驟如下。
(1)在信息傳輸采集系統中,由一個云平臺公布若干采集任務。介紹任務內容并公布不同任務相對應的報酬給若干個手機用戶。
(2)有一些手機用戶,例如手機用戶1、3、5響應,表示對其有興趣,之后手機用戶會使用自己的手機采集信息并將收集到的信息上傳至云平臺。而手機用戶2、4由于某些約束則不參加任務。
(3)手機用戶完成任務后,會得到步驟(1)所宣稱的報酬,用于彌補完成任務的損耗和獎賞上傳信息的貢獻。該報酬實際上是與手機用戶遞交的結果相關的。

圖1 傳感過程圖
用戶遞交的結果好壞實際上取決于步驟(2)中用戶傳輸數據的信息傳輸速率,表達式如下:
(1)
其中B為帶寬,N為高斯噪聲的功率,S為用戶移動設備的傳輸功率,S∈{SH,SL},云平臺公布的采集任務包含使用高功率SH傳輸的任務和使用低功率SL傳輸的任務兩種,命名為SH任務和SL任務。用戶可根據選擇的任務類型來選擇發射功率。由于信息采集過程受云平臺處理速度限制,信息傳輸速率并不是越快越好,考慮如圖2所示的信息傳輸速率密度圖,本文設置一閾值Xd,并定義兩種結果,將大于Xd的Xi定義為好結果,將大于Xd的Xi統計平均值X1定義為其帶來的收益;將小于Xd的Xi定義為壞結果,將小于Xd的Xi的統計平均值X0定義為其帶來的收益,于是X1>X0,X={X0,X1},Xi∈X,i∈{0,1}。

圖2 數據傳輸速率密度分布圖

利用契約理論,將群智感知轉換為契約關系,則云平臺為委托人,手機用戶為代理人[4]。委托人的任務是設計出一個獲取代理人私人信息的有效合同。
該數據采集過程中存在1個委托人和n個異構化代理人,將其根據成本函數的不同(下面會進行說明)劃分為好類型代理人與壞類型代理人。好類型代理人的比例為θG,壞類型代理人的比例為θB,且θG+θB=1。收益函數定義為收入減去成本,代理人的收益函數如下[5]:
EV=u(w(t))-C(t,S)
(2)
其中w(t),t∈{G,B}為代理人的報酬,與其類型相關。u(w(t))為代理人的收益,u(·)為效用函數,代理人為風險規避型用戶,其效用函數為凹性,效用隨貨幣收益增加而增加,但增加率遞減,即其二階導數小于零。其反函數為w(t)=u-1。C(t,S)為代理人成本函數,根據代理人類型分為兩種C(G,S)=v(S),C(B,S)=cv(S),如圖3所示,不失一般性,將函數定義為線性的,其中c>1。v(S)為行動成本函數,與其實際傳輸功率相關。如圖定義SH>SL,所以v(SH)>v(SL)。對于相同的行動成本,壞類型代理人需要更多成本,這也是壞類型代理人命名的原因。

圖3 代理人成本函數圖
風險中性委托人的收益函數如下:
(3)

通過式(2)和式(3)的對比,發現委托人和代理人之間存在利益沖突,為了最大化委托人的效益,并讓代理人按照契約執行,本文需要設計一個契約。其策略是對于t類型代理人,令其完成S任務,并給與其報酬w(t),另一類型代理人則完成另一種任務。將所提出的這樣一組(任務,報酬)組合稱為契約,記為{(S,w(t))|?t∈G,B,S∈SH,SL}。最優契約需要達到的目標是令委托人的效益最大化,可表示為:
(4)
該目標同時要滿足兩個條件:


(5)
(2)某類型的代理人會對應選擇委托人為其類型提出的報酬而非其他類型的報酬,則最優契約還需要滿足激勵相容約束(IC約束),這意味著,某類型代理人選擇為其設計的契約方案和選擇另一個契約方案,對其收益進行比較,若前者較大則不會偽裝,否則該類型會偽裝為另一類型,可表示為:對于任何類型代理人,有
u(w(t))-C(t,S)≥u(w(t′))-C(t,S′)
?t≠t′,S≠S′
(6)
S′為t類型代理人完成t′類型代理人任務時的功率。
于是可將最優契約求解問題構造成一個帶有約束的最大化問題。契約按兩種方案討論,方案1:好類型代理人完成SH任務,壞類型代理人完成SL任務。方案2:好類型代理人完成SL任務,壞類型代理人完成SH任務。首先,以方案1為例進行求解分析。
在對稱信息場景中,委托人可觀測到代理人的類型,代理人會如實上報自身類型信息,于是契約可由以下帶有約束的最大化問題求解。
(7)
s.t.
(8)
(9)

當設計方案2契約時,參照方案1的推導。
在對稱信息場景下,委托人應按方案1還是方案2發布契約實際上取決于其收益,方案1中委托人收益為:
EU1=θG(π(SH)-w(G))+θB(π(SL)-w(B))=
方案2中委托人收益為:
EU2=θG(π(SL)-w(G))+θB(π(SH)-w(B))=

在不對稱信息場景中,由于信息的非對稱性,委托人在簽訂合同時不能觀測到代理人的類型,但知道代理人類型的統計信息。代理人為了提升個人利益,存在隱瞞真實信息的行為。為了解決該問題,委托人需激勵代理人披露其特征,這一機制也被稱為顯示原理。可由以下最大化問題求解:
(10)
s.t.
(11)
(12)
u(w(G))-v(SH)≥u(w(B))-v(SL)
(13)
u(w(B))-cv(SL)≥u(w(G))-cv(SH)
(14)

(15)
v(SH)-v(SL)≤u(w(G))-u(w(B))≤c(v(SH)
-v(SL))
(16)
由于收入不變,為了最大化委托人的收益,應壓制兩種報酬到最大程度,于是壞類型IR約束(16)為緊約束,約束(16)中取較小的緊約束,即為:v(SH)-v(SL)=u(w(G))-u(w(B)),于是好類型契約即為以下方程組的解。
求解得:
當設計方案2契約時,參照方案1的推導。在激勵好類型代理人完成SL任務時,無法同時激勵壞類型代理人完成SH任務,即兩種類型的IC約束是矛盾的,于是該方案在該場景下無解。
結論2:在不對稱信息場景下,方案1最優契約為:
在不對稱信息場景中,若發布結論1中方案1契約,好壞類型代理人均會選擇壞類型代理人對應契約,這導致委托人的收益減小并且無法分辨用戶類型。于是需要激勵好類型用戶,提高給其的報酬,但提高的程度需要讓好壞類型代理人收入差控制在v(SH)-v(SL)與c(v(SH)-v(SL))之間,避免矯枉過正而讓壞類型代理人因此而隱瞞真實信息。多支付的報酬作為委托人獲取代理人私人信息承擔的信息租金。效率更高的好類型代理人收益增加了(c-1)v(SL)。

如圖4所示,當好類型用戶比例θG不變時,隨著噪聲N增大,委托人收益EU遞減。在N<0.152時,當噪聲功率N不變時,好類型用戶比例θG遞增,委托人收益EU遞增,好類型用戶雇傭得越多,委托人收益越大。在N>0.152時,則相反。

圖4 噪聲對委托人收益的影響
結合實際情況分析,在環境安靜、噪聲較小的情況下,好類型代理人有更大的概率得到清晰圖片,能給委托人帶去更多貢獻。雇傭越多好類型用戶,委托人收益越大。但在雨天等噪聲較大情況下,由于雷聲和雨衰,信道條件差、信噪比小,代理人均難以得到優秀質量圖片,由于好類型代理人需要更高的報酬,雇傭越少好類型用戶,委托人收益越大。
如圖5所示,當好類型用戶比例θG不變時,隨著代理人成本v(SH)增大,委托人收益EU遞減。在v(SH)<10時,如果噪聲功率v(SH)不變,則好類型用戶比例θG遞增,委托人收益EU遞增。好類型用戶雇傭得越多,委托人收益越大。在v(SH)>10時,則相反。

圖5 代理人成本對委托人收益的影響
結合實際情況分析,當好類型代理人使用包月流量套餐傳輸數據時,所付出的成本較低,其最優契約報酬即委托人支出也較低,雇傭越多好類型用戶,委托人收益越大。當好類型代理人使用按流量計費模式傳輸數據時,相較于包月流量套餐,所付出的成本較高,其最優契約報酬也較高,雇傭越少好類型用戶,委托人收益越大。
如圖6所示,當好類型用戶比例θG不變時,隨著好壞結果分界線Xd增大,委托人收益EU先增大后減小,在Xd=5.3×107處達到最大值。在4.65×107 圖6 好壞結果分界線對委托人收益的影響 結合實際情況分析,分界線可理解為委托人的要求,當要求在一個較低的范圍時,隨著要求的逐漸提高,好壞結果的對應收入增大,委托人得到的收益增大。當要求在一個較高的范圍時,隨著要求的逐漸提高,代理人越來越難以達到好結果。委托人得到的收益減小。對于離線服務,如路線信息采集服務,委托人對及時性和信息采集速率要求不高,好壞類型代理人均能遞交好結果。由于好類型報酬更高,雇傭越少好類型代理人,委托人收益越大。但對于在線服務,如實時交通流采集服務,委托人對及時性和信息采集速率要求較高,好類型遞交好結果的優勢明顯,雇傭越多好類型代理人,委托人收益越大。最后,對于極高的質量要求,好壞類型代理人都難以達到,雇傭越少好類型代理人,委托人收益越大。 本文利用契約理論提出了應用于群智感知的激勵機制,有效解決了在不對稱信息場景下,委托人無法觀測到代理人類型信息而產生的問題。并結合仿真與實際情況分析了外界因素對委托人收益的影響,仿真結果表明本文的方法是可行、合理且與實際相符的。在下一步的研究中,將結合群智感知中存在的其他問題優化契約。 [1] 劉魯濱, 朱燕民. 基于群智感知的噪音收集展示系統[J]. 計算機工程, 2015, 41(10):160-164. [2] 吳垚,曾菊儒,彭輝,等.群智感知激勵機制研究綜述[J].軟件學報, 2016, 27(8): 2025-2047. [3] 袁桂霞, 周先春. 移動群智感知網絡中基于QoS感知與協作競爭的機會傳輸機制[J]. 計算機工程, 2016, 42(8): 73-79. [4] Li Yuqing, Zhang Jinbei, Gan Xiaoying, et al. A contract-based incentive mechanism for delayed traffic offloading in cellular networks[J]. IEEE Transactions on Wireless Communications, 2016, 15(8): 5314-5327. [5] Zhang Yanru, Song Lingyang, Pan Miao, et al. Non-cash auction for spectrum trading in cognitive radio networks: contract theoretical model with joint adverse selection and moral hazard[J]. IEEE Journal on Selected Areas in Communications, 2017, 35(3): 643-653.
4 結論