胡 娟,王 霄,張 譯,劉佳林
(貴州大學電氣工程學院,貴陽 550025)
近十年來我國滑坡災害多發,其強度、頻次、范圍極大,給人們生活與生命安全造成了巨大損失[1]。要加強滑坡災害的監測、響應和應對能力,必須加強時空信息獲取能力建設。時空信息在滑坡災害管理中發揮著重要作用,已成為研究滑坡災害形成和發展規律的重要數據資源,也是滑坡災害監測、預警和災害評估的重要數據信息保障。目前,我國滑坡災害時空信息從源頭到相關職能部門的傳輸主要依靠蜂窩網絡系統,這必然導致蜂窩系統的流量過載和網絡擁塞等問題,影響重大災害應急階段災害信息獲取的動態和實時性。因此,為緩解滑坡災害時空信息在數據采集和傳輸階段給蜂窩網絡帶來的負載壓力,結合機會網絡[2],建立一套滑坡災害時空信息分流激勵機制,將對減災、防災和災害治理防御工作起到促進作用,具有很好的研究意義。
當滑坡監測區域出現滑坡災害時,可通過機會通信的方式,采用無人機配備信息搜集裝置,及時將滑坡發生時的災害時空信息傳出,以緩解蜂窩網的通信負載壓力,實現移動通信網負載的分流。
機會通信網絡起源于容忍延遲網絡[2]和移動自組網,采用通信模型為“存儲-攜帶-轉發”。在機會通信網絡中,消息的傳輸主要取決于節點之間的合作。但由于能量和緩存容量有限,一些節點會為了自身利益(如節能、低功耗要求等等),限制自身參與網絡協作,降低了轉發消息的頻率[4-7]。有些惡意節點甚至通過廣播風暴和黑洞攻擊等方式,造成嚴重的網絡性能損失。節點通常是理性的,只要有利可圖,就愿意參與網絡協作,因此,許多作者從相關利益出發激勵節點參與協作,從而提高網絡性能。
現有的激勵機制(聲譽激勵機制[8]、貨幣激勵機制[9])在不同方面存在不足,作為應對,在此結合三次討價還價的博弈模型嘗試提出一種分流機制。該機制構建分流請求者和分流響應者之間的行為交互模型,并通過博弈制定出雙方都能接受的價格,鼓勵自私節點之間的合作,阻止惡意節點進行的虛假報價,促使交易和消息的轉發。通過仿真實驗來評估此分流激勵模型對節點協作及機會網絡傳輸性能的影響。
根據滑坡安全監管對滑坡綜合監測相關信息的需求,當有線傳輸電纜損毀,無線傳感器網絡節點無法形成穩定通信鏈路的情況發生時,機會轉發機制可以通過中繼節點有效地選擇消息并傳輸給相關信息分析機構[10]。
以貴州畢節地質滑坡災害監測點為實例,構建機會網絡模型。該機會網絡模型中的節點分為三類:第一類是基站,通常作為機會網絡模型中的目標節點,負責向指揮控制中心傳輸環境數據;第二類是無人機搭載的信息搜集裝置,通過無人機的移動將信息中繼到基站;第三類是常見的無線傳感器節點,負責收集和傳輸環境信息。
其中,作為中繼節點的信息搜集裝置分為三種節點:合作節點、自私節點、惡意節點。合作節點將毫無保留地去幫助其他節點;自私節點轉發消息則需要被支付一定數量的虛擬貨幣;惡意節點就是在其中進行虛假報價的自私節點。
所設計的激勵機制,即是針對這三種節點,用來刺激節點間的合作。假設每個節點都據有一定數量的虛擬貨幣,為了刺激自私節點使之合作、抑制惡意節點的虛假報價,針對節點自私性或惡意報價導致分流效率低的問題,在此將三次討價還價博弈引入到激勵機制的設計中。
三次討價還價博弈模型包含兩個參與者:分流請求者(Offloading Requester, OR);分流響應者(也稱為分流協助者,Offloading Helper, OH)。把需要獲得轉發服務的OR 節點的節點財富值W 看成一個整體,用于OR 和OH 劃分(假如轉發服務報價為Q,則OR 分得W-Q,OH 分得Q)。這一博弈過程的原理圖如圖1 所示。

圖1 三次討價還價博弈過程
它的具體過程歸納為:
1) 當OH 提出一個報價時,OR 可以選擇接受和拒絕;
2) 若OR 選擇接受,則雙方按當前價格進行交易,如果OR 選擇拒絕,則OR 進行報價,OH 可以選擇接受和拒絕;
2) 如果OH 拒絕交易,則需要進行第三次報價,此時,OR 只能選擇接受,交易達成,消息得以轉發。
在上述過程中,雙方討價還價的時間長短與雙方的收益損失成正比。也就是說,每經過一輪的討價還價,雙方的收益就會損失的更多。定義σ 為衰減因子,每一回合的具體收益情況如表1 所示。

表1 三次討價還價過程中的收益情況
第1 回合時,OH 提出服務價格Q1,則OH 分得Q1,OR 分得W-Q1,此時雙方收益分別為Q1、W-Q1。如果OR 接受當前價格,則交易雙方以當前價格完成消息的轉發,否則進行下一回合的討價還價;
第2 回合,由OR 出價Q2,OH 分得Q2,OR 則分得W-Q2,交易雙方收益分別為σQ2、σ(W-Q2),此時若OH 接受該價格,雙方將以該價格完成消息轉發,否則再次進行下一回合的討價還價;
第2 回合,OH 第三次報價Q2,而此時OR 必須接受,OH 獲得Q2,OR 獲得W-Q2,雙方收益為σ2Q2、σ2(W-Q2),交易完成。
整個過程中,Q1, Q2, Q2∈[0,W]。
該博弈過程中有兩點需要注意:①在第2 回合中,OH 提出的報價OR 必須接受,且雙方都很了解這一點;②隨著交易進行,雙方的收益都會有所衰減。基于此兩點規則,在此采用逆向歸納法來進行均衡分析。
在第2 回合,OR 必須接受OH 的報價,則OH一定會報價Q2=W,即OH 單獨獲得OR 的全部財富。在此暫時不將W 賦值給Q2,即把Q2視為一個普通報價,則OH 獲得Q2,OR 獲得W-Q2,雙方收益為σ2Q2、σ2(W-Q2);
在第2 回合,OR 知道博弈到了下一回合就必須接受OH 的報價從而處于完全被動的狀態,從收益來看,雙方都不愿將博弈進行到第2 回合,所以只要在第2 回合OR 的報價使得OH 的收益不低于第2 回合的收益,那么OH 就接受OR 的報價,即:

由式(2)可知,OH 的第2 回合收益和第2 回合收益相等,而根據式(2),OR 的第2 回合收益大于第2 回合的收益。綜上,當Q2=σQ2時,交易在第2 回合完成。
在第1 回合,OH 知道自己在第2 回合的收益是σ2Q3,OR 會在第2 回合報價Q2=σQ2。從收益下降的角度來看,希望在第1 回合完成交易,因此,第1 回合OH 的報價應使OR 的第1 回合收益不小于第2 回合收益,即:

OR 的第1 回合收益不小于其在第2 回合的收益,將Q1的最大的值W-σ(W-σQ2)賦給Q1,則OH的收益為:

根據公式(6),OR 的第1 回合收益等于其第2 回合收益,而根據公式(5),OH 的第1 回合收益大于其第2 回合的收益。綜上,當Q1=W-σ(W-σQ2) 時,交易在第1 回合完成。
至此可歸納出該博弈的納什均衡解[11]為:
在第1 回合,OH 報價Q1=W-σ(W-σQ2),此時OH 的收益為Q1=W-σ(W-σQ2),OR 的收益為W-Q1=σ(W-σQ2) 。
此外,在最后一個回合,OR 必須接受OH 的報價,故OH 必定會報價Q2=W,因此子博弈的納什均衡解為:

設計并進行一系列仿真實驗,以評估基于博弈論的協作激勵模型對移動自組網節點協作及網絡傳輸性能的影響。采用MATLAB 網絡模擬器,所涉及的仿真都是基于隨機生成的移動自組網環境。其中1000m×5000m 的區域隨機部署500 個節點;網絡中的路由協議采用DSR 協議,單對節點之間傳輸范圍的最大值為100m。各節點按照隨機路點移動模型[12](Random Waypoint Mobility Model)移動。表2 列出了仿真實驗所設置的參數。

表2 LCD 屏幕位置顯示實例
實驗具體過程為:節點在預先設定的半徑范圍內隨機自主選擇一個目的地,并以預設速率(在[0.5m/s,2.5 m/s]區間)移動到目的地;到達目的地后停留一段時間,然后以新的速率重復這一過程。
為評價提出的協作激勵模型的網絡性能,將不同比例的惡意節點混合在網絡模擬器中。惡意節點根據利益最大化原則選擇相應的策略進行博弈。重點對以下協作指標進行模擬和測量:
協作成員比率:即網絡中選擇協作行動的成員數占總成員數的比例;
傳輸成功率:即成功傳輸的消息數占計劃消息數的比率。
采取每個系列的仿真進化博弈500 次來評估上述指標。由圖2 給出不同惡意節點比率下,激勵模型與未使用激勵模型影響下的協作成員比率隨博弈進化過程的對比曲線。在移動自組網中,尤其是具有較大規模的網絡,如果有70%以上的成員拒絕參與協作,網絡的服務將會受到阻礙,故在此次仿真中,當合作成員比例小于20%且持續100 次時,網絡傳輸服務將終止,此時20%臨界點對應的次數為網絡生命周期數。


圖2 不同惡意節點比率下協作成員比例對比
從圖中可以看出,在不同規模惡意成員比例情況下,未使用激勵模型的網絡生命周期相較于基于博弈論的協作激勵模型而言有大幅下降。具體來說,當初始惡意節點比例為0、0.2、0.4、0.6 時,未采用協作激勵模型的網絡生命周期分別為116 次、58 次、22 次、15 次。在相同條件下,使用基于博弈論的協作激勵模型,網絡傳輸服務持續到仿真結束,全部進入穩定狀態,協作成員比例超過20%,分別為92.8%、81.5%、74.6%、71.9%。可以看出,當初始惡意節點的比例超過50%時,基于博弈論的激勵機制仍然具有良好的性能。
在應用數據傳輸的移動自組網中,傳輸成功率是評價網絡數據傳輸服務的一個重要指標。因此設計仿真實驗來驗證、比較和評估基于博弈論的激勵機制在移動自組網數據傳輸服務中的有效性。在初始惡意節點比例為40%的情況下使用基于博弈論的協作激勵模型和傳統的多跳傳輸策略,仿真得到在不同規模下的數據傳輸成功率,結果如圖2 所示。按照網絡節點數200、200、400、500 得到A、B、C、D四組對比。

圖3 網絡數據傳輸成功率對比仿真圖
由于協作模型大大增加了網絡中協作成員的數量比例,當整個網絡中節點的規模從200 增加到500 時,數據傳輸的成功率從74%迅速增加到82%;然而,傳統的多跳傳輸協議主要還要依賴于網絡中各個節點之間的協作。當惡意節點的比例為40%時,協作成員比例會大幅下降,因此隨著網絡規模的擴大,數據傳輸的成功率從71%急劇下降到42%。
由仿真實驗結果可以看到,基于博弈論的協作分流激勵機制能夠有效地激勵成員間的合作,在惡意節點比例相對較高的初始條件下,仍能具有兩良好的協作性能和網絡數據傳輸效果。
結合機會通信網絡特征,構建了基于貴州畢節地質滑坡災害監測點的機會網絡模型,建立了基于滑坡災害的時空信息分流機制,利用三次討價還價博弈,在有效地抑制惡意節點進行虛擬出價的情況下,鼓勵了網絡中自私節點之間的合作,推導并總結出了該機制完美的納什均衡解。該機制在惡意節點占比較高的移動自組網環境下仍可實現良好的數據傳輸性能,對于我國的減災防災和滑坡災害治理防御,能夠提供有意義的助益。