尹 乾
(西安外事學院工學院,陜西 西安 710077)
傳輸延遲是指信息傳輸過程中,由于傳輸經過的距離遠或者一些故障,或者網絡繁忙,導致傳輸并沒有準時達到目的地情況。而要提高傳輸效率,就要求數據在局域網和廣域網之間傳輸時不進行協議轉換,避免傳輸延遲和抖動,因此會增加網絡開銷。傳輸延遲和網絡開銷對車輛自組織網絡數據傳遞都非常重要,但兩個指標之間相互沖突,即一個指標減少時會誘發引起另一個指標增加。如果要兼顧兩個指標,不能簡單地最小化傳輸延時或者網絡開銷,也不能按比例分割處理,要通過方案優化來處理二者之間的關系,提高傳輸效率[3]。
通過與交叉路口相連的各方向采取優先級排列的方法進行優化決策,當攜帶數據包的車輛到達交叉路口處,數據包攜帶者根據數據平臺測算的優先級別進行優先級別的選擇,并實現自身狀態信息與數據平臺及周邊車輛終端之間的數據傳遞。預先計算好的最優決策進行下一步轉發方向選擇,它首先檢查自己傳輸范圍內是否有向優先級為1的方向(這個方向由道路段或交叉路口指明)行駛的車輛,如果有就轉發,若沒有,再檢查它自己是否向這個方向行駛,如果是,就不轉發數據包[4]。否則就認為數據包無法向優先級為1的方向轉發,那么攜帶數據包的車輛再檢查其通信范圍內是否有向優先級為2的方向行駛的車輛,其優先級的決策,如圖1所示。依次類推,數據包最終會根據當前交通狀況,以最優的選擇向數據平臺或周邊的數據包攜帶者車輛終端轉發信息。

圖1 交叉路口處具有優先級的決策Figure.1 Decision with priority at intersection
車輛自組織網絡中數據傳遞問題可以很好地映射為馬爾可夫決策過程。其中數據包的位置為馬爾可夫決策過程中的狀態集,轉移概率可以通過對車輛軌跡的分析或通過道路交通統計得來[5],如圖2所示。

圖2 交叉路口i處馬爾可夫決策過程模型Figure.2 Markov decision process model at interaction i

此外,選擇數據包將哪個方向傳遞即為馬爾可夫決策過程的動作集,傳遞延遲和網絡開銷都可以看作馬爾可夫決策過程中需要最小化的值。解馬爾可夫決策過程的目標便是求出最優決策,在本問題中即是求出數據包傳遞過程中道路網的每個交叉路口的決策。
根據相應的馬爾可夫決策過程模型,計算公式如下:

它的通用表示形式為:
一百多年前人們在規劃西克爾高地時就設定了一系列明文規定:“包括你能做什么和不能做什么”。他們相信“規則是秩序之母,是營造和諧的關鍵,因此一切都應該得到管理”,就連起床時間、窗簾顏色、男人頭發長度等等,都需要得到管理。此外“還有一些潛規則”,比如每家房子的顏色都要遵從規劃者的意圖。這座被譽為“克利夫蘭山巔的彩虹”的城市,從一開始就被規劃和建設成“山巔之城”。由此形成西克爾人“只有規劃才是最好”的價值觀、“一絲不茍”的追求目標。里查德森太太家第一代移居者就非常贊賞這些規則,終生踐行、維護著它們,并且將之一代代傳承下來。

其中j為交叉路口i的某相鄰交叉路口,Ii為i的相鄰交叉路口集合。

首先考慮這樣的情景:攜帶數據包的車輛到達交叉路口i,在采取策略的情況下數據包通過道路段eij被傳遞到交叉路口j,便表示當前情境下數據包被向交叉路口j的方向轉發的概率[6]。很顯然,如果攜帶數據包的車輛遇到向 j方向行駛的車輛或者它自己向這個方向行駛,這個數據傳遞過程便能完成,但是前提是攜帶數據包的車輛沒有遇到駛向策略中比eij優先級更高的道路段的車輛,并且它自己也不向優先級更高的道路段上行駛。由此,定義三個概率事件:
A事件表示某一車輛在交叉路口i處沒有遇到駛向比道路段eij優先級更高的道路段的車輛;
B事件表示某一車輛在交叉路口i處遇到駛向道路段eij上的車輛,并且車輛自己不駛向比道路段eij優先級更高的道路段;
C事件表示某一車輛駛向道路段eij上的概率。
通過三個實踐的組合推導可以得到轉移概率公式如下:

凸組合的方法就是將兩個優化目標的值函數通過加權進行合并,設定這個新的數據傳遞目標為M,在決策π的情況下,交叉路口i處的這個目標函數表示為:

解多目標馬爾可夫決策過程還有另一種方法就是求出它的帕累托最優決策集。對于車輛自組織網絡數據傳遞問題,可以先利用求解多目標馬爾可夫決策過程得到它的帕累托最優決策集合,再根據一定的策略選取集合中的決策進行數據包的轉發[8]。利用馬爾可夫決策過程優化傳輸延遲和網絡開銷這兩個指標,使之最小化。
帕累托最優是指資源分配的一種理想狀態。假定固有的一群人和可分配的資源,如果從一種分配狀態到另一種狀態的變化中,在沒有使任何人境況變壞的前提下,使得至少一個人變得更好,這就是帕累托改善。帕累托最優的狀態就是不可能再有更多的帕累托改善的狀態;換句話說,不可能再改善某些人的境況,而不使任何其他人受損。在車輛自組織管理中,假設具有傳輸延遲和網絡開銷兩個目標要通過馬爾可夫決策過程最大化這兩個目標的值。假設兩個目標的值都大于0,兩個坐標軸與凸曲線之間的每個點都對應一個決策(連續情況,離散的情況相似),每個點都對應兩個目標的值,這兩個目標值便是由相應的決策計算得來。那么凸曲線上的所有點對應的決策即為此多目標馬爾可夫決策過程的帕累托最優決策集合。這個曲線上所有點的特點即不會被集合中其他任何一個點所 dominate[9]。這里,dominate定義這樣描述:兩個l維值向量,滿足以下條件:


圖3 多目標馬爾可夫決策過程的值曲線(兩個目標)Figure.3 Value curve in multi-target Markov decision process (two targets)
當數據包到達目的交付路口時,目的車輛可能不在此位置,無法直接交付,主要考慮兩種情況。第一種是目地車輛比數據包先到達目的交叉路口 id。當攜帶數據包的車輛到達id在其通信范圍內沒有找到目的車輛,于是檢查時間戳,這時會發現目的車輛已經駛過此處,這時數據包會被沿著目的車輛的軌跡的方向繼續轉發(不再使用之前計算出的策略),直至追上目的車輛交付成功或者到達TTL而被丟棄。第二種情況即數據包比目地車輛提前到達目的交叉路口 id。此情況下,數據包會被朝著目的車輛軌跡相反的方向繼續轉發直至與目的車輛相遇并交付或者達到網絡生存時間被丟棄。
為了使實驗結果更為真實,使用真實的車輛軌跡數據集進行實驗。目前,有三個一線城市公開了的車輛軌跡數據集:SUVnet數據集、Geolife數據集、車輛GPS軌跡數據集等,其中規模最大的公開數據集是SUVnet數據集,其中包括近5 000輛不同類型的車輛,包括出租車、公交車、社會車輛,其運行軌跡數據連續一個多月。
原始數據逐條記錄了某時刻對應車輛的位置、運行狀態等信息。記錄中每一列分別表示為:記錄 ID標識、車輛當前位置所在經度、車輛當前位置所在緯度、車輛速度、角度,記錄時間的六列為年、月、日、時、分、秒,最后兩列分別為擴展狀態和保留字段。此外,如果單獨以車輛為單位來看,數據大約以每 30 s記錄一次。選取了某市中心區域的 12.6 km×12.9 km的區域作為我們的實驗區域,如圖4所示。我們選取了此區域中的主次干道和比鄰的比較寬的道路,制作了區域的路網圖,標注出各交叉路口的信息,將路網與交叉路口信息以數據格式存儲在電子地圖中,作為實驗研究區域,如圖4所示。

圖4 實驗區域Figure.4 Text area
結合算法將道路環境建模稱為有向圖即路網圖,并將數據集中的數據映射到路網圖上。將無線通信的范圍假設為半徑相等的圓,其半徑設定為200m。選取了某區域中的3996輛不同類型的車輛進行實驗,區域中最大的車輛密度處為93.9輛/千米。此外,不考慮周圍建筑物、綠化帶等環境對無線傳輸的影響。
3.2.1 凸組合評估
凸組合是一類特殊的線性組合,是若干個點的某種特定意義下的非負線性組合。基于車輛自組織網絡中車輛軌跡的多目標化數據傳遞特性與凸組合非付線性的類似性,現決定選用凸組合法去評價數據傳遞中多個目標傳遞的不穩定性。凸組合法求解多目標的馬爾可夫決策過程,一般是先分析各目標的關系,指定凸組合參數,或者利用不同的凸組合參數值分別求解,通過比較獲得最佳效果。設定不同的凸組合參數α的值,選擇不同類型、一定數量的車輛進行實驗,其實驗結果如圖5所示,圖5中的(a)、(b)、(c)分別為V2V數據傳遞中α的值變化對交付率、網絡開銷、數據傳輸效率的影響。由圖5可以看出,當α的值取0.9時,對應交付率高、網絡開銷較低、傳輸效率大,綜合評價效果最優。

圖5 V2V數據傳遞中α值的變化對交付率、網絡開銷及數據傳輸效率的影響Figure.5 Impact of αchange on delivery rate, network overhead and data transmission efficiency in data transmission
由于V2V的數據傳遞方法具有通用性,很方便地可以把V2V的數據傳遞方法轉化為V2I和I2V的方法,OVDF法對于優化傳輸延遲的V2I較佳。為了進一步論證α值對交付率、網絡開銷、數據傳輸效率的影響確定性,現將TMOD F法與OVDF法進行比較試驗。
實驗中,設定目的節點即AP的數目為3個,按照OVDF的方案,數據包被傳遞到3個AP中的任何一個便視為交付成功。將TMODF法也作此設定,且不使用任何額外的基礎設施來輔助數據傳遞,只要求數據包攜帶者車輛終端之間進行數據傳遞。兩種方法均將α的值設定為0.9,觀測α的值對交付率、網絡開銷、數據傳遞效率等要素的影響。
通過實驗看出,目的節點的移動性會給數據傳輸帶來更大的不確定性,在相同的車輛密度下,TMODF法獲取的交付率比OVDF法獲取的交付率高,TMODF法對于V2I的交付率比對V2V的交付率高。TMODF法隨著車輛密度的不斷提高,有更多的車輛節點能夠作為中繼節點協助數據傳遞,交付率也是不斷提高,這是由于當網絡中的車輛數目增加時,有更多車輛節點可以作為中繼節點對數據進行轉發。OVDF法只對傳輸延遲進行了優化,對網絡開銷考慮前充分。若同時考慮傳輸延遲和網絡開銷,OVDF法在傳輸延遲方面的優化效果要高于本研究中的多目標方案,但是,數據傳遞的效率也要考慮其對交付率、網絡開銷等指標的影響。
3.2.2 帕累托最優評估
理論上講,不管是用凸組合法,還是帕累托最優法,其研究對象及其試驗區域是一樣的。在凸組合法中α的值可以有無窮多個,從無窮多個方案中選出最優的,而帕累托最優法卻無法實現這樣條件的選擇。此外,利用帕累托最優法求解多目標馬爾可夫決策方案,其需求空間較大。在利用帕累托最優法求解過程中,每次迭代選取帕累托最優決策集合,距離均值最近的點以及對應的決策予以保留,并參與下次迭代計算。每輪迭代時帕累托最優策略的數量均呈指數型增長。此外在每輪迭代還保留帕累托最優決策集合中傳輸延遲最小的點和網絡開銷最小的點。
在傳遞時選擇使用折衷的策略進行V2V數據傳遞分析,并與凸組合中α值為0.9時進行比較。將多目標馬爾可夫決策過程利用帕累托最優法與凸組合法在交付率、延遲時間、網絡開銷、數據傳輸效率等要素進行比較。同時,針對研究的車輛,對帕累托最優方案中保留的三個策略在各數據傳遞指標上進行比較,見表1。

表1 車輛數目固定的情況下三種策略的各指標比較Table.1 Comparison of indicators of three strategies when vehicle number is fixed
由表1可以看出:折衷策略相比其他兩個方案在交付率和數據傳遞效率上都取得了較好的效果。另外,側重于優化傳輸延遲所取得的效果明顯優于側重于優化網絡開銷效果。
本文通過在設定試驗區域內,將車輛自組織網絡數據傳遞問題建模,選定不同類型的試驗車輛并采集分析車輛歷史軌跡、統計道路交通運行狀況等手段,挖掘多目標馬爾可夫決策過程參數,求得數據傳遞的最優解,利用最優解來指導真實的數據傳遞過程。此外,還設定了錯誤恢復過程對預測目的交叉路口的錯誤進行恢復,提高了數據交付率。最后,利用數據集驗證了多目標優化數據傳遞方法TMODF的有效性。本文作為項目研究課題的一部分,在試驗條件的界定、選取研究對象的代表性等方面難免以偏概全。另外,隨著Alios操作系統、阿里云Link、5G網絡、北斗導航系統(BeiDou Navigation Satellite System,BDS)、GPS、電子地圖、實時道路數據、車輛運行軌跡等技術平臺被廣泛應用于車輛自組織網絡中,以及無人駕駛汽車的推廣應用,優化傳輸延遲、網絡開銷、交付率等車輛自組織網絡參數,已成為數據傳遞中不可或缺的重要指標,這些指標的優化情況,將直接影響未來智能交通技術的應用與推廣。