江 帆 梁 曉 孫長印 王軍選
(西安郵電大學通信與信息工程學院 西安 710121)
(陜西省信息通信網絡及安全重點實驗室 西安 710121)
隨著近年來移動互聯網平臺的迅速發展以及各類智能設備的空前增長,對于數據流量的需求也呈現爆炸式高速增長[1]。截至2021年底,僅蜂窩物聯網用戶在我國已達13.99億戶[2],逼近移動電話用戶規模。然而,由于無線網絡通信資源有限,大規模的數據流量會使得移動通信網絡面臨時延增加、通信擁塞甚至通信中斷的困境。在低時延、高效數據處理需求的驅動下,霧無線接入網(Fog-Radio Access Network, F-RAN)作為一種新型網絡架構,能夠充分利用邊緣設備-霧接入點(Fog Access Point, F-AP)的通信、計算、存儲能力,有效緩解大規模數據流量帶來的無線網絡負載壓力[3]。因此,可以將用戶感興趣的熱門內容提前緩存在霧接入點,從而減少無線通信中回程鏈路的負載壓力,降低用戶的請求時延。在信息緩存過程中,緩存的內容一般包含兩種類型:靜態內容和動態內容。靜態內容不隨時間的改變而改變(如電影、圖片、音樂等);而動態內容會隨時間的改變發生變化,一般用來表征設備所處環境的實時狀態(如道路通行狀態、停車場空位情況、車輛位置等),該類內容通常對于時延非常敏感且具有動態特性。雖然移動邊緣緩存技術能夠有效減小信息傳輸的端到端時延,但是隨時間和環境的動態變化,如何保證已緩存動態內容的信息時效性,避免信息滯后甚至信息失效值得深入探究。因此,相關研究提出了采用信息年齡(Age of Information, AoI)作為度量動態內容新鮮度的指標,其定義為信息從產生到使用的時間差,即AoI越大信息越滯后,反之,則表示信息越新鮮[4]。與時延指標不同,AoI與信息的產生時間、緩存時間等因素密切相關;而時延則一般取決于信息的比特大小,隊列的分組到達強度等因素。在實際的網絡中,智能終端側的AoI不僅與傳輸時延有關,也取決于信源節點內容的生成過程,中間節點的轉發與處理等過程等。因此,如何為用戶提供滿足時效性需求的動態內容,已成為近年來霧無線接入網中緩存策略的研究熱點[5,6]。
傳統的內容緩存策略,如先入先出(First In First Out, FIFO),最近最少使用(Least Recently Used, LRU),最不經常使用(Least Frequently Used, LFU)等已經在有線網絡中得到了廣泛使用,但上述策略沒有考慮內容流行度,其性能效率受限[7]。近些年,通過預測內容流行度來提高內容緩存效率已成為目前緩存策略的研究主流。在相關的研究工作中,文獻[8]提出一種基于聯邦學習的上下文感知流行度預測策略。文獻[9]提出一種基于深度強化學習的協作邊緣緩存方法。但是,目前大多數基于流行度預測的緩存算法并未充分考慮內容流行度的時空動態性,且僅考慮了靜態的內容緩存策略,而沒有考慮如何維護已緩存的動態內容的時效性。
基于已有研究,本文提出一種基于內容流行度和信息新鮮度的緩存更新策略。該策略主要包含基于流行度預測的內容緩存和基于信息新鮮度的緩存更新兩方面。首先,根據用戶的歷史位置信息,使用Bi-LSTM神經網絡訓練得到用戶的移動模型,從而預測用戶在下一時段所處的位置區。然后,根據預測得到的用戶所在位置區,結合用戶偏好模型,得到各位置區內的內容流行度分布。最后,使用最流行緩存策略(Most Popular Caching, MPC)將流行內容緩存在多個霧接入點(F-APs)中[10]。針對已緩存在F-APs中的內容,本文以最小化時延為目標,為具有不同流行度分布的內容設置不同的緩存更新窗口,從而保證已緩存內容的新鮮度。仿真結果表明,所提出的算法可以有效地提升緩存命中率,在保證內容新鮮度的同時,最大限度地減小平均時延。
如圖1所示,考慮結合邊緣緩存的霧無線接入網(F-RAN)場景,其中包含云服務器,云服務器所覆蓋的若干個霧無線小區、隨機分布的提供內容的源節點及用戶。假設用戶所發出的內容請求包含靜態內容和動態內容,且該內容流行度具有時空動態性,即內容流行度會隨所處時間空間不同而改變。將圖1所示網絡又進一步劃分為若干個獨立的位置區,假設用戶可以在各個位置區之間隨機移動。令L={1,2,...,l,...,L}表 示所劃分的位置區集合,U={1,2,...,u,...,U}表示整個區域的所有用戶集合。考慮有限時間內的內容緩存情況,故將時間軸劃分為離散集合T={1,2,...,t,...,T}。在每個時間周期t內,假設用戶的位置不發生變化,用戶u在t時刻所處的位置用lu,t表 示,用Ul,t={1,2,...,ul,t,...,Ul,t}表示在t時間段處于l位置的用戶集合。假設用戶設備(User Equipment, UE)會自動記錄用戶的歷史請求信息和移動位置信息,且每個位置區都已部署一個F-AP來為UE提供包含接入、切換、內容請求等在內的服務,部署在不同位置區的F-AP可以共享整個區域內的用戶的位置信息。假設每個位置區的F-AP具有相同大小的內容存儲空間,設為C。F={1,2,...,f,...,F}代表整個系統內源節點所提供的所有內容的集合,其包含了靜態內容和動態內容,每個內容大小為φ。為了減少用戶請求時延并考慮到F-APs有限的緩存空間,只將部分流行度較高的內容緩存在F-APs中。考慮到用戶并非只會請求流行度高的內容,流行度較低的內容也可能會被請求,因此將所有的內容上傳到云中心存儲備份。

圖1 基于F-RAN的緩存系統模型
為了實現高效的內容緩存,云中心首先結合系統內的用戶信息,進行線下流行度模型訓練,并將訓練好的模型發送到F-APs處。在每個時間周期t開始時,各位置區的F-AP再結合訓練好的模型和位置區內的用戶歷史位置信息和歷史請求信息,進行線上的流行度預測,進而得到位置區內的流行度分布。根據預測得到的流行度分布,使用MPC策略將流行度高的部分內容緩存在F-AP中。假設已緩存在l位置區的靜態內容集合可表示為Sl,t={1,2,...,sl.t,...,Sl,t}, 動態內容集合表示為Cl,t={1,2,...,cl.t,...,Cl,t}。為保證所有緩存在F-APs中動態內容的時效性,需要為每個動態內容設置緩存更新窗口,令其為Wcl,t。記Alc,t為t時間段緩存在l位置動態內容c的信息年齡。若用戶所請求的動態內容cl,t已緩存在本地的F-AP處,且Alc, t≤Wcl,t,用戶將直接從FAP處下載該內容;如果Alc, t>Wcl,t則表示該動態內容已失效,F-AP需要先從源節點處獲取最新的動態內容,再傳輸給用戶,因而就產生了1次緩存命中。而當用戶請求的動態內容并沒有緩存在本地FAP時,用戶請求將會被路由到云中心,則認為緩存未命中。


由式(2)所建立的最大化緩存命中率目標函數可以看出,全局緩存命中率取決于各位置區的緩存命中率的分布,且內容流行度會隨著位置區中用戶集合的變化而變化。如果能夠對用戶的位置區進行精準預測,再將用戶位置預測和該位置區內的用戶偏好模型結合,會進一步提高內容流行度預測的精確性和針對性,從而有效提高緩存命中率。因此,所提出的基于內容流行度預測的緩存策略首先針對用戶的位置區進行預測,然后結合用戶偏好模型,得到各位置區的內容流行度分布。最后,利用最流行緩存策略將流行度高的內容緩存在F-AP中以最大化緩存命中率。
由于用戶當前所處位置與用戶的歷史位置及未來位置之間存在緊密的制約關系,獲取用戶過去位置信息的同時挖掘未來可能的位置信息顯得非常的重要。本文采用了雙向長短期記憶(Bi-directional Long-Short Term Memory, Bi-LSTM)[11]以線下線上結合的方式,對用戶的位置進行預測。其中,Bi-LSTM結合了兩種長短期記憶網絡(Long-Short Term Memory, LSTM),一種 LSTM能從前往后分析輸入的位置序列信息,另一種 LSTM能從后往前分析輸入的位置序列信息,因而將用戶歷史位置信息輸入到Bi-LSTM神經網絡進行訓練,即可得到用于預測下一時刻用戶的位置預測模型。





最后,基于預測得到的內容流行度分布,則利用MPC緩存策略將流行度較高的內容緩存在F-AP處。


圖2 緩存內容的信息年齡(AoI)變化示意圖

其中,P2問題的目標函數是最小化平均更新概率,這等價于最小化平均時延Dˉc。此外式(21)中的約束條件C1也等價于式(22)中的約束條件C1,式(22)中的約束條件C2也等價于式(21)中的約束條件C3。根據Wc和Nc的線性關系,雖然P1和P2在數學上不等價,但可以通過求解P2來找到P1的最優解。根據文獻[16]可以證明問題P2是凸的,因此可以利用凸優化工具來解決P2問題,進而得到P1的最優解,最后即可得到各緩存內容的更新窗口長度。

為了評估內容流行度預測的準確性,本文利用從MovieLens[18]網站下載的真實電影評級數據進行仿真實驗。此數據集由用戶ID、電影ID、電影類型、電影評分以及時間戳組成。電影類型一共可分為18種,這18種電影類型組成了一個18維特征矢量。當電影具有1個特征時,就將該內容特征矢量所對應的位置設置為1,否則設置為0。此外,當用戶對電影的評分≥3 時,視為用戶偏好此部電影;否則視為用戶不偏好此電影。將內容流行度預測的周期t設置為1 d。為了與位置預測結果相對應,在BALI-2的數據集中我們共提取了分布在90個位置的102名用戶的位置數據,對應于MovieLens數據集中的102個用戶信息,并假設兩個數據集所包含的用戶是相同的。由于用戶的內容請求既包含靜態內容又包含動態內容,假設每個內容請求最大為1M,其他仿真參數設置參見表1。

表1 仿真參數
圖3展示了Bi-LSTM神經網絡和LSTM神經網絡預測準確率的對比圖。從圖中可以看出Bi-LSTM的預測準確率比LSTM準確率高,這是由于相比較LSTM而言,Bi-LSTM神經網絡可以同時利用正向和反向的LSTM層,更為精準地挖掘到輸入信息中歷史位置和未來位置之間的關系。圖4展示了本文所提出的用戶位置預測方法對一個隨機選定用戶進行30 d的位置的預測結果與用戶真實位置的對比圖。可以看出,所提出的用戶預測模型在絕大多數時間段內,都能較為準確地預測出用戶所處的位置區。

圖3 Bi-LSTM和LSTM的準確率對比圖

圖4 用戶位置預測隨時間的變化
圖5展示了內容流行度預測誤差在劃分位置區和不劃分位置區的分布情況,可以看出劃分位置區的絕大多數預測誤差都分布于0-0.1,平均預測誤差為綠色橫線所示的0.0404。而不劃分位置區的平均預測誤差為橙色橫線所示的0.137。這是因為考慮位置劃分的流行度預測算法充分考慮了內容流行度與用戶位置之間的關系,因而對于內容流行度的預測更為準確。

圖5 內容流行度預測誤差
為了評估本文所提出算法的緩存性能,分別選擇了3種基準對比方法,即基于流行度已知 (最優方法)的緩存方法,最近最少使用(LRU)緩存方法以及無位置預測的緩存方法。其中,基于流行度已知 (最優方法)緩存方法是根據真實流行度的分布情況來緩存流行度較高的內容;最近最少使用(LRU)緩存方法的基本原理是當用戶有新的內容請求時,F-AP只緩存近期用戶請求過的內容,而將之前長時間未使用的內容刪除;無位置預測的緩存方法則是不考慮位置區的劃分,結合整個區域內的用戶歷史請求信息與用戶偏好模型實現流行度預測,將較為流行的內容緩存在各個F-AP中。
圖6展示了4種緩存算法緩存命中率隨F-AP緩存容量增長的變化情況。從圖6的仿真結果可以看出,隨F-AP緩存容量的增長,4種算法的緩存命中率都增長。同時,可以觀察得到本文所提算法的緩存命中率最接近于最優方法的性能,且明顯高于其他兩種對比算法。這是由于本文所提出算法充分考慮了內容流行度與用戶所處的位置之間的緊密關系,使得內容流行度的預測的結果更加準確,緩存命中率也得到了提升。而LRU緩存方法的緩存命中率最低是因為其沒有考慮內容流行度的動態變化。

圖6 緩存命中率隨F-AP緩存容量的變化情況
圖7描述了考慮不同內容流行度分布情況下基于信息年齡的最佳更新窗口結果,其中橫軸序號1-10代表內容流行度按照降序分布排列的10個內容。在仿真中,將每個F-AP能夠緩存的內容條目數設置為10,且內容流行度選取基于本文第3節的流行度預測算法得到的內容流行度分布。給定平均的AoI要求為不大于100 ms。
從圖7可以看出,利用所提出的基于信息年齡的最佳更新窗口設置算法,不同流行度的緩存內容動態地設置了不同的更新窗口,且流行度較高的內容采用了更小的更新窗口(如內容序號1),從而保證了較為流行的內容具有較高的新鮮度。圖8描述了不同內容流行度分布情況下基于信息年齡的最佳更新概率。從圖8可以看出,較流行的內容的更新概率更低,表明所提出的方案避免了F-AP頻繁地對較流行內容進行更新,因此在AoI需求和時延兩方面性能之間取得了平衡。

圖7 不同流行度內容的最佳更新窗口

圖8 不同流行度內容的最佳更新概率
圖9對比了給定不同的AoI要求,分別采用動態更新窗口和恒定更新窗口兩種情況下,服務時延的變化情況。可以看出,采用所提出的動態窗口更新方式能夠在滿足AoI的要求下,明顯降低時延。這是因為動態窗口更新算法以最小化延時為目標,能夠在滿足信息年齡的要求下,動態地選擇內容更新窗口,進而降低時延。

圖9 時延隨要求AoI的變化情況
為了提高邊緣緩存算法的緩存命中率以及保證已緩存內容的時效性,本文在霧無線接入網中提出了基于內容流行度和信息新鮮度的緩存更新策略。首先使用訓練好的Bi-LSTM神經網絡對用戶位置進行預測,從而得到用戶在下一時間段內用戶的位置區;進而結合用戶的偏好模型獲得各位置區內的內容流行度分布。考慮到F-AP有限的緩存計算能力,以最大化緩存命中率為目標,利用最流行緩存策略將流行度較高的部分內容緩存在F-AP中。此外,為了保證已緩存在F-AP處內容的新鮮度,進一步以最小化時延為目標,為具有不同流行度分布的內容設置了最優的緩存更新窗口,從而保證已緩存內容的新鮮度。仿真結果表明,所提出的緩存策略相比已有緩存策略能夠實現更高的緩存命中率。且通過為具有不同流行度的內容動態地設置更新窗口大小,能夠在保障內容的時效性的同時,有效地的減小平均服務時延。