徐丹,曾宇,孟維業(yè),李力卡
(中國電信股份有限公司研究院AI研發(fā)中心,北京 102209)
5G時代的到來將為海量設備提供網(wǎng)絡服務,以滿足泛在的連接及海量數(shù)據(jù)傳輸需求。根據(jù)《5G時代運營商數(shù)據(jù)和存儲架構白皮書》[1]的預測,到2025年,5G網(wǎng)絡中每月數(shù)據(jù)量將達到17.75 ZB,5G網(wǎng)絡容量需求顯著提升。為了滿足5G網(wǎng)絡的容量需求,在當前的5G架構下,網(wǎng)絡使用了更寬的頻譜資源[2],同時引入了大規(guī)模多輸入多輸出(massive multiple input multiple output,massive MIMO)技術,使得5G網(wǎng)絡的能耗大幅增加[3]。未來5G全面普及之后,預計到2030年,我國5G基站數(shù)量將達到1 500萬個[4],而單個5G基站的功耗是4G基站的3~4倍[5],這會帶來巨大的能源開銷。依靠現(xiàn)有網(wǎng)絡范式和體系結構來實現(xiàn)該目標將不可避免地導致能源緊縮,并帶來嚴重的經(jīng)濟和環(huán)境問題。為應對全球能源短缺和環(huán)境保護面臨的挑戰(zhàn),5G系統(tǒng)的節(jié)能技術成為當前學術界和運營商研究的重點[6]。
近年來,學術界已經(jīng)開展了一系列研究,從理論上探索5G網(wǎng)絡潛在的節(jié)能范式和體系架構。傳統(tǒng)的網(wǎng)絡節(jié)能主要通過合理的網(wǎng)絡規(guī)劃和多層關閉實現(xiàn)[7],合理的網(wǎng)絡規(guī)劃意味著通過網(wǎng)絡規(guī)劃和優(yōu)化,減少站點部署數(shù)量,以滿足網(wǎng)絡容量和節(jié)電的要求,提高覆蓋效率,同時也可以減少無效的系統(tǒng)開銷。然而5G網(wǎng)絡的復雜性使得傳統(tǒng)依賴于人工的運維手段無法滿足節(jié)能需求,具體表現(xiàn)在:第一,解決方案不靈活。為了簡化部署的復雜性,將在一個區(qū)域甚至整個網(wǎng)絡中配置統(tǒng)一參數(shù),而無須進行場景識別,這可能無法與實際流量變化相匹配;第二,該解決方案不支持可持續(xù)發(fā)展。一旦網(wǎng)絡架構發(fā)生變化(例如小區(qū)數(shù)量的增加或減少、相鄰小區(qū)關系的變化或流量的變化),先前的節(jié)能策略可能會完全無效;第三,該解決方案的適應性較差,需要大量的現(xiàn)場或遠程支持人員。隨著人工智能(artificial intelligence,AI)技術的蓬勃發(fā)展,基于AI的智能化節(jié)能方案成為未來新的技術研究熱點,通過網(wǎng)絡預測、策略調(diào)整和優(yōu)化以及實時KPI監(jiān)視,基于AI設計閉環(huán)省電解決方案,在省電和網(wǎng)絡性能之間找到平衡[8]。
同時,運營商及產(chǎn)業(yè)界對5G節(jié)能也展開了一系列的實踐探索,利用AI技術對網(wǎng)絡歷史數(shù)據(jù)進行學習,構建業(yè)務的模型,同時引入實時數(shù)據(jù)不斷訓練修正模型,實現(xiàn)對業(yè)務場景的精準預測,進而在當前環(huán)境下進行節(jié)能場景的識別、負荷的智能預測、節(jié)能策略的智能推薦,提高節(jié)能觸發(fā)的靈活性,達到智慧節(jié)能的效果[9]。
隨著5G的增長,預計到2025年,無線接入網(wǎng)能耗占網(wǎng)絡總能耗的 50.6%,數(shù)據(jù)中心占23.3%,邊緣和核心網(wǎng)占2.2%[10]。因此,在5G各個單元(如基站、核心網(wǎng)元、數(shù)據(jù)中心機房等)應用智慧節(jié)能技術勢在必行,并將期待實現(xiàn)5G端到端能效提高。
在不考慮部署場景的情況下,能源效率可以表示為[11]:

其中,i表示第i個載荷,Vi表示網(wǎng)絡每秒的流負載(byte),Ei表示處理流量負載所消耗的能量(J),iα為流量負載級別的權重。
根據(jù)式(1),能效的提升可以分為兩個方面:第一,利用更寬的頻譜資源、更多的天線、更高的調(diào)制階數(shù)等來增加流負載;第二,降低處理有效負載所消耗的能量。
參考文獻[12]中提出一種潛在的5G核心網(wǎng)絡能效KPI,可表示為:

其中,DV表示5G核心網(wǎng)絡測量的數(shù)據(jù)量,EC表示核心網(wǎng)絡消耗的能量。DV測量包括5G核心網(wǎng)絡僅用戶面測量,或者用戶面和控制面測量。
根據(jù)式(2),能效的提升可以分為兩個方面:第一,通過提高單位時間有效流量負載;第二,降低處理有效負載所消耗的能量。
在數(shù)據(jù)中心中,將常用的電源使用效率(PUE)作為能效衡量指標[13]:

其中,總用電量包括IT負載能耗、冷卻系統(tǒng)的能耗、場地和核心房間的照明、電力與配電損耗等。由于冷卻和設備散熱、設備配置、設備機房環(huán)境和大氣條件之間的關聯(lián),在運維達到一定的成熟度后,人力或?qū)<医?jīng)驗無法滿足進一步降低能耗的要求。降低數(shù)據(jù)中心總能耗,可以通過動態(tài)負載調(diào)節(jié)優(yōu)化服務器能耗[14],以及降低水冷主機、冷卻塔、熱交換器和水泵等能耗調(diào)節(jié)優(yōu)化服務器能耗。
5G基站是5G網(wǎng)絡的核心設備,提供無線覆蓋功能,實現(xiàn)有線通信網(wǎng)絡與無線終端之間的無線信號傳輸。基站的架構、形態(tài)直接影響5G網(wǎng)絡如何部署。由于頻率越高,信號傳播過程中的衰減也越大,與4G網(wǎng)絡相比,5G網(wǎng)絡需要更高的基站數(shù)量和密度,隨著覆蓋范圍、容量和站點數(shù)量的增加,基站的功耗占移動網(wǎng)絡的一半以上,甚至高達80%。因此,5G基站的節(jié)能迫在眉睫。
基站的能量消耗可以定義為:

其中,NC是組件的載波數(shù),Nse表示每個站點的扇區(qū)數(shù),PΔ表示負荷與功耗的斜率關系,χ為傳輸資源元素(RE)的數(shù)量與總RE的數(shù)量之比,0P為基站最小輸出功率,Pmax為射頻模塊每個載波上的最大輸出功率,Psleep為基站睡眠模式下的功率。從式(4)可以看出,χ=0狀態(tài)下的基站能耗更小[15]。
在LTE網(wǎng)絡中,基站節(jié)能技術應用主要通過人工設定的門限來決定是否需要開關。這種方法參數(shù)設置保守,節(jié)能效果有限,且所有的參數(shù)都是由基站統(tǒng)一設置的,無法在復雜多變的環(huán)境下做到對網(wǎng)絡環(huán)境自適應。
在5G網(wǎng)絡中,靈活的參考信號設計使基站的睡眠模式更加高效。通過設計靈活的參考信號,在不需要基站組件時將其關閉,使得基站在更長的時間內(nèi)處于χ=0的狀態(tài),從而降低了能耗Ei。例如,基站的大多數(shù)組件都不使用時,可以通過關閉其大部分組件的能量來使其進入睡眠模式。尤其在小區(qū)多層覆蓋時,通過流量預測和決定微基站的睡眠狀態(tài),并將流量遷移到宏基站,實現(xiàn)非常低的覆蓋損耗,在保障區(qū)域QoS的同時提供可能的最佳能源效率[16]。
(1)AI使能的5G基站節(jié)能技術
人工智能技術可以令基站節(jié)能技術更加智能化,實現(xiàn)全網(wǎng)運行效率最優(yōu)、綜合節(jié)能效率最優(yōu)的節(jié)能目標[17]。通過數(shù)據(jù)預測和實時監(jiān)控,基于AI的基站節(jié)能可以分為以下3個方向。
· 基于時間的節(jié)能:網(wǎng)絡負載和用戶行為可以通過歷史數(shù)據(jù)分析來預測,如自回歸綜合移動平均(autoregressive integrated moving average,ARIMA)模型、長短期記憶(long short-term memory,LSTM)和Facebook的Prophet用于時間序列預測[18]。基于單元的時間窗口無須設置統(tǒng)一的參數(shù),而是可以確保更長的激活時間以節(jié)省功耗。
· 基于閾值的節(jié)能:通過預測RRC連接的用戶和PRB的使用情況,將不同的觸發(fā)閾值用于不同的情況[19]。將預測值與基于15 min粒度的實時流量進行比較,預測準確性超過90%,這意味著逐個單元的策略和方案識別可提高可執(zhí)行性。
· 基于KPI的節(jié)能:實時監(jiān)控網(wǎng)絡KPI(例如呼叫建立成功率、掉線率、切換成功率和吞吐量、平均功耗和用戶體驗)以優(yōu)化策略,在AI省電中允許實時策略回滾[20]。
AI使能的基站節(jié)能方案需要采集無線端負載、感知數(shù)據(jù)等[21],使用AI技術識別業(yè)務場景[22],如商業(yè)區(qū)、居民區(qū)、高鐵線路等。基于歷史業(yè)務負荷數(shù)據(jù)訓練預測模型,在預測未來業(yè)務量增大時,適當關閉一些節(jié)能手段,或在預測的節(jié)能小區(qū)和節(jié)能時段觸發(fā)該小區(qū)的負荷轉(zhuǎn)移到其鄰區(qū),負荷轉(zhuǎn)移完成后立即觸發(fā)該小區(qū)的節(jié)能[23]。業(yè)務流量預測模型主要根據(jù)歷史小區(qū)信息以及環(huán)境因素的特征,利用神經(jīng)網(wǎng)絡找到這些特征值和模型的對應關系,確定權重矩陣和梯度后構造,表1給出一些網(wǎng)絡流量預測模型。根據(jù)預測結果進行節(jié)能策略最優(yōu)選擇、實時調(diào)整、自動更新和執(zhí)行,實行差異化的閾值調(diào)整門限,滿足預設的KPI和節(jié)能目標[24]。多基站協(xié)同節(jié)能的方法是將相鄰基站的歷史信息加入上述的模型進行聯(lián)合模型的預測,使預測結果更精確[25]。同時也可以自動識別多層覆蓋小區(qū)、基礎覆蓋小區(qū)和補熱小區(qū),熱點覆蓋小區(qū)可根據(jù)業(yè)務量變化、多網(wǎng)覆蓋狀態(tài)等進入節(jié)能模式,實現(xiàn)節(jié)能效果。
(2)AI使能的基站節(jié)能試點應用
某試點區(qū)域5G站點采用AI節(jié)能技術,首先進行數(shù)據(jù)(包括OMC數(shù)據(jù)、DPI數(shù)據(jù)、MR/工參、話單數(shù)據(jù)等)采集,然后對數(shù)據(jù)進行融合處理包括清洗(去噪、填充)、關聯(lián)、稽核。通過試點小區(qū)的歷史數(shù)據(jù)構建無監(jiān)督學習分析潮汐結構、模式,挖掘試點小區(qū)在不同周期(月內(nèi)、周內(nèi))的無線資源、業(yè)務負荷等特征,為其建立不同周期級別的潮汐檔案。基于試點小區(qū)的潮汐結構和業(yè)務指標的時序預測結果,結合場景識別、共覆蓋分析情況,生成試點小區(qū)的安全節(jié)能建議(包含小區(qū)最佳節(jié)能時段、節(jié)能功能(符號關斷、載波關斷、通道關斷等)的推薦),然后配置OMC及指令集,并自動完成執(zhí)行策略實施后的網(wǎng)絡性能、節(jié)能情況分析,利用強化學習(Q-learning)與操作交互結果獲得最大獎賞/懲罰(預先設定)優(yōu)化參數(shù)調(diào)整。
5G基站應用AI節(jié)能策略的同時亦評估對網(wǎng)絡業(yè)務的影響,支持突發(fā)事件早期感知智能剎車/喚醒。基于AI的預見性基站節(jié)能能夠?qū)崿F(xiàn)節(jié)能時段的精細選擇,延長節(jié)能時長,同時保障用戶感知。

表1 網(wǎng)絡流量預測模型
核心網(wǎng)作為“管理中樞”,負責管理數(shù)據(jù),對數(shù)據(jù)進行處理和路由交換。由于數(shù)據(jù)密集型應用程序不斷普及,連接到互聯(lián)網(wǎng)的設備數(shù)量不斷增加,互聯(lián)網(wǎng)流量已經(jīng)呈指數(shù)級增長。在經(jīng)濟、環(huán)境和社會影響的驅(qū)動下,學術界和工業(yè)界對核心網(wǎng)的能耗開展了一系列研究,目標為有效提高能源效率。
隨著軟件定義網(wǎng)絡(software defined network,SDN)和網(wǎng)絡功能虛擬化(network functions virtualization,NFV)的出現(xiàn),核心網(wǎng)元的功能實現(xiàn)可以通過SDN進行定義,進而通過網(wǎng)絡云中的虛擬網(wǎng)絡功能(virtualized network functions,VNF)來實現(xiàn)。虛擬化可能成為一種非常有用的降低能源消耗的方法,硬件充當同時運行多個應用程序的承載,可節(jié)省額外部署專用硬件和軟件組件[32]的成本。參考文獻[33]提出了在接入網(wǎng)絡和核心網(wǎng)絡中使用虛擬網(wǎng)元節(jié)點,相比于使用物理網(wǎng)元節(jié)點執(zhí)行單一功能的結構,虛擬網(wǎng)元有顯著節(jié)能優(yōu)勢(如資源分配的靈活性、單個節(jié)點運行多個虛擬化接入/核心網(wǎng)功能)。虛擬化網(wǎng)元在不工作時休眠,根據(jù)工作負載隨時準備激活這些功能。
在3GPP框架下,3GPP SA5正在針對5G核心網(wǎng)以及切片的能效 KPI 進行標準化研究,利用3GPP R17的管理服務框架有可能實現(xiàn)利用管理服務對網(wǎng)元的能效KPI進行標準化測量和收集[25]。
5G核心網(wǎng)中應用AI技術,可以根據(jù)網(wǎng)絡流量的變化趨勢,調(diào)節(jié)虛擬網(wǎng)元資源占用情況,在不影響網(wǎng)絡提供服務關鍵性能指標的前提下,降低能量消耗,提高網(wǎng)絡的能量效率,從而達到節(jié)能的目的。
針對核心網(wǎng)控制面和用戶面的資源使用和流量變化趨勢調(diào)整資源分配,需要采集相關數(shù)據(jù),包括但不限于:各網(wǎng)元實例的業(yè)務量、最大服務用戶數(shù)、能耗數(shù)據(jù)、資源使用數(shù)據(jù)、NF級性能測量數(shù)據(jù)和網(wǎng)絡級KPI數(shù)據(jù)等。
基于網(wǎng)絡流量的歷史數(shù)據(jù),需要對網(wǎng)絡流量變化趨勢進行預測。網(wǎng)元實例流量的精準預測可以幫助推動節(jié)能的網(wǎng)絡決策,然而網(wǎng)絡流量在時間和空間上具有不均勻性、用戶在一天的不同時刻和不同的地方有不同的QoS要求以及用戶的移動性等使網(wǎng)絡流量預測面臨挑戰(zhàn),所以模型算法需要根據(jù)監(jiān)測數(shù)據(jù)不斷更新迭代。
基于網(wǎng)絡流量的預測數(shù)據(jù),可以智能地調(diào)整VNF的資源分配,例如根據(jù)VNF實例上的負載統(tǒng)計及預測情況,將資源利用率低的VNF實例上的負載遷移到特定的少數(shù)專用VNF實例上,從而產(chǎn)生更多的空負載的VNF實例,對這些VNF實例占用的資源進行重分配(或回收),提高核心網(wǎng)的能量效率KPI。參考文獻[34]提出一種基于半監(jiān)督機器學習的資源需求新模型,參考文獻[35]使用深度學習實現(xiàn)NFV中的資源分配。
以節(jié)能為目的,同時考慮用戶的QoS(QoE)需求,在滿足用戶需求的前提下,降低VNF的資源占用,從而在節(jié)能和網(wǎng)絡需求層面達到均衡。參考文獻[36]使用了Facebook數(shù)據(jù)中心的真實生活數(shù)據(jù),在已經(jīng)建立的包括移動管理實體、服務網(wǎng)關、分組數(shù)據(jù)網(wǎng)網(wǎng)關和策略、收費功能等基礎設施之上進行了真實的估算,在工作隊列下通過改變不同的因素(包括VNF的總數(shù)、可用的服務器總數(shù)以及傳入的速度、整個系統(tǒng)容量和虛擬機的設置時間等不同參數(shù)),比較了消耗功率和服務器的響應時間,旨在基于動態(tài)自動縮放算法(dynamic auto scaling algorithm,DASA),為運營商提供一種更好地理解其成本與性能之間的權衡的方法。
隨著5G時代的到來,各類數(shù)據(jù)的需求增長,數(shù)據(jù)中心大量能耗帶來的問題也引起了廣泛的關注。
影響數(shù)據(jù)中心能耗主要由3個部分組成,分別是IT設備、制冷系統(tǒng)和配供電系統(tǒng)。其中,IT設備和制冷系統(tǒng)能耗占數(shù)據(jù)中心總能耗的80%以上,因此對IT設備和制冷系統(tǒng)的運行模式和控制方式進行優(yōu)化對數(shù)據(jù)中心節(jié)能具有重要意義。
(1)AI使能的數(shù)據(jù)中心節(jié)能技術
服務器主要進行數(shù)據(jù)傳輸和路由交換,服務器設計通常會提供對數(shù)據(jù)的最大處理和路由交換能力,但是在使用的數(shù)據(jù)量較少時,服務所提供流量會產(chǎn)生冗余,并且傳輸大部分時間遠高于實際的使用流量,也就是說即使服務器空閑也會發(fā)生大量的能耗。
通過使用人工智能技術,可以基于歷史數(shù)據(jù)訓練學習得到業(yè)務模式變化和服務器運轉(zhuǎn)對能耗的影響規(guī)律,對未來業(yè)務負載進行預測并迭代更新,當業(yè)務負載較少時進行業(yè)務遷移,將一部分服務器轉(zhuǎn)到休眠狀態(tài)。此外,當預測業(yè)務負載顯著增加時,可以將必要數(shù)量的服務器喚醒并重新進行業(yè)務負載的引導和分配。通過分析數(shù)據(jù)中心不同業(yè)務的負載特征,發(fā)掘節(jié)能潛質(zhì),實現(xiàn)設備休眠和喚醒,達到綠色節(jié)能的效果[37]。
數(shù)據(jù)中心通常采用過度冷卻的方法,將溫度設定為較低的溫度以確保服務器穩(wěn)定運行不出現(xiàn)較熱的問題,這會導致極大的能源浪費。傳統(tǒng)的溫度控制方法依靠定時采集溫度數(shù)據(jù)作為判定依據(jù),具有很大的時延。同時溫度特性及環(huán)境的復雜性導致傳統(tǒng)控制難以達到需求。
利用AI的機房節(jié)能策略可以以機房冷卻系統(tǒng)為監(jiān)控對象,進行機房溫度信息采集、溫度數(shù)據(jù)采集、溫度的預測和機房溫度的控制[38]。
數(shù)據(jù)采集除了機房溫度信息,還包括但不限于IT負載耗電量、末端空調(diào)耗電量、風機輸出、溫度設置、水冷機組各部件耗電量(此為水冷數(shù)據(jù)中心需要)等。
基于AI的智能控制通過對知識信息的學習和推理,并通過啟發(fā)式的方法求解,神經(jīng)網(wǎng)絡控制是指在控制系統(tǒng)中應用神經(jīng)網(wǎng)絡技術,對難以精確建模的復雜非線性對象進行神經(jīng)網(wǎng)絡模型辨識。神經(jīng)網(wǎng)絡控制的基本思想:假設被控對象輸入u與輸出y滿足非線性關系y=g(u), 控制的作用就是確定最佳的輸入,從而使系統(tǒng)輸出達到期望值。參考文獻[39]利用BP算法作為控制器用于車站溫度的控制;參考文獻[40]將徑向神經(jīng)網(wǎng)絡和常規(guī)的PID結合,達到控制室內(nèi)溫度的目的;參考文獻[41]將機房溫度值和設備負載輸入神經(jīng)網(wǎng)絡,輸出空調(diào)的節(jié)能控制參數(shù),使環(huán)境溫度維持在正常范圍。
數(shù)據(jù)中心利用AI技術對機房溫度進行預測可以有效地解決利用經(jīng)驗對溫度的預測和估計帶來的可靠性低的問題[42]。
參考文獻[43]提出一種基于強化學習算法的數(shù)據(jù)中心機房控制方法,獲取當前時刻來自環(huán)境的狀態(tài)量(包括機房各個通道中傳感器的數(shù)值),基于預先訓練的強化學習模型得到當前時刻的控制參數(shù),控制數(shù)據(jù)中心機房的溫度調(diào)節(jié)設備的工作狀態(tài),直至數(shù)據(jù)中心機房的溫度穩(wěn)定,達到節(jié)能的目的。
除了對末端機房制冷設備控制,水冷數(shù)據(jù)中心的水冷機組的能效控制尤為重要。參考文獻[44]利用神經(jīng)網(wǎng)絡模型建立PUE預測模型,實施制冷系統(tǒng)參數(shù)設定,優(yōu)化了PUE指標。通過分析不同數(shù)據(jù)中心的PUE差異,水冷機組可以采用控制制冷主機運行臺數(shù)、降低冷卻塔出水溫度和提升冷凍水水溫等措施實現(xiàn)能效優(yōu)化[45]。
(2)AI使能的制冷設備節(jié)能試點應用
某試點數(shù)據(jù)中心采用冰蓄冷技術,即可在用電低谷期使用電制冷機制冰,將冷量儲存在冰池中,在用電高峰期將儲存的冷量釋放,在不同季節(jié)不同負載的情況下可選擇不同的工況運行模式。
在該試點數(shù)據(jù)中心的末端機房部署有機柜級溫/濕度傳感器,采集IT設備和空調(diào)設備能耗的智能電表。通過采集4個月的歷史數(shù)據(jù),采集頻率為每小時1條,數(shù)據(jù)包括機柜溫度、末端空調(diào)運行參數(shù)、機柜功率、末端空調(diào)功率、主機功率、主機運行參數(shù)等,訓練機器學習模型,輸出制冷設備的參數(shù)設置包括末端空調(diào)參數(shù)設置(空調(diào)啟停、空調(diào)溫濕度設置等)以及主機參數(shù)設置(主機運行模式、泵頻率設定、冷凝溫度設定值等),從而制定該試點數(shù)據(jù)中心制冷設備的節(jié)能調(diào)整策略并實施。通過應用AI技術建模分析制冷冗余,降低了試點機房的制冷能耗。
雖然AI使能的節(jié)能技術在學術界引起了廣泛的研究,并在產(chǎn)業(yè)界獲得一些應用基礎,然而在系統(tǒng)級建模、綜合能效評估等方面仍存在一些挑戰(zhàn),基于此提出以下未來的研究和發(fā)展方向。
數(shù)字孿生是虛擬世界與真實世界的動態(tài)連接,通過建立數(shù)字孿生模型,可實現(xiàn)物理系統(tǒng)與虛擬模型結合,具有可見性、預測性、假設分析支持和多系統(tǒng)互聯(lián)的特征。
通過數(shù)字孿生建模接入網(wǎng)絡,模型能夠擬合和反映物理網(wǎng)絡的環(huán)境和特點,可模擬虛擬系統(tǒng)在覆蓋小區(qū)的用戶移動,業(yè)務流量的增加、減小,以及不同節(jié)能功能使用時的響應,在復雜動態(tài)空間通過智能分析決策找到不同環(huán)境下最適宜的節(jié)能方式,既能夠提高無線系統(tǒng)能效又不影響用戶體驗。
通過數(shù)字孿生建模數(shù)據(jù)中心,是一種實現(xiàn)數(shù)據(jù)中心精密空調(diào)節(jié)能運行的潛在方案。在虛擬模型中,可模擬IT負載、外部環(huán)境溫度以及空調(diào)控制設定值等變更即時響應機房內(nèi)的熱環(huán)境變化,通過調(diào)試可以彌補經(jīng)驗數(shù)據(jù)的不足,輸出空調(diào)控制的優(yōu)化設定值,既能滿足機房內(nèi)的制冷需求,又能降低機房PUE指標。
數(shù)字孿生和人工智能結合應用在系統(tǒng)節(jié)能時,可模擬環(huán)境狀態(tài)動態(tài)變化以及節(jié)能策略執(zhí)行對系統(tǒng)的影響,有效保障在應用節(jié)能策略時避免影響系統(tǒng)性能。
綠色通信的研究必須從整體上考慮,這涵蓋了通信生態(tài)系統(tǒng)的方方面面,有必要從系統(tǒng)的角度考慮能效解決方案。首先,除了系統(tǒng)使用階段所消耗的能量外,用于制造電信設備的隱含能量在任何能效解決方案的評估中也起著重要的作用。任何用于能效改進的新體系結構和設備的引入都應該考慮系統(tǒng)生命周期中消耗的總能量[46]。此外,系統(tǒng)某一點的能效優(yōu)化可能導致其他點的次優(yōu)結果,需采用端到端的視角來評估網(wǎng)絡能源效率和能源消耗[47]。
各類節(jié)能技術的有效集成有望優(yōu)化系統(tǒng)能源消耗,但是整個系統(tǒng)的能源消耗建模、能效指標的使用和系統(tǒng)級能效設計面臨挑戰(zhàn)。系統(tǒng)級能效設計的目標是改善整個系統(tǒng)/網(wǎng)絡的能效,同時不影響QoS。
現(xiàn)有的機器學習(ML)算法能識別大型數(shù)據(jù)集的分析規(guī)律性,但是當在應用程序級關聯(lián)時,其功效性和外部有效性不足[48]。
當前AI算法應用在系統(tǒng)節(jié)能時,依賴于大量數(shù)據(jù)。在存量數(shù)據(jù)中心中,數(shù)據(jù)條件具備情況差異很大,按照具備較好數(shù)據(jù)的數(shù)據(jù)中心訓練的AI模型可能在其他機房完全不具備部署條件,因為很多數(shù)據(jù)中心在設計建設之初未考慮各類機房狀態(tài)和參數(shù)監(jiān)控。數(shù)據(jù)中心應用AI技術需要基礎的訓練數(shù)據(jù)集,但是對于已投入使用的數(shù)據(jù)中心,各類數(shù)據(jù)采集涉及的改造是一個很大的挑戰(zhàn)。
為了使AI算法具備更好的部署性和外部適用性,需要研究訓練數(shù)據(jù)縮減方法以開發(fā)完全自主的系統(tǒng)。
專用硬件平臺不斷增長的計算能力為ML解決方案提供了基礎,然而不斷提高模型精度所需的計算資源和產(chǎn)生的能源消耗不容忽視。利用分布式、計算高效和能量高效的方式訓練ML將成為一種研究方向,如聯(lián)邦學習[49],可緩解傳統(tǒng)的、集中的ML方法造成的低能效問題。此外,當找到接近最優(yōu)的解決方案時,也可以使用定制的及時停止來終止訓練過程,從而減少訓練ML模型所需的迭代次數(shù)和相關的能量消耗[50]。
ML的綠色應用還需要在優(yōu)化算法的設計階段評估計算和能源消耗,即在評估ML模型時除了準確性和優(yōu)化指標外,還必須考慮計算效率和能源消耗。使用這些指標,可以設計得到收斂速度更快和消耗計算資源和能耗更少的ML模型。
對5G接入網(wǎng)絡、核心網(wǎng)絡和數(shù)據(jù)中心的能源效率評估方法進行了調(diào)研,基于降低系統(tǒng)能耗及提高能效,介紹了AI使能的基站節(jié)能技術,包括無線網(wǎng)絡數(shù)據(jù)采集、場景識別、業(yè)務流量預測、節(jié)能策略推薦、基站協(xié)同節(jié)能控制及試點應用;其次介紹了AI應用于5G核心網(wǎng)的節(jié)能方式,包括核心網(wǎng)控制面和用戶面的數(shù)據(jù)采集、網(wǎng)絡流量預測以及VNF的資源分配;并介紹了AI用于降低數(shù)據(jù)中心制冷設備能耗的技術和試點應用;最后提出了節(jié)能技術的未來研究和發(fā)展方向,提供了端到端AI節(jié)能技術的全景。“能效管理、綠色發(fā)展”是未來網(wǎng)絡發(fā)展的目標,端到端AI智能化節(jié)能手段的應用能夠緩解運營商的能耗壓力,并提升運維效率,將促進企業(yè)轉(zhuǎn)型升級及可持續(xù)發(fā)展,從而實現(xiàn)經(jīng)濟、社會、生態(tài)效益的多贏局面。