何濤 曹暢 唐雄燕 李銘軒 李建飛



【摘? 要】首先闡述了6G時代中算力網(wǎng)絡(luò)存在的意義,并簡要說明了算力網(wǎng)絡(luò)分層結(jié)構(gòu),然后,結(jié)合算力網(wǎng)絡(luò)(CPN)控制技術(shù),詳細(xì)說明了分布式控制及集中式控制的工作原理,并對算力網(wǎng)絡(luò)中的異構(gòu)計算資源納管進(jìn)行了描述,最后詳細(xì)分析了整個算力網(wǎng)絡(luò)分層架構(gòu)中各層的作用及構(gòu)成,并對算力網(wǎng)絡(luò)未來的發(fā)展進(jìn)行了總結(jié)與展望。
【關(guān)鍵詞】算力網(wǎng)絡(luò);分布式控制;集中式控制;異構(gòu)計算資源
0? ?引言
2019年是5G元年,雖然全球5G商用已經(jīng)起步,但是5G相比于4G的殺手級應(yīng)用尚未脫穎而出,整個社會對于5G的應(yīng)用有待挖掘。與此同時,世界上對于6G技術(shù)的研究也已起步,雖然5G的明天及6G世界的藍(lán)圖尚未明確,但可以預(yù)見,在未來社會,尤其是步入到6G社會時,數(shù)字化程度日益增強(qiáng),終端連接數(shù)量日益增多,數(shù)據(jù)驅(qū)動全球化日益加快等,許多人們期盼的服務(wù),比如可穿戴設(shè)備和自動駕駛等,都將非常依賴實時的數(shù)據(jù)處理及超大容量的設(shè)備連接。6G時代,通信及其相關(guān)技術(shù)的發(fā)展將遠(yuǎn)遠(yuǎn)超過5G時代,包括泛在連接、泛在計算、數(shù)字孿生網(wǎng)絡(luò)及區(qū)塊鏈網(wǎng)絡(luò)等,將使我們的日常生活更加便利和安全,也將顯著地提高商業(yè)的效率,這一切都將以6G時代強(qiáng)大的信息處理能力,即算力為基礎(chǔ)。
1? ? 算力網(wǎng)絡(luò)概述
由于工藝的約束,單芯片的算力在5 nm之后將接近頂峰,傳統(tǒng)集約化的數(shù)據(jù)中心算力和智能終端的算力可增長的空間也面臨極大挑戰(zhàn),為了滿足未來6G時代整個社會對信息處理的巨大算力需求,需要將大量閑散算力進(jìn)行統(tǒng)一管理和調(diào)度,通過網(wǎng)絡(luò)將閑散計算資源節(jié)點(diǎn)連接在一起,再通過網(wǎng)絡(luò)的方式將計算資源提供給需要的應(yīng)用和服務(wù),供用戶使用。這種基于網(wǎng)絡(luò)匯聚計算資源,對算力進(jìn)行統(tǒng)一管理和調(diào)度,為上層業(yè)務(wù)提供算力服務(wù),并最終為用戶提供應(yīng)用的系統(tǒng),我們稱之為算力網(wǎng)絡(luò)[1]。
如圖1所示,算力網(wǎng)絡(luò)自下而上,可分為基礎(chǔ)設(shè)施層、平臺資源層和業(yè)務(wù)應(yīng)用層。基礎(chǔ)設(shè)施層將計算資源、存儲資源、網(wǎng)絡(luò)資源等基礎(chǔ)設(shè)施進(jìn)行整合,以虛擬機(jī)或者容器的方式為上層提供業(yè)務(wù)承載,并可將閑散資源以服務(wù)的形式提供給最終用戶;平臺資源層在基礎(chǔ)設(shè)施層支撐的基礎(chǔ)上進(jìn)行能力構(gòu)建,一方面對下層進(jìn)行管理和調(diào)度,一方面以組件的方式為上層應(yīng)用提供服務(wù);業(yè)務(wù)應(yīng)用層以應(yīng)用軟件的方式為用戶提供最終服務(wù),并通過對下層能力及資源的調(diào)用來實現(xiàn)其業(yè)務(wù)功能。
2? ?算力網(wǎng)絡(luò)控制技術(shù)
算力網(wǎng)絡(luò)最終的目的是以應(yīng)用服務(wù)的形式為用戶提供計算資源,而計算資源位于基礎(chǔ)設(shè)施層,物理位置一般也與用戶不同,這就需要借助網(wǎng)絡(luò)功能將用戶需要處理的任務(wù)傳送到計算資源處。在初始的網(wǎng)絡(luò)中,計算資源的位置及其具備的資源量,對于用戶和整個算力網(wǎng)絡(luò)來說都是未知的,需要借助通信報文作為載體,按照特定的協(xié)議在網(wǎng)絡(luò)中進(jìn)行交互,完成計算資源信息的共享。
在TCP/IP的體系架構(gòu)中,只要授權(quán)的計算資源IP可達(dá),我們就可以認(rèn)為這些計算資源是可用的,所以承載計算資源信息的通信協(xié)議可以位于網(wǎng)絡(luò)層之上(包括網(wǎng)絡(luò)層)的任意層,它們以網(wǎng)絡(luò)層協(xié)議為基礎(chǔ),將計算資源信息基于IP報文進(jìn)行轉(zhuǎn)發(fā)。
2.1? CFN協(xié)議的設(shè)計思路
算力網(wǎng)絡(luò)中可基于CFN(Computing First Network,計算優(yōu)先網(wǎng)絡(luò))協(xié)議進(jìn)行計算資源信息的控制分發(fā),CFN協(xié)議的設(shè)計初衷是為了解決MEC部署復(fù)雜、效率低、資源復(fù)用率不高等問題,它使網(wǎng)絡(luò)能夠具備內(nèi)建計算業(yè)務(wù)動態(tài)路由的能力。CFN協(xié)議通過將計算資源狀況和網(wǎng)絡(luò)狀況作為路由信息發(fā)布到網(wǎng)絡(luò),并基于虛擬的服務(wù)ID將計算任務(wù)報文路由到最合適的計算節(jié)點(diǎn),可以達(dá)到用戶體驗最優(yōu)、計算資源利用率最優(yōu)、網(wǎng)絡(luò)效率最優(yōu)的目的。
CFN協(xié)議繼承了傳統(tǒng)標(biāo)簽轉(zhuǎn)發(fā)協(xié)議的設(shè)計思路,承載在IP網(wǎng)絡(luò)之上,在相鄰的支持CFN協(xié)議的路由器之間建立會話,并借助路由協(xié)議將獲取的計算資源信息發(fā)布給相鄰的CFN路由器,實現(xiàn)計算資源信息的全網(wǎng)擴(kuò)散[2]。同時,CFN路由器根據(jù)不同的服務(wù)構(gòu)建服務(wù)路由信息表,引導(dǎo)業(yè)務(wù)報文以服務(wù)ID為目的地址進(jìn)行轉(zhuǎn)發(fā),從而以服務(wù)的方式實現(xiàn)分散計算資源的利用,如圖2所示:
2.2? CFN協(xié)議的工作原理
在算力網(wǎng)絡(luò)中,要實現(xiàn)計算資源信息的整合以及隨時隨地的計算資源信息使用,就必須完成信息的全網(wǎng)同步。CFN路由器負(fù)責(zé)本地計算資源信息的搜集,通過IP報文或者路由協(xié)議報文將信息進(jìn)行全網(wǎng)擴(kuò)散,所有的CFN路由器根據(jù)獲得的完整計算資源信息并結(jié)合網(wǎng)絡(luò)的拓?fù)湫畔⒃诒镜厣煞?wù)路由信息表,用于指導(dǎo)業(yè)務(wù)報文轉(zhuǎn)發(fā),具體的實現(xiàn)流程及詳細(xì)闡述如下文所述。
例如,在圖3中,CFN路由器A和D連接了本地的計算資源節(jié)點(diǎn),CFN路由器B和C負(fù)責(zé)網(wǎng)絡(luò)中A和D的連通。①CFN路由器A和D完成本地計算資源信息的搜集,搜集過程可以采用本地計算資源節(jié)點(diǎn)將計算資源信息注冊給CFN路由器的方式,也可以采用CFN路由器周期性的進(jìn)行信息采集的方式;②CFN路由器A和D將計算資源信息承載在IP協(xié)議或者路由協(xié)議中,發(fā)布給網(wǎng)絡(luò)中的其它CFN路由器,實現(xiàn)信息的全網(wǎng)共享;③CFN路由器根據(jù)獲取到的全網(wǎng)信息,并結(jié)合通過路由協(xié)議了解到的網(wǎng)絡(luò)拓?fù)洌诒镜厣煞?wù)路由信息表,以指導(dǎo)業(yè)務(wù)報文的轉(zhuǎn)發(fā)。
特別需要指出的是,在圖3中,路由器B和C作為中轉(zhuǎn)路由器,可以不必支持CFN協(xié)議,因為計算資源信息是承載在IP協(xié)議或路由協(xié)議中,B和C只需要將攜帶計算資源信息的IP報文或者路由協(xié)議報文進(jìn)行轉(zhuǎn)發(fā),而對于報文中的CFN相關(guān)信息不進(jìn)行解析。
2.3? 集中式控制
隨著IT技術(shù)的發(fā)展,各類應(yīng)用層出不窮,而不同應(yīng)用對計算資源的需求側(cè)重點(diǎn)會有所不同,例如二維圖片的處理對CPU要求更高、視頻和AI的處理對GPU的要求更高、網(wǎng)絡(luò)報文的處理對NPU的要求更高等。根據(jù)不同的應(yīng)用服務(wù)及所需計算資源的不同,在算力網(wǎng)絡(luò)路由器上會生成不同的服務(wù)路由信息條目,每臺算力網(wǎng)絡(luò)路由器上的每條服務(wù)路由信息條目都會根據(jù)計算資源需求的不同指導(dǎo)轉(zhuǎn)發(fā)。
當(dāng)應(yīng)用服務(wù)數(shù)量巨大,網(wǎng)絡(luò)規(guī)模龐大時,每臺路由器針對每個應(yīng)用服務(wù)都需要獲取全網(wǎng)信息后再獨(dú)立進(jìn)行路徑的計算,此時,整個網(wǎng)絡(luò)維護(hù)工作量是無法接受的,而且目前對于CFN協(xié)議關(guān)于匯聚、IGP與BGP之間的交互以及AS之間的交互細(xì)節(jié)研究尚未成熟,所以為了算力網(wǎng)絡(luò)運(yùn)行的可行性,我們需要對算力網(wǎng)絡(luò)進(jìn)行統(tǒng)一的管理,將信息的同步及路徑的計算集中化,將服務(wù)路由信息表項完成計算后再下發(fā)給路由器,路由器只負(fù)責(zé)數(shù)據(jù)層面的業(yè)務(wù)報文轉(zhuǎn)發(fā),這與SDN的思想是一致的[3]。
前文所描述的CFN協(xié)議是基于分布式架構(gòu)的,集中式架構(gòu)與分布式架構(gòu)的不同在于路由器之間不需要直接通信,也不需要通過本地計算生成服務(wù)路由信息表,只需要根據(jù)算力網(wǎng)絡(luò)控制器的下發(fā)表項,在本地生成表項指導(dǎo)轉(zhuǎn)發(fā)即可。在集中式架構(gòu)的設(shè)計中,為了確定是將計算資源信息直接發(fā)送給算力網(wǎng)絡(luò)控制器,由算力網(wǎng)絡(luò)控制器統(tǒng)一進(jìn)行計算,還是沿用在分布式架構(gòu)中的思想,將計算資源信息發(fā)送給路由器,再由路由器發(fā)送給算力網(wǎng)絡(luò)控制器的方式,我們考慮到,相比路由器,計算資源節(jié)點(diǎn)數(shù)量龐大,如果每一個計算資源節(jié)點(diǎn)都需要與算力網(wǎng)絡(luò)控制器進(jìn)行通信,那么對于算力網(wǎng)絡(luò)控制器來說壓力過大,所以,最終我們采用的是路由器繼續(xù)承擔(dān)計算資源信息搜集的責(zé)任,詳細(xì)的集中式控制架構(gòu)下工作流程如圖4所示[4]。
①路由器A和D完成本地計算資源信息的搜集,搜集過程可以采用本地計算資源節(jié)點(diǎn)將計算資源信息注冊給路由器的方式,也可以采用路由器周期性的進(jìn)行信息采集的方式;②路由器A和D將計算資源信息承載在IP協(xié)議或者路由協(xié)議中,發(fā)布給算力網(wǎng)絡(luò)控制器;③算力網(wǎng)絡(luò)控制器根據(jù)完整的計算資源信息,結(jié)合完成的網(wǎng)絡(luò)拓?fù)溆嬎悖煞?wù)信息流表;④算力網(wǎng)絡(luò)控制器將服務(wù)信息流表下發(fā)給路由器A和D;⑤路由器A和D根據(jù)接收到的算力網(wǎng)絡(luò)控制器信息,在本地生成服務(wù)信息流表用于指導(dǎo)業(yè)務(wù)報文的轉(zhuǎn)發(fā)。
3? ?異構(gòu)計算資源的統(tǒng)一管理
在互聯(lián)網(wǎng)剛剛興起的時候,網(wǎng)頁訪問應(yīng)用占據(jù)主導(dǎo),訪問量也十分有限,一般一個網(wǎng)站租用幾臺服務(wù)器就可以滿足大部分時間的業(yè)務(wù)訪問,但隨著互聯(lián)網(wǎng)的發(fā)展,在21世紀(jì)初期,越來越多網(wǎng)絡(luò)應(yīng)用興起,各互聯(lián)網(wǎng)公司為了業(yè)務(wù)的發(fā)展,需要投入大量的成本采購硬件設(shè)備,同時也要求提高運(yùn)營效率,節(jié)約能源,以降低經(jīng)濟(jì)成本和空間浪費(fèi),從而促使VMware和OpenStack為代表的虛擬化技術(shù)應(yīng)運(yùn)而生。移動互聯(lián)網(wǎng)以及電子商務(wù)的進(jìn)一步飛速發(fā)展,對于云計算服務(wù)的要求進(jìn)一步提升,容器技術(shù)則以其輕量化和靈活性,在大規(guī)模突發(fā)訪問量的場景下逐漸替代了高資源消耗的虛擬機(jī)技術(shù)。所以,互聯(lián)網(wǎng)發(fā)展至今,鑒于各自適用的場景,裸機(jī)(物理機(jī))、虛擬機(jī)、容器則成為云計算中提供計算服務(wù)的三種主流形式[5]。
用戶獲取算力時,并不關(guān)心底層的硬件資源形態(tài)以及調(diào)用計算資源的操作系統(tǒng),只關(guān)心能夠隨時隨地方便地使用算力,所以在算力網(wǎng)絡(luò)中,需要一個能夠承上啟下的中間層,對于下層,它能將各種形態(tài)的計算資源歸一化,能與各種操作系統(tǒng)及平臺對接,對于上層,它能將算力信息無差別的上報[6]。
網(wǎng)絡(luò)協(xié)議負(fù)責(zé)計算資源信息的傳播,其本身并無法直接承擔(dān)與計算資源進(jìn)行通信的角色,所以我們考慮在網(wǎng)絡(luò)層之下構(gòu)建一個組件來與底層計算資源進(jìn)行交互,并由這個組件將計算資源信息編碼加載到網(wǎng)絡(luò)協(xié)議報文中,這個中間層被稱之為算力網(wǎng)絡(luò)代理層。如圖5所示,算力網(wǎng)絡(luò)代理層與目前主流的云平臺及操作系統(tǒng)進(jìn)行信息交互,通過云平臺或操作系統(tǒng)獲取計算資源信息,然后進(jìn)行信息編碼,交由上層網(wǎng)絡(luò)協(xié)議發(fā)布,從而實現(xiàn)異構(gòu)計算資源的統(tǒng)一管理[7]。
4? ?算力網(wǎng)絡(luò)架構(gòu)
如圖6所示,算力網(wǎng)絡(luò)從底層硬件獲取計算資源,通過資源整合、網(wǎng)絡(luò)分發(fā)、算力提取,最終通過算力共享平臺為用戶提供應(yīng)用服務(wù),自下而上可分為基礎(chǔ)設(shè)施層、平臺資源層和業(yè)務(wù)應(yīng)用層[8]。
基礎(chǔ)設(shè)施層是所有上層的基礎(chǔ),包括服務(wù)器、存儲、網(wǎng)絡(luò)設(shè)備等硬件設(shè)備以及在硬件設(shè)備基礎(chǔ)上部署的主機(jī)操作系統(tǒng)、云操作系統(tǒng)及虛擬化網(wǎng)絡(luò)功能等。從物理位置上講,它不僅包括一個機(jī)柜、一個機(jī)房的物理設(shè)施,而且涵蓋了一個數(shù)據(jù)中心以及多個數(shù)據(jù)中心的跨地域資源整合,通過網(wǎng)絡(luò)提供通信確保分布式部署以及提供計算資源信息分發(fā)功能,為上層提供整體的計算能力。
平臺資源層為業(yè)務(wù)應(yīng)用層算力網(wǎng)絡(luò)共享平臺提供能力整合,在這一層完成計算資源的能力化,直接提供給業(yè)務(wù)應(yīng)用層的應(yīng)用進(jìn)行使用。在平臺資源層部署的控制器是為了實現(xiàn)路由器的集中控制,并通過算力網(wǎng)絡(luò)編排系統(tǒng),完成算力網(wǎng)絡(luò)的資源編排以及資源調(diào)度,并通過在編排系統(tǒng)中進(jìn)行策略設(shè)置,實現(xiàn)計算資源的優(yōu)選。
業(yè)務(wù)應(yīng)用層是直接為用戶服務(wù)的一層,算力共享平臺完成從平臺資源層的算力獲取,無差別地為應(yīng)用提供服務(wù)。各類業(yè)務(wù)應(yīng)用可以采取應(yīng)用商店的模式在算力共享平臺中部署,例如視頻、游戲、VR、大數(shù)據(jù)及AI等。業(yè)務(wù)因共用層實現(xiàn)了整個算力網(wǎng)絡(luò)的可視化,為用戶提供友好的UI界面,用戶基于應(yīng)用對算力進(jìn)行使用,并可在算力共享平臺上實現(xiàn)算力交易。
5? ?結(jié)束語
基于對6G時代泛在計算的構(gòu)想,算力網(wǎng)絡(luò)旨在打造CPaaS(Computing Power as a Service,算力即服務(wù))的統(tǒng)一化應(yīng)用平臺,使用戶能夠便利地以服務(wù)的形式隨時隨地獲取所需的計算資源,而不需要關(guān)注計算資源實際的物理位置。
目前,在整個算力網(wǎng)絡(luò)體系中,還存在未完全標(biāo)準(zhǔn)化的細(xì)節(jié),例如,計算資源涉及不同類型的算力,并且對于不同物理距離的計算資源,計算能力的大小與網(wǎng)絡(luò)資源的優(yōu)劣有著很大的關(guān)系,所以完善的計算資源度量還未形成統(tǒng)一的標(biāo)準(zhǔn),從某種意義上來說還不是絕對的準(zhǔn)確,這需要隨著應(yīng)用與算力更為緊密的結(jié)合,實際應(yīng)用的不斷增多才能逐步完善。
綜上所述,雖然算力網(wǎng)絡(luò)目前還在不斷發(fā)展完善中,但是可以預(yù)見,算力網(wǎng)絡(luò)是未來6G時代數(shù)字化信息社會不斷向前發(fā)展的要求,人們對于未來信息的述求不再是純粹的單向獲取,而是逐步演變?yōu)榻?jīng)過信息輸入、信息處理、信息返回過程形成的雙向信息交互。整個網(wǎng)絡(luò)的發(fā)展,也由目前的云網(wǎng)融合逐步演變?yōu)樗憔W(wǎng)融合,隨著通信、IT技術(shù)的不斷發(fā)展,算力網(wǎng)絡(luò)會不斷完善,在不遠(yuǎn)的將來必定會成為數(shù)字化信息社會的重要基石。
參考文獻(xiàn):
[1]? ?唐雄燕,曹暢,張帥,等. 中國聯(lián)通算力網(wǎng)絡(luò)白皮書[R]. 2019.
[2]? ? 網(wǎng)絡(luò)5.0產(chǎn)業(yè)聯(lián)盟. 網(wǎng)絡(luò)5.0產(chǎn)業(yè)聯(lián)盟 CFN特設(shè)組倡議與籌備匯報[Z]. 2019.
[3]? ? ?唐雄燕,馬季春,曹暢,等. 中國聯(lián)通169網(wǎng)絡(luò)SDN化改造的成果與經(jīng)驗[J]. 移動通信, 2019(7): 2-6.
[4]? ? 王瑞雪,熊學(xué)濤,翁思俊. 中國移動數(shù)據(jù)中心SDN網(wǎng)絡(luò)架構(gòu)及關(guān)鍵技術(shù)[J]. 移動通信, 2019(7): 7-12.
[5]? ? 李銘軒,魏進(jìn)武,張云勇. 面向電信運(yùn)營商的IT資源微服務(wù)化方案[J]. 信息通信技術(shù), 2017,11(2): 48-55.
[6]? ? ITU. ITU-T Y 3151: High-level technical characteristics of network softwarization for IMT-2020 - part: SDN[S]. 2019.
[7]? ? ?ETSI. ETSI GR IP6 010 V1.1.1: IPv6-based SDN and NFV;?Deployment of IPv6-based SDN and NFV[S]. 2017.
[8]? ? IETF. IETF RFC 7426: Software-Defined Networking (SDN): Layers and Architecture Terminology[S]. 2015.
作者簡介
何濤(orcid.org/0000-0001-6993-0570):
高級工程師,碩士畢業(yè)于北京郵電大學(xué),現(xiàn)任職于中國聯(lián)合網(wǎng)絡(luò)通信有限公司網(wǎng)絡(luò)技術(shù)研究院,主要從事云化網(wǎng)絡(luò)及數(shù)據(jù)通信網(wǎng)絡(luò)相關(guān)技術(shù)研究工作。
曹暢:高級工程師,博士畢業(yè)于北京郵電大學(xué),現(xiàn)任中國聯(lián)合網(wǎng)絡(luò)通信有限公司網(wǎng)絡(luò)技術(shù)研究院未來網(wǎng)絡(luò)研究部高級專家、智能云網(wǎng)技術(shù)研究室主任,主要研究方向為IP網(wǎng)寬帶通信、SDN/NFV、新一代網(wǎng)絡(luò)編排技術(shù)等。
唐雄燕:教授級高級工程師,博士,現(xiàn)任中國聯(lián)合網(wǎng)絡(luò)通信有限公司網(wǎng)絡(luò)技術(shù)研究院首席科學(xué)家,中國聯(lián)通智能網(wǎng)絡(luò)中心總架構(gòu)師,“新世紀(jì)百千萬人才工程”國家級人選,兼任北京郵電大學(xué)兼職教授、博士生導(dǎo)師,工業(yè)和信息化部通信科技委委員,中國通信學(xué)會信息通信網(wǎng)絡(luò)技術(shù)委員會副主任,中國通信標(biāo)準(zhǔn)化協(xié)會物聯(lián)網(wǎng)技術(shù)委員會副主席,中國光學(xué)工程學(xué)會光通信與信息網(wǎng)絡(luò)專家委員會主任,中國互聯(lián)網(wǎng)協(xié)會標(biāo)準(zhǔn)工作委員會副主任,主要研究方向為寬帶通信、互聯(lián)網(wǎng)/物聯(lián)網(wǎng)、新一代網(wǎng)絡(luò)等,主持了企業(yè)許多重大技術(shù)工作,擔(dān)任過多個國家級科研課題的負(fù)責(zé)人。