張葉紅 董一川 相 洋 王 暉 余 躍
鵬城實驗室 深圳 518000
2019 年起,國內三大運營商、華為等設備廠商先后發布了算力網絡、算力感知網絡、計算優先網絡、算網一體等相關概念及白皮書[1-4],率先開啟了對算網融合、算網一體等概念的探索。筆者認為,“算網融合”概念需要從“以網調算”和“算力成網”兩個方向進行探討,通信行業提出的“算力網絡”概念通常關注前者,從網絡視角切入,重點考慮如何將算力信息和計算能力嵌入網絡,通過網絡的路由與分發服務實現全網資源的分配調度。然而,若從“算”的視角觀察,想要真正將“算力”互聯成為“算力網”,除通過網絡信息對算力信息進行調度的技術手段外,還存在著異構性兼容、協同效率優化等諸多問題。分散在各地的算力資源真的能協同調度嗎?全網算力一體化仍面臨著哪些問題?本文從“算”的角度切入,探討算網融合過程中“算力成網”面臨的關鍵挑戰。
近年來,隨著智能計算產業的快速發展以及人們對ChatGPT等超大規模模型能力的認知不斷提升,各行業對算力的需求迅速攀升,算力逐漸成為數字經濟時代的核心驅動力。因此,算力中心作為新型基礎設施的重要組成部分,已納入全國各大城市的重點布局和規劃中。然而,當前分散在各地的算力基礎設施水平不一、形態各異、發展不均衡,嚴重制約了各地算力、數據等資源的高效使用,急需以部署整體化算力基礎資源為核心,對算力進行統籌和協調發展,形成效率更高且可廣泛支撐新型計算模式的算力服務體系。
“算力互聯”并不是一個新的理念,早在21世紀初,國內外便提出了“網格計算”(Grid Computing)的概念,通過將各大超算中心的算力進行聚合,有效支持各類科學研究應用[5-6];美國谷歌、微軟,國內華為等云廠商,也紛紛提出各自的數據中心互聯(Data Center Interconnect,DCI)解決方案,實現企業內部的數字網絡平臺建設;云際計算(JointCloud Computing)[7]、天空計算(Sky Computing)[8]等概念面向云計算產業,通過云服務間的開放協作,實現多云平臺間的高效協作。上述工作大多面向超算、企業內數據中心、云計算等傳統算力類型的互聯需求開展,對近年來興起的人工智能算力(簡稱“智算”)互聯問題,以及超算、智算、云計算等不同類型算力的互聯協作尚未進行深入探討。
“算力網”在以上概念及技術的基礎上進一步拓展,是一種覆蓋智算中心、超算中心、數據中心等大型異構算力資源的新型算力基礎設施,通過對分布在不同地域的異構算力中心進行高速網絡互聯,形成一臺跨地域部署的“大計算機”,實現多中心間的資源共享、自主協作與統一服務,以提升各算力中心的整體運行效率、系統能效和服務能力,如圖1所示。

圖1 “算力網”概念示意圖
“算力網”作為網絡和計算融合的重要體現,具有廣泛的應用前景和發展潛力,其系統天然的高度異構性與復雜性也使得算力網大規模建設與落地應用面臨一系列重要挑戰。
“算力網”建設的重要目標之一,是實現各算力中心間從底層計算、存儲資源到上層應用、服務的多層級互操作。然而,目前全國各算力中心通常面向各自需求、基于不同架構獨立建設,軟硬件異構性極高,為算力互聯互通與任務廣域調度帶來了極大挑戰。
在算力資源互聯互通方面,各算力中心的集群管理平臺異構性是其面臨的主要問題。如對于計算資源的互聯,涉及到各平臺支持的使用方式不同,平臺提供的外部訪問接口不統一;對于存儲資源的統一管理,存在因為各算力中心數據安全策略不同,導致的訪問權限差異,同時也存在不同類型的底層存儲(如對象存儲、文件存儲、API形式開放的存儲等)導致的訪問接口差異。因此,在實現此類異構算力中心的互聯互通時,需要對用戶屏蔽各平臺底層差異,在各類不同的中心間探索統一的互聯方式和標準,實現對異構算力中心資源的統一管理和訪問。
在任務統一調度方面,需考慮如何屏蔽各算力中心從底層計算芯片、驅動程序,到上層開發框架、應用軟件等多層次的異構性。以人工智能(Artificial Intelligence, AI)場景為例,目前大部分AI技術與模型均基于國外主流硬件(如NVIDIA GPU)及主流計算框架(如PyTorch)設計,缺乏對國產軟硬件的有效兼容,導致在算力網的任務調度環節,無法有效調動大量的國產算力資源。當前,國內AI硬件(如寒武紀思元、百度昆侖芯、燧原邃思等)和AI計算框架(如PaddlePaddle、MindSpore、OneFlow等)也已進入高速發展期,對國產軟硬件實現更好的適配和兼容,將進一步有助于解決不同算力中心間異構算力的調度問題。如何真正實現“一次編程,隨處運行”,從而支撐異構算力資源的統一服務與自主協作,是算力網建設過程中面臨的重要挑戰。
算力網內的計算、存儲資源等廣泛分布于不同地理位置,為實現異地資源的協同使用與協同優化,跨地域的遠程數據傳輸不可避免,特別是以“東數西算”、大模型跨域協同訓練為代表的算力網業務增長迅速,很多場景數據傳輸量大且對傳輸效率需求較高。
如在“東數西算”業務中,其傳輸數據量可達PB級;超大規模模型跨域分布式訓練業務單次數據傳輸量在10GB級以上[9],且為確保訓練效率,需要的數據交互速率可達100Gb/s級。由此可見,當前基于公網的通用數據傳輸技術無法滿足長距離、高帶寬、低時延等算力網業務需求,且當前網絡傳輸方面缺乏基于通信技術來簡化網絡協議棧的相關研究,尚未針對算力網業務流量特征優化傳輸控制協議。如何實現高速、極簡、算網原生的數據傳輸,利用新型網絡技術提高算力網資源的整體利用率,實現算網一體概念中“網”對“算”的有效支撐,是算力網互聯技術需要解決的關鍵問題之一。
“算力網”建設的一個重要目標是實現各地算力資源的統一服務和統一運營,從而對算力進行統籌和協調發展,以提高全網算力資源的綜合使用效能。然而,現實情況中,由于各算力中心大多獨立建設,隸屬于不同利益主體,其對自身資源分配、數據訪問、業務調度等關鍵環節具有自主決策與控制需求,且通常使用不同的運營標準與服務體系,很難在現有框架內實現完全中心式的一體化運營。
因此,在算力網的建設過程中,需要在認證授權、互聯適配、網絡接入、計量計費等多個方面考慮如何使用非侵入式的技術手段規避過于標準化導致的各主體自主權削弱問題,在各中心“自治性”與算力“一體化”之間實現利益均衡。
針對上述挑戰,本文提出一套算力網參考架構。如圖2所示,算力網系統主要包括調度適配器、統一數據存儲、網絡設施與控制、云際管理與調度以及運營平臺幾大部分,各部分之間通過標準化接口進行對接,各業務系統的具體功能設計如下。

圖2 算力網系統功能架構圖
調度適配器:調度適配器通過在任務與算力中心間增加抽象層,通過低代價、非侵入的方式屏蔽算力中心異構硬件、異構系統等差異,對算力網提交來的任務進行適配轉換后提交給算力中心本地管理調度系統;同時,適配器會收集各算力中心的任務狀態及運維監控信息并上報算力網調度系統,使得算力網可以通過統一的接口收集各中心及任務狀態信息,從而對全網資源進行協同調度優化。為保證算力網長穩運行,調度適配器接口訪問的服務水平需滿足穩定性、可靠性以及性能要求,并同時滿足各算力中心的安全控制邏輯以及安全實施策略。
統一數據存儲:為提高計算任務的執行效率,實現“算隨數動”“數隨算動”的調度策略,統一數據存儲系統基于算力中心的異構存儲資源,構建統一的數據存儲系統,為計算任務所需要的大量數據集、模型、算法等數據提供高速訪問與共享交換服務。首先,需構建全局統一存儲視圖,從而使得算力網調度系統可以感知數據集在各個算力中心的存儲情況;由于各分中心之間的存儲介質采用的子存儲系統本身通常是異構的,對外提供的接口可能是華為云對象存儲的OBS、阿里云對象存儲的OSS、廣泛應用的私有部署對象存儲平臺MINIO、FTP方式以及自定義存儲訪問API等,統一存儲系統的一項重要功能是對異構存儲系統和接口進行適配和統一化,以便在任務調度過程中實現跨中心的數據遷移。
網絡設施與控制:在算力網各類資源中,除計算、存儲資源高度異構外,實現算力互聯的網絡基礎設施也通常存在異構性(如以太網、全光網等),算力網的網絡設施與控制系統通過異構網絡融合,支持多元化異構網絡類型,實現異構網絡資源信息的采集上報;當算力網調度系統確定任務的目標計算節點后,網絡控制系統在現有網絡協議的基礎上,額外考慮算力作業對網絡的需求,動態調整算力作業中數據包的路由策略,將算力作業等信息路由至指定節點,并通過QoS等技術,保障網絡的時延、丟包、帶寬等網絡性能參數,實現網絡系統對算力調度系統的有效支撐與協同優化。
云際管理與調度:該系統負責接入各個算力中心,對算力、網絡等資源進行統一管理和協同調度,統一對上層應用提供作業操作等能力,以實現全網資源的高效使用。主要功能模塊包括資源管理、作業管理、作業調度等。其中資源管理模塊實現各算力中心的算力、網絡等資源信息采集、監控、管理;作業管理提供了各類任務作業的管理功能;任務調度模塊根據集群負載、數據拓撲、網絡狀態、能耗等調度因子選擇最優算力中心執行作業。
一體化運營:算力網的運營系統實現多個算力中心算力、數據等資源的一體化運營。首先,通過用戶統一認證與授權確保不同算力中心的用戶可以互相認證并分配全局統一的用戶身份;在用戶對資源的使用過程中,對各算力中心的資源貢獻進行統一的計量和費用結算;同時,通過構建數據市場、模型市場與應用市場,支持算力網用戶進行數據、模型、應用服務等資源的發布、訂閱、交易及使用,從而真正實現全網資源的開放共享。
“算力網”作為新型強力算力底座,可有效支撐“東數西算”“一帶一路”等國家重大戰略的實施落地。以面向“一帶一路”的語言服務場景為例,目前中國已經同140個國家和31個國際組織簽署共建“一帶一路”合作文件,其中共涉及12語系、28語族、132種語言。由于語種使用人口、地理分布的不均衡、社會信息化水平的差異以及語料收集渠道的隔離,造成語種數據資源的極度不均衡,或產生性能參差不齊的模型及應用,形成天然的數據和模型“孤島”。
針對大規模多語言模型及其應用在低資源語料分散、數據開源意愿不強、各語種數據資源極度不均衡等問題,可基于算力網的構建整合“一帶一路”沿線國家的計算及數據資源,進行以中文為核心的“一帶一路”多語言大模型研究及應用平臺建設,聯合優勢企業單位、科研院所、優勢研發平臺,在數據、模型不出本地的前提下,通過多方跨域協同計算,突破多語言模型研究及應用關鍵技術,促進“一帶一路”國家語言互通,成為國家戰略落地的重要支撐,如圖3所示。

圖3 面向“一帶一路”國家重大戰略的多語言大模型跨域協同計算
隨著數字經濟建設的不斷深入,各行各業的發展越來越依賴于強大的算力底座,將單點算力互聯成網,推進算力資源的協同使用已是大勢所趨?!八懔W”的建設旨在構建自主創新的技術體系,以建立互聯互通、高效協同的一體化算力基礎設施為目標,推動實現數字經濟時代算力供給模式的變革。在算力網的建設過程中,依然面臨著多層次異構性兼容、遠距離通信優化、一體化運營機制建設等關鍵技術挑戰,如何在算網融合的新趨勢下,基于網絡能力釋放算力能力,真正實現互聯算力的高效協同,仍需在算力網建設過程中進行深入探索。