孫 滔 周 鋮 段曉東 陸 璐 陳丹陽 楊紅偉 朱艷宏 劉 超 李 琴 王 曉 沈 震 瞿逢重 蔣懷光 王飛躍
隨著5G、物聯網和云計算技術的發展以及層出不窮的網絡新業務涌現,網絡負載不斷增加,網絡規模持續擴大.由此帶來的網絡復雜性,使得網絡的運行和維護變得越來越復雜[1-2].同時,由于網絡運營的高可靠性要求,網絡故障的高代價以及昂貴的試驗成本,網絡的變動往往牽一發而動全身,新技術的部署愈發困難.具體來說,超大規模網絡發展面臨的典型挑戰總結如下.
1) 網絡靈活性不足.伴隨物聯網技術的興起,網絡通信由最初的人與人通信,發展至人與物通信,并進一步發展至物與物通信.通信模式不斷更新,網絡承載的業務類型、網絡所服務的對象、連接到網絡的設備類型等呈現出多樣化發展的態勢,均對網絡本身提出了更高的要求,網絡需具備更高的靈活性與可擴展性.
2) 網絡新技術研發周期長、部署難度大.作為基礎設施,網絡具有高可靠性要求,網絡運營商的現網環境很難直接用于科研人員的網絡創新技術研究.僅僅基于線下仿真平臺的研究會大大影響結果的有效性,從而降低網絡創新技術的發展速度.此外,新技術的失敗風險和失敗代價會阻礙對網絡創新應用的嘗試.
3) 網絡管理運維復雜.隨著云計算、虛擬化技術的發展,傳統網絡已經開始向軟件化、可編程轉變,呈現了許多新的特點,如資源的云化、業務的按需設計、資源的編排等,這使得網絡的運行和維護面臨著前所未有的壓力.由于缺乏有效的統一仿真、分析和預測平臺,很難從現有的預防性運維轉向理想的預測性運維.
4) 網絡優化成本高、風險大.由于缺乏有效的虛擬驗證平臺,網絡優化操作不得不直接作用在現網基礎設施中,造成較長的時間消耗以及較高的現網運行業務風險,從而加大網絡的運營成本.
為解決上述困難,網絡智能化越來越為產業界所重視.“基于意圖的網絡”[3-4],“自動駕駛網絡”[5-6],“零接觸(Zero-Touch)網絡”[7]等概念和技術相繼被業界提出和推廣,希望借助網絡智能化技術,實現網絡自動化和自主化運行的愿景.數字孿生網絡構建物理網絡的實時鏡像,可增強物理網絡所缺少的系統性仿真、優化、驗證和控制能力,助力上述網絡新技術的部署,更加高效地應對網絡問題和挑戰.
將數字孿生技術應用于網絡,創建物理網絡設施的虛擬鏡像,即可搭建數字孿生網絡平臺.通過物理網絡和孿生網絡實時交互,相互影響,數字孿生網絡平臺能夠助力網絡實現低成本試錯、智能化決策和高效率創新.數字孿生網絡的研究和應用在產業和學術界還處于起步階段.本文結構如下:第1 節介紹數字孿生的研究與應用現狀,第2 節描述數字孿生網絡的定義和架構并給出應用示例,第3節描述數字孿生網絡的關鍵技術,第4 節描述數字孿生網絡的目標價值,最后是總結和展望.
數字孿生的概念最早由美國學者M.Grieves教授提出[8],并定義為三維模型,包括實體產品、虛擬產品以及二者間的連接.2012 年,美國空軍研究實驗室和美國國家航空航天局 (National Aeronautics and Space Administration,NASA)合作提出構建未來飛行器的數字孿生體[9],并定義數字孿生為高度集成的多物理場、多尺度、多概率的仿真模型.近年來,隨著多學科建模與仿真技術的飛速發展,數字孿生技術研究成為熱點,并在虛擬樣機、數字孿生車間、數字孿生衛星、能源交通、醫療健康等諸多領域得到成功運用[10-12].面向未來網絡,伴隨著云計算、大數據、人工智能等技術的不斷發展以及信息的泛在化,數字孿生技術也將更廣泛地運用于人體活動監控與管理、家居生活和科學研究等領域,使得整個社會走向虛擬與現實結合的“數字孿生”世界.國際電信聯盟電信標準化部 (International Telecommunication Union — Telecommunication Standardization Sector,ITU-T)面向未來網絡的Network2030 焦點組的技術報告[13-14]也將數字孿生作為未來網絡12 個代表性用例之一.
數字孿生模型框架目前尚無統一定義.商業公司、科研機構和標準組織都在嘗試定義通用或者專用的模型框架.Gartner 在其物聯網(Internet of things,IoT)數字孿生技術報告[15]中提出構建一個物理實體的數字孿生體需要4 個關鍵要素:模型、數據、監控和唯一性.文獻[10]提出了數字孿生的五維模型 {PE,VE,Ss,DD,CN},其中,PE 表示物理實體,VE 表示虛擬實體,Ss 表示服務,DD 表示孿生數據,CN 表示各部分之間的連接.國際標準化組織(International Organization for Standardization,ISO)發布了面向制造的數字孿生系統框架標準草案[16-17],提出包含數據采集域、設備控制域、數字孿生域和用戶域的參考框架,該草案即將成為數字孿生領域第一個國際標準.
與數字孿生觀念緊密相關的理論,是由中國科學院自動化研究所王飛躍研究員于2004 年提出的平行系統理論[18-19].平行系統理論同數字孿生理論在虛實映射、動態仿真等方面有相似性.但是,兩者在研究對象、核心思想、實現方法、功能等方面均有所區別[20].數字孿生主要研究由信息空間和物理空間組成的空間物理系統 (Cyber physical system,CPS)[21],而平行系統主要研究社會網絡、信息資源和物理空間深度融合的社會物理信息系統 (Cyber physical social system,CPSS)[22],包含社會活動的部分,考慮社會的反映和影響.平行系統相對于數字孿生的“形似”,更注重“神似”.數字孿生通過數字化空間構建物理空間的鏡像,而平行系統更強調計算實驗和外在行為的干預,基于人工系統生成場景.平行系統理論在平行醫療[23-24]、平行自動駕駛[25]、平行軍事[26]等領域同樣有較多應用.類似于數字孿生及平行系統理論,文獻[27]提出了智能空間設想,探討了基于智能交通空間,實現智能化車輛和交通基礎設施控制的可行性.
隨著數字孿生技術的發展及其在生產制造等多個產業的應用,數字孿生技術理念在通信網絡領域的應用也逐漸被業界研究和關注.華為公司提出在意圖驅動網絡的網絡云化引擎(Network cloud engine,NCE)中[28],在物理網絡和商業意圖之間構建數字孿生,將過去離散的數據進行關聯并轉為在線共享,構建全生命周期的數字化運維能力.Aria公司的產品 STEP-T (Strategic traffic engineering and planning tool)[29]在運營商客戶的骨干網上建立數字孿生體,運用人工智能 (Artificial intelligence,AI)技術在大規模復雜骨干網上完成了路由優化和故障仿真.文獻[30-31]提出基于賽博孿生(Cybertwin)的下一代網絡架構,通過人和物在虛擬世界的數字表示,提供通信助理、日志記錄和數字資產等功能,適于未來網絡從端到端連接至云到端連接的演進.文獻[32]建立了5G 移動邊緣計算(Mobile edge computing,MEC)網絡的數字孿生體,利用孿生體離線訓練基于強化學習的資源分配優化和歸一化節能算法,然后將方案更新至MEC 網絡.文獻[33]提出一種工業互聯網對應的數字孿生網絡集成框架,利用強化學習算法在此框架下尋求最優隨機計算卸載和資源分配策略.文獻[34]建立了面向6G 移動邊緣計算系統的數字孿生邊緣網絡,其中邊緣服務器的孿生體評估實體服務器的狀態,移動邊緣計算系統的孿生體提供數據用于訓練卸載策略,方案在降低卸載延時的同時減少了系統開銷.此外,數字孿生技術在無線頻譜等方面的感知與管理也有了相關的探索.
中國科學院自動化所王飛躍研究員將平行系統理論用于網絡系統,提出“平行網絡(Parallel networks)”網絡架構[35-37],通過建立相應的人工網絡系統,開展相關計算實驗,對網絡進行全面、準確和及時的評估.數字孿生網絡與平行網絡在概念和目標上有一定的相似性,主要設計思想都是類似于狀態觀測器的設計思路,通過構造出類似原系統的衍生系統,再針對所構造的人工網絡系統或者孿生系統間接的修正實際系統的狀態,從而調整網絡優化資源管理,達到網絡性能優化的目的.同時,二者在架構和實現方法上有所區別:平行網絡中的人工網絡并非總是實際網絡的完全映射;數字孿生網絡的孿生體強調物理網絡的實時鏡像.平行網絡中的人工網絡基于軟件定義網絡(Software defined network,SDN)[38-39]技術和理念,實現集中控制、整體優化和決策的功能;數字孿生網絡的孿生層不依賴SDN 技術進行構建,而是根據物理網絡中網元和拓撲的實際形態進行抽象建模.在實現方法上,平行網絡可基于有限數據進行計算實驗和平行執行,不依賴于全面、準確的數據即可建模;數字孿生網絡強調基于全面且準確的數據,進行精準建模,達成虛實網絡實時交互.
數字孿生網絡技術的相關研究目前還處于初級階段.盡管數字孿生技術在網絡中的應用已經起步,但目前的應用側重于特定的物理網絡中、特定的場景(如網絡運維)中,或者將網絡數字孿生平臺作為網絡仿真工具.結合數字孿生技術的特點以及在其他行業的應用,本文認為數字孿生網絡可以作為網絡系統的一個有機整體,成為未來涉及物理網絡的全生命周期的通用架構,服務于網絡規劃、建設、維護、優化,以及網絡自動駕駛、意圖網絡等網絡創新技術的應用,提升網絡的自動化和智能化水平.
數字孿生網絡業界尚無統一的定義,本文將“數字孿生網絡”定義為:一個具有物理網絡實體及虛擬孿生體,且二者可進行實時交互映射的網絡系統.
在此系統中,各種網絡管理和應用可利用數字孿生技術構建的網絡虛擬孿生體,基于數據和模型對物理網絡進行高效的分析、診斷、仿真和控制.基于此定義,數字孿生網絡應當具備4 個核心要素:數據、模型、映射和交互,如圖1 所示.

圖1 數字孿生網絡的核心要素Fig.1 The core elements of digital twin networks
1) 數據是構建數字孿生網絡的基石,通過構建統一的數據共享倉庫作為數字孿生網絡的單一事實源,高效存儲物理網絡的配置、拓撲、狀態、日志、用戶業務等歷史和實時數據,為網絡孿生體提供數據支撐.
2) 模型是數字孿生網絡的能力源,功能豐富的數據模型可通過靈活組合的方式創建多種模型實例,服務于各種網絡應用.
3) 映射是物理網絡實體通過網絡孿生體的高保真可視化呈現,是數字孿生網絡區別于網絡仿真系統的最典型特征.
4) 交互是達成虛實同步的關鍵,網絡孿生體通過標準化的接口連接網絡服務應用和物理網絡實體,完成對于物理網絡的實時信息采集和控制,并提供及時診斷和分析.
基于四要素構建的網絡孿生體可借助優化算法、管理方法、專家知識等對物理網絡進行全生命周期的分析、診斷、仿真和控制,實現物理網絡與孿生網絡的實時交互映射,幫助網絡以更低成本、更高效率、更小的現網影響部署各種網絡應用,助力網絡實現極簡化和智慧化運維.
根據數字孿生網絡的定義和四個核心要素,數字孿生網絡可以設計為如圖2 所示的“三層三域雙閉環”架構:三層指構成數字孿生網絡系統的物理網絡層、孿生網絡層和網絡應用層;三域指孿生網絡層數據域、模型域和管理域,分別對應數據共享倉庫、服務映射模型和網絡孿生體管理三個子系統;“雙閉環”是指孿生網絡層內基于服務映射模型的“內閉環”仿真和優化,以及基于三層架構的“外閉環”對網絡應用的控制、反饋和優化.
1) 物理網絡層.物理實體網絡中的各種網元通過孿生南向接口同網絡孿生體交互網絡數據和網絡控制信息.作為網絡孿生體的實體對象,物理網絡既可以是蜂窩接入網、蜂窩核心網,也可以是數據中心網絡、園區企業網、工業物聯網等;既可以是單一網絡域(例如,無線或有線接入網、傳輸網、核心網、承載網等)子網,也可以是端到端的跨域網絡.既可以是網絡域內所有的基礎設施,也可以是網絡域內特定的基礎設施(例如,無線頻譜資源、核心網用戶面網元等).
2) 孿生網絡層.孿生網絡層是數字孿生網絡系統的標志,包含數據共享倉庫、服務映射模型和網絡孿生體管理三個關鍵子系統.數據共享倉庫子系統負責采集和存儲各種網絡數據,并向數據映射模型子系統提供數據服務和統一接口;服務映射模型子系統完成基于數據的建模,為各種網絡應用提供數據模型實例,最大化網絡業務的敏捷性和可編程性;網絡孿生體管理子系統負責網絡孿生體的全生命周期管理以及可視化呈現.
3) 網絡應用層.網絡應用通過孿生北向接口向孿生網絡層輸入需求,并通過模型化實例在孿生網絡層進行業務的部署.充分驗證后,孿生網絡層通過南向接口將控制更新下發至物理實體網絡.網絡運維和優化、網絡可視化、意圖驗證、網絡自動駕駛等網絡創新技術及各種應用能夠以更低的成本、更高的效率和更小的現網業務影響實現快速部署.

圖2 數字孿生網絡架構Fig.2 Digital twin network architecture
從數字孿生網絡的架構可以看出,數字孿生網絡不局限于軟件定義網絡SDN 的架構;同平行網絡相似,數字孿生網絡能夠基于虛擬層的仿真,實現SDN 管理和控制層無法實現的復雜網絡動態控制和優化.表1 進一步對比了數字孿生網絡、軟件定義網絡和平行網絡在物理對象、架構層次、虛實映射和分析方法等方面的區別.
2.3.1 數據共享倉庫
數據共享倉庫通過南向接口采集并存儲網絡實體的各種配置和運行數據,形成數字孿生網絡的單一事實源,為各種服務于應用的網絡模型提供準確完備的數據,包括但不限于網絡配置信息、網絡運行狀態和用戶業務數據等.數據共享倉庫主要有以下四項職責.
1) 數據采集.完成網絡數據的抽取、轉換、加載,以及清洗和加工,便于大規模的數據實現高效分布式存儲.
2)數據存儲.結合網絡數據的多樣化特性,利用多種數據存儲技術,完成海量網絡數據的高效存儲.
3)數據服務.為服務映射模型子系統提供包括快速檢索、并發沖突、批量服務、統一接口等多種數據服務.
4)數據管理.完成數據的資產管理、安全管理、質量管理和元數據管理.
作為數字孿生網絡的基石,數據共享倉庫中的數據越完備越準確,數據模型的豐富性和準確性就越高.
2.3.2 服務映射模型
服務映射模型包括基礎模型和功能模型兩部分.
基礎模型是指基于網元基本配置、環境信息、運行狀態、鏈路拓撲等信息,建立的對應于物理實體網絡的網元模型和拓撲模型,實現對物理網絡的實時精確描述.
功能模型是指針對特定的應用場景,充分利用數據倉庫中的網絡數據,建立的網絡分析、仿真、診斷、預測、保障等各種數據模型.功能模型可以通過多個維度構建和擴展:按照網絡類型構建,可以有服務于單網絡域(如移動接入網、傳輸網、核心網、承載網等)的模型或者服務于多網絡域的模型;按照功能類型劃分,可分為狀態監測、流量分析、安全演練、故障診斷、質量保障等模型;按照適用范圍劃分,可以劃分為通用模型和專用模型;按照網絡生命周期管理劃分,可分為規劃、建設、維護、優化和運營等模型.將多個維度結合在一起,可以創建面向更為具體應用場景的數據模型,例如,可以建立園區網絡核心交換機上的流量均衡優化模型,通過模型實例服務于相應的網絡應用.
基礎模型和功能模型通過實例或者實例的組合向上層網絡應用提供服務,最大化網絡業務的敏捷性和可編程性.同時,模型實例需要通過程序驅動在虛擬孿生網元或網絡拓撲中對預測、調度、配置、優化等目標完成充分的仿真和驗證,保證變更控制下發到物理網絡時的有效性和可靠性.
2.3.3 網絡孿生體管理
網絡孿生體管理完成數字孿生網絡的管理功能,全生命周期記錄,可視化呈現和管控網絡孿生體的各種元素,包括拓撲管理、模型管理和安全管理.
1)拓撲管理基于基礎模型,生成物理網絡對應的虛擬拓撲,并對拓撲進行多維度、多層次的可視化展現.
2)模型管理服務于各種數據模型實例的創建、存儲、更新以及模型組合、應用關聯的管理.同時,可視化地呈現模型實例的數據加載、模型仿真驗證過程和結果.
3)安全管理與共享數據倉庫中的數據管理一起,負責數字孿生網絡數據和模型安全保障相關的鑒權、認證、授權、加密和完整性保護.

表1 DTN、SDN 和平行網絡對比Table 1 Comparison of DTN,SDN and parallel networks
意圖網絡[3]是可以使用“用戶意圖”進行管理的網絡,它能夠識別和接收操作員或用戶的意圖,并根據用戶意圖自主地配置和調整自己,從而實現預期的結果,而無需用戶指定用于如何實現結果的詳細技術步驟.圖3 所示為一種基于數字孿生網絡架構實現意圖網絡的參考框架.其中意圖網絡的基礎設施對應于DTN 架構中的物理網絡層,意圖網絡的配置驗證、意圖保障和自動修復等關鍵功能可基于孿生網絡層的多種服務映射模型實現,實時保障來自網絡應用層的用戶意圖.

圖3 基于DTN 的意圖網絡框架Fig.3 Intent network architecture
1) 基于服務映射模型的配置驗證.用戶意圖經過意圖翻譯后,生成大量物理網絡能執行的網絡配置,如果將這些配置直接下發到物理網絡上可能影響其他業務正常處理,所產生的影響無法預估.利用數字孿生網絡的服務映射模型,提前校驗和模擬配置下發,提前發現配置中的一些異常問題,例如地址沖突、路由環路、路由不可達等.驗證配置既能滿足用戶業務意圖,又對其他已有業務沒有影響后,再將配置下發到物理網絡.
2) 基于服務映射模型的意圖保障和自動修復.通過數據采集將物理網絡運行狀態傳遞到孿生網絡層的數據共享倉庫,服務映射模型不斷驗證用戶意圖是否被滿足.當發現網絡偏離了用戶業務意圖,可利用AI 等智能化技術做根因分析,生成修復策略.因為當前AI 技術還不能保證修復策略完全可靠且能解決問題,所以一般需要人工確認無誤后再下發到物理網絡,拉低了故障修復效率.利用數字孿生網絡的服務映射模型先驗證修復策略,保證正確無誤后,再通過自動化配置模塊下發到物理網絡,既提高了運維效率,又推動了AI 技術的應用落地.
綜上,意圖網絡可基于數字孿生網絡架構,實現網絡配置的提前驗證和用戶業務意圖的實時保障等關鍵功能,這將有助于意圖網絡的有效落地部署.
構建數字孿生網絡系統面臨以下主要問題和挑戰:
1) 兼容性問題.網絡中不同廠商設備的技術實現和支持的功能不一致,因此建立面向全網絡域的數據共享倉庫,設計適配異廠家設備的接口以進行統一數據采集和處理的難度較高.
2) 建模難度大.基于大規模網絡數據,數據建模既要保證模型功能的豐富性,也需考慮模型的靈活性和可擴展性,這些需求進一步加大了構建高效的、層次化的基礎模型和功能模型的難度.
3) 實時性挑戰.對于實時性要求較高的業務,模型仿真和驗證在數字孿生網絡上的處理會增加延遲,所以模型的功能和流程需要增加多種網絡應用場景下的處理機制;同時,實時性要求也會進一步增加系統的軟硬件性能需求.
4) 規模性難題.通信網絡通常網元數量多、覆蓋地域廣、服務時間長,因此網絡數字孿生體必將是一個規模龐大的復雜巨系統,這會顯著增加數據的采集和存儲、模型的設計和運用等方面的復雜度,對系統的軟硬件要求也會非常高.
為了解決以上問題和挑戰,本文將基于第2.2 節提出數字孿生網絡參考架構,擬采用目標驅動的網絡數據采集、多元網絡數據存儲和服務、多維全生命周期網絡建模、交互式可視化呈現、以及接口協議體系五大關鍵使能技術,完成數字孿生網絡系統的構建.
數據采集是構建數據倉庫的基礎,作為物理網絡的數字鏡像,數據越全面、準確,數字孿生網絡越能高保真的還原物理網絡.數據采集應當采用目標驅動模式,數據采集的類型、頻率和方法以滿足數字孿生網絡的應用為目標,兼具全面、高效的特征.當對特定網絡應用進行數據建模時,所需的數據均可以從網絡孿生層的數據共享倉庫中高效獲取.以目標應用為驅動,只有全面、高效地采集模型所需數據,才能構建精準數據模型,為目標應用提供良好服務.
網絡數據采集方式有很多,例如技術成熟、應用廣泛的SNMP (Simple network management protocol)、Netconf,可采集原始碼流的NetFlow、sFlow,支持數據源端推送模式的網絡遙測(Network telemetry)等;不同的數據采集方案具備不同的特點,適用于不同的應用場景.結合數字孿生網絡對數據采集全面、高效的要求,本文認為可選擇網絡遙測技術作為數據采集的解決方案.
目前,業界通常認為,網絡遙測是指自動化遠程收集網絡多源異構狀態信息,進行網絡測量數據存儲、分析及使用的技術.網絡遙測系統具備如下主要特征[40]:
1)推送模式.設備支持通過推送(Push)模式主動向遙測服務器發送采集數據.
2)大容量和實時性.網絡遙測數據可直接被系統使用,因此支持大容量和實時數據.
3)模型驅動.數據使用YANG 模型描述,可擴展性好.
4)定制化.支持網絡管理員基于特定應用需求定制網絡采集方案.
圖4 所示為網絡遙測系統的數據結構關系.數字孿生網絡的數據主要包括用戶業務數據、網絡配置及運行狀態數據三大類數據,依據網絡遙測系統的數據結構,各類數據源使用統一的數據建模語言YANG,而數據流編碼格式、數據流輸出協議和傳輸承載協議根據不同的數據源按需擇優選擇.

圖4 網絡遙測系統數據結構Fig.4 Data structure of network telemetry system
按照測量與轉發是否分離,網絡遙測可分為帶外遙測和帶內遙測.帶外遙測具有網絡開銷較小、測量信息種類較多的優點,但很難滿足對用戶數據流檢測的實時性和準確性要求,同時可編程性也較弱,包括NetFlow、IPFIX[41]、PBT[42]等方案;帶內遙測的隨路檢測特性能夠保證獲取業務測量的準確性,能夠對網絡拓撲、網絡性能和網絡流量實現更細粒度的測量,同時具有較好的可編程性,包括INT[43]、In-situ OAM[44]、iFIT[45]等方案.
針對不同網絡建模需求可按需選擇最適合的網絡遙測方案.以網絡運行狀態數據中的時延數據為例,可使用帶內網絡遙測(Inband network telemetry,INT)技術進行采集:數據報文經過每一臺交換機時都將設備時延數據插入數據包,插入的位置依據報文封裝格式不同而不同,最后一跳交換機將收集所有的轉發時延,通過gRPC 協議輸出至數字孿生數據共享倉庫.
數據倉庫是一個面向主題的、集成的、隨時間變化的、但信息本身相對穩定的數據集合,用于對管理決策過程的支持[46].數據共享倉庫是數字孿生網絡的單一事實源,存儲海量的網絡歷史數據和實時數據,并將各種數據集成到統一的環境中,為數據建模提供統一的數據接口和服務.針對網絡數據規模大、種類多、速度快等特點,可綜合應用多元存儲和服務技術構建數字孿生網絡的數據共享倉庫,參考功能框架如圖5 所示.
1) 數據采集層.負責將網絡采集的源數據進行抽取、轉換和加載(Extract-Transform-Load,ETL),完成數據清洗和優化,以盡可能小的代價將數據導入分布式數據倉庫.
2) 數據存儲層.根據網絡數據的應用場景、數據格式和實時性要求等特性的不同,選用多種數據存儲技術構建多源異構數據庫,分別存儲結構化、非結構化的網絡數據.結合數字孿生網絡的建模數據以結構化數據為主的特點,可基于大規模并行處理MPP (Massive parallel processing)數據庫構建DTN 的主數據倉庫.Hadoop 云平臺存儲和處理技術可用于管理非/半結構化數據,采用分布式文件系統HDFS (Hadoop distributed file system)存儲文件,使用分布式并行計算框架MapReduce 并行執行計算操作.NoSQL 數據庫支持半結構化或者非結構化數據的海量存儲、高擴展性、高可用及并發要求,其中的圖形數據庫和列存儲數據庫適用于網絡特定場景下的數據處理,可作為傳統數據庫的有效補充.
3) 數據服務層.面向數字孿生網絡的服務映射模型,通過統一的數據服務接口提供建模所需數據,同時提供包括快速搜索、數據聯邦、并發沖突、批量服務、服務組合、歷史快照與回退等各種服務.
4)數據管理.負責數據采集、存儲和服務過程中的數據準確性、安全性和完整性,具體包括元數據管理、數據安全管理、數據質量管理和數據資產管理.
3.4.1 基于本體的基礎模型建模
數字孿生網絡的基礎模型通過定義基于本體[47]的統一數據模型,實現多源異構網絡數據的一致性融合表征,為構建數字孿生網絡奠定基礎.基礎模型中網元模型和拓撲模型的構建包括如下三個步驟:構建本體模型、構建“統一表征數據庫”及構建網元模型和拓撲模型.具體流程如圖6 所示.

圖5 數據共享倉庫功能框架Fig.5 Data sharing warehouse functional framework
1)本體模型構建.孿生網絡本體模型是實現多源異構網絡數據一致性表征的基礎,可指導生成“統一表征數據庫”.具體實現方式可結合網絡領域知識,定義本體的組成要素〈類,屬性,關系,公理,實例〉,繼而通過本體對多源異構數據進行一致性表征[48].以交換機為例,其本體模型的組成要素可以設計如下:
〈類:對應交換機的種類,如二層、三層、四層等類型交換機.
屬性:對應交換機的基本屬性:物理屬性包括交換機的尺寸、功耗、端口數量等;功能屬性包括交換機支持的各種轉發功能、管理功能等.
關系:對應交換機實例之間或者交換機同其他網元之間的關系,例如物理直連、邏輯互聯、IP 可達等.
公理:交換機公知的規則及原理,例如存儲轉發需要耗時、互聯互通時需要統一的接口和協議等.
實例:基于交換機種類創建的多個個體.〉
2)統一表征數據庫的構建.基于孿生網絡本體模型構建,通過語義反求工程、語義映射過程和多源異構數據一致性融合表征實例化操作,形成具有統一格式的數據,完成從多源異構數據到統一表征數據的映射.

圖6 基于本體的網元和拓撲模型構建流程Fig.6 The process of constructing network element and topology model based on ontology
3)網元模型和拓撲模型的構建.根據不同網元模型的功能或拓撲模型的結構,可基于統一表征的數據庫,按需組合構建網絡基礎模型,從而實現孿生網絡和物理網絡的虛實映射.
3.4.2 全生命周期功能模型建模
功能模型面向實際網絡功能需求,通過全生命周期的多種功能模塊,實現動態演進的網絡推理決策.如第2.3.2 節所述,功能模型可以根據各種網絡應用的需求,通過多個維度構建和擴展.本文從數字孿生網絡的功能模型服務于物理網絡的全生命周期運維的維度,描述規劃、建設、維護、優化及運營五個方面數據建模時分別適用的關鍵算法.
1)網絡規劃和建設的建模.基于數據倉庫中的網絡及業務相關的數據,利用深度學習、機器學習(隨機森林[49]、梯度提升決策樹 (Gradient boosting decision tree,GBDT)[50])等人工智能算法對業務預測、網絡性能預測、覆蓋優化、容量規劃及站址規劃等場景進行一一建模,通過數據倉庫不斷補充、更新訓練數據到模型中,進行模型更新迭代,形成一種AI模型的自適應機制,以實現更加精確的模型推理.
2)網絡維護的建模.網絡維護是一項龐大而復雜的工程,面對網絡維護中存在的各種故障定位及定界問題,當前已有的抽象出來的數學算法還不具備對現存問題全面準確的表達能力.面向網絡維護的建模,基于經驗知識的推理規則通常更加有效.因此,我們引入知識圖譜[51]作為數字孿生體中一種重要的核心技術,人類的經驗知識通過知識圖譜固化下來.知識圖譜的規模隨著不同的場景域相關經驗知識的不斷沉淀,構建的事物之間的關聯關系體系愈發龐大,所累積的背景知識亦不斷增加.將網絡專家自身的經驗轉換為推理規則集成于知識圖譜,可實現對故障診斷及定位等網絡維護場景的精準推理.
3)網絡優化的建模.網絡優化包括諸如資源調配、流量工程、內容分發網絡調度等多種場景.對于網絡優化模型的建模,由于其問題的非凸性、非平穩性、隨機性等困難,可采用進化類算法,如遺傳算法[52]、差分進化算法[53]、免疫算法[54]等,或者采用群智能算法,如蟻群算法[55]、粒子群算法[56]等.另外,對于復雜的動態調度優化場景,可引入強化學習[57].基于強化學習的智能調度方法組合了動態規劃、隨機逼近和函數逼近的思想,與傳統調度方法相比,無需建立精確的問題模型,適合解決基于動態調度的網絡優化問題.
4)網絡運營的建模.網絡運營包括基于網絡所提供的多種服務,如話音、數據流量等基礎業務以及多媒體社交和娛樂等富媒體業務.建模過程中需要有針對性的采集相關網絡與業務數據,借助深度學習、集成算法等進行模型訓練,為了節省計算資源,對于不同領域之間或者相似領域內的不同場景的建模,可借助遷移學習[58],針對不同情況利用基于實例的遷移、特征的遷移及共享參數的遷移等方法進行快速精準建模.以視頻用戶體驗評估 (Quality of experience) 為例,采集網絡側關鍵性能指標數據和用戶側視頻體驗數據(如初緩時延、卡頓等)進行關聯,利用深度學習算法構建視頻用戶體驗的評估模型,實現運營商對用戶體驗的智能感知評估.鑒于視頻業務的相似性,可將一個視頻業務訓練好的模型利用遷移學習應用于另外的視頻業務,以達到快速精準建模.
利用網絡可視化技術,高保真地可視化呈現網絡孿生體中的數據和模型 直觀反映物理網絡實體和網絡孿生體的交互映射,是數字孿生網絡系統的內在要求.圖形化展示網絡數據和模型,一方面可以輔助用戶認識網絡的內部結構,另一方面有助于挖掘隱藏在網絡內部的有價值信息.數字孿生網絡的可視化面臨孿生網絡規模大、虛實映射實時性要求高、數據模型的可解釋性偏低等挑戰,需要探索高效、實時、精確、互動性強的可視化呈現方法.根據需求范圍不同,網絡孿生體可視化呈現分為以下三類:
1)網絡拓撲可視化.網絡拓撲結構是通信網絡各種元素(鏈路、節點等) 的排列,是圖論的應用,其中通信設備被建模為節點,設備之間的連接被建模為節點之間的鏈路.作為數字孿生網絡可視化的基礎,網絡拓撲可視化將網絡節點和鏈路以點和線構成圖形進行呈現,清晰直觀地反映網絡運行狀況,輔助人們對網絡進行評估和分析.可視化布局算法是拓撲可視化的核心.一個好的拓撲布局算法需要滿足3 個條件:a)有效避免拓撲圖中節點的重疊;b)拓撲結構圖中邊的交叉盡可能減少;c)網絡拓撲滿足基本美學標準,如區域最小原則、邊交叉最小原則、節點密度均勻原則[59].文獻[60]列舉了常用的拓撲布局算法,結合通信網絡規模大、隧道多、分域自治等特點,數字孿生網絡的拓撲可視化可選用層次型布局、啟發式布局或力導向布局等算法(或者幾種算法的組合)進行拓撲布局.同時,網絡拓撲可視化需要反映網絡數據時間的動態變化,連續顯示網絡拓撲的狀態或者按需顯示任意時刻的網絡拓撲快照.
2)功能模型可視化.數字孿生網絡功能模型的可視化是指將模型實例的創建、數據的加載、模型的仿真驗證過程和結果利用網絡可視化技術呈現出來,幫助用戶更好理解、探索和推演模型.近些年來,諸多網絡領域包括網絡流量和資源規劃、安全威脅描述[61]、網絡異常分析[62]、網絡攻擊檢測[63]等已實現了網絡功能的可視化呈現.將相關的可視化技術運用到數字孿生網絡的流量建模、故障診斷、質量保障、安全建模等功能模型中,基于網絡孿生體完成功能驗證的同時實現可視化呈現,可進一步直觀體現統一數據模型作為數字孿生網絡能力源所發揮的作用.
3) 可視化動態交互.動態交互是用戶通過與系統之間的對話和互動操作理解數據的過程.交互操作可有效緩解有限的可視化空間和數據過載之間的矛盾,拓展可視化中信息表達的空間.數字孿生網絡的網絡拓撲和數據模型需要盡可能提供動態交互功能,讓用戶更好地參與對網絡數據和模型的理解和分析,幫助用戶探索數據、提高視覺認知.常用的網絡可視化動態交互方法有直接交互、焦點+上下文交互、關聯性交互和沉浸式模擬[60],數字孿生網絡系統可根據不同的應用場景選用不同的交互方法或通過多種交互方法的組合實現虛實網絡的可視化動態交互映射.
面對構建大規模數字孿生網絡的兼容性和擴展性需求,數字孿生網絡系統需要設計標準化的接口和協議體系.基于本文數字孿生網絡的參考架構,系統主要包含三種接口:
1) 孿生南向接口.包括孿生網絡層和物理網絡層之間的數據采集接口和控制下發接口.數據采集接口負責完成孿生網絡層數據共享倉庫的數據采集,控制下發接口負責將服務映射模型仿真驗證后的控制指令下發至物理網絡層的網元.
2) 孿生北向接口.包括網絡應用層和孿生網絡層之間的意圖翻譯接口和能力調用接口.網絡應用層可以通過意圖翻譯接口,將應用層意圖傳遞給孿生網絡層,為功能模型提供抽象化的需求輸入.孿生網絡層可以通過能力調用接口,把其內部的數據和算法模型能力,提供給上層的各式各樣的應用調用,滿足網絡應用對數字孿生體的數據和模型的調用,簡易實現對實體狀態的監控、診斷和預測等功能.
3) 孿生內部接口.包括孿生網絡層內部數據倉庫和功能模型之間的接口、功能模型和數字孿生體管理之間的接口、功能模型之間的接口等一簇接口.孿生層內部基于功能模型對網絡應用進行閉環控制和持續驗證,內部數據的交互數量和頻率將非常高,因此內部接口通過標準化定義保證擴展性的同時,需要使用高效的協議保證數據傳輸的效率.
隨著網絡規模的發展,上層應用系統越來越多,下層的物理網元數量也會逐步增加,導致網絡接口的實際數量將會迅速增加.為了新應用、新功能的快速引入和集成,需要在孿生網絡接口設計時考慮采用統一的、擴展性強的、易用的標準化接口.
1) 孿生北向可以考慮使用輕量級的、易擴展的RESTful 接口.表現層狀態轉移 (Representational state transfer,restful)以資源為核心[64],將資源的CRUD (create,read,update,delete)操作映射為HTTP 的GET、PUT、POST、DELETE 等方法.由于REST 式的web 服務提供了統一的接口和資源定位,簡化了服務接口的設計和實現,降低了服務調用的復雜度.
2) 孿生南向接口由于需要頻繁、高速的數據采集,可以考慮使用RDMA 協議.遠程直接數據訪問(Remote direct memory access,RDMA)是一種遠端內存直接訪問技術[65],數據收發時通過網絡把數據直接寫入內存,可以大大節約節點間數據搬移時對CPU算力的消耗,并顯著降低業務的傳輸時延,提高傳輸效率.
3) 網絡應用層和孿生網絡層之間的意圖翻譯接口和能力調用接口可以考慮使用基于QUIC 的HTTP/3.0 協議.QUIC (Quick UDP internet connections)協議[66]是一種新的多路復用和安全傳輸UDP 協議,具有連接快、延遲低、前向糾錯、自適應擁塞控制等特點.HTTP/3.0[67]是HTTP 協議的第3 個版本,采用QUIC 作為傳輸層,解決了很多之前采用TCP 作為傳輸層存在的問題.
面向未來網絡持續增加的多維度、全場景的泛在連接,本文認為數字孿生網絡將成為未來網絡規劃、運行、管理和運營的新方向,成為實現網絡智能化、自動化的重要手段.數字孿生網絡在以下四個方面將體現其在現網應用的核心價值.
1) 拓撲透視和流量全息.基于交互式的網絡可視化技術,數字孿生網絡可大大提升網絡全息化呈現水平.不僅網絡中各種網元、拓撲信息能夠動態可視化呈現,網絡全生命周期的動態變化過程、實時狀態、演化方向等信息也能夠隨數字孿生網絡的模型以全息化的方式呈現給用戶.全息化呈現網絡虛實交互映射,將幫助用戶更清晰地感知網絡狀態、更高效地挖掘網絡有價值信息、以更友好的沉浸交互界面探索網絡創新應用,將物理網絡由“黑盒”變成“白盒”.
2) 從設備到組網的全生命周期管理.網絡設備的生命周期包括“設計、開發、測試、試產及發布”,主要由設備供應商管理;網絡的生命周期包括“規劃、建設、維護及優化”,主要由網絡運營商管理.網絡和設備的責任主體不同,生命周期管理并沒有很好的融合,不利于網絡故障回溯、故障預測、網絡優化設計等.數字孿生網絡不僅包括網絡功能模型,也包括網元模型,通過對網元模型的特征分析可預測設備在網絡中的運行狀態;當網絡運維中出現故障,不僅能回溯到網絡的“過去”,也能通過網元模型回溯到網絡設備的“過去”,從而實現了網絡和設備的生命周期關聯分析.通過數字孿生網絡將網絡和設備的生命周期緊密結合,可實現網絡和設備的全流程精細化管理.
3) 網絡實時閉環控制.基于數字孿生網絡具備的仿真、分析和預測功能,生成相應的網絡配置,實現網絡實時閉環控制.網絡配置既可在孿生網絡層內進行“內閉環”調整與優化,又可實現數字孿生網絡三層“外閉環”實時控制、反饋與優化.通過“內閉環”與“外閉環”,最終實現網絡的自學習、自驗證、自演進的實時閉環控制.
4) 網絡風險和成本降低.基于數字孿生網絡對網絡優化方案高效仿真,充分驗證后部署至實體網絡,可以大大降低現網部署的試錯風險和成本,提高方案部署的效率.同時,借助數字孿生網絡平臺,可實現低成本、高效率的網絡創新技術研究.借助數字孿生網絡平臺,更多錯誤代價較高的網絡智能應用可以在數字孿生平臺上充分訓練、高效仿真,從而大大降低新技術在現網中驗證時產生的風險,減小部署到現網中發生錯誤的可能性.
本文系統化對“數字孿生網絡(DTN)”的概念進行了定義,對意圖網絡、平行網絡等相關工作進行了探討分析,并給出了DTN 的系統架構設計.同時,本文描述了構建DTN 系統所面臨的規模大、兼容難、建模難、實時性高等主要問題和挑戰,探討了解決DTN 主要問題和挑戰所需的五大關鍵技術,即目標驅動的網絡數據采集、多元網絡數據存儲和服務、多維全生命周期網絡建模、交互式可視化呈現技術、以及接口協議體系.
目前業界數字孿生網絡相關的研究剛剛起步,產業界和學術界需要進一步探討數字孿生網絡的場景和需求,明確數字孿生網絡的定義和統一架構.基于本文參考系統架構,下一步工作將在關鍵技術上持續深入研究,選取典型應用場景(如智能路由、網絡業務質量保障等)開發數字孿生網絡驗證系統,驗證數字孿生網絡的架構、流程、功能和接口.同時,進一步研究數字孿生網絡體現物理網絡的信息完備性,保證其仿真驗證的有效性,促進數字孿生網絡技術的成熟和應用,推動數字孿生網絡在國內外行業組織的標準化工作.