本刊記者|王熙 刁興玲

基于SDN、NFV和Cloud的網(wǎng)絡架構重構帶來大量新的多維度復雜性,在很大程度上抵消了其帶來的諸多好處,而AI在處理復雜問題上的能力遠超人腦,有望解決網(wǎng)絡架構重構所面臨的挑戰(zhàn)。

SDN/NFV產(chǎn)業(yè)聯(lián)盟理事長、中國電信科技委主任韋樂平
在“2018中國SDN/NFV大會”上,SDN/NFV產(chǎn)業(yè)聯(lián)盟理事長、中國電信科技委主任韋樂平針對SDN/NFV發(fā)展情況的一番演講,直指目前NFV發(fā)展痛點和云計算癥結,以及人工智能(AI)對運營商網(wǎng)絡重構的創(chuàng)新推動。
韋樂平指出,SDN已渡過炒作期,進入理性發(fā)展階段,基于SDN/NFV的網(wǎng)絡云化成為共識,NFV化已開始落地,但征程依然艱難,SDN將進一步從自動化走向智能化。基于SDN、NFV和Cloud的網(wǎng)絡架構重構帶來大量新的多維度復雜性,在很大程度上抵消了其帶來的諸多好處,而AI在處理復雜問題上的能力遠超人腦,有望解決網(wǎng)絡架構重構所面臨的挑戰(zhàn)。
在談到NFV的發(fā)展情況,韋樂平表示,NFV項目已覆蓋所有核心網(wǎng)網(wǎng)元(如vEPC,vIMS)。NFV開始落地,5G成為NFV新的最大驅動力,NFV成5G必要條件。
不過,由于思維落后、硬件性能限制、標準化滯后及互操作的復雜性,其他領域的NFV化還不盡人意。同時,網(wǎng)絡云化的挑戰(zhàn)不可輕視。遠營商的一朵云理想依然還只是理想,其內部IT系統(tǒng)的復雜性和對外服務的質量和速度要求導致公有云和電信云還在獨立建設,。
而根據(jù)SDN/NFV產(chǎn)業(yè)聯(lián)盟最新發(fā)布的《2018年NFV技術白皮書》顯示,當前形勢下,基于SDN/NFV技術進行網(wǎng)絡重構面臨以下三大主要挑戰(zhàn)。
挑戰(zhàn)1:標準進度慢,技術仍需成熟
隨著NFV的發(fā)展,截至2017年4月,全球已有部分NFV商用部署案例,主要集中在VEPC、VIMS、VCPE等場景,但相關商用案例中,涉及MANO的端到端流程和接口方面均采用運營商各自私有解決方案,MANO一直沒有統(tǒng)一的可指導互聯(lián)互通測試的流程和接口規(guī)范,同時不同組件對應的開源軟件與標準之間存在一定的不一致性,無法凝聚產(chǎn)業(yè)力量,均制約了NFV的大規(guī)模商用部署。
此外,目前NFV虛擬層與硬件解耦的成熟度相對較高,虛擬層與上層應用的解耦成熟度低,且沒有一套完善的方法體系來明確相關的要求,目前主要通過測試認證的方式來確保虛擬層和上層應用解耦,存在配對測試樣本少、測試用例無法覆蓋生產(chǎn)環(huán)境中各種潛在的不兼容問題。
挑戰(zhàn)2:分層解耦后集成和組網(wǎng)難度大
NFV除了解耦傳統(tǒng)網(wǎng)絡功能的實現(xiàn)方式,還引入了MANO管理系統(tǒng),MANO管理系統(tǒng)又分為NFVO、VNFM、VIM三部分,分別負責網(wǎng)絡、網(wǎng)元、資源的管理。當運營商在部署NFV的時候,通常涉及到不同組件由不同提供商提供的情形,為使得不同提供商提供的組件可以組合起來實現(xiàn)NFV系統(tǒng),需要比傳統(tǒng)電信網(wǎng)絡更復雜的IoT測試驗證、集成和規(guī)劃部署等工作。
挑戰(zhàn)3:運營商NFV網(wǎng)絡運維管理挑戰(zhàn)大
傳統(tǒng)網(wǎng)管采用豎井式的運維管理模式,依賴工單進行故障管理,且重在設備監(jiān)控和排障,隨著NFV技術的引入和MANO管理系統(tǒng)的提供,NFV網(wǎng)絡可根據(jù)策略自動彈性擴縮容,發(fā)生故障時可以實現(xiàn)自愈相關變化,這些都對傳統(tǒng)運營商網(wǎng)絡管理模式帶來了很大的挑戰(zhàn),需要運營商做好MANO和傳統(tǒng)0SS的協(xié)同,并且需要轉變觀念,適應新的管理運維模式,打造新型管理運維流程,提高運維人員技能等。
另外,韋樂平認為,SDN將進一步從自動化走向智能化,電信網(wǎng)的復雜性和人工依賴性使得具備應付高度復雜性能力的AI具有很好的擴展空間。比如,結合SDN與AI的基于意圖的網(wǎng)絡(IBN)將可能成為網(wǎng)絡自動化和智能化的目標。
對于AI技術在電信網(wǎng)絡的發(fā)展,韋樂平表示:“AI有望解決網(wǎng)絡架構重構所面臨的三大挑戰(zhàn),網(wǎng)絡架構動態(tài)變化帶來的網(wǎng)絡和業(yè)務的復雜性;網(wǎng)元分層解耦后的故障定位等運維帶來的復雜性;網(wǎng)絡資源實時調整帶來的網(wǎng)絡運行復雜性。”
談到AI網(wǎng)絡應用的原則時,韋樂平表示越高層越集中,且跨域分析能力越強,對計算能力的要求也越高,所需數(shù)據(jù)量也越大,更適合對全局性的策略集中進行訓練和推理。越低層越接近終端,專項分析能力越強,對實時性要求往往越來越高,對計算能力要求滿足業(yè)務需求即可,適合引入AI的推理能力或具備輕量級的訓練能力即可。
韋樂平還分享了AI在電信運營商網(wǎng)絡賦能的三種方式。
第一,AI在基礎設施層的應用:主要是為有源硬件設施提供AI加速器,實現(xiàn)不同層級的訓練和推理能力,諸如核心DC的基礎設施可優(yōu)先引入AI加速器,滿足全局性的策略或算法模型的集中訓練及推理需求。而接入側可以逐步按需推進,例如基站內嵌AI加速器可以支撐設備級的AI策略及應用。
第二,AI在網(wǎng)絡和業(yè)務控制層的應用:表現(xiàn)在可以優(yōu)先集成AI的推理能力,對網(wǎng)絡和業(yè)務實現(xiàn)智能網(wǎng)絡優(yōu)化、運維、管控和安全。實現(xiàn)網(wǎng)絡各層級的KPI優(yōu)化、路由優(yōu)化、網(wǎng)絡策略優(yōu)化等,例如無線的覆蓋優(yōu)化、容量優(yōu)化、負荷優(yōu)化等。
第三,AI在運營和編排層的應用:可優(yōu)先在大數(shù)據(jù)平臺上引入AI引擎,對OSS和BSS數(shù)據(jù)做更深度的智能化挖掘。隨著虛擬化網(wǎng)絡的部署,編排層上可以逐步疊加AI能力,從而提升產(chǎn)品編排、業(yè)務編排、端到端資源編排的自動化和智能化水平。進而對業(yè)務量的變化做前瞻性的智能預測,實現(xiàn)動態(tài)規(guī)劃和管理配套的資源。
韋樂平表示,AI網(wǎng)絡應用主要有三大場景:一是高效智慧運維場景;二是個性化業(yè)務服務場景;三是網(wǎng)絡安全場景。在高效智慧運維場景中,可對網(wǎng)絡進行預防性、主動性維護,實現(xiàn)集約資源智能調度,對業(yè)務質量閉環(huán)優(yōu)化。在個性化業(yè)務服務場景中,可使用網(wǎng)絡業(yè)務相關的大量數(shù)據(jù),利用這些數(shù)據(jù)以及網(wǎng)絡其他數(shù)據(jù)、CRM信息能夠給客戶個性化服務的分析和建議,例如結合企業(yè)專線的帶寬利用率、周期性潮汐流量特征、特殊試驗要求等能夠更好地設計個性化業(yè)務和靈活的資費模式。而在網(wǎng)絡安全場景中,可利用AI/ML學習技術針對惡意/病毒會話特殊的會話字節(jié)、頭端包大小和頻次、病毒特征字節(jié)等信息進行統(tǒng)計分析,從而在惡意流量攻擊的早期就能識別,對于潛在的、前期的惡意病毒進行預警。
不過,由于技術尚未成熟,AI的網(wǎng)絡應用還面臨四大挑戰(zhàn):首先,AI成功應用的前提是足夠大的訓練數(shù)據(jù)。盡管電信網(wǎng)絡數(shù)據(jù)足夠大,但由于部門和各管理層級的數(shù)據(jù)語義和格式不同、數(shù)據(jù)存儲和管理應用機制不同、數(shù)據(jù)監(jiān)管限制等原因,能真正有效利用的數(shù)據(jù)并不足夠;其次,AI/ML與網(wǎng)絡結合的價值場景尚不清晰;再次,盡管相對而言,AI算法比較成熟,但網(wǎng)絡和業(yè)務遠比目前已經(jīng)成功應用AI的圖像、語音識別和單一棋類博弈要復雜,特別是還缺乏成熟可靠的電信網(wǎng)絡和業(yè)務的建模和特征表示及提取方法;最后,現(xiàn)有運營商垂直煙囪式組織架構不適應AI使能的新網(wǎng)絡。