云超 趙智偉 周輝 安娜
摘要:新的網絡特點、新的網絡架構的出現對運維管理提出新需求,NFV和人工智能等新技術驅動運維管理向智能化方向發展。運維管理體系架構經歷了集中式、分布式、基于策略的網絡管理架構和智能自主運維管理架構。集中式網絡管理結構簡單,管理職能集中,適用于小型網絡管理;分布式網絡管理適用于多業務、大信息量、需要靈活擴充容量的異構網絡。基于策略的網管在很大程度上提高了管理的靈活性和自動化程度,智能自主運維管理適用于高動態的彈性通信網絡,實現主動、協同、智能管理。
關鍵詞:集中式結構;分布式結構;基于策略的網絡管理;智能自主運維管理
中圖分類號:TP393 文獻標志碼:A 文章編號:1008-1739(2021)14-66-4
0引言
隨著通信網絡的發展,新的通信網絡呈現出如下特點:環境可感知、容量可伸縮、屬性可變化、能力可調整、萬物可互聯。這些特點對運維管理提出了新的管理需求,要求運維管理系統能夠感知網絡變化,動態調控物理和虛擬資源、進行網絡功能虛擬化編排,以及進行多維信息感知和融合呈現。
彈性網絡架構打破了以往垂直分割、封閉網元的靜態架構,對傳統的管理架構管理模式提出了新的挑戰。SDN/NFV、云計算、大數據、人工智能等新技術的發展也對運維管理提出了新的需求和挑戰。總之,新的網絡特點、新的網絡架構的出現,新技術驅動,都對傳統運維管理提出了挑戰。
1管理模式
隨著網絡管理對象規模增大、復雜性增加,同時大數據和人工智能等新技術的驅動,網絡管理模式也隨之發生了變化,集中式、分級式以及分布式等管理模式都是伴隨管理對象和技術的變化而升級變化的。可以概括為集中式和非集中式兩大類,其中分級式和分布式2種模式歸為非集中式管理模式。隨著網絡和新技術的發展,又出現了基于策略的智能網管體系和智能自主運維管理模式。
1.1集中式網絡管理模式
集中式網絡管理模式是最早出現的,也是最常用最普通的一種管理模式。在集中式管理模式下,所有的網管代理統一由一個管理站管理,協同工作實現集中管理。在集中式網絡管理模式下,在全網設置一個統一網絡管理節點,稱之為管理站。所有的管理軟件和管理功能均部署在管理站上,管理站負責對全網進行統一集中管理:統一規劃和調控全網資源,實時監視全網節點運行狀態并在拓撲視圖上實時呈現,監視全網端到端的路由和流量信息;對全網進行實時告警信息采集和呈現,故障定位、故障診斷和清除;對全網性能進行統計分析,設定性能閾值進行越限告警。
集中式網絡管理模式的優點是網管結構簡單、管理職能集中,有利于從整體和全局對網絡進行有效集中管理。然而任何事物都有兩面性,集中式管理的缺點在于:①所有的管理信息均需上報至管理站,極易導致網絡管理信息擁塞,管理站匯總存儲著全網的管理信息,一旦管理站發生故障則第一所有管理信息極有可能丟失。②全網管理工作無法進行,因此集中式管理模式具有明顯的可靠性、抗毀性差的問題。隨著網絡規模擴大和復雜異構度的日益增加,集中式管理模式很容易成為網絡運行瓶頸,致使網絡負荷不均衡。同時全網所有的管理數據在同一時刻涌向管理站,不僅占據大量帶寬,同時也極易導致管理站超負荷運行至崩潰,各種請求響應操作超時,管理性能大大降低。
1.2分級分布式網絡管理模式
隨著網絡規模增大和復雜性的提高,集中式管理模式日益暴露缺點,難以適應大規模高復雜網絡的全網管理功能。分級式網絡管理體系結構和分布式網絡管理體系結構應運而生。分級式網絡管理體系結構將網絡管理中心功能進行分級,可以根據管理需要分為一級、二級和三級網絡管理中心,一級網絡管理中心負責全網級的管理工作,根據管理規模,可以設置多個二級網絡管理中心;二級網絡管理中心實現本區域的管理工作;三級網絡管理中心實現本節點的管理。一級網絡管理中心對多個二級網絡管理中心進行管理,二級對三級網絡管理中心進行管理,在一級網絡管理中心故障時,二級可以升級為一級,進行全網管理,且可以根據管理規模和需要,橫向擴展二級或三級管理中心,或縱向延伸為四級管理代理。相對于集中式管理模式而言,分級管理模式具有可靠性高和管理靈活的優點。
分布式網絡管理模式是一種對等式管理模式。多個管理者可以按需部署在一個網絡系統中同時運行,每個管理者管理網絡中的一個特定管理域,協同管控整個網絡。任何一個管理者失效,其令居管理者均可以接管;而且在數據存儲和共享方面,每個管理者都可以存儲使用全網管理數據,共享其他管理域的管理信息。管理者之間可以對等通信,也可以通過上級管理者統一協同工作。
分布式網絡管理模式將管理者分布在網絡中,使得網絡負載均衡,相對于集中式網絡管理模式而言,大大提升了管理的可靠性和健壯}生,非常適應目前的大規模高復雜網絡管理。
隨著網絡發展和新技術的出現,新的管理模式應運而生,主動網絡管理、智能移動代理、基于Web的網絡管理、智能網絡管理、基于策略的網絡管理PBNM等新型管理模式如雨后春筍般涌現。分級、分布、智能管理體系已經成為目前網絡管理模式的主流,分布式和智能網絡管理適應目前大規模高動態高復雜的網絡形態和特點,有效提升了管理的自動性和智能性,已經成為目前流行的重要管理模式和研究方向。
1.3基于策略的網絡管理模式
基于策略的網絡管理(PBNM)的原理是基于策略將管理行為的控制和具體執行分離,初步實現了網絡管理的自動化。基于策略的網絡管理的重要組成部分就是移動代理。移動代理(Mobile Agent,MA)技術結合了分布式計算技術和代理技術的優點,MA具有自主}生、移動}生、智能性和平臺獨立}生等特征,將MA技術應用到網絡管理中可以提升管理的自主性。PBNM和MA這2種技術具有很好的互補性:智能代理技術能夠彌補PBNM中存在的技術復雜、廣泛分布、缺乏智能性、環境適應性差等缺點;將智能策略植入自動代理中可以按需設定MA攜帶代碼的容量,根據需要靈活設定MA的遷移路徑,提升MA與所運行環境的自適應通信能力,使用基于策略的訪問控制還可進行MA和運行執行環境的安全認證。綜上所述,PBNM和MA的結合對于提升網絡管理的自主性和智能性具有顯著的優勢。
基于策略的網絡管理能自主采集網絡和環境信息,不依賴于具體環境和網絡拓撲結構,能夠基于策略理解和執行各種管理指令,自適應調控資源,實現業務管理的自適應協商和配置,具有管理流程簡化、資源配置優化、強兼容性、易擴展性等特點,但是PBNM嚴重依賴于管理策略,不能根據網絡拓撲動態變化進行實時管理,被管對象無法自主管理,這些缺點不適合于彈性通信網絡的管理。將策略管理和移動代理與分布式管理相結合,能更好地實現智能自動管理。
綜上所述,集中式網絡管理模式在網絡拓撲、管理模式上都比較簡單,適用于小型網絡、業務單一網絡的管理。分級分布式網絡管理模式在網絡拓撲、管理模式和實現技術上相對復雜,更適合大規模高復雜性、多樣化業務的網絡管理。基于策略的網管在很大程度上提高了管理的靈活性和自動化程度,但是對被管對象的自主功能無法得到充分體現。不同的管理模式各有其優缺點,不存在一種“最好”的管理模式。每種管理模式都有適合的網絡和工作場景,可以根據被管網絡的特點和不同的應用環境選擇一種適合的網絡管理模式。
綜合分析對比集中式網絡管理模式和分級分布式管理模式的優缺點,同時結合彈性通信網絡的拓撲動態變化和用戶需求動態變化的特點,彈性網絡架構的出現打破了以往僵化的管理架構,以及SDN、NFV、人工智能等新技術驅動,需要具備管理規模自適應的智能自主的運維管理體系。
1.4智能自主運維管理架構
采用運維管理中心-域管理中心-管理代理的智能自主運維管理架構,同時結合策略管理技術,基于感知-分析-決策-執行實現智能自主自動管理,適應彈性網絡和應用的雙重動態變化,具備管理規模自適應能力。運維管理中心是彈性通信網絡管理的最高層,具有最高管理權限,進行彈性網絡全網級的運行狀態監視、端到端流量監控、跨網跨域資源調控、跨網跨域故障監視和處理。能夠基于任務進行資源規劃和調度,是運維管理的核心。負責進行動態分域,管理和委任各個域管理中心,向域管理中心發送命令以達到監控和優化網絡,負責網絡規劃,向域管理中心發送管理命令進行通信網絡配置和任務分配,同時接收域管理中心上報的網絡狀態數據進行全局監控和優化。
運維管理中心采用固定位置或由域管理中心選舉產生,固定模式實現機制簡單,但是其抗毀性較差,選舉算法采用多因子加權算法,綜合考慮彈性網絡節點的位置、移動性、性能、管理能力等多種屬性,當原有運維管理中心故障時,域管理中心可以升級為運維管理中心,接替運維管理中心進行彈性網絡全網管控。
管理域是按照行政劃分或地理位置劃分的按照策略和規則確定的集合,域管理中心負責實施單個管理域的管理工作。域管理中心是運維管理中心的下級,域管理中心負責將本域的管理信息上報運行管理中心,同時接受上級運維管理中心的查詢和配置操作,上報本域重要信息和實時狀態,域管理中心與運維管理中心只進行必要的或者涉及全局或跨域的管理信息交互,減少了所有信息交互所帶來的帶寬占用和超負荷運行,管理域內的事情原則上由域管理中心自主管理和處理,大幅提高管理性能和效率。
各個域管理中心可以通過協作完成單一域管理中心不能獨立完成的管理任務。域管理中心負責本管理域內地面網絡和空中網絡的管理,整個彈性通信網絡的管理需要由不同的域管理中心共同完成,即域管理中心通過協作的方式完成單—域管理中心無法實現的任務。
網管代理是策略和命令的執行者,受所在域中域管理中心的管理。網管代理屬于唯一的域,受其所在域管理中心的管理。網管代理是各種策略的具體執行者。
每個網管代理管理所在的節點,多個代理形成一個域并由域管理中心管理,域管理中心由運維管理中心管理。各個域管理中心接收運維管理中心分發的管理任務,整理和處理收集本管理域的數據,管理本域內的多個代理節點,同時把影響整個通信網絡管理的數據上報給運維管理中心,本管理域的拓撲、故障、性能和配置等信息由域管理中心自主完成管理,具有高度自主性和自治性,大幅提高了網絡管理效率。
管理域劃分既可以依靠網絡規劃時的域分配情況,也可以通過彈性通信網絡拓撲結構動態變化來觸發管理域的動態更新和劃分。通過管理域的劃分,具備管理規模自適應能力,根據網絡的動態變化隨時增加或減少管理域;通過運維管理中心之間的協作運行,實現資源自適應配置、對系統運行情況的監視、診斷和智能處理、安全問題的及時監測和自我保護以及系統狀態發生偏移時進行有效調整和優化,最終達到彈性通信網絡的自主化、智能化運維的目標。
域管理中心具有自主管理能力,當運維管理中心發出簡單的管理指令后,域管理中心能夠獨立完成某些管理功能。例如,域管理中心可以將運維管理中心下發的管理任務進行管理域內分解,根據各個MA的當前網絡狀態進行合理分配,并根據任務需求選擇合適的派發方式,如采用基于移動代理技術的任務委派方式。另外,域管理中心還負責管理域配置、密鑰的分發和更新、故障診斷或排除等,既可提高網絡管理的自主}生和實時性,又可降低管理開銷。
基于策略的管理代理負責接收域管理中心分配的任務和配置信息,并及時將自己的狀態信息上報給域管理中心。另外,基于策略的代理具有一定的自主性,同處于一個管理域內的策略管理代理之間可以相互協商,進行任務的委托和遷移。
與傳統的網絡管理相比較,智能自主管理具有如下優勢:
①自主管理實現了主動管理,網絡的變化觸發感知,進行動態分域和自動處理,實現了自主管理,提高了管理效率。
②自主管理增加本域故障診斷和故障處理,減少了故障處理時延,增加了管理自主性。
③自主管理可以滿足高動態彈性通信網絡高抗毀性的要求,一個域管理中心乃至運維管理中心的失效可以由其他域管理中心代替管理,并不影響整個運維管理系統的運行。
④自主管理可以保證實時運維管理,且能根據網絡節點的增加和減少相應地增加或減少管理域,具備管理規模自適應能力。
⑤基于策略和移動代理的智能管理與域管理中心之間的自主協作相結合,實現智能自主管理。
⑥管理域具有擴展性,可以根據網絡規模的大小和管理層級的伸縮按需靈活擴展。2網絡管理架構總結
網絡管理系統成體系發展,體系逐步完善。由單一設備的管理、對網絡的管理、對業務和應用的綜合運維管理;管理模式由集中式到分布式到智能自主運維管理模式;形成了由網元管理系統、專業網絡管理系統、綜合網絡管理系統、綜合運維管理系統的管理體系。
實現了集中控制下的分布式專業網絡管理和綜合網絡管理,網絡管理體制適應通信網絡組織管理機構的編成,各級各類管理機構都具備了自動化集中管理所屬專業網絡及其綜合網絡的基本手段。
專業網絡管理系統具備掌控全程全網的拓撲、性能、故障、配置和資源等運行情況的能力。綜合網絡管理系統以專業網絡管理系統為基礎,實現了綜合網絡拓撲、性能、故障、配置和資源的綜合管理。宏觀監視和掌握各專業網在性能、故障、配置等方面的總體運行情況,網系間的關聯故障進行關聯分析和準確定位,綜合統計分析各網系運行情況的主要特征指標,按規范化工作流程進行網系問性能、故障、配置等方面的管理作業,處理各類通信業務,而向保障任務進行綜合的業務管理。
3結束語
運維管理系統以及體系架構的發展經歷了從集中式、到分布式到自動運維到智能運維的階段,運維管理系統的發展趨勢如下:
(1)進一步提升網絡管理的彈性和自主性
基于SDN/NFV技術的彈性網絡架構,成為下一代網絡的重要發展方向。彈性網絡架構突破了傳統的垂直分割、剛性網絡體系和復雜繁多的封閉網元架構。改變了現有網絡的部署、操作和管理方法,因此彈性通信網絡的管理、資源調度和監視也會對現有的網絡管理系統帶來極大的挑戰。需要構建縱向貫通、橫向協作的彈性化自主化網絡運維管理機制,實現通信網絡無配置、零規劃開通運行。
(2)SDN/NFV、云計算、云存儲、大數據技術在運維管理中的應用
將SDN/NFV、云計算、云存儲、大數據技術思想應用于運維管理,使得運維管理在管理架構、信息感知和存儲、多維態勢認知、大規模業務流量和用戶行為分析等方面與先進的技術結合,提高管理的智能性和先進性。