李雅男
【摘 ?要】隨著經(jīng)濟的發(fā)展和科技的進步,電信運營商業(yè)務(wù)的增長,特別是4G及5G時代的到來,電信運營商數(shù)據(jù)中心的規(guī)模逐漸龐大,設(shè)備類型,數(shù)據(jù)類型,及大數(shù)據(jù)平臺及云平臺的出現(xiàn),給傳統(tǒng)的運維手段帶來了新的挑戰(zhàn)。本文就智能化運維管理平臺的規(guī)劃設(shè)計展開探討。
【關(guān)鍵詞】智能化;運維平臺;設(shè)計
引言
智能化運維管理平臺建立的意義在于能夠保證運維管理的體系化及運維管理的自動化,同時能夠提升運維管理的質(zhì)量及運維管理的效果,運維管理能夠保證網(wǎng)絡(luò)運行的穩(wěn)定化,安全化及正?;?,能促進各企業(yè)運作的體系化,及保證信息交互的安全性和穩(wěn)定性,能在一定程度上維系各行各業(yè)的穩(wěn)定發(fā)展,降低發(fā)展過程中所承受的風險及損失,進一步推動網(wǎng)絡(luò)技術(shù)及互聯(lián)網(wǎng)在行業(yè)中的應(yīng)用發(fā)展,提升其所占據(jù)的地位,進行智能化運維管理平臺的研究是具有實際價值的。
1智能化運維管理平臺整體設(shè)計
按照平臺即服務(wù)的設(shè)計理念,統(tǒng)一運維的基礎(chǔ)采控、數(shù)據(jù)計算、組件服務(wù),使得上層的各類運維工具、場景、應(yīng)用實現(xiàn)無縫打通和擴展,為運維的持續(xù)良性的發(fā)展奠定基礎(chǔ)。(1)統(tǒng)一采控平臺:分布式的資源采控體系,完成被管理資源統(tǒng)一采控,實現(xiàn)統(tǒng)一的第三方系統(tǒng)集成和納管。(2)數(shù)據(jù)處理平臺:可建模運維大數(shù)據(jù)服務(wù),預(yù)置運維模型和分析算法,從而統(tǒng)一運維數(shù)據(jù),形成數(shù)據(jù)資產(chǎn)。(3)組件服務(wù)平臺:提供常用運維服務(wù)組件,封裝典型場景的API擴展,快速拓展運維應(yīng)用,實現(xiàn)持續(xù)發(fā)展。
2智能化運維管理平臺的規(guī)劃設(shè)計
2.1數(shù)據(jù)存放軟件的優(yōu)化與規(guī)范化
智能化運維管理平臺實現(xiàn)的要求、數(shù)據(jù)安全性的保證及數(shù)據(jù)運行的自動化的具體操作是對數(shù)據(jù)存放軟件進行優(yōu)化,即需要對數(shù)據(jù)的獲取設(shè)置相應(yīng)的程序,包括用戶、密碼、用戶限制對象及限定登入頻率,以此來自動化的保證數(shù)據(jù)運行的安全性及穩(wěn)定性,同時保證運維管理平臺的正常運作,及運作安全系數(shù)的提升。管理體系與數(shù)據(jù)軟件相關(guān)聯(lián),在數(shù)據(jù)軟件正常運作的過程中,管理體系跟蹤性的運作,能夠保證獲取到數(shù)據(jù)的運作軌跡及輸送軌跡,同時對管理體系所設(shè)置的程序能及時的獲取運行過程中存在的漏洞與危險數(shù)據(jù),并進行及時的防御與控制,進一步保證運維管理平臺自動化運行的質(zhì)量。
2.2數(shù)據(jù)處理系統(tǒng)
數(shù)據(jù)處理系統(tǒng)運維集中存儲與處理各類運維數(shù)據(jù),這些數(shù)據(jù)來自不同類型的通信IT資源,也有著完全不同的結(jié)構(gòu)類型,因此專門設(shè)計數(shù)據(jù)融合管理模塊來對各類數(shù)據(jù)進行標準化處理、存儲與提供讀取API,形成運維大數(shù)據(jù)數(shù)據(jù)分析與智能運維管理能力。
2.2.1智能處理引擎
平臺提供多種類型的數(shù)據(jù)智能處理引擎:(1)實時計算:平臺對采集到的各類數(shù)據(jù),提供實時的數(shù)據(jù)計算處理能力,以數(shù)據(jù)流式處理的方式,從各類原始數(shù)據(jù)中,實時提煉出高層業(yè)務(wù)數(shù)據(jù)。(2)離線計算:平臺同時提供對歷史數(shù)據(jù)的定期跑批計算能力,定期加載海量數(shù)據(jù),通過計算節(jié)點的分布式計算能力,完成大數(shù)據(jù)計算處理。(3)算法庫:平臺內(nèi)置運維中需要使用的各類計算算法,并提供擴充庫,可不斷補充算法,以實現(xiàn)運維數(shù)據(jù)的多種加工計算要求。(4)模型訓(xùn)練:當數(shù)據(jù)平臺積累到較大規(guī)模的數(shù)據(jù)量后,可將這些數(shù)據(jù)導(dǎo)入機器學(xué)習(xí)過程,實現(xiàn)運維業(yè)務(wù)模型訓(xùn)練,如生成動態(tài)基線、資源訪問模式等功能。
2.2.2數(shù)據(jù)融合管理
運維集中存儲與處理各類運維數(shù)據(jù),這些數(shù)據(jù)來自不同類型的IT資源,也有著完全不同的結(jié)構(gòu)類型,因此運維平臺,專門設(shè)計數(shù)據(jù)融合管理模塊來對各類數(shù)據(jù)進行標準化處理、存儲與提供讀取API。(1)數(shù)據(jù)來源:平臺應(yīng)支持多種異構(gòu)的數(shù)據(jù)來源,包括鏡像數(shù)據(jù)、機器數(shù)據(jù)、應(yīng)用數(shù)據(jù)、撥測數(shù)據(jù)、人工數(shù)據(jù)。(2)數(shù)據(jù)存儲:平臺結(jié)合關(guān)系型數(shù)據(jù)庫與NoSQL的技術(shù)特點,提供出強一致性,的聯(lián)機讀寫數(shù)據(jù)庫;面向運維數(shù)據(jù)時序特點的時序列數(shù)據(jù)庫;以及大量各種資源半結(jié)構(gòu)化的描述型日志數(shù)據(jù);同時各數(shù)據(jù)庫均應(yīng)支持水平擴展,避免數(shù)據(jù)瓶頸。(3)數(shù)據(jù)模型:基于數(shù)據(jù)存儲。
2.2.3智能分析學(xué)習(xí)引擎
智能運維管理平臺收集的各類運維大數(shù)據(jù),可以通過機器學(xué)習(xí)的方式,訓(xùn)練出相應(yīng)的計算模型,以更好的支撐運維業(yè)務(wù)需要。主要包括以下部分:(1)算法庫:提供訓(xùn)練與消費服務(wù)需要的各類數(shù)據(jù)算法,平臺預(yù)置如復(fù)合抖動算法、趨勢預(yù)測、去噪濾波等多種算法,并允許擴展引入相關(guān)算法。(2)原始數(shù)據(jù)輸入:支持從運維平臺或外部數(shù)據(jù)庫,加載大量用于模型訓(xùn)練的算法。(3)訓(xùn)練任務(wù)調(diào)度:將訓(xùn)練任務(wù)分解為有向圖,每個節(jié)點代表任務(wù)中的一個計算環(huán)節(jié),通過分布式方式分散到計算集群中,利用主機的水平擴展能力,加速模型訓(xùn)練與計算任務(wù)的完成。(4)模型庫:訓(xùn)練任務(wù)完成的模型記入模型庫,以用于后續(xù)的分析與消費。(5)消費服務(wù)接口:通過接口接受運維平臺上層各類運維數(shù)據(jù)計算需求,根據(jù)輸入調(diào)用模型進行計算,提供輸出結(jié)果。
2.3運維智能化
(1)智能化監(jiān)控及故障診斷。采用基于業(yè)務(wù)、IT層級和全路徑三個維度的監(jiān)控覆蓋手段,結(jié)合數(shù)據(jù)處理引擎和智能的關(guān)聯(lián)分析算法,對海量監(jiān)控數(shù)據(jù)進行實時處理,實現(xiàn)較為準確快速的故障定位。目前,已基本實現(xiàn)近70%左右日常事件的自動識別能力。(2)運維數(shù)據(jù)分析及預(yù)測。運維管理工作逐步向業(yè)務(wù)運營和用戶服務(wù)等領(lǐng)域延伸,利用運維大數(shù)據(jù)實時數(shù)據(jù)處理能力,結(jié)合業(yè)務(wù)場景,對業(yè)務(wù)運營數(shù)據(jù)深入挖掘分析,協(xié)助業(yè)務(wù)部門優(yōu)化服務(wù)效率,提升運維服務(wù)價值。
2.4網(wǎng)絡(luò)安全領(lǐng)域的智能化研究探索
信息安全管理既是運營管理的關(guān)鍵領(lǐng)域,也是運用數(shù)據(jù)挖掘、機器學(xué)習(xí)、人工智能等新技術(shù)的重要場景方向。通過與國家信息技術(shù)安全研究中心聯(lián)合開展課題攻關(guān),設(shè)計開發(fā)了網(wǎng)絡(luò)安全情報系統(tǒng),致力于形成共享的情報獲取生態(tài)機制。在單要素威脅場景的精確檢測領(lǐng)域,結(jié)合自然語言處理等技術(shù),對深度學(xué)習(xí)算法在該領(lǐng)域的適用能力進行了研究,取得了優(yōu)于同類工具的檢測效果。
結(jié)語
隨著智能化運維管理平臺的順利上線運營,采用了自動化管理工具,運維的操作采用自動化的方式,運維效率較之前有顯著的提高,操作標準化與規(guī)范化水平提升,減少了電信運營商數(shù)據(jù)中心安全隱患與風險。運維態(tài)勢相關(guān)信息掌控程度提高,確保運行態(tài)勢保持合理水平,特別是系統(tǒng)監(jiān)控的相關(guān)新應(yīng)用,可以更加適應(yīng)大數(shù)據(jù)、云計算環(huán)境下的運營商數(shù)據(jù)中心的運維管理工作。
參考文獻:
[1]林莉.智能化運維管理平臺的研究與實現(xiàn)[J].福建電腦,2015(3).
[2]羅雁,孫立志,李峰.規(guī)劃二三維網(wǎng)絡(luò)綜合管理平臺的設(shè)計與實現(xiàn)[J].城市勘測,2016(5).
[3]田軍,陳文婷,羅志剛.智能化平臺在數(shù)據(jù)中心基礎(chǔ)設(shè)施運維管理中的應(yīng)用[J].現(xiàn)代建筑電氣,2015(9).
(作者單位:信息化管理中心普光項目部)