馬幸飛
摘 要:隨著科學技術的不斷進步,計算機技術與信息技術已經在社會各領域得到了廣泛應用,其中,以信息交換、傳輸、統計、分析與存儲為一體的數據中心建設成為信息化時代的重要標志。文章以數據中心自動化運維管理及平臺建設為主要內容,通過深入了解自動化運維的相關內容,從而指導數據中心自動化運維平臺的建設。
關鍵詞:數據中心;自動化;運維;管理;建設
中圖分類號:TP39 文獻標志碼:A 文章編號:2095-2945(2017)36-0103-02
在計算機技術的應用中,通過軟件等一系列非人為方式的操作與控制類型,就是所謂的自動化運維。自動化運維技術的應用,在提高運維工作效率的同時,也減少了因人為失誤所造成的損失。基于當前計算機軟件技術發展水平的限制,并不能夠真正意義上實現運維工作的完全自動化,在自動化運維實現的過程中,需要借助科學的運維管理方法,在一定的原則下,使數據中心能夠完成自我運行和維護。
1 自動化運維管理概述
計算機運維技術由來已久,在運維技術發展初期,僅有的幾個服務器中所存有的數據信息極為有限,時至今日,信息技術的發展,為數據中心的建立奠定了基礎,在此基礎上,計算機運維技術也得到了很大程度的提高。研究人員根據用戶需要,設計出與之相適應的管理軟件,從而實現了有人參與下的數據中心自動化運維管理。
自動化運維的實現,大大減小了傳統人工運維管理下的時間延遲,將人們從反復性的工作中解放出來,大大提高了工作效率。不僅如此,基于計算軟件技術的自動化運維系統還可以實現自我狀態監控,對運維管理中的各種風險進行預估,并根據軟件中閾值設置的大小發布預警信息,從而降低自動化運維過程中存在的風險,減少因自動化運維風險導致的成本支出。
2 自動化運維管理需要實現的功能
無論是政府、企業或者學校,在自動化運維技術的實現方面,需要大量的功能予以保證,從當前自動化運維管理工作中廣泛使用監控和診斷優化工具、流程自動化工具可以看出,自動化運維管理需要實現的功能主要包括以下幾個方面。
2.1 自動監控功能
隨著自動化運維管理的不斷普及,以及自動化運維系統的擴大,運維人員在數量上已經無法滿足日常管理需要,以至于不能及時發現其中存在的風險,進而導致較為嚴重的后果。因此,實現自動化運維的自動監控功能,有利于通過數據分析,對相關運行風險進行評估,并將評估結果上報計算機管理員,以及時提出應對措施。
2.2 自動檢測配置變更功能
在實際運維工作中,由于工作量的增加,導致在軟件配置方面極易發生遺漏現象,因此,自動檢測配置變更功能的實
現,能夠使運維人員通過遠程控制的方式,檢查對應軟件的配置信息是否與約定配置相同,若不相同,則需要通過遠程配置的方式,對軟件中的配置進行變更,與此同時,觸發自動化運維變更流程。
2.3 自動提示功能
運維工作是一項極為復雜的工作,對運維人員有著極高的要求,在運維管理工作中,自動化運維平臺需要對任務類型進行分類,并嚴格按照流程執行相關任務。但是,在實際應用中,自動化運維平臺出現故障的幾率較高,一旦出現故障,自動化運維平臺將向運維工作人員發出告警信息,并為工作人員解決故障提供指導。
2.4 自動記錄維護過程
為實現自動化運維系統的溯源性,則需要對每一次產生的數據進行記錄,并且,在運維人員例行檢查的過程中,對其檢查過程進行詳細記錄。如此一來,運維人員可以通過該維護記錄掌握其常見故障,以及對應的解決方法,從而提高了自動化運維平臺的可靠性。
3 自動化運維平臺建設的主要內容
3.1 構建自動化運維管理平臺
自動化運維管理平臺是數據中心自動化運維平臺的核心,通過自動化運維管理平臺,能夠實現對數據中心自動化運維平臺所存在的風險提出預警,并對其中出現的故障進行快速恢復。在自動化運維管理平臺的構建中,需要借助服務端、數據庫、互聯網、計算機等技術,實現對數據中心海量數據的監控,通過科學的數據分析,對自動化運維風險進行評估,同時給出降低自動化運維風險的建議。
3.2 構建數據中心自動化運維平臺的故障觸發流程
故障觸法流程,是指在自動化運維平臺出現故障之后,系統將自動對故障信息進行匯總,并啟動上報流程,將匯總后的故障信息發送至相關人員,并對這一故障將產生的風險進行預估,為運維人員后期故障的排查、處理提供依據,提高自動化運維平臺的故障處理效率。
3.3 設計完善的事件跟蹤流
自動化運維平臺的實現,是基于軟件對參數分析后的自我判斷,在軟件判斷行為做出之前,需要對數據庫中的信息進行比對,從而確保自動化操作的正確性。為實現的對自動化運維平臺工作情況的監督,自動化運維平臺的建設過程中,應當設計完善的事件跟蹤流,從而明確自動化運維平臺所發出的每一項指令,減少運維工作人員對系統的隨意操作,避免不必要的風險與故障出現。
3.4 增加關鍵流程管控
在自動化運維平臺的建設過程中,基于關鍵流程對整個平臺的影響,需要單獨進行管控。在觸發關鍵流程之后,運維人員需要對關鍵流程進行分析,詳細介紹該流程的含義、處理機制,以及對平臺的影響,從而為流程審批人員提供參考。除此之外,針對關鍵流程所產生的影響,運維人員應當進行特別監視,避免關鍵流程所引起的自動化運維平臺連鎖反應造成的影響。
4 數據中心自動化運維平臺的設計目標
基于數據中心自動化運維平臺相關設備眾多,技術難度較高等一系列特點,在平臺設計目標的制定方面,應當具有以下三個方面的特點:
4.1 指導性
為避免人為因素導致的各種風險,數據中心自動化運維平臺的設計應當具有一定的指導性,利用計算機軟件技術在數據處理方面的優勢,通過科學的分析,對風險進行評估,為運維管理工作提供依據,從而提高自動化運維平臺的安全性,降低平臺運營風險。endprint
4.2 實時性
自動化運維平臺的相關工作均以數據流的形式進行展現,因此,為保證自動化運維平臺的工作效率,數據的實時傳輸就是必要條件之一。數據傳輸的實時性,能夠使運維人員在第一時間掌握自動化運維平臺的工作狀態,并根據數據分析的結合,對可能存在的風險進行防范。
4.3 可靠性
數據中心自動化運維管理平臺建設的目的是實現以數據為參考的自動化運營和維護,因此,數據的可靠性就顯得至關重要。因此,在自動化運維中心的設計過程中,需要增加數據監控、對比、分析的功能,保證數據的真實、有效。
5 數據中心自動化運維平臺功能的實現
5.1 基于本地數據庫與異地數據庫的同步監控
在自動化運維管理工作中,以本地數據庫和異地數據庫之間的數據監控的同步進行為核心,從而實現對應數據的精準復制,確保數據中心安全。在缺少自動化運維技術的情況下,該工作只能由人工完成,通過對源端和目標端之間數據狀態進行檢查,從而完成相應的數據處理工作,這大大加重了運維工作人員的工作量,其效率也明顯偏低。
為此,技術人員通過編寫程序的方式,在本地服務器上運行Shell腳本,并通過互聯網將數據信息傳輸至自動化運維平臺的數據庫中,提高了數據的有效性,還可以更加及時對故障進行預警,并將故障點在自動化運營平臺上顯示。
5.2 應用服務與數據庫服務可用性監控
作為運維人員的評估項目,應用服務狀態與數據庫服務狀態建設關系到政府、企業和高校的正常運營。在缺少自動化運維平臺的情況下,相關風險不能提前預警,具有不同程度的滯后性,從而大大降低了相關工作效率。
在自動化運維管理平臺的基礎上,通過對應用服務與數據庫服務的實時監控,將大量數據傳送至自動化運維管理平臺的前端,運維人員借助軟件對相關數據進行分析,從而大大加快了數據分析的速度與準確度。在此過程中,一旦發現存在風險的數據信息,則會由自動化運維管理平臺進行預警,從而彌補了傳統人工運維過程中故障處理的滯后性。
6 結束語
大數據時代的到來,使政府、企業、高校工作的信息化程度不斷加深,以數據中心為代表的新技術為政府、企業、高校等各項工作的開展帶來了極大便利。加快數據中心自動化運維管理建設,是降低數據中心管理過程中人為因素導致的故障,減少運維管理成本,提高管理效率,實現真正意義上自動化管理的必然選擇。
參考文獻:
[1]朱玉立,任義廷.淺談大數據時代下的數據中心運維管理[J].信息系統工程,2015(11).
[2]蔣飄蓬.基于云計算的數據中心服務架構研究與實踐[J].電腦知識與技術,2017(22).
[3]王維沂.現代企業數據中心運維管理[J].商,2015(14).endprint