陳中元
(廣西民族大學相思湖學院 廣西 南寧 530008)
在信息化時代,信息系統作用的大小將決定社會生產環節的快慢。而智能化運維系統其實就是將大數據與云計算技術兩者進行結合,并以此為基礎,這樣能夠有效地解決這種傳統模式下IT運維服務的表現方式,在實際操作中就可以發揮大數據智能運維系統對網絡實時監控的有效性,同時其還具有對大數據進行分析的能力。這就使其能夠從根源上發現問題并發出警報,隨后進行自我調整,同時將各種危機狀況化險為夷。
和傳統的運維系統相比,這種將大數據和智能技術應用在運維系統中,就可以使其擁有對數據大規模進行搜索、快速進行處理以及大量開展業務等功能,使其起著非常關鍵性的作用。這種新型的大數據智能運維系統,在傳統的自動化基礎上實現了智能化,使其在應用過程中既減少了運維資金,又能夠提高對客戶的服務質量以及服務體驗。由于其將智能混合技術合理地應用,從而使其擁有了對各種工作進行動態化的管理及對內存的合理計算調節和全方位的調控等,用通俗的話來說,就是其可以將資源的利用達到最大化,從而節省對初期資金的預算[1]。
在大數據運維系統中,只需要我們對大數據技術進行簡單的基礎操作,就可以使各項運維工作達到各方面的基本指標,從而實現對每個服務器運行的數據進行實時動態管控。并且,其可以對運行日志統一進行收集,憑借著對不同非關系類型數據庫的有效借助,從而實現對各類數據進行多樣化存儲的功能。基于這項基礎,在Hadoop數據的集群當中,同一時間輸入每項所收集到的數據情況,就能夠使大數據技術對這些收集到的數據情況進行全方位的離線分析,并且同時生成相應數據的曲線圖。另外,可以將其和預先設定的相關數據做對比,在與監控報警系統進行合理關聯后,就能夠實現對目標數據進行實時監控,除此之外,還需要根據時代的發展趨勢進行有效分析。可以根據之前收集到的有關數據和算法,就能夠使預算模型獲取相應的應用基礎。此外,還需要觀察其運行狀況,從而合理地對未來服務器進行預測,運維人員可以針對這些所獲得的數據信息,從而提前對系統及硬件進行調整以及遷移。
就現如今的信息系統運維來看,將面臨著一個新的巨大挑戰——云計算技術。云計算技術在應用過程中,通常會以能量分散、管理集中的方式進行,從而就會對信息系統的整體架構以及運營模式產生巨大的影響。然而,對于傳統運維系統來說,想要把虛擬技術作為核心是一個巨大的挑戰,這主要是因為若想讓運維系統能夠正常地運轉,只運用傳統的監控以及數據分析是遠遠不足的[2]。從根本上來講,其主要存在著以下兩方面的問題。
在傳統的監控防護中,大多數監控都是按照發生問題-發現問題的位置-通告運維人員-運維人員處理問題的流程進行的。換句話來說,就是當出現了預警的聲音,就代表監控的相關工作人員已經發現了問題所在,這時候就需要將這個信息進行傳遞,合理展開控制和管理等相關工作。當然,能夠在這種環境工作的相關運維人員,其自身的專業素質也都是非常高的。因為,若其自身專業素質過低,發生問題的時候,就不能在第一時間找到問題根源,那么帶來的后果是不可估量的。
在大數據的環境中,指數式增長就是其數據特征之一。在海量的數據面前,頻繁地運用相對傳統的運維手段,這樣就易發生在工作當中出現死角的現象,既降低工作效率又沒能確保運維工作是否能夠正常完成。與此同時,在傳統的運維模式當中,沒有對管理人員以及業務人員進行多維度分析相關數據的工具配備,從而使這些運維人員無法針對這些大量的運維數據,合理開展運維方面的相關工作,從而導致問題沒能在第一時間得到有效處理,造成巨大的損失。
大數據智能運維系統其智能預警功能就是把監控對象的歷史數據以及此對象的走勢作為基礎,對統計學原理基礎充分利用,對被監控對象使用大數據技術進行詳細的了解并分析,從而可以有效地對被監控對象的平穩性做出準確的判斷。同時,其還可以對業務形態和時間范圍進行查看并分析,從而知道被監控對象之間存在的差異性。最終形成一個動態閾值,在不同的時間對業務進行實時勘測,通過利用這種動態閾值,就可以使性能監測機制得到進一步的提升,對傳統的預警監測進行改良,從而使其在動態上以及實時勘測上有著明顯的優勢。這樣一來,無效預警的出現概率就會大幅度降低,從而就可以使用戶更精確地感知系統中的性能是否存在異常狀況。
分析預測智能化,用通俗的話來說,就是在服務器當中對SAMATR信息和sysolg信息等一些不相同的信息進行基礎應用。與此同時,還應當做好相關的監督工作和對各種例子的模擬等。在進行一些特殊的場景時,若能夠將GBDT模型合理地引入或者借助LR,這樣就能夠有效地對服務器內部反復使用多次的部件出現故障的概率預測以及出現該故障的具體時間進行準確的,同時會采用相對應的措施,有效地對故障做出預防,從整體上來看,增強了IT架構的時效性以及可用性。另外,就產品和定制而言,利用智能技術對產品標準的準確預測及對方式的開發,能夠對動態閾值、瓶頸點獲取進行預測及分析,這些都是需要以IT系統能夠準確對容量進行預測為基礎。除此,通過智能預測對方式的定制開發的使用,就可以通過針對數據中心以及其余鏈路設計出一種全新的預測技術,從而對網絡流量實現針對性地預測,將其快速地作為決策依據,進而為流量數據的調度工作提供有效幫助。
根因定位智能化其實就是根據故障發生的原因,從而對發生故障的地方進行精確定位,該功能的工作原理就是將專家知識庫作為基礎,該功能通常會應用在相對困難的IT故障場景之中。與此同時,該功能也還可以對故障發生的位置做一些基礎的運算,可以有效算出該故障地方所影響的范圍以及對故障進行自動化修理的功能。
在能耗的智能化管控過程中,就需要對服務器數據以及運行的能耗進行全方位的采集,將集群和業務作為基礎,通過歷史數據的比對分析服務器的能耗狀況,同時與云平臺的業務調度機制相結合,通過使用powercapping、powersaving等相關的技術,從而使業務系統能耗得到明顯的優化,進而使其能耗最大化減少的同時又保障了其系統正常的運轉。
從大數據智能運維系統的整體來看,其主要包含著四大邏輯性各不相同的模塊,分別是采集器、存儲數據、對數據進行分析以及展示數據的模塊。這4個模塊表示著從開始直至展示的過程,其中所謂的采集器模塊就非常高效地運用分布式來實現數據動態化進行采集目標的,這種采集目標的方法在保障對數據資源高效采集的同時,又可以切實保障相關任務的完成效率。比如,主機、虛擬機、存儲和網絡等相關的數據都可以利用此技術進行采集。當然,在采集器當中,所有的節點的地位也都是平級的,只是在執行相關采集任務的時候會有所不同。當其中的某一項功能出現故障,導致停止運轉,那么控制中心就會像我們人身體中的白細胞受到指揮時的情形一樣,第一時間去查看發生事故的根本原因,隨后,控制中心就會將出現故障地方的相關采集任務分配給其他節點,從而減少數據采集過程中受到的干擾,以保證其完整性[3]。
大部分的系統當中都會有兩大數據模塊,他們就是擁有結構化的MYSQL數據庫和沒有結構化的MongoDB數據庫。其中,擁有結構化的MYSQL數據庫擁有相對較強的穩定性以及數據總量并不是非常龐大的特點。而沒有擁有結構化的MobgoDB數據庫主要擁有較好的更新頻率以及實時性,并且它的數據結構相對來說較為簡單。將這兩種數據庫合理地應用,那么若想存儲系統內全部的數據類型也不再是特別困難的事。
在大數據智能運維系統的運行中,數據分析模塊在其中起到的作用是非常重要的,其主要的功能就是對收集到的數據快速匹配相對應的任務進行分析,檢測此項數據完成的是否合格,將檢測合格的數據用最快的速度存儲在數據庫內部,從而降低計算機重復計算相同數據任務的概率。
展示模塊其實就是在我們運用圖表工具的基礎上,根據所收集到的相關信息做出圖形化處理的方式,將那些抽象的運維數據用直觀的數據圖進行展示,隨后將這些直觀的數據圖給相關操作人員進行查看,操作人員根據數據圖很快就能夠看出其運行狀況以及對應的相關結果,進而就可以提高工作效率。
綜上所述,在當今這個時代,隨著大數據、人工智能、云計算等技術的迅速發展,許多企業也開始跟隨時代的步伐,把智能運維系統的建立作為企業的發展方向,這源于智能化運維系統的便捷以及對各項業務的效率有著促進作用的緣故。與此同時,智能運維系統擁有著強大的技術基礎,當我們在處理運維系統中一些較為困難的問題時,可以為我們提供一條全新的解決思路。