姜 珂/文
隨著信息技術的發展,物聯網、云計算、移動互聯技術、云時代等各種新信息化名詞不斷出現,人們驟然發現已不知不覺地處在新的信息化時代——大數據時代,并成了大數據中的一員。隨著大數據時代的到來,數據的重要性逐漸突顯,數據已經成為一種重要的生產要素,它和黃金、能源一樣寶貴,卻又能實現反復的利用。大數據在帶來挑戰與機遇的同時,也給人帶來了更多的思考。
大數據可以理解為大規模和超大規模的數據集,但是大數據時代不僅僅是對這些數據的存儲和掌握,最重要的意義在于對特定的數據集進行專業化處理,以達到盈利的目的。業界對大數據的特征概括為4個V:Volume(數據量)、Variety(類型多樣)、Value(價值)、Velocity(速度)。
數據量巨大:由于新媒體技術的發展,信息傳遞的方式在改變,速度在加快,各種終端設備產生了大量的數據。
數據類型繁多:由于新媒體技術的產生,數據不僅僅是結構化數據,更多的是非架構化數據,例如視頻、聲音、文字、照片等,數據類型的多樣化給數據處理分析能力提出了更高的要求。
價值密度低:大數據時代,人們被各種數據不停地轟炸著,但是真正有價值的數據也許瞬時而過。以監控視頻為例,不間斷的錄制好幾天,可能真正需要的數據也就那2、3秒。但是就這2、3秒也許就能起到關鍵性的作用,具有很高的利用價值,
速度處理快:快速處理相關數據是大數據時代的一個顯著的特征,也是區別傳統數據處理的一個重要指標。尤其是在數據量龐大、數據類型繁多,數據價值密集度低的情況下,數據的處理速度將會直接影響企業的發展,且受到數據時效性的約束,大數據要求數據的處理速度更快,實時性更高,提煉的數據更精準。
從大數據的4個特征看,大數據不僅僅是一項技術或一個平臺,而應該是一個集成性的平臺,一個能夠幫助我們很好的收集、匯總、處理數據的平臺,能迅速地從垃圾數據中提煉出對企業有幫助的信息。
大數據與傳統數據的另一個顯著差異是具有更加豐富的數據類型。傳統數據偏重于描述對象,而大數據更傾向于對數據過程的記錄。為了便于大家理解,下面簡單地舉個例子說明傳統數據與大數據的記錄方式有何區別。
傳統數據的記錄方式如表1。

表1 傳統方式下小明的一日三餐記錄
大數據的記錄方式如表2。

表2 大數據時代下小明的一日三餐記錄
可以很明顯地看出,傳統數據和大數據記錄數據的最大區別是大數據不僅對對象進行了描述,還加入了地點、時間等維度,這樣的數據記錄的是一個過程,從小明到達餐廳之前開始一直到小明離開餐廳結束,這整個過程都會被記錄下來。而傳統數據的記錄方式更傾向于對結果的簡單描述。
當然,大數據能記錄的用戶就餐數據遠不局限于上述所列的字段,理想狀況的大數據監控甚至會記錄用戶吃飯的方式、吃飯時的行為、吃飯時的面部表情等一系列數據,這些數據反映了用戶對就餐環境的感受,對餐食口味的反應,進一步可以用來改進就餐環境、食物口味,給出點餐建議。
大數據與傳統數據的關鍵差異在于其價值的不可估量。傳統數據的價值體現在信息表象和傳遞,是對現象的反饋和描述,讓人通過數據去了解數據。而大數據記錄了現象發生的整個過程,通過數據不僅能夠了解對象,還能分析對象,把握對象運作的規律,挖掘對象內部的結構與特點,甚至能了解對象自己都不知道的信息。
大數據價值的特殊之處在于它的可挖掘性,同樣的一堆數據,不同的人能從中看到不同層次的東西。就好像同樣見一個人,有些人只看他的外形漂不漂亮,有些人能從他的表情中讀出心理活動,從眼神中看出閱歷,從衣著打扮中了解品位,從鞋子上了解生活習慣。我們要用技巧與實力去挖掘出來這些深層次的非表象的內容,這就是我們統計大數據的現實意義。
運維中心在運維過程中有可能產生的數據一般來說有以下四種:(1)工作交流類軟件:用戶通過工作交流軟件與運維人員進行交流,工作交流軟件上會記錄用戶的疑問和難點。(2)管理類流程數據:用戶的申請記錄、故障問題的處理工單、設備的部署信息等。(3)服務目錄變更、出入口管理數據:設備的出入庫管理和服務目錄變更管理類數據。(4)硬件系統的狀態監控信息:主要是對硬件設備的電源供電環境、機房環境狀況和設備的運行狀態進行監控而得到的數據,如機房溫度、機房濕度、(電源、內存、CPU)的運行狀態信息等。
運維中心每天都會從各種渠道得到大量的數據,而這些數據完全滿足大數據時代的4V特征:數據量龐大,每天有無數人咨詢各種各樣的問題或提出各種各樣的服務請求;數據類型繁雜多樣,有文字、視頻、圖片、語音等非結構化數據較多;數據價值密度低,很多監控類數據均沒有利用價值;目前運維中心數據處理能力不高,對這些數據的分析和利用均靠運維人員的運維經驗和專業技能,且大多數都是以報表或圖表的形式來進行展示,分析的效率極低,使用率還不足10%,且實效性差,因此,難以滿足運維中心高效工作的要求。
解決故障問題時,通常由于信息不對稱或不及時造成故障,問題遲遲得不到徹底解決,大部分時候運維人員僅僅能想出一個臨時解決方案,這樣的結果是導致重復告警,多次的重復告警會讓運維人員產生麻痹思想,降低了運維人員對故障的警覺性和敏感性。
傳統的運維方式通常依賴于運維專家的運維經驗,而一個運維專家需要長時間的培訓或工作才能得到,周期非常長,且運維專家在處理問題時的主觀性很強,對處理故障問題有很大的影響。因此,如何快速的提高運維數據的利用率成了擺在運維人員面前的一道難題。
現階段如何在這海量的運維數據里,發現運維的價值、方向,提升運維管理水平,提高運維人員的業務技能、從而獲得較高的用戶滿意度,將成為運維中心需要深度思索的問題。
工作藍信、郵件、微信、QQ等充斥著運維中心的角角落落。這種以網絡為基礎的溝通方式方便快捷,而得到了人們的青睞,現在的人們可以輕松地用電腦或手機實現各種類型的文檔和信息的傳遞,運維中心人員在和用戶交流過程中,大數據分析平臺可以協作運維人員分析出哪些區域的用戶基礎比較薄弱,哪些區域的用戶對某些服務請求有比較高的需求,哪種問題有比較多的用戶咨詢這種通過數據互通,場景互聯,讓數據維度更加豐富,從而能更好地知道用戶是誰,用戶的痛點在哪里。然后幫助運維人員更好地知道用戶需求,運維中心人員就可以有針對性地對這些用戶和問題進行分類處理,提供更好的服務,以提高用戶滿意度,從而帶來更大的數據價值。
近年來隨著網絡和信息安全問題的日益復雜和攻擊手段多樣化,對網絡與信息安全風險的防護能力提出了更高的要求。雖然不少用戶都通過Web應用防火墻、入侵防御系統、抗拒絕服務攻擊系統、下一代防火墻等安全防護手段構成了一整套安全防護體系,但是如果各類安全防護手段都是獨立部署,缺乏公司層面統一的日志管理分析系統,就不能及時發現各種異常行為事件,給信息系統的整體安全性和可用性帶來極大的安全隱患。因此,需要通過部署大數據分析平臺,收集、索引和利用所有應用程序、服務器或網絡設備所生成的機器數據,包括操作系統、虛擬化、應用程序、數據庫和聯網數據。通過搜索、警告、報表和知識庫,關聯分析跨越多個系統的復雜事件,并快速定位安全事件、集中排查安全風險和及時發現安全威脅,提升IT業務整體智能化水平。
隨著高科技產品的不斷推出,用戶獲取知識的渠道也越來越廣泛多樣。通過手機或電腦獲取相關知識成為人們目前使用的最為廣泛的方式。因此,把用戶常咨詢的問題或故障處理步驟,做成知識存放在知識庫里,建立長期有效的知識庫。把運維經驗知識化,利用人工智能系統可以做到7×24小時的常見問題答疑,從而實現知識共享,又能極大地方便用戶,提高用戶對系統的滿意度,同時還能提高運維響應速度和服務質量,最后還能避免由于運維人員的流失造成的知識流失,降低運維成本。而大數據分析平臺可以根據依據用戶的咨詢情況分析哪些可以形成知識存放于知識庫,并提醒運維人員對該知識進行相應的處理;可以協助運維人員知曉知識庫里哪些知識常被查詢,用于確定哪些知識是屬于有效的知識;還可以在用戶查詢知識庫信息的時候,把相關信息都推送給用戶,以縮短用戶查詢的時間,提高用戶查詢的準確性,并可以督促運維人員不停地優化知識庫里的相關知識,達到更好服務用戶的目的。
在大數據時代,高效利用各種數據資源為用戶提供更好的服務,已成為運維中心競爭的關鍵手段,大數據挖掘分析計算就是從海量的、非完整性的、價值密度低的和隨機的數據中提取隱含在其中的有價值的數據和信息的過程。對運維中心而言,對運維數據進行進一步的分析挖掘將有助于幫助運維中心發現新的價值點,有助于幫助運維中心轉變被動響應的運維模式,提供高其積極主動性。