承德石油高等專科學校計算機與信息工程系 張清濤
大數據這個概念的推廣,始于2008 年白皮書《大數據計算:商務、科學和社會領域的革命性突破》的發表,自此研究人員及業界高管開始認識并正視這一概念,隨后《Big Data:Science in the Petabyte Era》的發表,讓這一概念傳播開來[1]。在計算機網絡信息管理領域,大數據技術得到了廣泛的應用,使得網絡安全系數有效提升,為信息產業的長效穩定發展提供了技術支持。
在大數據時代背景下,數據更新速度提升,數據信息呈現出多元化、海量化特征,數據信息獲取渠道增加的同時成本降低,掌握海量數據信息,分析市場發展規律,能夠為行業發展提供決策支持,基于這一戰略意義,當前大數據技術被廣泛應用于企業管理、教育培訓、物流運輸等領域。
從技術層面上分析,大數據中包含以下核心技術:(1)數據收集技術。借助管理系統、WEB 信息系統、物理信息系統、科學實驗系統,可采集海量信息,為數據分析提供基礎。(2)數據存取技術。采集到海量數據信息后,需進行儲存,常采用的技術路線有大規模大結構化數據、半結構化和非結構化數據、結構化與非結構化混合數據這三類。(3)基礎架構。基礎架構可分為云存儲、分布式文件存儲兩類。(4)數據處理技術。這項技術能夠將不同結構形式的數據幾何,集成、整合成一個新的數據集,為后續的數據分析、檢索打下良好的基礎。(5)統計分析技術。這項技術中包含特征檢驗、假設檢驗、關聯分析、卡方分析、曲線分析、對照分析、逐級回歸等多種數據分析方式。(6)數據挖掘技術。大數據中有著海量信息,并不是所有的信息都是你需要的,所以需要應用數據挖掘技術,尋求目標數據信息。(7)模型預測技術?;跀祿治觥⑼诰蚪Y果,構建預測模型及仿真模擬。(8)結果呈現。以標簽云圖、關系圖的形式,可視化展現數據采集、處理、分析結果。
在計算機網絡信息管理中,應用云計算技術,需要網絡計算模式和集中處理技術協調配合,聯合構建數據模型,并集中處理數據信息,再將其遷移到云端,這樣能夠有效降低計算機系統的信息處理成本。借助云計算技術,技術服務軟件能夠在無線局域網中自動生成移動數據網格,形成閉環式信息反饋處理模型。應用這一技術時,首先應繪制標準的數據流圖G=(V,E),然后再應用公式計算,生成一系列的組合及遠程傳輸數據的隱形通道,設置出口節點,輸出對應數據,處理數據流圖的關鍵部位時,應用向圖模式和配套公式完成運算和控制。在應用云計算技術進行數據信息的動態配置管理時,則需構建無向圖模式,這樣能夠有效整合多元化數據,提升計算機系統的數據容載量,提升數據處理效率,實現資源共享。
在大數據時代,進行數據備份是確保信息安全的關鍵性策略,但是不少企業都忽視了這項工作的重要性,據調查統計,應用數據備份系統的企業不到20%,而同時應用數據備份系統、容災系統的企業不到5%。在應用數據備份技術時,企業可以根據自身需求,從移動硬盤、U 盤、磁帶這三種存儲介質中選擇一種,拷貝數據,分開存放,并且在存放地點配置計算機及遠程通訊設備,如遇突發狀況,立馬啟動數據備份系統,以防數據丟失。同時,企業管理系統應該和數據備份系統連接起來,這樣數據損壞或丟失后,工作人員可以從備份數據庫中,調取相應數據,確保企業管理運營活動能夠盡快恢復,從而減小損失。同時,盡量做到異地存放,在存放地點配置完善的計算機裝置與遠程通訊裝置,以便在發生突發狀況時,快速啟動數據備份系統,防止數據丟失。另外,還應將數據備份系統與企業管理系統予以有效連接,提升損壞數據的恢復效率,保證企業相關工作的有序進行。除此之外,還可以將數據信息用遠程技術壓縮處理,制作成光盤,單獨存放管理,進一步提升企業信息的安全性。數據備份技術還有數據庫動態追蹤及監管功能,備份機上能夠自動更新監控日志及備份磁盤,有效保護企業信息。
所謂大數據,就是通過常用計算機軟件實現高效信息處理、管理的巨量數據信息集合。數據是一種沒有實際形態的東西,看不見也摸不著,但是作為一種信息載體,廣泛分布在人們的日常生活及社會的生產活動中,在計算機網絡信息管理中,可以利用大數據技術展開數據的收集、儲存、分析、挖掘、應用,提高知識層次,充分發揮信息的利用價值[2]。