摘 要:大數據的大量化、多樣化、數據流的快速化以及數據的低價值密度,使大數據的信息處理存在一定困難。本文介紹了大數據時代與計算機信息處理技術的基本概念,論述了目前計算機信息處理的核心技術,并對其發展進行了展望。
關鍵詞:大數據;計算機;信息處理技術
中圖分類號:TP3文獻標識碼:A文章編號:1003-5168(2019)29-0014-03
Research on Computer Information Processing Technology under
the Background of Big Data Era
LIU Cuifang
(Zhengzhou University of Industrial Technology,Zhengzhou Henan 451100)
Abstract: The large amount of big data, diversification, rapid data flow and low value density of data make the information processing of big data difficult. This paper introduced the basic concepts of big data era and computer information processing technology, discussed the core technology of computer information processing, and forecasted its development.
Keywords: big data;computer;information processing technology
大數據,可以簡單理解為大量的數據,具體則是指目前無法利用主流軟件進行挖掘、存儲、傳輸、處理及分析的數據集合。對于數據總量,行業內并沒有明確的規定,一般數據總量超過10TB即被稱為大數據。由于數據量太過龐大,因此其很難為用戶提供高效的信息處理服務。隨著網絡技術的發展與普及,人們的信息與網絡需求增長,再加上原本較大的數據基礎,現如今每天都會產生難以用具體數字衡量的大量數據。
大數據的特點可以歸納為“4V特征”,即Volume(大量)、Variety(多樣化)、Velocity(快速)以及Value(價值密度低)。第一,數據的大量化。大數據的出現就是由于數據處理量的日益增加,而在大數據時代,數據處理量已經增長到ZB級別。第二,數據種類多樣。在計算機與網絡技術的發展下,數據來源不斷增加,人們生活的點滴都會產生數據,因此數據種類十分多樣。第三,快速化。快速化所指的是數據處理及傳輸,只有能夠實現高速處理與傳輸,才能夠將大量的數據利用起來,以滿足用戶的需求。第四,價值密度低。大數據的價值體現于整體數據的處理分析,但就其中的少量數據而言,價值并不高,甚至存在大量無意義的數據,因此總體價值密度較低。
1 大數據與計算機信息處理技術概述
1.1 大數據的研究意義
大數據具有極高的利用價值,大數據的研究具有重要意義。第一,大數據于國家而言是十分重要的信息資源,大數據的研究有助于提升國家信息安全的競爭力,因此也具有較高的戰略意義[1]。第二,大數據的研究可以促進數據的高效利用,提供更加高效的信息處理服務,在產業發展及服務中發揮指向性作用,對國家經濟調控、產業結構調整也具有重大意義。此外,大數據還能夠促進相關技術的發展,大數據研究也推動著整個行業的進步。
1.2 計算機信息處理技術概述
計算機信息處理技術就是利用計算機將所搜集整合的數據進行傳遞、處理的技術。其中包含信息輸入輸出、計算、存儲等多個過程,因此計算機信息處理實質上是多種技術的綜合運用。計算機信息處理技術具體可以分為三類。一是信息檢索,信息檢索技術的運用可以大大提高數據的查找與利用效率。二是數據庫技術,其主要內容就是對數據的整合排序,能夠將數據進行分類,信息的存儲更加有序,可以使數據運算與傳輸更加高效。最后就是信息系統技術,信息系統是依托于計算機,利用數據庫與網絡技術進行信息處理的一個系統,由于高效存儲與傳輸的實現,信息處理的效用也更高。目前,信息處理技術在人們日常生活及各個行業中都發揮了重要作用。
2 大數據時代的影響與挑戰
2.1 大數據時代的影響
大數據時代的到來,一方面是因為數據處理量的不斷增加,另一方面還依托于物聯網、云計算以及高效存儲等技術的發展[2]。大數據時代使計算機行業獲得了變革,同時也對其他行業以及人們生活帶來了較大的影響。數據是大數據時代的核心,在大數據的影響下,不同人群、機構、社會角色之間的界限變得更加模糊,因此對企業的經營管理等都產生了較大影響,同時也帶來了許多挑戰與機遇。大數據的發展是社會發展的必然結果,其產生是為了解決信息處理的問題。大數據時代,每時每刻都有大量的數據產生,只有能夠將這些數據進行篩選處理,才不會造成信息資源的浪費。為了滿足這一需求,計算機的信息處理能力要求就會相應提高,同時也會對軟件的信息處理能力及效率提出更高要求,而大數據時代所提出的這些更高要求則會大大推進計算機信息處理技術的發展。
2.2 計算機信息處理技術在大數據時代的機遇
大數據時代的到來得益于計算機網絡技術的高速發展與普及,雖然目前無法使用軟件對大量數據進行直接處理,但大數據的信息處理依然可以通過新興的思維與技術實現,而大數據的信息處理結構對不同行業都有著十分巨大的實用價值[3]。例如,在銷售行業,借助大數據分析可以對消費者的需求、喜好以及不同產品的市場競爭力等進行分析,借此可以調整銷售策略,給用戶進行更加有針對性的推薦,同時也能夠借助大數據分析得出的反饋對產品進行改良,在大數據信息處理的幫助下,可有有效提高產品銷量,帶來更大的利潤。在公司管理中,大數據分析可以優化企業管理結構,提升部門合作與工作效率,從而節省管理成本,同時也能借助更加科學的管理策略提升企業的綜合競爭力。
2.3 計算機信息處理技術面臨的挑戰
大數據時代為各行業的發展以及信息處理技術的進步都帶來了機遇,與此同時,大數據時代也為目前的信息處理技術帶來了挑戰。
2.3.1 數據的大量化為數據的存儲與傳輸技術帶來挑戰。大數據背景下,數據的處理級別不斷提升,對數據處理的要求也不斷提高,而其中最重要的就是數據的存儲和傳輸。大數據的處理需要相當大的存儲空間,同時也對存儲技術提出了更高的要求,而大量數據的傳輸則需要更快速的傳輸速度,對數據傳輸技術提出了更高的要求。同時還需要發展信息檢索與數據可視化技術,使數據分析更加直觀快捷。
2.3.2 大數據為網絡硬件設備與信息處理能力帶來挑戰。大數據時代不僅對數據傳輸技術提出更高要求,也對網絡硬件提出了更高要求,需要硬件提供更高的傳輸速度,同時也需要更高的數據處理能力與之匹配。另外,還需要提高網絡監控能力,確保數據的安全性。
2.3.3 數據價值密度低帶來的挑戰。大數據在具有大量化特點的同時,還有著較低的價值密度,這就需要在信息處理過程中能夠將具有價值的數據從海量數據中提取出來。但由于數據量巨大,數據的篩選提取工作十分困難,對信息處理技術中的數據篩選提出了更高要求。
3 大數據背景下計算機信息處理技術所存在的問題
3.1 專業人才短缺
技術的研究與應用都離不開專業人才,大數據信息處理技術不僅需要軟件方面的人才,還需要大量硬件技術人才。大數據發展歷程較短,其應用尚處于初級階段,高校的大數據專業也才剛剛起步,而培養一名優秀的計算機軟件人才則不僅需要較高的教育條件,還需要豐富的實踐經驗,種種原因,使得目前大數據信息處理人才短缺。在硬件方面,目前限制數據處理技術的主要還是硬件功能的上限,因此大力培養硬件技術人才也十分重要,只有這樣才能加快硬件發展的步伐,為軟件創新帶來更大的發展空間。
3.2 信息安全問題
大數據的發展為人們日常生活帶來了諸多便利,但也帶來了一定的信息安全隱患。信息安全問題是目前網絡技術中急需解決的一個重要問題。無論是用戶還是企業或機關單位,信息的泄露都有可能會帶來較大的損失。例如,在網絡購物中,用戶的個人信息都存儲在交易平臺的服務器上,如果存在安全漏洞且被黑客利用,那么用戶信息的泄露就很有可能給用戶帶來經濟損失,同時也會對購物平臺帶來惡劣影響。因此,針對信息安全問題,應大力提升信息處理技術的安全性,國家也可以在信息安全方面制定相關法律制度,通過監管進一步提升信息安全性。
3.3 數據篩選問題
大數據具有信息大量化與種類多樣性的特征。在數據量不斷增加的同時,其中的無意義、無價值數據也同樣增加,信息質量良莠不齊,數據價值密度較低,而面對海量數據的信息處理,很難快速篩選出有價值的信息,因此在數據檢索中常會摻雜無意義信息或篩選出的數據不夠全面。這樣的問題不僅為信息分析技術員帶來了極大的挑戰,同時也為用戶帶來了挑戰。如何在海量數據中提取最有效、最有價值的信息進行處理分析,如何運用各種信息數據得出專業化的決策建議,是目前信息處理中亟待解決的兩個重要問題。為此,要大力培養相關專業人才,促進信息處理技術發展,保證大數據處理的高效性、真實性與準確性,發揮大數據中大量信息的價值作用。
4 大數據時代的計算機信息處理技術
基于DEEP WEB的數據獲取技術是大數據時代計算及信息處理的重要技術基礎。DEEP WEB是指深層網絡空間技術,具有較大規模的數據量,在數據分布、訪問以及動態變化上都比較特殊。在實際運用中,DEEP WEB實現了數據的高度集成,充分運用數據實現了數據的篩選與整合。在具體運用中,DEEP WEB可以在海量數據中篩選出有價值的信息并加以運用,由此看來,DEEP WEB數據獲取技術可以使數據信息分析的準確性大大提高[4]。
數據存儲在信息處理中十分重要,而在大數據中,最為重要的就是分布式存儲系統。分布式存儲系統主要包含分布式文件系統、分布式鍵值系統、分布式表格系統以及分布式數據庫系統。分布式存儲技術在商業中獲得了很大的發展空間,同時也是目前互聯網的核心。分布式存儲具有低成本、可拓展的特點,同時有著較高的容錯性,因此在海量數據的存儲中具有明顯優勢。
分布式計算是目前大數據信息處理中主要使用的計算方式,其中基于互聯網虛擬環境的云計算最為重要。由于依托于網絡環境,云計算能夠提供動態虛擬化的信息資源,從而實現資源共享,使信息分配更加合理化。云計算技術大大降低了數據處理成本,同時提高了信息處理效率,在大數據時代下,云計算為信息處理技術注入了活力。
5 大數據時代計算機信息處理技術的發展方向
5.1 云計算網絡
大數據時代,許多計算機硬件都難以滿足海量數據處理的需求,而傳統的計算機數據結構也存在一些問題,主流的信息處理軟件無法對大數據進行分析處理,而其中最突出的矛盾就是軟件的數據需求超出硬件性能的極限。傳統的計算機網絡技術是一種以硬件為依托的靜態結構,因而無法跟上時代步伐,現有網絡很多都轉向了類數據中心的可編程設施。在云計算網絡的影響下,政府及企業在網絡系統上的需求不再局限于傳統的網絡中心,而是更加便捷開放的、符合大數據處理需求的網絡模式。在這一背景下,云計算逐漸向網絡模式發展,從而誕生了云計算網絡,它可以提供更強大的數據存儲,同時數據處理更加高效,可以有效解決大數據處理的問題。隨著云計算技術的發展與優化,計算機信息處理技術將會更加高效化,其內涵也會更加豐富。
5.2 更高的信息安全性與可靠性
大數據時代,數據依靠網絡傳輸,整個數據系統與網絡系統是密不可分的,PC端存儲的數據通過網絡與數據系統及云平臺進行共享,互聯網的開放性使每個人都能隨時獲取需要的信息。但是,網絡過高的開放性也給了犯罪分子機會,黑客可以通過攻擊系統安全漏洞竊取數據,通過分析則可能獲取個人隱私或商業機密,帶來了較大的安全隱患。由此可見,信息安全管理是信息處理技術未來發展的一大重點。大數據時代的信息安全已經不再像過去一樣局限于單一的數據安全,而是需要保障整個系統的安全性,確保系統中的數據不會泄露。因此,傳統計算機信息處理技術已然無法滿足大數據時代對數據安全提出的更高要求,數據安全相關軟件的開發與計算機安全系統的發展都十分重要。
6 結語
大數據整體數據結構復雜程度更高,因此信息處理的難度也大大增加。就目前而言,計算機信息處理技術難以完全滿足大數據時代的信息處理需求,因而未來計算機信息處理技術的發展會趨于高效化、全面化、快速化,同時也會具有更高的安全性。
參考文獻:
[1]劉翠芳,梁富強.“互聯網+”信息化時代下高校智慧校園建設的探索與實踐[J].赤峰學院學報(自然科學版),2017(19):218-219.
[2]張書月.“大數據”時代背景下計算機信息處理技術研究[J].電子測試,2018(19):120-121.
[3]鄭鑫淼.“大數據”時代背景下計算機信息處理技術的分析[J].科技創新導報,2016(17):72-73.
[4]閆丹.關于“大數據”時代背景下計算機信息處理技術的探析[J].電腦與信息技術,2018(6):45-47.