袁春蕓
?
大數據時代的計算機信息處理技術分析
袁春蕓
中國聯合網絡通信有限公司唐山市分公司,河北 唐山 063000
隨著網絡的普及,計算機用戶的數量呈現出爆炸式的增長,每天因此而產生的數據總量,已達到了十分驚人的地步,然而新形勢下計算機的處理技術能力的要求也是在不斷變化發展著,計算機技術也在不斷跟進,兩者是相輔相成的?,F在,必須利用新的思路、新的技術來應對日益增長的數據處理要求。基于此,對大數據時代的計算機信息處理技術進進行了分析。
大數據時代;計算機;信息處理技術
在現代社會發展的過程中,各種數據不斷產生,數據的容量及本身的結構也發生了巨大的變化,然而這些數據對計算機信息處理技術提出了新的要求,這些要求的提出使現有的計算機信息處理技術面臨了巨大的挑戰,同時也迎來了新的發展機遇,本文就將對大數據時代背景下的計算機信息處理技術進行簡單的闡述,供參考。
(1)大數據的概念。所謂的“大數據”,就是信息的數據量巨大,由于需要處理的數據十分龐大,目前的計算機主流軟件在短時間內無法實現對其進行獲取、處理、存儲、傳輸、管理等方面的功能,它不僅包括數據量大,同時還包括數據比較難以處理、復雜多樣,同時在處理的過程中,還會出現數據處理的重復性,對于大數據的數據量大到什么程度,目前還沒有一個統一的標準,一般認為數據量在10 TB~1 PB(1 TB=1024 GB,1 PB=1024 TB)以上的數據為大數據。
(2)大數據的特點。一是數量大。大數據的產生是基于大量數據信息處理而產生的,需要運用計算機技術處理數據的量越來越大,從TB及已經發展到PB技術的數據處理;二是種類多。隨著信息技術在生活應用中普及,人們對信息的需求也越來越多樣化,信息數據的來源也變得多樣化,結構化和半結構化的原始數據也出現了多樣化,使得大數據呈現出多樣化的發展趨勢;三是速度快。海量的數據,就需要高速度的對數據進行處理,這樣才能滿足使用者對信息數據的需求,如果大數據的處理出現滯后,將不利于信息的傳播與擴散。
(1)分布式存儲技術。分布式存儲技術是當前專門應對大數據存儲的問題而發展起來的,由于大數據的海量數據使得傳統模式的單個數據庫很難存儲,同時應對管理以及備份等工作,分布式存儲技術打破了傳統的思維,利用網絡專線或者高速網絡將多個數據庫存儲服務器搭建在一起,形成一個總分形式的分布式存儲系統,而上層的總與下層的分的特殊結構之間則是通過數據之間的邏輯關系串聯起來,在結構上看,分布式系統中同一個數據鏈中大數據可能隨機分配到不同的數據庫服務器中進行存儲,而由于數據庫存儲服務器彼此之間特殊的數據邏輯關系,看似分離的數據卻又在邏輯上得到統一,分布式存儲技術,不僅解決了海量數據的存儲問題,而且多個服務器的共同服務還提升了大數據的高通并發性,解決了數據串行處理反應時間長的問題,大大提升數據處理性能,目前,分布式處理技術在百度、IBM得到了廣泛的應用。
(2)數據挖掘技術。數據挖掘技術是主要應對大數據數據處理的而興起的、體現人工智能處理的計算機處理技術。數據挖掘技術多采用仿生學的手段,按照人類思維的方式,將海量的大數據進行處理,最終從海量數據中過濾出對企業生產或決策有用的信息,進而指導人們的行為。數據挖掘的主要流程包括數據選取、數據預處理、數據挖掘、數據分析與評估。首先對大數據的有效部分進行選取,然后采用數據預處理的技術對數據中的無效數據、冗余數據、零數據等進行清洗和刪除,然后采用數據挖掘的技術方法對有效數據進行挖掘,最后將有用的數據,通過專門的應用系統進行分析與展示。其中,數據挖掘技術是采用人工智能的思維方式而設計的數據處理技術,主要包括決策樹、聚類、神經網絡等多種數據處理技術,通過數據挖掘的處理,最終對清洗后的數據進行有效地分類,最后通過專門的應用系統對分類的數據進行分析、處理、展示,從而使用形象直觀的方式展示有價值的數據信息。
(3)信息安全技術。在大數據背景下,各種數據信息已經脫離了原來獨立的形式而形成了相互關聯的數據結構,但是受限于這種關聯結構,其中的某個數據出現問題時,其他數據也會隨之受到影響,對信息的安全管理也不在是建立在單個數據或者是單個數據的基礎之上,而是需要同時對整個信息系統進行管理,為了保證大數據信息的安全,就需要不斷發展信息安全技術。首先,需要加強當前信息安全體系的建設,在加強安全體系建設的同時,還需要對技術管理人員進行新技術的培訓,提高技術人員對新管理體系的適應能力和管理能力,確保新的安全體系的作用能夠充分發揮,為大數據信息的安全提供保障;其次,需要加快大數據安全相關的技術研究工作,隨著大數據時代數據結構及總體容量的變化,當前的信息安全技術難以對大數據進行全面的安全監測,應該全面加強新的信息安全技術的開發,通過技術的更新實現對大數據信息的全面監測,全方位保障數據的安全;最后,在新的安全技術出現之前,大數據的存儲管理容易造成數據的泄露,同時,由于當前監測方式無法對數據進行全面監測,還容易導致數據存在一定的安全隱患,因此,在當前技術條件下,可以將重點數據信息作為監測的首要對象,通過確保重要信息的安全來保障整體信息的安全性,在當前技術條件下,這是行之有效的辦法。
綜上所述,相信在不久的未來,計算機信息處理技術會發展會推動現代社會的不斷進步和發展。本文主要對大數據處理中運用的關鍵技術進行了分析,希望能夠為相關研究領域的人們提供參考。
[1]劉銀龍.“大數據”背景下的計算機信息處理技術分析[J].電子技術與軟件工程,2015(1):206.
[2]呂敬全.“大數據”時代背景下計算機信息處理技術分析[J].信息與電腦,2013(6):126-127.
The computer information processing technology of the era of large data analysis.
YuanChunyun
China United Network Communications Co.,Ltd.,Tangshan branch,Hebei Tangshan 063000
With the popularity of the network,the number of computer users showing explosive growth,the amount of data generated every day so,has reached alarming proportions,but the processing ability under the new situation of the computer is in constant change and development,computer technology is also constantly follow up,the two are complementary and now,we have to deal with the processing requirements of the growing use of new ideas,new technical data,the computer information processing technology in the era of big data is analyzed.
Big data era;The computer;Information processing technology
TP274
A
1009-6434(2016)11-0140-02