周北一
摘 要 大數據是隨著信息的急劇膨脹而提出的一種概念,目前大數據技術在世界經濟、軍事、信息傳播等領域有了廣泛的應用,而這種應用所帶來的網絡革命效應也越來越多的引起人們的重視。提供大數據服務的企業要積極推廣大數據技術的應用模式,開發大數據中的數據安全保密技術,為大數據的長遠發展做出貢獻。
關鍵詞 大數據 技術 解讀分析
隨著計算機信息化的建設,互聯網中的數據量呈現出爆炸式的增長,大數據正是隨著信息的急劇膨脹而提出的一種概念。目前大數據技術在世界經濟、軍事、信息傳播等領域有了廣泛的應用,而這種應用所帶來的網絡革命效應也越來越引起人們的重視。本文將對大數據概念進行闡述,討論大數據與CDN、IDC、云計算之間的關系,對大數據技術未來的發展前景和應用范圍進行分析,希望對大數據技術更好地發展和應用提供幫助。
一、大數據概述
大數據技術的發展時間比較短,目前在學術界定上沒有一個清晰統一的定義。總體來說,大數據指的是一種數據集合,這種數據集合由于信息資料的規模過于龐大,在一定的時間內,應用目前的信息收集和管理軟件不能夠做到對數據的收集、分析、處理工作。大數據在廣義層面上,可以分為大數據技術、大數據工程和科學等。其中,大數據工程通過對大數據進行分析,建立對數據進行管理的工程;而大數據科學,則是指在大數據發展的過程中,對大數據的發現和研究活動。大數據技術就是指通過科學的分析和合理的規劃,從龐大的數據庫中獲得所需要信息的技術。通過研究發現大數據主要具有下面的特點:
(一)數據信息規模巨大
數據信息規模巨大是大數據最基本也是最重要的特點。目前,互聯網技術得到了巨大的發展,使用互聯網技術進行數據查詢的主體也單純從機構查詢,發展為個人、企業、機構等共同查詢的方式。用戶在使用互聯過程中,進行無意的點擊,對于一些信息的分享等都成了大數據龐大信息規模的一部分。現在大數據的數據單位已經上升到了PB的級別。
(二)數據的類型復雜
大數據龐大的數據規模中,數據類型非常復雜。既包括傳統的一些基本數據,也包括網頁、文檔等新式數據;既包括比較完整加工后的數據,也包括加工未完成的數據。
(三)數據的傳播速率較快
大數據的傳播速率過快,這也是造成傳統軟件對于大數據難以處理的一個原因。有時大數據的處理結果需要在一瞬間就形成,否則形成的結果就失去了使用價值,這對于傳統軟件來說是很難達到的,所以大數據對于處理的時效性有很高的要求。
(四)數據間的價值密度較低
一般情況下,大數據的規模在巨量增長的時候,用戶需要的信息數據規模卻增長緩慢,這在一定程度上加大了獲取數據的難度,造成了數據間價值密度較低的特點。
二、大數據技術介紹
大數據技術的前身是商務智能(BI),主要的技術環節包括:數據的收集、數據的處理、數據的計算、數據的研究以及數據結果的表現。其中,大數據的收集工作主要在互聯網、當地數據庫等展開;在數據分析方面,主要基于人工軟件智能進行進一步的研究;在數據表現方面,通過多媒體技術與相關的網頁技術相結合,通過圖像的形式進行展現。
三、大數據、CDN、IDC和云計算之間的關系
(一)大數據與云計算之間的關系
云計算和大數據之間的關聯性比較強。云計算指的是以巨量的數據作為基礎,通過對巨量的數據進行研究,在巨大的數據規模中尋找需要的信息數據。云計算的英文簡稱為Cloud Computing,它的計算方法主要依托互聯網進行。一般情況下,對瀏覽器等軟件進行訪問,就可以訪問到云計算的經營商提供的網絡應用,這些應用中的數據信息都存儲在網絡數據庫中。云計算的服務類型主要包括:軟件即時服務類型、平臺即時服務類型以及基建即時服務類型。總體來說,云計算主要就是應用虛擬化的技術,以互聯網為依托,通過對巨量的數據規模進行整合、分析、計算,從而取得需要信息的一種及時計算服務。云計算的特點是虛擬化程度較高,適用人群較廣,計算結果準確性較高。云計算的這些特點促使云計算在大數據中有著廣泛的應用。同時,云計算和大數據技術也有著一定的不同。大數據更加看重的是對于數據的存儲能力,而云計算則強調的是計算,通過計算來獲取有效數據的處理能力。
(二)大數據與CDN之間的關系
CDN的英文全稱為CONTENT DELIVERY NETWORK,通過CDN的使用可以加快數據傳播的速度,確保數據傳播的穩定性。CDN的工作原理是通過設置其他地方的結點服務器,以互聯網為依托,構建出一層智能網絡,通過網絡結點中傳遞的數據和流量,促使客戶的數據請求流向最近的服務節點,進而進行數據的收集、查詢等工作。由于互聯網在實際應用中會出現通讀的現象,通過CDN技術的應用,可以有效解決網絡堵塞問題,提高互聯網的訪問速度。
(三)大數據與IDC之間的關系
IDC的英文簡稱為INTERNET DATA CENTER,中文意思為網絡數據中心。IDC是以互聯網為媒介,通過集中形式數據匯總、管理、處置和發送數據的相關設備,來為數據的維護提供運行基地,并附帶提供配套的服務。IDC的服務對象主要是企業、傳媒機構、網站等,并為它們提供高質量的專業化服務。IDC可以提高網絡站點的性能,提高訪問的響應能力,同時通過對網絡服務器的有效利用,確保網絡數據傳播的安全性和時效性。
(四)大數據與三者之間關系的總結
大數據與CDN、IDC以及云計算之間的關系有著很強的關聯性。首先,它們的產生都是由于互聯網技術的大力發展,數據處理規模的急劇增加,數據的收集都來自互聯網上的信息,可以說,互聯網是它們信息傳遞的橋梁。其次,后三者的存在對于大數據是很好的補充,通過不同角度對數據的收集和整理,實現信息的有效處理。總體來說,大數據信息的有效存儲為后三者提供的對于數據的有效計算和處理提供了平臺,同時,大數據通過與三者的有機結合,可以更好地進行數據的挖掘和處理,從而及時地提供所需要的信息。
四、大數據技術的發展與應用
隨著信息網絡技術發展力度的加大,大數據技術在如今的許多方面有了更廣泛的應用。大數據技術以前主要在互聯網科技公司中進行使用,但現在無論是傳統的公司企業、公共機構還是新興的具有高技術性質的企業單位,對于大規模數據的處理需求越來越大。同時大數據以往的應用主要在企業智能和商務營銷方面,但現在它的應用范圍越來越廣,例如社會科學、經濟學等方面都有了廣泛的應用。
信息化的大力發展,促進了大數據時代的到來。由于大數據技術的使用可以有效促進公司智能化的發展、提升信息數據的安全性,所以,可以預見,未來大數據的發展前景是極其光明和寬廣的。大數據的產業結構可以發展成為三個主要領域:分別是硬件為基礎的商業領域;基礎軟件的商業領域以及應用軟件的商業領域。
五、結束語
大數據的發展規模不斷壯大,相應的對數據進行收集分析,確保數據安全等方面的人才缺口也會非常大,而相關人才的缺失將會對大數據的發展帶來非常不利的影響。提供大數據服務的企業要重視人才短缺的問題,積極推廣大數據技術的應用模式,開發大數據中的數據安全保密技術,為大數據的長遠發展做出貢獻。
(作者單位為北京浩瀚深度信息技術股份有限公司)
參考文獻
[1] 王妍,柴劍平.大數據及相關技術解讀[J].廣播電視信息,2014(02):18-21+24.