馬偉良
(福建省龍巖市閩西職業技術學院,龍巖 364000)
大數據技術一般指能夠對數量龐大、類型復雜的數據進行有效處理,挖掘其中有效信息的技術。隨著信息大爆炸時代的到來,全世界范圍內的數據量快速增長,傳統數據技術已經無法對海量技術進行有效處理,大數據技術因而在近年來得以快速發展和廣泛應用。
自大數據出現以來,其就對各行各業產生了不可忽視的影響,在各個領域得到了廣泛應用。不過就當前來看,大數據應用主要集中在商業、網絡及科學三大領域。
商業領域應用。現代商業包含大量數據,尤其是互聯網金融的發展使得傳統數據處理方式無法滿足商業發展需求。大數據技術的出現能夠幫助企業充分挖掘海量數據信息,包括市場變化、用戶行為、產品競爭、產品銷售、用戶反饋等。對這些數據信息進行深度挖掘與有效掌握,能夠幫助企業準確掌握自身經營生產情況,同時更加準確地預測市場變化,從而為企業優化產品布局、分析客戶交易、完善產品、制定經營生產決策等提供可靠支持,為企業穩定、長效發展奠定良好基礎。
網絡領域應用。網絡是數據大爆炸的基礎。網絡的出現徹底改變了傳統信息存儲、傳播與分享方式,尤其是隨著互聯網的普及,網絡用戶數量的快速增長以及人們對網絡的依賴性逐漸提升,都使得網絡中包含了海量不同類型的數據,如文本、圖像、視頻、交互內容等。在海量網絡數據中獲取需要的數據信息是大數據技術的一大作用,能夠充分挖掘網絡數據價值,并將網絡數據信息用于商業、執法、軍事應用等方面。
科學領域應用。科學研究往往會產生大量數據,尤其是隨著現代科學的發展,各種高通量傳感器與儀器的長期運作所產生的數據量十分驚人。只有對這些數據進行全面、深入而準確的研究,才能推動科研發展并取得科研成果。傳統數據處理方式難以快速、準確地處理如此多的數據,需要利用大數據技術進行處理,如生物信息科學實驗的數據計算往往就需要使用大數據技術來保障準確性。
就當前來看,大數據關鍵技術主要集中于六個領域。其一是結構化數據庫領域。依靠數據挖掘與統計分析的方式對結構化數據進行處理,能夠快速、準確地處理大量商業及科研領域所產生的海量結構化數據。其二是文本分析領域。文本是信息存儲的主要形式,當前常見的信息檢索、機器學習、統計、數據挖掘等均是大數據技術的表現方式。其三是Web 分析領域,通過數據庫、信息檢索、自然語言處理、文本挖掘等手段,對Web 內容、結構及使用信息進行挖掘。其四是多媒體分析。隨著現代技術的飛速發展,多媒體數據在人們生活與工作的重要地位也在不斷提升,當前針對多媒體進行摘要、注解、索引、檢索、建議、事件檢測等均是大數據技術的重要研究領域。其五是社交網絡分析。社交網絡呈現出驚人的發展速度,其中包含有大量鏈接與內容數據,因此當前大數據在其方面的應用主要集中體現在基于鏈接的結構分析以及基于內容的分析兩方面。其六是移動分析。隨著智能手機、智能平板等的快速發展,移動終端所產生的數據量也不容忽視,而且移動數據有著極為獨特的特征,利用大數據對其進行分析尚處于探索階段。
大數據關鍵技術主要包括數據采集、存儲與分析技術。當前大數據采集主要包括軟采與硬采兩種,未來軟采將形成統一數據采集框架,從而實現對海量數據地快速、可靠采集,并且能夠對采集數據進行自動化的預處理,保障采集質量;硬采則會逐漸向低功耗智能傳感器發展。大數據存儲技術發展趨勢主要表現為高可用性以及低成本性,即能夠以更低的存儲器成本存儲更多高質量數據,確保這些數據能夠被快速訪問且不會丟失。大數據分析技術的發展則主要表現在云計算平臺、機器學習及人工神經網絡等方面,以低成本實現高性能分析的同時推動大數據智能分析發展。另外大數據技術發展還會與其他新技術相結合,如人工智能、機器學習、區塊鏈等都能推動大數據技術創新發展。
就當前的產業發展情況來看,大數據產業在未來發展必然會更受政府政策體系支持,這點由當前我國對大數據技術的重視程度便能窺得一二。與此同時,大戶數產業規模將會隨著發展繼續擴大,而且保持高速增長趨勢,預計2020年大數據產業便能突破1萬億規模,是2017年的2倍有余。另外大數據開放共享程度將進一步加強。當前數據流通性較弱,在很大程度上限制了大數據技術應用,不過隨著相關政策支持以及技術發展,這一現象必將得到改善。在大數據產業快速發展的情況下,我國相關立法進程必然也會加速推進,為產業健康發展提供法律保護。
隨著大數據技術的不斷發展,其應用領域將不斷拓寬,同時應用深度也將不斷加深,逐漸深入到社會運行的方方面面。當前大數據技術的應用主要集中于商業、網絡及科學領域,而在大數據技術逐漸成熟且成本逐漸降低后,其能夠在政府決策、生產制造等各個行業領域得到充分應用,并能幫助各行各業解決各種實際問題。
綜上可知,大數據作為新時代的重要技術,關于其應用發展進行研究十分有必要。只有準確把握大數據技術應用發展趨勢,才能充分利用其推動行業發展,為經濟社會發展提供有效動力。