李東 遠方


大數據分析在很多的領域都起到了非常重要的作用,數據的來源多種多樣,數據的產生和數據的提取涉及到各種不同的應用系統、信息平臺以及傳感器等軟件和硬件。大數據是海量數據的組合,將這些海量的數據通過有效的、準確的方式進行利用,是當前大數據研究的一個重要方向。本文首先對大數據、大數據分析以及傳統數據分析的區別等方面進行了闡述,其次對大數據分析的相關技術進行了研究,最后對大數據分析的應用進行了研究。隨著信息化社會的不斷發展,以網絡為介質,各種應用系統、信息平臺以及傳感器等軟件和硬件每時每刻都在生產著數據,這些海量的數據中存在著大量有價值的信息,如何從海量的數據中提取到企業所需要的、有價值的數據信息,是大數據分析主要解決的問題。
(一)大數據定義
大數據是一種數據量非常龐大的數據集,通過人工的方式無法進行相關的數據分析和運算,數據通過某種方式能夠結合成各種數據結構,這些數據結構能夠為一些涉及大數據分析的機構或企業提供相應的數據參考和數據分析的依據。大數據中所說的大是相對而言的,這個大和過去我們所能涉及到的數據來說是非常龐大的,但在未來大數據所規模還會發生本質的變化和飛躍。大數據的特性主要包括規模性(Volume)、多樣性(Variety)、高速性(Velocity)和價值性(Value)4方面。大數據中對于某一小部分數據的價值是不穩定和不確定的,但是從海量的數據中提取到的數據會產生出很大的價值。……