郝冉
(中認國證(北京)評價技術服務有限公司 北京市 100020)
維基百科上這樣定義大數據:在一定的時間內無法使用常規方式進行內容抓取、管理和分析處理的數據集合。大數據的“大”有兩層含義,一是指數據量大,還指數據類型多種多樣。隨著社會信息化程度逐漸提高,市場競爭、社會發展分析等多方面都要依仗大數據來推進,從數據中挖掘出其背后的信息已成為目前各國重要的研究方向。為了提高對海量數據的處理效率,云計算、粒計算等相關技術隨之出現,這些技術的應用使得數據充分發揮了它的作用,來源于社會并服務于社會。2020 年中國通信院大數據白皮書預測:2035 年全球數據總量將達到2142ZB。
各國各地區都已經意識到不斷增長的各種數據中蘊含著豐富的實際意義,與此同時,信息行業的技術工作者們也感受到了來自龐大數據的巨大挑戰,目前以往的技術手段和性能已經很難滿足對當前數據量的處理要求,因此使得人們需要不斷在數據存儲、數據處理、計算機模型與性能等多個相關領域進行探索和提高,以達到盡可能快速高效地將這些龐大的數據中蘊藏的價值充分挖掘出來,使其發揮作用促進社會與科技的不斷進步。
粒計算作為一種更為有效的方法論,主要是為了建立以外部環境為基礎,以用戶為中心的一種思想,從而簡化人們對于物理與虛擬世界的認知,并在此基礎上,用適當粒度的“粒”作為中間環節從而求得整個問題的解,相較于對完整問題進行求解的過程而言,以合適的粒度的“?!弊鳛樘幚韺ο罂梢杂行У靥岣咔蠼庑省!?br>