劉 偉
(金航數碼科技有限責任公司,北京 100028)
在數據網絡技術廣泛普及的當下,信息將成為決定社會發展、市場競爭以及社會事業等多方面發展的重要因素。為了實現對數據的高效應用,云計算、粒計算等大數據處理技術相繼誕生,在大數據整合、處理以及利用中發揮出了重要的作用。因此,探究基于粒計算的大數據處理具有十分重要的意義。
大數據是信息時代背景下出現的一種新型概念,其內涵是通過海量、高效、全面、真實可靠的數據集合實現數據的捕捉、處理和應用,實現數據信息作用最大化發揮。為了實現對大數據的有效應用,許多大數據處理技術相繼涌現出來,目前大數據處理技術具體可以分為數據采集技術、數據分析技術和數據管理技術三類,其中的大部分都是從“小數據”領域直接移植過來的,因此在許多方面存在一定的不適之處。例如,尤其是在數據采集的內容,大數據是依據海量信息有效實現,但是在互聯網發達的當下,還存在很多的虛假信息,使得網絡安全無法保障的情況下,很難實現私密信息的有效共享。
當前階段,粒計算的方法主要包括三類,分別是詞計算理論、粗糙集理論和商空間理論。其中詞計算理論保持不需要、不知道、無法定義的原則,以及無法解決的原則,在自然語言中保持一定的計算范式[1]。粗糙集理論則是一種不完整、不準確、不統一等類信息處理的工具,具有便捷、成熟等特點,在數據挖掘和知識發現上具有較大的優勢,和其他數據挖掘方法區別在于,粗糙集理論不需要先驗知識。商空間理論則脫胎于近代代數的環、群概念,即在構建商空間的基礎上進行擴大處理,構建一個全面但模糊的空間集,實現對終端需求信息的分類采集,為信息的粒計算提供支持。
其一,?;突诹;挠嬎?。?;从沉藛栴}空間的劃分過程,進行大數據處理轉換時必須具備一定的參考,這樣才能實現大數據的粒計算,簡而言之,就是如何構造計算模型。其二,粒計算一般是有粒結構盡量解決問題,具體是由自上而下或是自下而上的結構方向進行交換,或是在同一層次中移動。
將粒計算原理引入到大數據處理中的目的是通過粒度計算模型的構建實現大數據處理能力的強化。根據粒計算原理,可以在不同粒化標準化獲得多個粒層,共同組成一個覆蓋多層次的網絡結構,采用更加精細化的處理方法進行?;嬎?,實現高效率、多粒度數據信息的整合和應用,為數據信息的快速檢索提供支持[2]。粒計算在大數據處理中的應用主要體現在以下三個方面:
首先,粒計算解決了大數據的“海量”問題。不同于傳統數據,在現代化信息網絡的支持下,大數據的規模出現了極大的擴張,這為終端使用者快速準確的獲取所需信息帶來了巨大的困難。而通過粒計算技術構建商空間,則能夠將具備同類特征和類似特征的數據進行有效整合,在此基礎上完成優先級劃分,這樣就可以幫助人們快速有效的獲取有價值信息,提高了數據處理的效率。
其次,粒計算解決了大數據的“多樣化”和“分布式”問題。通過粒化處理將數量龐大的數據信息進行初步粒計算處理,此時數據的總量依舊十分龐大,在這樣的情況下,可以根據精細字段和模糊字段的參考詞計算理論進行深度處理,將數據劃分為多個粒層,實現對數據信息的有效分類和分布,進而構建符合計算規格粒層,解決了大數據形式多樣和分布廣泛的問題。
最后,粒計算在大數據時代保證了信息的及時性、高效性。在新形勢下,人們對數據信息處理效率提出了更高的要求,而基于里計算的大數據處理能夠在對信息進行?;幚淼耐瑫r,將實踐要素和需求優先要素加入到計算規則中。以百度搜索引擎為例,人們在進行信息檢索時,根據需求信息的內容和關鍵字,與之關聯性最強和時間最近的信息往往處于數據信息分類整合后的最上層,以此類推,最下層的是相似信息和時間較為久遠的信息。
綜上所述,信息時代背景下,針對大數據的特點和大數據處理中存在的問題,提出大數據問題的粒計算解決框架;分析了深度學習與粒計算的邏輯關系,提出深度學習本質上是多粒度計算,人們對大數據處理的效率和質量提出了更高的要求,傳統數據處理技術已經不再適用,在這樣的情況下,必須開發新技術。基于粒計算的大數據處理能夠有效的應對大數據處理中遇到的難題,具有較高的推廣價值,對我國各行業健康發展也是極其有利。