李明陽 林靜旭 廣州大學
大數據時代的數據挖掘
——從應用的角度看大數據挖掘
李明陽 林靜旭 廣州大學
大數據時代是指信息化時代,信息爆炸的時代背景下,信息、數據、資源能內容大量出現且充斥在我們的生活中。針對大數據的挖掘,旨在將大數據所包含的信息內容進行分析,明確其各自之間存在的關系。本文中針對大數據的挖掘,主要是從大數據的定義、特點出發,從而來了解大數據的內涵。
大數據時代 數據挖掘 數據應用
目前,關于大數據的研究表明,大數據從數據信息的表現和實際應用兩方面觀察,存在不一樣的特性。具體來講,從表現上來分析,大數據具有大量、多樣、高速以及價值四個特征。首先,信息化時代下大數據的數量是龐大的,第二,在此基礎上,這些龐大的數量以各種各樣的形式和類型表現出來,如我們通常查看的圖片、視頻、音頻文件等,第三,互聯網的全面普及以及信息技術的更新,使得信息數據的傳播越來越迅速,而且信息數據處理的速度也有了翻天覆地的變化。第四,這些數據所蘊含的價值是巨大的,我們可以通過搜索、查詢、處理等方式來分析這些數據信息所包含的數據,從而使這些信息數據更具有價值意義。從大數據的實際應用層面分析,大數據具有變化性、真實性、波動性以及可視化性四個特征。信息處理技術的更新,使得對大數據的處理更加的快速和便捷,而且在新的趨勢下,大數據可視化能夠有效的促進數據處理的速度,提升信息數據的效率,能夠更加直觀的方便獲取信息價值,充分的發揮信息數據的作用。
目前,國內外針對大數據理論和實踐的研究非常之多,對于大數據的理解也各不相同。根據實際調查發現,目前對大數據的定義主要包含以下幾種觀點:大數據是多類型的海量數據;大數據是規模龐大、并且具有一定的復雜性和時效性的數據集合,而且這類數據集合需要使用特定的工具,且在一定的時效內才能對其進行處理;大數據是一種信息類的資源和資產,非常具有價值,但是其需要通過更為先進科學的處理手段,才能更好的發揮其作用。綜上所述,大數據是一種來源于實際生活中,在實際生活中應用實踐所產生的信息數據,對于大數據的發掘是因為實踐所需要,通過一定的方式和媒介,將數據信息挖掘出來,并加以處理,將其應用到實踐當中,從而產生更加具有價值的信息以及作用。
信息化時代背景下,數據的價值在于其產生-挖掘-收集這一流程,其中最為關鍵,同是也最具有意義的在于對于數據的挖掘。一般情況下,我們將海量的數據進行處理和分析,根據分析,大數據的挖掘具有應用性、工程性、集合性以及交叉性四個特征。具體來講,大數據挖掘的應用性表現在,大數據挖掘的原因在于,實踐過程中需要數據信息作為支撐,所以需要對大數據進行挖掘和采用,而大數據挖掘后得到的信息數據,是要應用到實踐當中的,因此,大數據挖掘具有應用性。大數據挖掘的工程性在于,大數據挖掘的過程是一個復雜化、組合型的過程,需要依靠多方面的支持來輔助進行的,針對大數據的挖掘需要利用到計算算法、處理以及分析,還包括實際的數據應用,而且這個過程中對大數據來講,需要準備好數據資源,對其進行管理、處理以及分析,然后將所獲取的信息數據重新應用驗證,因此可見大數據挖掘具有工程性。而大數據挖掘的集合性和交叉性分別在于,大數據的挖掘包括對于大數據的發現、探索、分析;相似信息的挖掘、序列發掘等類型,以具體的大數據挖掘應用為例,針對這個數據的挖掘以及后期的應用是涉及到多個內容以及功能的,這些內容和功能的使用都需要以技術、理論作為支撐,交叉性在于大數據挖掘包含多個學科知識、理論和技術的使用。
根據上文所述,大數據挖掘的關鍵在于挖掘信息的意義,即通過技術、理論等方式所挖掘的信息是否具有實用性和適用性。具體來講,針對大數據的挖掘是需要將大數據的應用性挖掘出來。
以企事業單位為例,企事業單位的大數據庫涉及企事業單位內部各個部門、崗位以及職員的信息數據,其所包含的信息內容具有復雜性和多樣性,針對這類單位的大數據挖掘,首先需要對單位內部的信息數據進行重新收集,將各個部門的信息數據進行整合,是一項大工程,需要企事業單位領導階層的理解和全力支持,對下屬部門進行溝通和要求,為大數據的收集提供便利。另外,對大數據的挖掘最終是要將處理后的信息數據應用于實踐中,對所獲取的數據進行檢驗,查驗其是否具有意義和價值,因此也同樣需要領導人員的支持和支撐。
除此之外,基于數據的復雜性、多樣性、瑣碎性以及關聯性,導致所挖掘的大數據具有一定的模糊性,企事業單位也存在不明確信息數據的用途等可能性,這種情況下,可能就會造成數據挖掘和處理部門工作的難度增大,阻礙數據挖掘的進程。因此,在大數據挖掘的過程中,數據挖掘處理部門需要和數據來源部門進行詳細的溝通,明確數據挖掘的要求和目的,然后再進行數據的收集和挖掘,通過長時間的溝通和嘗試,來挖掘具有實用性的大數據。
總而言之,信息化時代下,大數據挖掘的目的在于將所挖掘處理的信息數據再次應用到實踐中,因此,信息數據挖掘部門在進行大數據挖掘工作中,務必要明確數據挖掘的來源、用途,才能確保所挖掘的數據和應用具有關聯性,才能保證最終獲取的數據具有價值,避免無用之功。
[1]田志民,梁品超,任艷紅,彭程.大數據時代下數據挖掘技術與應用[J/OL].當代教育實踐與教學研究,2017,(10):4(2017-10-16).
[2]李翼,孟莉. 大數據條件下的數據挖掘技術及應用[J/OL]. 電子技術與軟件工程,2017,(18):198(2017-09-27).