郭偉偉 吳文臣 隋亮
摘要:在大數據時代背景下,各行各業受到大數據的影響,在數據應用與共享上有了極大的便利。數據的價值在大數據時代下十分重要,不再單純是數字、額度,而是一種非物質產物。而數據挖掘技術在大數據時代下廣泛應用于各行業之中,本文就從數據挖掘技術概念入手,分析幾種常見的數據挖掘技術,然后提出數據挖掘技術在各領域中的實際應用,希望能夠給相關人員提供參考。
關鍵詞:大數據;數據挖掘;技術;應用
中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2020)08-0103-03
大數據技術能夠對數據實施集優化處理與數據管理,但實際數據操作中還存在數據搜索不精準等問題,影響用戶對數據的使用情況。數據挖掘技術的出現能夠有效解決該問題,保證數據搜索的精準性,同時還能對數據進行必要的編輯處理。在大數據時代下,數據挖掘技術已經在各領域中有了廣泛應用,為推動社會進步發展做出了巨大貢獻[1]。基于此,加強對大數據時代數據挖掘技術與應用的研究具有十分現實的意義。
1 數據挖掘技術概述
數據挖掘主要是對隨意性強、模糊性質數據的處理,能夠實現對不是十分精確數據的深度挖掘。數據挖掘的過程相對復雜,且存在多種數據挖掘方法,不同挖掘方法在數據處理中相關步驟基本相同:第一,對待挖掘數據特點、形式等進行前提判斷,并分析這些數據是否具有挖掘的意義;第二,確定數據衡量標準,選擇恰當標準,將殘余數據進行清理;第三,實施深度挖掘,最終得到數據挖掘的結果。
目前,在各領域中數據挖掘都發揮了重要作用,能夠實現對行業所需數據實施精準定位,將其中實用數據進行挖掘。同時,能夠對數據信息進行深度挖掘,根據數據實施市場預測,做出更加合理的判斷。基于數據挖掘技術,從大數據庫中提取出有用的信息,其具有一定判定功能,通過對數據中變量動態分析,客觀判定數據,對根據數據情況將挖掘對象的特征描繪出來。
2 數據挖掘技術方法
現階段,經過科學技術發展,數據挖掘技術方法呈現出不同類型,以便于適應更多行業發展需求。大數據作為一個海量數據資源庫,利用數據挖掘技術想要實現精準分析,必須根據實際情況選擇針對性的數據挖掘技術。
2.1 聚類分析法
聚類分析法指的是將不同類型數據進行有效的歸類處理,整理零碎的數據信息,提升數據信息的條理性。聚類和分類有所區別,不是簡單的將數據進行分類,在數據對象不清晰情況下,尋找數據組中具有價值意義的信息[2]。聚類分析法缺點也十分明顯,即無法準確進行數據分類,因此目前聚類分析法僅運用于數據識別、心理學等領域中。
2.2 關聯分析法
根據相關理論發現任何事物之間都存在關聯性,這也是數據最為基本特征,為了在海量數據庫中提取有用的信息,必須能夠探索出數據和數據之間的規律。而關聯分析法即在這個背景下產生,利用數據之間關聯性進行數據挖掘,利用諸多具有關聯的數據最終找到想要的數據,并對數據進行辨別處理,最后將其運用到行業分析中。
2.3 特征分析法
在我國產業發展中,數據類型不斷增多,且數據量呈現持續增多的趨勢。面對這些數據量龐大、結構復雜、種類繁多的數據,需要針對其特征加以分類。這個過程中需要借助于先進的計算機設備,對數據加以虛擬分類,之后基于所需要數據的特征,對已經分類數據深度挖掘,最終得到想要的數據結果。
隨著科學技術發展,數據挖掘方法會越來越豐富,也將發揮更大的作用。
3 大數據時代數據挖掘技術的具體應用
現如今,數據挖掘技術已經廣泛應用于不同領域中,是由于其能適應各行業,能夠對市場進行精準預測,對促進企業發展,提高其生產效益具有重要意義。
3.1 在科研領域的應用
在科學研究過程中,必須以大量數據為基礎。可以說,數據對科研領域具有重要的作用,包括原始資料數據、實驗數據等,都關系到科研工作的成敗,不僅需要分析數據之間關系,同時需要對數據進行統計學分析。因此,在科研領域中可以利用數據挖掘技術,根據科研項目提供數據為基礎,對所需要數據進行深度挖掘,快速羅列出所需數據,能夠為科研工作人員提供必要參考。
3.2 在電信領域的應用
在計算機互聯網發展過程中,電信產業逐漸興起并發展起來,成為人們日常生活中不可缺少的一部分,而電信企業發展中必須應用海量數據,才能為用戶提供更加優質的服務。電信數據往往具有較強的綜合性特點,一旦受到限制,則嚴重影響服務質量[3]。利用數據挖掘技術,對相關數據條理化處理,更加全面的了解和記錄用戶信息,對服務過程中出現的各種問題。利用數據挖掘為電信企業提供精準的用戶信息,對電信企業優化、高效運行提供便利。
3.3 在教育領域的應用
新時期,現代化教育工作開展中,對于學生個人發展情況、學習情況較為關注,而只有相關數據采用準確反映學生個人情況。在學校中,學生成績、各科學習都會形成數據,而在教育領域中使用數據挖掘技術,能更準確的分析學生各項素質,最終得到的分析結果能為教師教學、學校管理工作提供參考,對促進現代化教育教學工作發展具有重要意義[4]。
3.4 在制造業領域的應用
經濟發展下,我國人民生活水平有了質的飛躍,對產品的質量、功能都提出更高要求。在制造業領域中,產品數據、消費者需求數據等是制造業關鍵,通過數據挖掘技術對產品數據分類整理,并進行統計學分析,能夠對比出產品的優點與缺點,根據數據結果對產品進行改良,不僅能有利于提升產品生產的效率,同時也能保證產品更加符合消費者需求,為制造商創造更大的經濟效益,同時也制造出更多優質的產品。可以說,制造業領域中應用數據挖掘技術,對其自身的推動作用是巨大的。
3.5 在醫療領域的應用
新時期,醫學逐漸發達起來,但要想精準的進行疾病診斷依舊是一項難度較大的工作。通過數據挖掘技術,能在疾病診斷方面提供重要幫助,提升相關檢測精準度,還能降低醫務工作者的勞動量,提升疾病診治的效率,從疾病中拯救更多患者。在長期積累下,醫院數據量十分龐大,且具有處理方式繁雜、類型復雜等,傳統數據處理方式并無法發揮這些數據價值[5]。應用數據挖掘正好能解決該問題,對醫生進行疾病診斷提供重要幫助。
3.6 在計算機安全領域的應用
通過數據挖掘技術,能夠幫助用戶有效篩選、甄別網絡中存在的威脅計算機安全的軟件、病毒等。一些不法分子會利用偽裝,將一些病毒隱藏在軟件中,而一般殺毒軟件無法順利檢測出來。利用數據挖掘技術能夠輕松檢測出惡意軟件行為模式,并對其益害進行判斷,對凈化網絡環境,維護計算機網絡用戶安全具有重要幫助。
4 大數據時代下數據挖掘技術的發展
發展至今,各行業都意識到數據挖掘技術在其發展中扮演的角色,也越來越重視數據挖掘開發。基于大數據時代背景,數據挖掘技術必須有進一步發展,才能更好迎合時代發展需求。
4.1 多媒體數據發展
多媒體指的是包括文字、圖片、音頻、視頻為一體的集合媒體形式,在計算機網絡發展中呈現出更多元化形式,多媒體數據類型更多、復雜程度更甚。為了能夠對這些更加多元復雜數據分析,傳統數據收集、分析技術已經無法滿足,需要采用新型的數據挖掘技術,對多媒體數據實施即時精準處理,探求到掩藏在數據下的真實信息。
4.2 改進數據挖掘算法
算法是數據挖掘技術中關鍵環節,大數據讓數據搜集更加便利,但同時也標志著數據量呈現出幾何倍數增加。為了能夠快速處理海量數據信息,必須更精確的數據挖掘技術,必須對算法加以創新、改進,提升數據挖掘技術效率,促進其在更多領域能夠發揮更大作用。
4.3 與其他系統的集成
數據挖掘實施過程中,并非只需要一種方法,很多時候需要多種計算模式共用,才能更加及時獲取有用信息。在應用數據挖掘技術中,應該保持更加靈活的原則,與各系統集成發展,保證數據挖掘發揮更大的價值。
5 結語
通過上述分析可知,在大數據時代背景下,數據的價值逐漸凸顯出來,而面對種類繁多、數量龐大的數據,傳統的數據處理技術已經無法滿足需求。而數據挖掘技術在這一背景下應運而生,并廣泛運用在各行各業中,無論是教育、醫療,還是電信、科研、制造,數據挖掘技術都發揮了重要作用。在市場經濟發展環境下,數據類型還會不斷增多,必須加強對數據挖掘技術的開發與應用,保證其為社會進步與發展做出更大貢獻。
參考文獻
[1] 李陽.基于Spark的并行數據挖掘研究及應用[J].電子科技大學學報.2018,14(8):69-70.
[2] 徐偉.基于大數據的數據挖掘技術和應用分析[J].安陽師范學院學報.2018,20(8):117-118.
[3] 裴海平.淺談數據挖掘技術在管理信息系統中的應用[J].科教導刊.2018,24(2):119-120.
[4] 王長林.大數據和數據挖掘技術在煙草行業的應用分析[J].現代信息科技.2018,13(1):28-30.
[5] 王娟.大數據時代數據挖掘在管理會計中的應用探討[J].現代商貿工業.2019,16(2):87-88.