令狐永芳
摘要:互聯網技術的不斷發展以及和人類社會的不斷融合,使得互聯網技術已經成為人類社會發展必不可少的關鍵因素之一。同時,其在逐漸發展的過程中演變成一個信息傳輸的綜合體,網絡數據也呈現出一種爆炸式增長的趨勢,由此人們正式進入了大數據時代。在這個時代背景下,人們通過使用數據挖掘技術,在整合分析大量數據的基礎上實現從中發現其隱藏規律以及有價值的信息。本文從其概念剖析入手,在解析其基本數據分析方法的基礎上,就其在互聯網中的應用進行了詳細的分析,希望對今后數據挖掘技術的推廣使用帶來一定的幫助。
關鍵詞:數據挖掘技術;概念;分析方式;互聯網;應用
1.何為數據挖掘技術
信息交互程度的提升以及網絡數據的實時分享,從某種意義上來說加速了人們的生活發展,人們在日常生活中可以時刻享受到大數據技術帶來的便利。同時在互聯網行業不斷發展的影響之下,互聯網平臺得以大規模發展,致使網絡數據得到了爆炸式的增長,出現了海量以及復雜性的特征。但是這些數據并非是全部具備使用價值的,其中包括了大量的噪聲數據,導致實際的具備價值的數據所占比例相對較少,再加之數據內容可能會存在缺失及分散的現象,繼而引發數據質量不一致的問題。在這種情況下,我們就需要使用數據挖掘技術從這些數量龐大的且較為隨機雜亂的數據中,借助一定的算法將信息進行提取,在發現其中具備價值以及規律信息的數據基礎上,將數據信息庫進行重新組合。
所謂的數據挖掘并非是僅僅只有收據的收集,其中更是包括了從海量類型不同的數據中,將其中具備使用價值的信息予以挖掘,并合理使用這些數據做到社會治理數據改善以及數據系統使用率的提升。數據挖掘技術就是針對數量龐大數據進行整合、分析以及分析之后,借助于機器學習方式、人工智能方式以及各種數據挖掘方式進行數據的深度挖掘工作,在發現總結其中隱藏規律的基礎上,將之合理應用的一種方式。
2.數據挖掘技術的基本分析方法解析
2.1聚類分析
這種數據分析方式主要就是將物理以及抽象對象的整合予以分類,與此同時針對那些完全相同或者是具備一定相似性的對象組成的分類開展更為深入的分析工作。其最終的目標就是將這些數據進行有效的分類,也就是在深入分析事物之間規律的基礎上,從而實現各個領域的智能化學習目標。聚類分析這種方式其中又可以分為硬聚類和模糊聚類兩種方式,其中的硬聚類方式就是將分析的對象歸屬到相近程度最高的類別之中。而其中的模糊聚類方式在劃分對象的過程中以取值范圍作為依據,同時還會出現同一個對象對應的多個類別的現象。
2.2關聯分析
關聯分析從其本質上來看和蝴蝶效應較為相似,所謂的蝴蝶效應就是指自然界中的任何一次微小變動都有很大的可能性帶來另一個事件的發生。同樣這也是關聯分析方式的規律所在,相同事物之間具備著不同程度的依賴以及關聯性,也正是因為事物之間的這一特點,就可以對事物之間的規律性予以有效的預測。
舉個例子,購物籃事件就是這種方式中最具有代表性的應用。就是通過針對顧客購物籃的物品管理規律進行相應的分析,就可以做到初步掌握顧客自身的購買特點以及習慣,并以這些數據作為基礎將日常化的營銷方案以及策略予以制定。通過使用這種方式就可以取得很好的營銷效果。
2.3分類與預測
分類就是針對那些不具備排序規律的標號予以分類,預測則是針對連續值的函數模型開展相應的預測工作。而其中的分類則是數據挖掘技術極為重要的基礎之一,借助分類可以將數據集合自身的特征予以明確的表示,從而將各個類別的屬性進行相應的劃分,其中較為常見的方式之一就是決策樹、遺傳算法等等。而預測就是將當前已知的分類情況作為基礎,并按照其中的發展規律將其未來的發展趨勢予以預測,當前較常用的方式主要包括時間序列以及回歸分析等等。
3.數據挖掘技術在互聯網領域中應用分析
3.1應用于電子商務領域
互聯網技術的出現以及普及對于傳統的實體行業帶來了相應的沖擊,由此網購逐漸深入人們的日常生活中,使得我國的營銷市場得到了極大的發展。數據挖掘技術應用在電子商務領域中主要是負責挖掘消費者自身的喜好之上。通過數據挖掘技術的應用針對消費者的商品瀏覽以及購買記錄就可以從中挖掘出不同消費者在商品類型、價格上的偏好。當前絕大多數的網購平臺都通過數據挖掘技術,在深刻分析消費者自身購買喜好的基礎上,為企業制定營銷策略提供了精準化的數據支撐,就可以達到電子商務平臺的運營投放上的優化。
3.2應用于金融領域
銀行業當前已經針對大數據在其經營管理、客戶營銷以及產品優化等工作中的重要作用有了一個全面清醒的認知。銀行業中使用數據挖掘技術往往都是將其自身大數據的巨大價值予以挖掘,并以此作為其產品、服務以及管理工作方面的創新依據。而在金融投資方面則是通過數據挖掘技術的應用針對投資數據進行分析,將隱藏在其中的規律予以發現,并以此作為投資行為的數據導向,最終目標就是降低投資風險的降低。
3.3應用于醫療領域
當前醫療信息化程度的不斷提升,導致醫院在病人檔案、醫療器具等方面管理工作的現代化程度逐漸得以提升,通過數據挖掘技術的幫助可以很好發現存在于其中的問題,實現醫院管理質量的不斷提升。
與此同時因為醫務工作人員自身的診斷方式也從之前的傳統依靠人員經驗的診斷方式逐漸向著現代化診斷方式發展。通過數據挖掘技術的使用醫務人員就可以針對患者的過往病史、臨床癥狀表現以及相似程度較高患者的病史與數據庫中的各項信息進行分析以及綜合研究,可以很有效的提升相應的診斷正確率,有助于提升醫療服務質量。
4.總結
當前大數據時代的到來,社會中的數據信息呈現出一種爆炸式的增長態勢,為了更好的使用其中有價值的數據,就需要借助于數據挖掘技術。通過數據挖掘技術中的聚類分析、分類預測以及關聯分析等方式就可以很好實現數據規律的發現以及利用,并且隨著技術的逐步發展在互聯網領域中的金融、醫療以及電子商務等領域中的應用將會逐漸得以推廣。
參考文獻
[1]管祥甫,管子涵.計算機文本信息挖掘技術在網絡安全中的應用[J/OL].電子技術與軟件工程,2019(21):184-185[2019-11-20].
[2]謝翠琴.淺析移動通信中數據挖掘技術的應用[J].電子世界,2019(20):192-193.