高超重慶大學
探究網絡用戶的數據挖掘行為
高超
重慶大學
伴隨著互聯網的飛速發展和用戶日益劇增的需求,關于網絡用戶的行為分析和數據挖掘研究從無到有的迅速的發展了起來?,F在的輿論亂七八糟,為了引導輿論朝著正確的道路走下去,節約網絡用戶的上網時間,提讓用戶更好的訪問網站,我們對網絡用戶的數據行為進行了如下探究。
網絡用戶 數據挖掘
網絡信息的數據挖掘包含的內容很多,有效的挖掘網絡信息不但可以增強網站的吸引力,還可以讓用戶更有效的利用網絡資源。和數據挖掘類似,社交網絡的用戶行為分析可以幫助決策者掌握用戶的行為特征,同時也能幫助決策者了解用戶的興趣變化,更好的發揮網絡的作用。
1.1數據挖掘的概念
數據挖掘的另一種叫法數據庫知識發現(Knowledge Discovery inDatabases),簡稱KDD,由數據的清理,數據的集成,數據的選擇,數據的轉換,模式額發現,模式的評估和知識的表示七個部分組成。數據的集成,數據的選擇和數據的轉換可以劃分為一個部分,成為數據預處理階段,數據的預處理階段的效果將直接影響著數據挖掘質量的好壞。模式的發現是中問階段,是運用數據挖掘算法從數據庫中提取有效模式的階段。
1.2網絡用戶行為的概念
網絡用戶行為是指網絡用戶在使用網絡信息和資源時所表現出來了規律性的行為特征。對網絡用戶行為的研究目的就是通過一些算法和軟件對網絡用戶行為進行研究分析,發現規律特征,進而利用這些特征預測未來的網絡用戶行為,同時通過這些網絡用戶規律優化網絡信息。
網絡用戶行為的特點:一方面是它的主觀能動性太強,牽扯到的東西很多,它不受地域的限制,用戶之間能自由的發表意見進行交流;一方面它知識豐富,計劃跟不上變化,用戶可以隨意的上傳資料行為信息豐富多彩;一方面網絡用戶特點鮮明,比較偏好的特征和用戶的習慣不受時間和空間的限制;一方面隱蔽性比較好,網絡用戶在訪問信息的時候可以隱藏自己的真實身份,并且物理傳遞介質也具有隱藏性;最后一方面,它即存在隨機性又存在規律性,用戶行為分析就是通過用戶行為的這一特征進行分析的。
不同的人有不同的興趣愛好,網絡用戶也是這樣的,因為網絡用戶的社會經歷文化程度等的不同,所以網絡用戶的行為模式各有不同。而數據挖掘是從眾多數據中選取有用知識的過程,這些有用的數據往往是被隱藏起來的。同時,數據挖掘的對象并不單一,任何數據集合都可以通過數據挖掘方法照出統一的規律。數據挖掘在用戶行為分析過程中的應用可以分為以下幾種:
1.1推薦系統
推薦系統有兩部分組成,一部分是基于內容的推薦,一部分是協同過濾推薦。基于內容的推薦它依賴產品和信息的說明,在各大購物網站出現的頻率最高。如京東,天貓,巴里巴巴等商城?,F階段在很多視頻網站也得到了廣泛的應用,比如奇異,優酷,土豆等網站。基于內容的方法它是以信息論為理論基礎的,以關鍵詞和用戶比較感興趣的信息作為模型,然后再通過其他的軟件計算出用戶對于其他信息的興趣程度,然后再將符合用戶興趣程度的信息傳遞給用戶,而協同過濾是基于模型的,它是通過尋找相似的用戶進行推廣的。
1.2檢測入侵和防止入侵
人侵檢測和預防系統分為基于特征的檢測和基于異常的檢測?;谔卣鞯臋z測在檢測網絡流量異常上應用比較廣泛,假如檢測異常的結果與標準模型相符合,那么該系統就會采取相關的措施終止該系統異常的運行。這種不具有動態性,只能對已經存在的異常進行檢測,對于新異常是不能進行檢測的。
1.3零售和電信業
在零售業,數據挖掘的應用也是很廣泛的。它用來分析處理購買者的購買行為,總結出顧客的購買模式,同時將顧客以后可能要購買的東西擺放在明顯的位置,以便顧客方便拿取,同時提高商品的銷售量。在電信業方面,主要是幫助用戶防盜,幫助電信運營商判斷用戶行為模式,從而提高電信運行商的服務質量。
在數據挖掘算法中,應用最廣的就是決策樹算法,它是一種歸納推理算法,它通過逼近離散值函數來對噪聲數據處理然后分析出表達式的方法來實現的。在這種方法中,表達式被稱為決策樹,也正是如此才被叫做決策樹算法的。
下面我們就談一下決策樹算法的特點:一方面,種方法便于理解,因為從事教務處管理的老師并不了解數據挖掘相關的知識,而決策樹算法非常形象的通過樹形結構表示最后的分類結果。它符合人們認識事物的一般規律;一方面決策樹算法的計算量小,復雜程度小,這樣就能提高工作人員的效率嗎,能在短時間內解決更多的問題;最后一方面,決策樹算法能夠主次分明的表達出重點,屬性的重要程度能被一眼看出來。
隨著信息技術和通信技術的飛速發展,數據挖掘幾乎出現在了所有的領域。在解決重大策略的時候,數據挖掘往往作為一種重要的手段。它能從萬千的數據中找出有價值的信息,為決策和方案的制定提供數據和理論支持。
網絡用戶的行為中蘊含著萬千的信息,不但用來反映用戶的興趣,還用來對未來的發展趨勢進行預判,雖然數據挖掘算法一直被創新,但是提高數據挖掘算法的效率的任務依舊艱巨,面臨著諸多挑戰。另外用戶行為分析系統還僅處在系統分析階段,而具體得到應用還有很長的路要走,需要我們對此加大研究力度。