劉青青
(洛陽師范學院數學科學學院, 河南洛陽 471934)
基于用戶行為的社交網絡挖掘分析
劉青青
(洛陽師范學院數學科學學院, 河南洛陽 471934)
本文基于分布式云計算, 提出了一種社交網絡行為搜索算法, 其可以增加影響因素, 并把時間箭頭和頁面相關因子轉化為挖掘因子, 從而可提高挖掘性能的計算和搜索效率. 實驗證明, 該計算有較好效果, 并對云計算的用戶分析具有指導意義.
分布式計算; 用戶搜索; 社交網絡
目前, 隨著社交平臺的快速發展, 出現了海量的信息, 并且信息量呈指數級增長. 預計到2020年, 每年產生的數字信息中將會有超過三分之一的內容存在云平臺上. 為了對這些數據進行分析處理, 以獲取更多的有價值的信息, 基于云計算的研究已成為一個重要研究方向. 在國外, 美國斯坦福大學提出了網頁的排名[1], IBM提出了HITS技術的理念[2-3]. 基于海量信息的特點, 傳統的數據存儲和計算方法很難適應. 因此, 針對這一問題, 本章提出了一種結合網絡搜索行為的算法.
Hadoop是一個能夠讓用戶容易使用的構架和分布計算平臺[4]. 用戶可以很容易在Hadoop上開發處理海量數據的應用程序. 它有以下幾個優點: 高可靠性、 強擴展性、 高效性、 高容錯性. 目前, 基于Hadoop的應用非常多, 比如, Facebook借助于集群運行Hadoop來進行數據的分析和機器學習, 百度也使用Hadoop進行搜索日志分析和網頁數據的挖掘工作[5].
在云計算中, 資源和任務的分配并不是一一對應的. 首先, 任……