王 喆, 李 鑫
(吉林大學 符號計算與知識工程教育部重點實驗室, 長春 130012;吉林大學 計算機科學與技術學院, 長春 130012)
網絡中的節點具有一個或多個角色, 節點可根據其在網絡中所扮演的角色劃分等價類, 即角色識別. 分析和識別網絡中節點的角色, 能幫助研究人員更好地理解網絡的屬性和演化, 并且擁有廣泛的應用場景, 例如: 支付網絡中的欺詐檢測[1]、 蛋白質功能預測[2]等. 節點在網絡中所扮演的角色可體現在節點的網絡結構中[3-4], 例如: 社交網絡中的領導者常對應網絡中心節點[3]; 蛋白質相互作用網絡中具有相似功能的蛋白質常具有相似的結構[5]. 因此, 可根據節點的結構信息進行角色識別.
由于網絡數據具有高維、 非線性等特征, 因此直接在原始的網絡數據上進行分析推理較困難. 為解決此類問題, 提出了網絡表示學習方法[6], 它將網絡中的節點映射為低維稠密的表示向量, 同時使原始網絡中相似的節點在嵌入空間距離相近. Perozzi等[7]提出的DeepWalk方法在網絡上執行隨機游走產生節點序列, 然后將節點序列集合輸入到自然語言處理處理模型Skip-Gram中, 從而學習節點的潛在表示向量; Grover等[8]提出的node2vec在DeepWalk的基礎上彌補了隨機游走采樣策略單一化的缺點, 采用有偏隨機游走策略, 在隨機游走時平衡節點的深度優先遍歷和寬度優先遍歷, 更靈活地探索節點的網絡鄰域; 隨著對節點鄰域探索細致化的趨勢, Tang等[9]提出了LINE算法, 該方法定義了節點間的一階……