張宇萌 吳昊 辛陽 承琪 趙經宇
(北京郵電大學 北京市 100876)
面對規模日益增長的信息資源,人們對于數據的理解,大多處于對數據的淺層感知模式,缺乏考慮數據之間的關聯,導致對數據的內涵理解不夠深刻。由于各類實體并不是孤立存在的,它們之間普遍存在關聯關系。正是這種聯系與交流的存在,使得數據之間顯式或隱式地形成一個巨大的關聯網絡。傳統的網絡異常行為分析采用的是在單個身份域內進行分析的方式,沒有考慮到由于系統條件、用戶背景或者用戶活躍平臺等屬性的變化而導致的行為變化所帶來的誤差。而現有的單域用戶異常行為分析模型不能很好的對多元化的用戶異常行為進行分析,因此易漏報異常行為與異常用戶。同時,現有的跨域用戶行為關聯分析研究更多的集中在用戶推薦領域[1],對跨域關聯用戶進行異常分析的研究少之又少。
隨著多域平臺的深層次合作以及用戶在各個平臺活動的多元化,對跨域網絡行為數據的挖掘與分析得到了廣大學者的研究。Xusong Chen[2]等人提出了一個注意力領域轉移網絡,通過產品域的個性化推薦方法來解決storytelling 域的用戶偏好預測問題,彌補了storytelling 與產品描述之間存在巨大差異這一缺陷,同時提出了一種雙域對比對抗學習方法,共同對storytelling 和產品的特征提取器進行預訓練。Xiujuan Wang[3]等人在單個社交網絡域中提出了一種名為“Hurst of Interest Distribution”的異常用戶檢測方法,利用文本主題特征以檢測異常賬戶。……