劉榮叁+張宇+王星



摘 要: 隨著微博的高速發展,微博信息溯源成為信息內容安全管理的重要研究內容之一。此前的信息溯源研究中,事件數據純度不高,且用戶影響力涉及的因素考慮得不夠全面,本文即針對以上問題進行研究。首先,由于微博信息采集過程中,得到的數據純度較低,對大量的新浪微博數據進行事件聚類,得到某一具體事件的相關微博。接著,為了得到更合理的用戶影響力數值,針對具體事件涉及到的用戶,考慮多個因素,進行用戶影響力分析,得到用戶的影響力數值。最后,綜合考慮微博的發布時間和用戶影響力數值,使用Hacker News排序算法,對具體事件進行信息溯源。最終分析得出了事件傳播過程中,發布時間較早,且用戶影響力較大的一篇微博為事件源頭。
關鍵詞: 新浪微博;事件聚類;用戶影響力分析;信息溯源
中圖分類號:TP391.41
文獻標志碼:A
文章編號:2095-2163(2017)02-0094-05