李攀攀,謝正霞,王贈凱,靳銳
一種基于信息DNA的互聯網信息內容傳播及演化追溯方法
李攀攀1,謝正霞1,王贈凱1,靳銳2
(1.嘉興學院,浙江 嘉興 314001;2.哈爾濱工業大學,黑龍江 哈爾濱 150001)
針對如何解決互聯網上信息內容傳播及演化過程追溯的問題,提出了一種基于信息DNA的互聯網信息傳播及演化追溯方法。首先,根據領域知識對互聯網信息內容進行語義抽取,形成信息內容關鍵特征集;然后,使用信息內容關鍵特征集,提出基于局部敏感哈希的信息DNA構建方法;最后,通過公開數據集驗證了所提方法的可用性及有效性。以信息DNA為核心標識符解決了互聯網同源信息傳播及演化過程可追溯的問題,對研究互聯網信息內容傳播、演化追溯及網絡輿情事件的治理與引導等有重要的現實意義。
信息DNA;信息演化;信息傳播;計算傳播學
以互聯網為代表的信息技術改變了信息的傳播模式,相較于傳統媒體,信息傳播渠道呈現開放性和虛擬化的典型特點。信息在互聯網中的傳播速度更快、影響范圍更廣,傳播渠道也更加多樣[1-2]。但是,在開放的互聯網中,網絡謠言傳播、數字知識產權剽竊、信息的不當引用等問題導致虛假和不實信息的蔓延和泛濫[3],給互聯網上信息內容的監管帶來嚴峻挑戰,因此,研究面向信息內容的傳播及演化溯源具有重要的現實意義[4]。
在互聯網信息傳播溯源的研究領域中,傳統方法主要使用信息發布時間、發布地址、引用(轉載或轉述)時間等關鍵特征構建信息傳播鏈,但是,這種方式通常忽略對信息內容的理解,導致對信息內容的不當引用或剽竊難以被溯源[5]。……