劉凱
摘要: 由于互聯網的普遍性、匿名性以及競爭的激烈性,越來越多的網絡用戶通過虛假信息以混淆視聽、惡意詆毀競爭對手和蓄意擾亂社會秩序。本文通過論述互聯網虛假信息的研究現狀,結合相關研究理論和方法,探索互聯網虛假信息的研究方向。
Abstract: Due to the universality, anonymity and the severity of competition of the internet, more and more network users use false information to confuse the public, malicious slander competitors and distribute the social order deliberately. This paper discusses the research status of internet false information and explores the research direction of it with relevant theory and method.
關鍵詞: 互聯網;虛假信息;研究方向
Key words: internet;false information;research direction
中圖分類號:TP393.4 文獻標識碼:A 文章編號:1006-4311(2014)22-0011-02
1 互聯網虛假信息研究現狀
2014年1月16日,中國互聯網絡信息中心(CNNIC)在京發布第33次《中國互聯網絡發展狀況統計報告》,報告顯示截至2013年12月,中國網民規模達6.18億,互聯網普及率為45.8%。根據國家互聯網信息辦公室統計,僅2012年3月監測到的各類網絡虛假信息就高達21萬余條。伴隨著微博、微信等自媒體媒介的普及,虛假信息的傳播也表現傳播速度更快、傳播范圍更廣、傳播過程更難控制的特點。
互聯網虛假信息作為一種信息形態,廣泛的存在與互聯網平臺之上。互聯網虛假信息的發布者往往是出于某種目的,虛假信息的傳播也存在著非常大的安全隱患。因此,學者們逐步開始對互聯網信息、互聯網信息傳播以及互聯網中存在的與事實不相符的信息進行研究。
從紅日(2003)[1]將網絡虛假信息分為惡意的、無意的、技術性的和主觀性的四類,將產生虛假信息的原因總結為利益驅動、從眾心理、信息儲存和傳播中產生的“誤差”和信息接受者的注意力或理解力不夠等四類,并提出了針對性的應對策略。
Carlos Castillo1、Marcelo Mendoza和Barbara Poblete(2011)[2]研究微博平臺twitter上的信息可信性發現,微博平臺上的信息絕大多數的信息是可信的,但是也會有博主有意或無意的傳播一些錯誤信息或者謠言。
王永剛、蔡飛志、Eng Keong Lua、胡建斌和陳鐘等(2012)[3]將社交網絡中的虛假信息分為涉及經濟利益和名譽利益兩類,并將用戶類比成網頁,提出了一種基于PageRank的社交網絡虛假信息傳播控制方法Fidic。
鐘琪、戚巍和張樂等(2012)[4]在Lotka-Volterra系統下構建了社會型危機信息的擴散模型,并提到從真偽的角度可以將危機信息分為真實信息和虛假信息兩大類,其中虛假信息為不真實、不客觀,阻礙災民認識危機、應對危機甚至擴大危機損失的信息。
劉可文(2012)[5]對微博中虛假信息的特征進行了詳細的總結,主要包括即興性與隱匿性、非理性與隨機性、延伸性與交織性、頻發性與反復性、蠱惑性與破壞性、難核實性與傳播慣性等六個特征,作者同時指出應從法治與德治、自律與他律、公開與公信、主動與聯動四個方面來防范微博虛假信息。
2 互聯網虛假信息研究存在問題
互聯網始于1969年,而互聯網真正的普及是在1990年以后,因此對于互聯網信息尤其是互聯網虛假信息的研究還處于起步階段,通過對互聯網虛假信息的相關研究進行對比分析,可以得出互聯網虛假信息的研究還存在以下幾方面的問題:
2.1 學者對互聯網虛假信息概念的界定不統一 學者對互聯網虛假信息還沒有較為權威、嚴謹、完善的界定。虛假信息也因此會和欺詐信息、謠言、垃圾信息以及不實信息相混淆。
2.2 學者對互聯網虛假信息的研究方向過于局限 學者們對虛假信息的研究大多集中虛假信息的特征分析和防范體制建設上。然而這些特征只是虛假信息在互聯網平臺上的表現特征,不能用這些特征來識別或發現虛假信息;體制的建設對可以促成互聯網形成較為健康的環境,卻不能從源頭遏制互聯網虛假信息的傳播。
2.3 互聯網虛假信息的研究方法較為單一 大多數學者對互聯網虛假信息的研究是通過定性的方法來分析虛假信息的成因、特征、傳播以及控制問題。定量研究是對統計收集到的資料進行分析、測算等,得出的結論是普適性的、概括性的、不受背景約束的。而對于互聯網虛假信息的研究問題中,由于互聯網信息數據龐大性,應該更多采用定量研究方法來對虛假信息進行科學的研究。
3 互聯網虛假信息的研究方法探討
互聯網信息對人們日常決策產生越來越大的影響,關系到國家安全和社會穩定,在新的時代、技術背景基礎上,本文認為可以從以下兩個方向對互聯網虛假信息展開研究。
3.1 利用分形分類技術在對信息進行識別 分形數據挖掘技術是一種利用數據集的分形特征對其進行挖掘的技術,Faloutsos (2007)[6]指出諸如網絡數據、圖數據、傳感數據、地理數據、醫學數據、金融數據等數據集適合運用分形數據挖掘技術進行分析。可以利用分形分類技術對互聯網信息的結構或屬性進行挖掘,通過對新產生的互聯網信息與已經被證明為虛假信息或者真實信息數據集的特征匹配程度來識別其真偽。
3.2 利用文本識別技術識別信息發布動機 伴隨著Web2.0的到來,互聯網逐漸成為大眾普遍交流觀點、抒發感情感的平臺,積累了大量的關于人類心理和行為的文本信息,社會科學研究可以利用心理學的情緒結構理論對信息進行分析處理。常用的研究方法主要有兩類:一類是基于自然語言處理技術, 通過確定情感表達與主題之間的關系, 分析文本中某一主題的情感傾向;另外一類是基于機器學習, 根據訓練數據并利用支持向量機(SVM)等技術,將文本區分為正情感和負情感。互聯網虛假信息正是互聯網用戶基于某種心理來在互聯網平臺上發布的信息,可以通過文本識別技術來挖掘信息內容所包含的情感因素,進而了解信息發布者的動機,借此識別信息內容的虛假與否。
參考文獻:
[1]叢紅日.網絡環境下的虛假信息問題及其對策[J].現代圖書情報技術,2003(101):149-153.
[2]Castillo C, Mendoza M, Poblete B. Information credibility on twitter[C]//Proceedings of the 20th international conference on World wide web. ACM, 2011: 675-684.
[3]王永剛,蔡飛志,Eng Keong Lua,胡建斌,陳鐘.一種社交網絡虛假信息傳播控制方法[J].計算機研究與發展,2012(49):131-137.
[4]鐘琪,戚巍,張樂.Lotka-Volterra 系統下的社會型危機信息擴散模型[J].系統工程理論與實踐,2012,32(1):104-110.
[5]劉可文.微博客虛假信息的傳播特征及治理策略[J].貴州師范大學學報社會科學版,2012(6):88-92.
[6]Faloutsos C. Data mining using fractals and power laws[J]. Lecture Notes in Computer Science, 2007: 1.