鄭 蕾, 李生紅
(上海交通大學 電子信息與電氣工程學院,上海 200240)
微博,是一種基于用戶關系的信息分享,傳播以及獲取的平臺,用戶通過 WEB,WAP以及各種客戶端組件便能隨時隨地地實現信息的更新和即時分享。與BBS和博客不同的是,微博用戶可以不受時間空間的限制,持續不斷地對某條信息作出評論和轉發,使得該信息可能在極短時間內以“核裂變”的方式被成百上千的用戶轉發,從而演化成引起輿論關注的社會新聞事件,例如,直播玉樹大地震,“我爸是李剛”,唐俊“學歷門”事件等。在微博網絡上,信息的傳播速度,廣度和效率都得到了極大提高,但這無疑也為一些帶有敏感字眼的失實消息(如“無償獻血被紅十字以一袋 200元賣給醫院”)在微博上的傳播創造了更有利的條件。因此,研究信息(輿論)在微博網絡上的傳播及其傳播的性質 、規律等,進而研究如何控制 、引導輿論,具有非常重要的理論價值和現實意義。
現有的文獻大多從單一的角度來研究人際網絡上的信息傳播,如,信息傳播所在網絡的拓撲結構[1-3],個體相互作用規則[4-7]。但實際中信息(輿論)的傳播與形成是一個典型的復雜系統的演化過程,需要將個體的相互作用和網絡結構進行綜合考慮才能更準確地描述信息在網絡中的傳播。文中在基于信息在微博網絡上的傳播規則,并結合微博網絡拓撲結構對傳播行為的影響,初步建立了微博網絡中信息傳播的隨機演化仿真模型。
在微博網絡中,入度越大,說明關注的用戶越多,信息來源越豐富,而出度越大,說明關注自己的人越多,影響力越大。早在20世紀40年代,拉扎斯菲爾德等人在《人民的選擇》中提出了“意見領袖”的概念,所謂意見領袖,維基百科是這樣描述的,在人際傳播網中經常為他人提供信息,同時對他人施加影響的“活躍分子”,他們在大眾傳播效果的形成過程中起著重要的中介或過濾的作用。通常而言,大部分微博用戶的粉絲一般是幾十至幾百的數量級,而少數用戶的粉絲超過上千乃至上萬,稱其為明星用戶(意見領袖)。文中基于提出的信息傳播模型,探討了明星用戶和小級別用戶在微博網絡信息擴散中扮演的角色,通過仿真實驗,得到了一些有趣的發現。
微博的每個用戶通常都擁有一定數量的“粉絲”(跟隨者),其發布的信息會以廣播的形式通知每個“粉絲”,從而受到關注甚至轉發。以新浪微博為例,它具有4大功能模塊:發布功能,轉發功能,關注功能及評論功能。發布功能,用戶可以隨時隨地發布消息;轉發功能,用戶可以把自己喜歡的消息一鍵轉發到自己的微博,在轉發過程中原帖內容不會被篡改,且轉發記錄會以“//@用戶名”的方式保留轉發路徑;關注功能,用戶u可以對自己喜歡的用戶v進行關注,成為用戶v的“粉絲”,這一行為不需要得到受關注用戶的同意,之后用戶 v更新的所有消息便會同步出現在用戶u的微博首頁上;評論功能,用戶可以對任何一條微博進行評論。由此,消息I在微博網絡上的傳播過程可以簡述如下:
1)用戶u發布消息I,消息的形式可能是一句話,一張照片等。
2)u的粉絲可通過個人首頁上系統的新鮮消息提醒和主動訪問u的微博頁面這兩種途徑來獲知消息 I。
3)對消息I感興趣的粉絲v可能會對該消息進行評論,收藏和轉發,從而將信息I進行再次傳播。
4)如此重復過程2)和3)。
將微博網絡中的信息傳播機制和網絡拓撲結構相結合,提出一種基于微博網絡的信息傳播模型IDM (α, β) , 其中α∈[0,1]表示消息的敏感度,其值是由消息的來源,內容及表現形式決定的;β∈{-1,0,1}是模型的另一個參數,用來決定選擇轉發信息的節點的方式。在這個模型中,網絡中的節點只可能處于3種狀態,一是未激活狀態,即不知道消息I,記為S0,二是被消息I激活但選擇不作為狀態,記為S1,三是被消息I激活后對消息進行轉發的狀態,記為S2。時間步序列是一個離散的等間隔(如,5 min)時間序列。模型定義如下:
1)初始時刻,將網絡中所有節點的狀態初始化為S0。在時間步T=0,隨機選擇一個節點v作為發布消息I的源節點。節點v的出度是dout_v。
2)在時間步T=T+1,關注節點v的dout_v個節點被激活,其中轉發消息 I的節點數量為M( M≤dout_v),M計算如下:設PT是時間步 T內選擇轉發的節點的集合,即PT={uj}, 其中uj的狀態為S2。

3)對關注節點 v且不屬于集合PT-1的n( n≤dout_v)個節點的出度進行排序,按照從小到大的順序記為Q={u_(1),u(2),…,u( dout_v )}。若β=1,順序選擇序列Q中前M個節點,將它們狀態設為S2,放入集合PT+1;若β=-1,順序選擇序列Q最后M個節點,將它們狀態設為S2,放入集合PT+1; 若β=0,從序列Q中隨機選出M個節點,將它們狀態設為S2,放入集合PT+1。將節點v從集合PT中刪去。
4)對每一個節點v∈PT遞歸執行2)和3),直到集合PT為空。
由式(1)可知,微博網絡中節點v對消息傳播的貢獻是與它的出度及消息的敏感度成正比的,這與現實情況中用戶的粉絲越多,其發布(轉發)的消息被進一步轉發的可能性就越大及消息的敏感度越高,吸引力越大,其轉發率越大是吻合的。在該模型中,利用參數β來選擇節點v的“粉絲”節點中會進一步轉發消息I的節點,當β=-1時,選擇出度小的節點對信息進行轉發,當β=1時,選擇出度大的節點對信息進行轉發,當β=0時,隨機選擇出轉發節點。
現利用自動搜索程序,獲得了新浪微博網絡的一個子網絡,該網絡是個有向圖,記為G=(V, E),其中節點v∈V表示一個微博ID,有向邊(u, v)∈E表示用戶v是用戶u的粉絲, 信息從u流向v。所獲取的子圖的節點數N=62 668,平均入度din_mean=248.12, 平均出度dout_mean=329.49。 累積出度的分布如圖1所示,p表示出度值。
圖2顯示的是信息敏感度取不同值時,采取不同的轉發節點選擇策略,信息在網絡上的擴散面積和擴散耗時的比較,圖2中空心點,倒三角,叉分別代表β取1,0,-1時信息在網絡中的擴散比例,每一條曲線是通過對每對參數 50次仿真結果的統計平均得到的。從圖2可以看出當信息敏感度較小時,明星用戶在信息傳播過程中扮演著意見領袖的角色,對輿論的傳播起著絕對的推動作用;但當信息敏感度大于某一臨界值后,明星用戶對提高信息傳播速度、擴大信息傳播面積的作用逐漸減小;當信息敏感度趨于1時,明星用戶在信息傳播中的優勢趨于0。

圖1 累積出度分布

圖2 信息擴散密度隨時間的演化
微博網絡是復雜網絡在實際人際網絡的一個實例,文中初步構建了一個基于微博網絡的信息傳播模型,該模型準確描述了微博網絡中信息傳播的基本特點,以及輿論演化過程中每次節點的選取、節點策略的轉移。通過在新浪微博的拓撲子網上進行仿真,得到如下結論:明星用戶在信息擴散的過程中起著著意見領袖的作用,但當信息敏感度大于某一臨界值后,明星用戶對提高信息傳播速度、擴大信息傳播面積的作用逐漸減小,當信息敏感度趨于1時,明星用戶在信息傳播中的優勢趨于0。由于輿論傳播過程中存在著許多會影響傳播過程的不確定因素,因此該模型還有很大的改善空間,例如,信息敏感度的劃分需要更多的實證研究來支持。相信隨著這方面研究的深入,復雜網絡中的信息傳播機制會越來越得到重視,進而更好的提升網絡空間的文明度和保障人們對網絡安全的需求。
[1] JAEWON Y, LESKOVEC J. Modeling Information Diffusion in Implicit Networks[C]//IEEE.2010 IEEE 10thInternational Conference on Data Mining.Berlin,Germany: IEEE,2010:599-608.
[2] GOLDENBERG J, LIBAI B, MOLDOVAN S, et al. The NPV of Bad News[J].International Journal of Research in Marketing,2007,24(03):186-200.
[3] LAHIRI M, CEBRIN M. The Genetic Algorithm as a General Diffusion Model for Social Networks[C]//The 24th AAAI Conference on Artificial Intelligence.Atlanta,Georigia,USA:[s.n.],2010:76-81.
[4] SAITO K, KIMURA M, OHARA K, et al. Learning Continuous Time Information Diffusion Model for Social Behavioral Data Analysis[J]. Advances in Machine Learning, Springer,2009(5828): 322-337.
[5] 惠彥濤,吳靜. 互補結構網絡建模與統計特性分析[J].通信技術,2011,44(05): 94-96.
[6] HADDADI H, BENEVENUTO F, GUMMADI K P. Measuring User Influence in Twitter: The Million Follower Fallacy[C]// Proceedings of International AAAI Conference on Weblogs and Social. Washington,DC:ICWSM,2010:97-105.
[7] BHARATHI S, DAVID K, MAYHAR S. Competitive Influence Maximization in Social Networks Internet and Network Economics[J]. Springer, 2007(2315):306-311.