999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于微博社交網絡的信息傳播分析

2013-04-29 22:34:55陳斌徐志明張永超
智能計算機與應用 2013年5期

陳斌 徐志明 張永超

摘要:微博作為重要的社交媒體,越來越受到人們的重視。同傳統的網絡媒體相比,微博的信息傳播呈現出數據量大、及時、快速等特點。主要研究微博信息傳播樹的分析技術,提出了兩種微博信息傳播樹的生成算法:基于轉發關系的微博信息傳播樹的生成算法和一種快速的微博信息傳播樹的生成算法。通過實驗,對這兩種算法的性能進行了對比,并分析了傳播樹的節點分布情況。

關鍵詞:信息傳播; 微博; 信息傳播樹

中圖分類號:TP3934 文獻標識碼:A 文章編號:2095-2163(2013)05-0070-05

0引言

隨著新浪微博、人人網等社交類網站的迅速崛起,社交媒體正在成為當今網絡技術發展的熱點和趨勢,也正日漸深刻地影響著人們生活的方方面面。社交媒體(Social Media),也稱為社會化媒體、社會性媒體,指允許人們撰寫、分享、評價、討論、相互溝通的網站和技術。具體來說,社交媒體就是人們彼此之間用來分享意見、見解、經驗和觀點的工具和平臺。用戶在這種新媒體上不再單純是信息的被動接收者,而變身為信息的主動發布者和傳播者,由此用戶真正成為了互聯網的主人。在社交媒體中,用戶還可以建立不同類型的各種關系,這就產生了類似真實社會的虛擬在線社交網絡,用戶之間可以進行觀點的交流互動和信息的發布擴散。

相比于傳統媒體,微博作為Web2.0時代新生的社交媒體,因其新型的信息發布方式、快速的消息傳播渠道、廣泛的受眾參與人群等特點使其迅速獲得了大量的互聯網擁躉。中國擁有全球最大的網絡人群,互聯網用戶超過6億、移動互聯網用戶4.61億。而截至2013年,新浪微博注冊用戶已經達到5億。

相比較于傳統的網頁媒體,社交媒體中用戶獲取信息的方式發生了很大變化。對前者而言,用戶在搜索引擎中輸入關鍵詞,從海量網頁中獲取自己所需信息。而在社交媒體中,搜索引擎不再是互聯網用戶獲取信息的最主要途徑,用戶開始具有主動性,如果用戶對某個主題的信息感興趣,此時用戶就可以同發布該主題信息的其他用戶建立聯系,構建自己的虛擬社交網絡,這時相關信息就會通過虛擬社交網絡擴散到該用戶那里。由此可見,信息在社交媒體中的傳播擴散對幫助用戶獲取需要的信息起到了至關重要的作用。另外,研究社交網絡中的信息傳播問題還可以發現現實生活中隱藏的不易察覺的社會現象。總而言之,研究社交媒體中信息的傳播擴散不僅可以幫助用戶獲取所需要的信息,還可以研究社會現象,因此具有非常重要的意義。

信息傳播的早期研究人員主要是一些經濟學家、社會學家和傳染病學專家,主要研究產品、創新和病毒在真實社會中的傳播,但是由于真實社會的數據采集比較困難,研究中所使用的數據集通常都較小,無法給出準確結果。隨著社交媒體的迅速發展,海量的數據可以簡易獲取,使得信息傳播的研究得到了新的發展機遇。目前的主流研究大體可劃分為兩大類,基于理論擴散模型的研究和基于信息擴散樹的研究。其中,基于理論擴散模型的研究包括:線性閾值模型[1]、獨立級聯模型[2,3]、博弈論模型[4,5]和傳染病模型[6-8];而基于信息擴散樹的研究則包括:信息擴散特性研究[9]、用戶影響力計算、信息擴散預測模型。

1基于新浪微博的信息傳播樹生成算法

微博類社交媒體并不同于傳統社會網絡中以信息為主體的傳播方式,其信息依賴于人與人之間的好友關系進行散播,因此用戶之間的結構在信息傳播過程中發揮了至關重要的作用。新浪微博中的用戶通過用戶個體之間的關系影響信息的擴散,其提供的轉發功能使得人們在獲悉信息時,也能夠同時對信息的來源一目了然,[JP2]使得用戶可以輕松地找到微博的初始傳播點。新浪微博中,每個用戶都會擁有一定數量的粉絲,同時也可以關注自己感興趣的人,即成為此人的粉絲,以此來建立好友關系。用戶發布的信息會以廣播的形式,發送到每個粉絲那里,粉絲收到信息時可以自行決定是否轉發,如果粉絲轉發此微博到自己微博,那么相應地,其粉絲也會接收到此條微博,以此類推,就形成了微博信息傳播樹。[JP]

1.1基于微博轉發列表的信息傳播樹生成算法[HT5”SS]

用戶登錄新浪微博,可以通過點擊一條微博,查看其引起的所有轉發微博情況。因此可以采用解析網頁的方式獲得一條微博的所有轉發微博列表。新浪對微博轉發情況的處理是:最原始微博的轉發列表可以獲得全部的轉發微博(包括其轉發微博引起的轉發,都算入其根節點內)。具體如圖1所示。其中,節點A為原始微博,其轉發列表包括節點。節點B為二級轉發節點,其轉發列表包括節點。節點F為三級轉發節點,

其轉發列表包括節點。其它節點轉發列表均為空。因此,基于如此狀況,就要對轉發樹的生成進行剪枝操作。

本算法是由二叉樹的先根遍歷算法改進而來,并將微博轉發列表獲取方法與剪枝算法相結合共同進入遞歸遍歷的過程中,最后完整還原微博轉發樹。其中,剪枝部分是比較根節點的創建時間與二次(及多次)轉發節點的創建時間,并以此為依據更新節點間的父子關系。傳播樹生成算法的主要偽代碼如下所示:

本算法的復雜度分析如下:

由本算法偽代碼可知,for循環內操作均為O(1)簡單操作,因此本算法的復雜度取決于每層節點的轉發列表中子節點數。假設一棵傳播樹中共有n+1個節點,[JP3]現在分析兩種極端情況:第一種情況如圖3中(a)所示,除根節點0的轉發列表子節點數為n外,其它節點轉發列表子節點數均為0,因此算法中基本操作需要執行n次,故算法復雜度為O(n),此種情況為復雜度最低情況;第二種情況如圖3中(b)所示,其中,0節點轉發列表子節點數為n,1節點轉發列表子節點數為n-1, 2節點轉發列表子節點數為n-2……以此類推,n-1節點轉發列表子節點數為1,n節點轉發列表子節點數為0。由等差數列求和公式可知轉發列表子節點總數為n(n+1)/2,故算法復雜度為O(n2),此種情況為復雜度最高情況。綜上可知。本算法的最好復雜度為O(n),最差復雜度為O(n2)。

采用以上算法生成的信息傳播樹,是與新浪微博用戶的轉發情況完全一致的。由此可以很好地觀測到在微博社交平臺上的信息傳播情況,并更好地掌握社會輿情。

1.2一種快速的信息傳播樹生成算法

現在,如果只得到轉發某條微博的所有節點以及這些節點間的相互關注關系,卻未得到相應的轉發微博列表,該如何生成本條微博的傳播樹?在這種情況下,本算法嘗試給出解決方案。本算法的主要依據為:在傳播樹中,如果存在某個節點關注的若干節點在該節點轉發該微博之前轉發了此微博,則該節點最有可能是從這些節點中最后轉發該微博的節點(即距離該節點時間最近的那個節點)那里轉發的本條微博。

算法描述:首先將轉發某條微博的節點按照微博發表時間升序排列存放到表statusList中,將第一個發表本微博的節點作為根節點存放到tree_node_set中,遍歷statusList列表,找到其中節點的關注列表friend_set,再將friend_set和tree_node_set取交集得到intersect_set列表。此時,如果intersect_set列表不為空,則選取其中微博發表時間最新的節點作為根節點,將此節點插入其孩子集合,否則將此節點插入到root的孩子集合,最后將該節點插入到tree_node_set列表中。偽代碼如下所示:

下面舉例說明本算法:假設為初始情況下某傳播樹的節點按發表微博時間的升序排列,其中節點B的關注列表為,C的關注列表為空,D的關注列表為,E的關注列表為,F的關注列表為,G的關注列表為。圖4是本例在該算法下的傳播樹生成過程。

本算法是在特殊情形下的傳播樹生成近似算法,并不能保證100%正確率,但已通過大量實驗證實本算法與真實傳播樹的相似度已達到了80%以上,如圖5即是兩種算法生成的傳播樹對比圖。本算法與基于微博轉發列表生成傳播樹相比,雖然準確度降低,但生成樹的速度得到了大幅提升,適用于對傳播樹準確度要求不高,但對生成時間要求較高的情況下使用。

2微博信息傳播樹節點分布統計分析

根據信息在新浪微博上的傳播情況轉化成傳播樹的可視化圖形,可以清楚地看到一些比較典型的情況的發生。本文列舉出筆者通過大量實驗觀察得到的幾種典型信息傳播樹模型,諸如:單節點爆炸型信息傳播樹、高影響力節點二次爆發型信息傳播樹、信息對抗性微博信息傳播樹以及多點爭鳴型信息傳播樹。

如圖6(a)所示為單節點爆炸型信息傳播樹,其第一層的轉發數居多,幾乎占據轉發數80%以上。二次轉發和居于其后的轉發相對較少,層數不夠深入。

如圖6(b)所示為高影響力節點二次爆發型信息傳播樹,表現為某意見領袖發表微博后,又有幾個意見領袖發表了微博,帶來了二次甚至多次轉發,使事件影響進一步擴大。

如圖6(c)所示為信息對抗型信息傳播樹,這樣的傳播樹圖形往往出現在遇到分歧問題時,兩大陣營的人們進行相互轉載的情況。

如圖6(d)所示為多點爭鳴型信息傳播樹,具體表現為某用戶發表微博后,能引起網絡多個意見領袖的參與,覆蓋人群廣泛,并且能得到廣大網民的轉發認可。

通過圖7可以清楚看到隨著層數的增加,微博傳播樹的個數呈現了先上升、后下降的態勢。當層數小于6時,隨著層數的增加,傳播樹個數呈上升趨勢;當層數達到6時,傳播樹的個數達到了頂點;此后,傳播樹個數隨層數增加則逐步遞減。由此可以看出,一定規模的傳播樹(1 000節點以上)的層數在6層左右的最多,這也與本文通過實驗得出的傳播樹平均層數為6.21層的結論相符。

微博傳播樹的層數與節點數之間的聯系比較緊密,理論上說,隨著節點數的增長,微博傳播樹的層數應當呈上升趨勢。對此,筆者隨機選取了3 000棵傳播樹做了實驗,結果如表2所示。

3結束語

社交網絡的信息擴散研究仍是一個很新的領域,各方面的研究還未足夠深入。本文開展了微博媒體的信息傳播樹生成與分析技術的研究,提出了兩種微博信息傳播樹的生成算法:基于轉發關系的微博信息傳播樹的生成算法和一種快速的微博信息傳播樹的生成算法。并通過大量的實驗,分析了微博信息傳播樹的節點分布情況。下一步的研究工作將考慮在大規模的微博數據上,對上述算法進行更細致的研究。

主站蜘蛛池模板: 久草视频一区| 国产精品久久久久久影院| 日韩在线欧美在线| 91久久偷偷做嫩草影院免费看 | 成人一区在线| 日本a级免费| 一级毛片在线免费看| 亚洲天堂日韩在线| 亚洲欧美激情小说另类| 狠狠色综合网| 2021亚洲精品不卡a| 无码视频国产精品一区二区| 国产乱子伦视频在线播放| 国产电话自拍伊人| 情侣午夜国产在线一区无码| 国产精品刺激对白在线| 久久性妇女精品免费| 91福利免费视频| 国产精品一区二区久久精品无码| 人妻无码一区二区视频| 国产精品无码久久久久久| 国产黑丝一区| 亚洲区第一页| 中文字幕永久视频| 综合人妻久久一区二区精品| 丁香六月激情婷婷| 国产视频你懂得| 中日韩一区二区三区中文免费视频 | 亚洲精品在线影院| 国产欧美精品午夜在线播放| 四虎影视国产精品| av色爱 天堂网| 一本二本三本不卡无码| 成年人免费国产视频| 亚洲精品日产AⅤ| 日韩美女福利视频| 欧美日韩亚洲综合在线观看| 久久窝窝国产精品午夜看片| 国产在线八区| 欧美在线精品怡红院 | 国产精品美女自慰喷水| 国产美女精品一区二区| 成人午夜免费视频| 8090午夜无码专区| 欧美黄网在线| 天堂成人在线| 国产精品视频久| 波多野吉衣一区二区三区av| 国产成人一区免费观看| 精品无码国产自产野外拍在线| 99久久精品免费看国产电影| 欧美精品亚洲精品日韩专区va| 99久久性生片| 国模视频一区二区| 亚洲欧美另类久久久精品播放的| 国产精品一区在线观看你懂的| 亚洲动漫h| 东京热高清无码精品| 国产1区2区在线观看| 国产成人8x视频一区二区| 欧美日韩一区二区三| 手机精品福利在线观看| 欧美日韩一区二区在线播放| 2020国产精品视频| 亚洲一区二区三区麻豆| 国产视频你懂得| 久久综合色视频| 午夜a视频| 伊人国产无码高清视频| 亚洲Av激情网五月天| 99在线视频网站| 天堂在线www网亚洲| a在线亚洲男人的天堂试看| 狠狠色婷婷丁香综合久久韩国| 亚洲人在线| 国产欧美视频综合二区| 亚洲视频一区| 国产真实乱了在线播放| 亚洲V日韩V无码一区二区 | 久久99国产乱子伦精品免| 97在线观看视频免费| 最新无码专区超级碰碰碰|