代艷華+張棟棟+鄭曉康+秦秋莉
摘 要 本次研究中選定人人網為研究對象,使用社會網絡分析的方式探索社交世界的交流模式。社會網絡分析在我國是一門剛剛引入的新鮮學科,本文采用這一先進技術,用社會網絡分析法和統計學方法對社交網絡進行科學描述,主要探究人人網內部連接情況、找到位于社群中心位置的用戶、并分析用戶的中心位置與活躍度是否存在內在關系,最后使用可視化技術將研究結果呈現。
關鍵詞 人人網;社會網絡分析法;統計學方法;可視化技術
中圖分類號:TP392 文獻標識碼:A 文章編號:1671-7597(2014)04-0035-02
1 人人網數據的采集及處理
采用滾雪球抽樣的方法抽取樣本,選定初始的三個人人網用戶,使用火車頭數據采集器采集對應的好友網址,采集結果直接保存在本地數據庫中。編寫C語言程序在三個起始用戶的人人好友中隨機抽取12個二級用戶,繼續采集12個人人用戶的好友,最后獲取了2059個樣本數據。利用createpajek軟件將樣本數據文件轉化為.net的格式,方便后續分析軟件的使用。處理結果使每個用戶對應不同的編號,并用對應關系表示好友關系的存在。
2 社會網絡分析
利用社會網絡分析法的四項指標對采集的人人網數據進行分析,分別是網絡密度、可達性、點度中心度和圖的點度中心勢指數。將采集數據導入pajek軟件中,進行分析。
2.1 網絡密度分析
抽象地說,一個圖的密度就是對這個圖的完備性的一種測度。網絡密度在一定程度上象征著這個網絡中關系的數量與復雜程度。密度為1,則每個個體都與其他所有個體產生關系。
利用pajek軟件實現對人人網網絡密度的測量,具體的步驟是在PAJEK中選“Info-Network-General”項目。結果顯示,在所有2059個樣本組成的網絡中,該網絡的平均網絡密度僅為0.03,考慮到可能是圖的規模使得結果偏小,為了使結果更加準確我們采用樣本密度估計總體密度的辦法,隨機抽取3個30人的樣本,結果分別為0.08,0.10,0.11,取平均值0.097,有研究指出在實際網絡中能夠發現的最大密度是0.5,可見人人網的網絡密度值偏小。
2.2 可達性分析
可達性考察一個網絡的連通性(connectivity),它的意義是:圖中所有個體在多大程度上通過有限個步驟相互聯絡在一起。測量可達性的指標是直徑(diameter)。直徑表示圖中任意可連通的兩點之間的最大距離。直徑短,表示可以通過很少的步驟訪問完整個網絡/最大關聯圖。
利用pajek軟件實現對采集數據的diameter測量,具體的步驟是“Net—Paths between 2 vertices—Diameter”。軟件處理的結果表明,直徑為5,根據“六度分隔”理論的內容,在現實社會中表明人人網用戶之間的可達性較強。最大關聯圖規模較強,基本實現了互聯。
2.3 點度中心度分析
形象地說,度數就是某個點引出來的線的條數。反映在數據上,某個個體的度數就是鄰接陣中這個個體所對應的行的行和或者列的列和(考慮到對稱性)。點度中心度(point centrality)是社會網絡分析的重點之一。如果一個點與其他許多點直接相連,就說該點具有較高的點度中心度。該點所對應的行動者也是中心人物,擁有最大權力。這里的權力是指網絡中行動者之間存在的一種互動模式。
在進行點度中心度和圖的點度中心勢指數分析時,根據統計學分析中參數估計的原理,隨機抽取樣本總體中20個人人用戶,并查找他們之間的好友關系。將用戶之間的好友關系用一個鄰接矩陣的形式表達出來,矩陣中“1”表示好友關系存在,“0”表示不存在。
通過UCINET軟件進行點度中心度的測量結果和點度中心勢的測量結果分別如圖1、圖2所示。
圖1 點度中心度的測量結果
圖2 點度中心勢的測量結果
從圖1來看,不同的用戶表現出不同的中心度,中心度最高的用戶,即他的好友數量最多,如20號用戶中心度為9,1號和2號用戶中心度為8,說明他們在人人網信息傳播中擁有較大的權利,他們發布的消息為更多人所注意。但是其內中心度最大值為9,平均值僅為3.1,可見,是過大的外中心度干擾了中心度的測量,造成了它們“位于網絡中心”的表象。
2.4 圖的點度中心勢指數分析
點度中心勢指數(centralization of a graph),指的就是網絡中點的集中趨勢,不同結構的圖中心趨勢存在很大差異,從另一個角度來說,如果一個網絡中“點的點度中心度差異很大”,則該網絡的向心趨勢就較為明顯,反之,則中心勢較小。
圖2中結果樣本的整個網絡標準化中心勢為4.05%。中心勢越接近1,說明網絡越具有集中趨勢(centralization)。抽取的樣本中集中化中心勢為11.50%,說明有較強集中趨勢,但不十分明顯。
3 統計學定量交叉分析
在測量點度中心度抽取的20個人人用戶中,采集20個用戶的最近訪客數量、近三個月內的月狀態平均更新數量、以及每條狀態的平均回復數量。由于人人網的權限設置以及采集的時間等問題,對一些不合格樣本進行了剔除。并利用spss軟件定量分析樣本的點度中心度和更新頻率、點擊率、回復數之間的相關關系。
進行點度中心勢和更新頻率、點擊率、平均回復數之間的相關性測量結果如圖3所示。
圖3 點度中心度和活躍度相關性測量
從圖3可以看出,點度中心勢和更新頻率、點擊率、平均回復數之間的相關系數分別是0.325,0.543,0.298,點度中心度和更新頻率、點擊率、平均回復數之間的顯著性P均大于0.01,所以點度中心勢和三者之間都不存在明顯的相關關系,統計結果不顯著。有較高點擊率、經常更新狀態并且能夠得到較高回復數的人人用戶不一定位于社交網絡人人網群落的中心。endprint
4 可視化實現
利用pajek軟件繪制3D化處理的社群圖如圖4所示。
圖4 3D化處理社群圖
從圖4中可以很明顯的看出,抽取的樣本中存在很明顯的子群分割,人人網的好友關系一般都是真實關系的反應,與此同時我們揣測,作為真實關系的線上反應,人人用戶間的網絡關系是呈現出一定的自動分割的。
這些結群點稱作社團結構,同一個社團結構相互之間有著比較大的相似性,而與網絡中的其他節點有著較少的聯系。而這樣的社團結構在社交網絡中往往是一些有著某種或某幾種共同特性的“圈子”,這對于一些商品和信息的推薦有非常重要的意義。
5 結論與啟示
1)抽取的樣本具有明顯的代表性,可以依據樣本的特性來推測總體數據,得出目前人人網的網絡密度一般,各個人人用戶之間的可達性一般,基本實現了互聯,但是人人網并不具備較強的集中趨勢。
2)人人網在活躍性方面高于全國平均水平,但較高的活躍性并沒有帶來網絡連接的高緊密度。研究數據顯示,人人網網絡的連接密度相對與美國比較低,連接強度一般,網絡可達性不高,網絡整體聚類規模小,目前大多數人使用人人網只是為了和好友保持聯系,對于一些話題的參與度并不高。但是未來的社交網絡必然是深關系化的發展,必然要從淡出的交流分享衍生為獲取專業信息、解決待定問題為主的信息分析、整合。
3)調查顯示,目前人人好友的推薦機制主要是共同好友的數量,很多時候,兩個人雖然擁有比較多的共同好友,但在現實中彼此并不相識,也不會選擇成為對方好友。人人網可以通過對用戶主頁的文本和行為挖掘,實現超越真實線下關系的推薦,使更多人找到和自己志趣相投的朋友,增強網絡的連接密度。
4)統計學定量分析的結果顯示,活躍度高的人人用戶不一定位于社交網絡人人網群落的中心。點度中心度高的用戶往往具有更高的“權力”,而信息及資源的傳遞往往受“權力”大小的影響,權力大的被稱為“意見領袖”,他們在網絡輿情傳播中起著重要的作用。
5)同一個社團結構的成員對彼此有更高的信任度,所以信息在社團內部的推廣性遠遠高于整個網絡,所以利用社團進行信息傳播是一個非常大的商機。
參考文獻
[1]李林容.社交網絡的特性及其發展趨勢[J].新聞界,2010(5).
[2]湯匯道.社會網絡分析法評述[J].學術界,2009(3).
[3]SNS新型社交網絡的傳播解讀與思考[J].今傳媒(學術版),2009(11).
[4]蘇雪皎.SNS社區網絡探析——以校內網和同學網為例[J].青年記者,2009(23).
[5]竇炳林,張世永.基于結構的社會網絡分析[J].計算機學報,2012(4).
[6]曾繁旭,黃廣生.網絡意見領袖社區的構成、聯動及其政策影響:以微博為例[J].傳播與網絡,2012(4).
[7]楊媛媛.應用自我中心法分析社會網絡[J].實踐與經營,2009(9).
[8]平亮,宗利永.基于社會網絡中心性分析的微博信息傳播研究[J].情報、信息與共享,2010(6).
[9]徐媛媛,朱慶華.社會網絡分析法在引文分析中的實證研究[J].理論與探索,2008(2).
[10]Yang ZHANG, Wanyang LING, A comparative study of information diffusion in weblogs and microblogs based on social network analysis[J]. Chinese Journal of Library and Information Science, 2012.04.
[11]A Social Network Analysis Methods based on Ontology, 2010 Third International Symposium on Knowledge Acquisition and Modeling[C]. wuhan hubei,2010.10.endprint
4 可視化實現
利用pajek軟件繪制3D化處理的社群圖如圖4所示。
圖4 3D化處理社群圖
從圖4中可以很明顯的看出,抽取的樣本中存在很明顯的子群分割,人人網的好友關系一般都是真實關系的反應,與此同時我們揣測,作為真實關系的線上反應,人人用戶間的網絡關系是呈現出一定的自動分割的。
這些結群點稱作社團結構,同一個社團結構相互之間有著比較大的相似性,而與網絡中的其他節點有著較少的聯系。而這樣的社團結構在社交網絡中往往是一些有著某種或某幾種共同特性的“圈子”,這對于一些商品和信息的推薦有非常重要的意義。
5 結論與啟示
1)抽取的樣本具有明顯的代表性,可以依據樣本的特性來推測總體數據,得出目前人人網的網絡密度一般,各個人人用戶之間的可達性一般,基本實現了互聯,但是人人網并不具備較強的集中趨勢。
2)人人網在活躍性方面高于全國平均水平,但較高的活躍性并沒有帶來網絡連接的高緊密度。研究數據顯示,人人網網絡的連接密度相對與美國比較低,連接強度一般,網絡可達性不高,網絡整體聚類規模小,目前大多數人使用人人網只是為了和好友保持聯系,對于一些話題的參與度并不高。但是未來的社交網絡必然是深關系化的發展,必然要從淡出的交流分享衍生為獲取專業信息、解決待定問題為主的信息分析、整合。
3)調查顯示,目前人人好友的推薦機制主要是共同好友的數量,很多時候,兩個人雖然擁有比較多的共同好友,但在現實中彼此并不相識,也不會選擇成為對方好友。人人網可以通過對用戶主頁的文本和行為挖掘,實現超越真實線下關系的推薦,使更多人找到和自己志趣相投的朋友,增強網絡的連接密度。
4)統計學定量分析的結果顯示,活躍度高的人人用戶不一定位于社交網絡人人網群落的中心。點度中心度高的用戶往往具有更高的“權力”,而信息及資源的傳遞往往受“權力”大小的影響,權力大的被稱為“意見領袖”,他們在網絡輿情傳播中起著重要的作用。
5)同一個社團結構的成員對彼此有更高的信任度,所以信息在社團內部的推廣性遠遠高于整個網絡,所以利用社團進行信息傳播是一個非常大的商機。
參考文獻
[1]李林容.社交網絡的特性及其發展趨勢[J].新聞界,2010(5).
[2]湯匯道.社會網絡分析法評述[J].學術界,2009(3).
[3]SNS新型社交網絡的傳播解讀與思考[J].今傳媒(學術版),2009(11).
[4]蘇雪皎.SNS社區網絡探析——以校內網和同學網為例[J].青年記者,2009(23).
[5]竇炳林,張世永.基于結構的社會網絡分析[J].計算機學報,2012(4).
[6]曾繁旭,黃廣生.網絡意見領袖社區的構成、聯動及其政策影響:以微博為例[J].傳播與網絡,2012(4).
[7]楊媛媛.應用自我中心法分析社會網絡[J].實踐與經營,2009(9).
[8]平亮,宗利永.基于社會網絡中心性分析的微博信息傳播研究[J].情報、信息與共享,2010(6).
[9]徐媛媛,朱慶華.社會網絡分析法在引文分析中的實證研究[J].理論與探索,2008(2).
[10]Yang ZHANG, Wanyang LING, A comparative study of information diffusion in weblogs and microblogs based on social network analysis[J]. Chinese Journal of Library and Information Science, 2012.04.
[11]A Social Network Analysis Methods based on Ontology, 2010 Third International Symposium on Knowledge Acquisition and Modeling[C]. wuhan hubei,2010.10.endprint
4 可視化實現
利用pajek軟件繪制3D化處理的社群圖如圖4所示。
圖4 3D化處理社群圖
從圖4中可以很明顯的看出,抽取的樣本中存在很明顯的子群分割,人人網的好友關系一般都是真實關系的反應,與此同時我們揣測,作為真實關系的線上反應,人人用戶間的網絡關系是呈現出一定的自動分割的。
這些結群點稱作社團結構,同一個社團結構相互之間有著比較大的相似性,而與網絡中的其他節點有著較少的聯系。而這樣的社團結構在社交網絡中往往是一些有著某種或某幾種共同特性的“圈子”,這對于一些商品和信息的推薦有非常重要的意義。
5 結論與啟示
1)抽取的樣本具有明顯的代表性,可以依據樣本的特性來推測總體數據,得出目前人人網的網絡密度一般,各個人人用戶之間的可達性一般,基本實現了互聯,但是人人網并不具備較強的集中趨勢。
2)人人網在活躍性方面高于全國平均水平,但較高的活躍性并沒有帶來網絡連接的高緊密度。研究數據顯示,人人網網絡的連接密度相對與美國比較低,連接強度一般,網絡可達性不高,網絡整體聚類規模小,目前大多數人使用人人網只是為了和好友保持聯系,對于一些話題的參與度并不高。但是未來的社交網絡必然是深關系化的發展,必然要從淡出的交流分享衍生為獲取專業信息、解決待定問題為主的信息分析、整合。
3)調查顯示,目前人人好友的推薦機制主要是共同好友的數量,很多時候,兩個人雖然擁有比較多的共同好友,但在現實中彼此并不相識,也不會選擇成為對方好友。人人網可以通過對用戶主頁的文本和行為挖掘,實現超越真實線下關系的推薦,使更多人找到和自己志趣相投的朋友,增強網絡的連接密度。
4)統計學定量分析的結果顯示,活躍度高的人人用戶不一定位于社交網絡人人網群落的中心。點度中心度高的用戶往往具有更高的“權力”,而信息及資源的傳遞往往受“權力”大小的影響,權力大的被稱為“意見領袖”,他們在網絡輿情傳播中起著重要的作用。
5)同一個社團結構的成員對彼此有更高的信任度,所以信息在社團內部的推廣性遠遠高于整個網絡,所以利用社團進行信息傳播是一個非常大的商機。
參考文獻
[1]李林容.社交網絡的特性及其發展趨勢[J].新聞界,2010(5).
[2]湯匯道.社會網絡分析法評述[J].學術界,2009(3).
[3]SNS新型社交網絡的傳播解讀與思考[J].今傳媒(學術版),2009(11).
[4]蘇雪皎.SNS社區網絡探析——以校內網和同學網為例[J].青年記者,2009(23).
[5]竇炳林,張世永.基于結構的社會網絡分析[J].計算機學報,2012(4).
[6]曾繁旭,黃廣生.網絡意見領袖社區的構成、聯動及其政策影響:以微博為例[J].傳播與網絡,2012(4).
[7]楊媛媛.應用自我中心法分析社會網絡[J].實踐與經營,2009(9).
[8]平亮,宗利永.基于社會網絡中心性分析的微博信息傳播研究[J].情報、信息與共享,2010(6).
[9]徐媛媛,朱慶華.社會網絡分析法在引文分析中的實證研究[J].理論與探索,2008(2).
[10]Yang ZHANG, Wanyang LING, A comparative study of information diffusion in weblogs and microblogs based on social network analysis[J]. Chinese Journal of Library and Information Science, 2012.04.
[11]A Social Network Analysis Methods based on Ontology, 2010 Third International Symposium on Knowledge Acquisition and Modeling[C]. wuhan hubei,2010.10.endprint