郭金龍 許鑫
[摘要]利用社會網絡分析法,對50個圖書情報學博客和互聯網博客構成的學術交流網絡進行定量分析,從
中心度、網絡密度、凝聚子群分析、小世界效應等角度對該網絡進行實證分析,得出該學術交流網絡中的核
心博客、“聯結”博客,并比較兩個專業圈子的不同結構特征和影響力,以期從完善結構的角度,促進科研
人員的學術交流。
[關鍵詞 ] 圖書情報學 互聯網 博客 社會網絡分析
1 引言
互聯網的快速發展,不僅使得各種學術資源空前增多,也促進了各種基于網絡的學術交流活動。在當前Web2.0的環境下,學術交流的載體從起初傳統而單一的文獻載體變為多元化的電子載體。現在人們可以通過各種工具如BBS、博客、SNS網站等組成各種專業的圈子,共同探討專業領域的學術問題。電子郵件、電子期刊、維基等為學者和研究者保持及時、迅速的聯系以及不受時空限制地傳遞、交換和獲取各種網絡信息資源提供了非常大的便利。因此,研究網絡環境下的非正式學術交流,探討其交流的機制和模式已經成為研究熱點。
在這些眾多的Web2.0交流方式之中,博客的交流方式更加多元。聊天工具如QQ和電子郵件均為點對點的交流,而博客則綜合了點對點與點對面這兩種交流方式。BBS、維基社區、QQ、電子郵件等都是面向人際交流和大眾傳播的純外向型傳播,而博客既可以向受眾提供信息又具有“私人日記”的功能,同時博客還具有引用鏈接和訂閱功能。這些特征使得博客成為了網絡學術交流的有力工具。
國內圖書館學界自2003 年6 月“閑來無空”博客創辦以來,也相繼出現了數以百計的圖書館學博客及圖書情報學博客(以下簡稱“圖情博客”)群,內容更是覆蓋了圖書情報基礎理論、編目方法、數字技術、信息搜索、學術刊物、教學研究等方方面面,對豐富圖書情報學專業人士的網絡學術交流起到了積極的作用。
針對圖情博客興起的現狀,很多研究者從定性與定量等不同的角度對之進行了研究,以期利用博客這一新興的Web2.0工具促進圖書情報學專業研究的發展。然而,縱觀現有的相關文獻,對圖情博客的研究大都只局限在本專業的圈子中,很少有研究涉及與其他博客圈之間的交流。當前網絡環境下,圖書情報學研究的側重點向網絡傾斜的趨勢十分明顯,因此本研究試圖探究圖情博客圈與互聯網博客圈之間的交流情況。本文選擇圖情學博客和互聯網博客構成的網絡為實例,從博客作者之間交流和溝通的角度出發,通過學者之間的交流互動尋找學術博客交流網絡的結構和特點,并比較這兩個博客圈不同的結構特征和影響力,以此進一步促進研究人員之間的信息溝通和學術交流。
2文獻綜述
對于圖情博客,國內學者進行了多方面的研究。定性研究方面,劉允(2005)[1]對圖情博客進行了分類,每一類選擇了典型的博客進行介紹,提出了圖情博客應注意獨立思考,保持原創性和創新性等三個問題。馬愛芳(2005)[2]則把圖情博客根據依托服務器的不同分成5類,對創建和閱讀博客提出了幾點建議。李修波(2006)[3]按照不同的分類標準把圖情博客分成理論性和實踐性、綜合性和專題性、名人博客和草根博客等幾類,該文首次提到了博客的知識產權問題。可以看到,較早的一些研究基本是對圖情博客現象的介紹,并用分類的方法對其進行了整理和歸納。
定量研究方面,吳超(2006)[4]從博客的外部特征(日均訪問量、日均寫作量、篇均評論數)、寫作時間、內容結構(分類綜述、類目名稱)等方面對圖情博客的特點進行了定量分析,提出了在教學中應用博客的建議。岳凱軍(2006)[5]選取6個代表性的圖情博客進行了對比研究,并提出相關建議。孔慶杰等(2007)[6]選取7個典型博客對圖情博客外部特征(如留言等)和內容特征(專業性、廣泛性、及時性等)進行了細致的研究,闡述了圖情博客知識交流與共享的模式。田潔(2008)[7]利用AltaVista的搜索結果作為一項評價指標對圖情博客進行了統計分析。祝小詩(2008)[8]則系統地提出了一套評價學術博客的模型,以圖情博客為例進行了實證分析。總體而言,定量研究停留在簡單的數據統計層面,缺乏對博客交流機制的深層探討。
社會網絡分析方法的應用使得對圖情博客的研究得以更加深入。這方面的研究通過對博客交流形成的網絡進行結構特征的分析,探討學術博客之間的交流模式與特點。博客之間的社會網絡關系通常根據博客之間的相互鏈接情況來構建。邱均平等(2008)[9]對20個著名的圖情博客進行了社會網絡分析,通過搜集博客之間互鏈與和共鏈的數據構建了兩個關系矩陣,利用社會網絡分析中的結構洞指標和中心度指標分析得出了圖情博客中具有信息控制優勢的博客及部分核心博客。黨洪莉等(2009)[10]同樣利用社會網絡分析法對16個圖情博客進行了分析,通過中心性分析得出了博客圈中的核心成員,通過密度和凝聚子群分析探究了網絡的整體互動交流情況。張玥等(2009)[11]則利用社會網絡分析中的核心——邊緣分析方法對圖情博客圈的結構和成因進行了深入分析,以此改善交流網絡的結構,促進科研人員之間的信息溝通和學術交流。
綜上所述,國內對圖情博客的研究已經深入到學術交流機制的探討,對博客圈構成的交流網絡特征進行了較多的研究。然而現有的研究只局限于圖情專業,沒有從更廣泛的學術交流視角探究圖情博客圈與其他專業博客圈的關系。鑒于近年來圖情研究與互聯網的密切聯系,本文嘗試利用社會網絡分析探究圖情博客圈與互聯網博客圈之間的交互情況,以及這兩個圈子構成的網絡各自不同的特征和影響力,以期從完善結構的角度促進科研人員之間的信息溝通和交流,促進學科的發展。
3研究對象與研究方法
3.1研究對象
本文選取文獻[9]中提到的20個圖情博客(博主均是國內知名的圖情專業學者或館員,部分博客地址已更換)和從文獻[12](這篇博文被大量轉載,具有非常大的影響力和一定的權威度)中篩出的30個互聯網博客(在40個互聯網博客中去除無法訪問和更換域名的博客)作為研究對象。對這50個專業博客由鏈接構成的網絡進行至少有如下意義:①找出核心博客,以降低信息獲取的成本;②探究學術交流的模式,以改善網絡結構,促進交流和進步。
3.2研究方法
本文主要采用社會網絡分析方法對50個圖情和互聯網博客構成的交流網絡進行分析。首先通過AltaVista采集50個樣本博客之間相互鏈接的數據,構建互鏈關系矩陣,將數據保存在Excel中。該鏈接關系矩陣是一個有向矩陣,即“鏈出”和“鏈入”是有區別的。“鏈出”類似于“引用”,是對別人博客的參考、引證。“鏈入”類似于“被引”,是被其他博客參考、提及等。“鏈入”的數據指標通常更能反映一個博客的影響力,正如“引文”用于文獻評價一樣。數據收集整理之后,本文通過社會網絡分析軟件UCINET對該網絡的個體屬性和整體屬性分別進行了分析。
·個體視角。通過點度中心性分析可以找出兩個圈子中的核心博客以及整個網絡的核心博客;通過中間中心性分析可以找出那些“橋”博客,這些博客在交流網絡中有較強的控制他人的能力。通過個體社會網絡指標,可以得出兩個圈子共同的“超星”以及兩個博客圈的重要聯結者。
·整體視角。通過網絡的密度指標,可以測度網絡整體的交流情況,并比較兩個圈子的不同密度特征;通過派系分析,可以探究整體網絡中的小團體情況;通過平均最短路徑,可以驗證該網絡的小世界效應。
4實證分析
4.1數據準備
本研究選擇AltaVista搜索引擎來獲取博客之間相互鏈接的數據。關于檢索式的構造,以“老槐也博客”和“超平的博客”為例:“link:http://oldhuai.bokee.com site:http://www.mingzhiguwen.net”。該檢索式得到的是超平的博客鏈接老槐博客的數據。類似地,“link: http://www.mingzhiguwen.net site: http://oldhuai.bokee.com”得到的是老槐博客鏈接超平的博客的數據。本研究不考慮鏈接次數產生的影響,即只要有鏈接數據都算作1。通過這種方式,獲得50個博客之間兩兩鏈接的數據,得到一個50*50的二值矩陣。該矩陣是非對稱的,因為分別考慮了“鏈出”和“鏈入”的數據。
由于有些博客作者有多個博客,同時有的博客有不止一個URL,本研究盡可能全面地搜集了博客作者的多個博客。在“鏈入”數據的處理中,只要作者有一個博客被鏈接,則記作1。“出鏈”數據的處理,則以作者最新的博客為標準進行測度(一般博客搬家,博文和評論都會全部轉移,相應的鏈接也會保留)。
4.2研究結果與分析
4.2.1中心性分析“中心性”是社會網絡分析的研究重點之一。個人或者組織在其社會網絡中具有怎樣的權利,或者說居于怎樣的中心地位,這一思想是社會網絡分析者最早探討的內容之一。中心性是一個重要的個人結構位置指針,評價一個人重要與否,衡量一個人的地位優越性或特權性以及在群體中的社會聲望等常用這個指標。代表網絡中心性的主要有三種形式:一是點度中心性(degree centrality) ;二是中間中心性( betweenness centrality);三是接近中心性(closeness centrality)。其中點度中心性與中間中心性使用較為廣泛。
·點度中心性點度中心性是用來測量團體中的重要中心人物。點度中心性越高者,表示其在網絡中與較多的行動者有所關聯,在團體中具有較高的影響力。點度中心性包括點出度與點入度,同時又可分為絕對點度中心度和相對點度中心度。前者就是與該點直接相連的點數,后者為前者的標準化形式。如果一個點與許多點直接相連,我們就說該點具有較高的點度中心度。在本研究中,點出度表示博客鏈接其他博客的次數,點入度表示博客被鏈接的次數。
由分析結果可知,點出度較高的博客有增輝、keso、丫枝、數圖、學林、圖謀、小5、編目等。其中,點出度排名前10的博客中,圖情博客占了8個。這說明圖情博客主動鏈接他人博客的數據較多,群體之間交流的頻率較高。點入度較高的博客有對keso、月光、老槐、編目、方軍、aw等。其中,點入度排名前10的博客中圖情博客只占了4個,顯然不如點出度的排名,其大部分被引用的鏈接來自本博客圈內。由此可見,圖情博客的影響力還有待提高。另外,點出度和點入度排名前兩位的均是互聯網博客。
綜合分析點出度和點入度的數據,發現對牛亂彈琴的博客排名都很高,分別排名第二和第一,由此可以認為對牛亂彈琴博客是整個網絡的核心博客,即所謂的“超星”,兩個領域的博客作者均大量鏈接了他的博客。從筆者瀏覽的相關博客來看,對牛亂彈琴博客,即洪波(網名keso)的博客被很多博客作為友情鏈接,并以“國內IT第一牛博”作為標簽,可見其影響力之大。點出度和點入度均非常高的還有編目精靈的博客,這是圖情領域專注編目領域的博客。其博文中經常引用大量翔實的數據和國外的最新研究進展。曾有學者專門寫過一篇文章《淺析編目精靈博客的內容與影響》,可見其博客質量之高。該博客還出版了博客書,這也是很罕見的。另外一些點出度和點入度均較高的博客還有一言談曹增輝、數圖研究筆記、圖謀博客、老槐也博客、月光博客、方軍商業日記等。這些博客均是領域里有較高影響力的博客。
·中間中心性中間性(betweenness)的概念是由弗里曼教授提出來的。該概念測量的是一個點在多大程度上位于圖中其他點的“中間”。他認為,如果一個行動者處于多對行動者之間,那么他的度數一般較低。這個度數相對來說比較低的點可能起到重要的“中介作用”,因而處于網絡的中心。在博客群體中,博主獲得中間中心度的必要條件是獲得他人的鏈接。A 鏈接B ,B 鏈接C ,B 節點在A、C 間的信息流通過程中具有重要作用。點的中間中心度測量的是該點在多大程度上控制他人之間的交往。如果一個點的中間中心度為0,意味著該點不能控制任何行動者,處于網絡的邊緣;如果一個點的中間中心度為1,意味著該點可以100%地控制其他行動者,它處于網絡的核心。
由圖2的結果可知,整個網絡的中間中心性為21.99%,表明整個網絡的中介性較高。標準化中間性指標在1以上的博客為21個,占整個樣本的42%,說明信息的流動并不依賴于少數人,這就避免了信息壟斷的可能。
中間性指標比較靠前的博客有對牛亂彈琴、laolus blog、編目精靈、圖謀博客、一言談曹增輝、數圖研究筆記、圖林丫枝、月光博客、老槐也博客、方軍商業日記、游園驚夢等。其中對牛亂彈琴博客以558.362的中間性指數遠遠高于其他博客。這同前面的點度中心性分析的結果是一致的,再次印證了對牛亂彈琴博客的巨大影響力。另外,laolus blog中間性指標排名第二。觀察其鏈接數據發現,laolu的博客是少數幾個既被圖情博客鏈接又被互聯網博客鏈接的博客之一,因此該博客是鏈接這兩個博客圈的重要博客之一。具有較高中間性指標的博客在網絡中扮演著信息中介的角色,是重要的“橋”博客。從圖3的可視化網絡圖中,我們可以直觀地看到這兩個博客圈之間的重要聯結者。
圖3圖書情報學和互聯網博客整體網絡
4.2.2密度分析密度表示的是社區成員間聯系的緊密程度。一般來說,關系緊密的團體合作行為較多,信息流通較易、情感支持也會較好;而關系十分疏遠的團體,則常有信息不通、情感支持少、協作程度低等問題。如果一個整體網是有向關系網,假設其中有n個行動者,網絡中包含的實際關系數目為m,那么其中包含的關系總數在理論上的最大可能值是n(n-1)。該網絡的密度因而等于m/n(n-1)[13]。密度是用來測量社會網絡中行動者的連結程度,密度值介于0和1之間。值越接近1則代表網絡關系越緊密,越接近0則表示網絡關系越疏遠。
在UCINET中,沿著Network——Cohesion——Density 這條路徑,然后選定所要分析的網絡數據,即可算出該網絡的整體密度。經計算,本次研究中整體網絡的密度為0.2171,圖情博客圈網絡的密度為0.5895,互聯網博客圈網絡的密度為0.3218。可以看出,總體來說整個網絡的聯系較為緊密,博客間的交互程度相對較好,相互鏈接較多,各博主積極參與交流、討論。其中,圖情博客圈的密度更大,一方面原因是該圈子相對較小,另一方面也表明該圈子相對比較活躍,且有較強的凝聚力。
4.2.3凝聚子群分析凝聚子群分析是社會網絡分析中的重要方法,其目的是為了揭示社會行動者之間實際存在的或者潛在的關系,利用一些算法找出行動者集合中具有相對較強的、直接的、緊密的、經常的或者積極關系的個體,以確定組成整個網絡中的小團體。團體內部成員通常聯系緊密,信息分享頻繁。凝聚子群分析方法主要有派系、n - 派系、n - 宗派、k - 叢、k -核、成分、lambda 集合等。本研究主要利用成分分析和派系分析對網絡中的小團體情況進行分析。
·成分分析成分分析的目的是找出網絡中的成分(components)。對于無向網絡來說,成分分析找出所有的成分,對于有向網絡來說,成分分析找出其中的強關聯成分和弱關聯成分。所謂強關聯就是在有向網絡中,成分的成員之間關系是雙向的,如果關系是單向的,則稱為弱關聯。
由于本研究中圖書情報學和互聯網博客網絡是關聯網絡,因此弱關聯成分為1,這對分析是沒有意義的。因此,對其進行強關聯成分分析,即只保留雙向關系的鏈接。分析的結果表明,50個結點被劃分成了7個成分,最大的成分由44個結點組成,其余6個成分分別只有一個結點。這些結點屬于網絡中的孤立點,他們是點出度為0的幾個博客。
成分分析屬于限制性較弱的分析,依然無法看出網絡中的小團體分布,接下來進行進一步的派系分析。
·派系分析派系與成分不同,它要求所有點都互相鄰接,且不被更大的派系所包含。正式的定義為:派系就是圖中最大的完全子圖(或完備子圖)。
在派系分析之前需要對關系矩陣進行對稱化處理。如果我們只考慮雙向關系,即只有單向鏈接的關系記作0,通過設定最小成員數為3,經分析得到了48個派系,其中前25個派系中只有互聯網博客,后19個派系中只有圖情博客,最后4個派系中只有互聯網博客。由此可知,這兩個博客圈子的聯系很少,當我們只考慮強關系時,兩個圈子幾乎沒有交互。
若在對稱化處理時,考慮所有的關系,即單向鏈接關系記作1,經分析得到73個派系。其中有10個派系中同時包含了圖情博客和互聯網博客。這10個派系分別是:{ 老槐 游園 編目 數圖 圖謀 丫枝 keso laolu}、{ 游園 編目 數圖 圖謀 丫枝 keso 月光 laolu}、{編目 丫枝 keso 月光 aw}、{編目 keso 方軍 月光 aw}、{編目 keso 方軍 月光 laolu} 、{數圖 keso 月光 麥田 laolu}、{丫枝 keso 武揮 動點 月光 aw} 、{丫枝 keso 武揮 月光 laolu}、{丫枝 keso 武揮 北城 aw}、{編目 學林 方軍 laolu}。
可以看出,連接這兩個圈子的成員有keso、laolu、aw、月光等,這與前面中間中心性分析的結果也是不謀而合的。
4.2.4小世界效應驗證維基百科是這么解釋小世界網絡的:小世界網絡是一種數學之圖的類型,在這種圖中大部分的節點不與彼此鄰接,但大部分節點可以從任一其他點經少數幾步就可到達[14]。驗證博客交流網絡小世界效應的意義在于探究該學術交流網絡信息是否暢通,交流是否快捷。如果該網絡不具備小世界效應,那么這個網絡就是一個信息流通速度慢甚至信息閉塞、專業人員不能夠進行快速交流的網絡,這不利于學科的發展。
本研究中,我們僅從最短路徑角度驗證小世界效應。
從計算結果來看,整個網絡中結點的平均距離L=2.196,標準差是0.893,方差是0.797。最小距離是1,最大距離是5。距離是1的情況出現了532次,占24.7%。距離為2和3的情況各出現819次和662次,分別占38%和30.7%。距離不超過3的比例達到了93.4%。也就是說,在該圖情和互聯網博客網絡中,每兩個專業人員平均只要通過2個人就可以聯系起來。根據小世界效應理論,L的值一般不超過10的網絡就可以看作具有小世界效應,因此,基于博客的圖情和互聯網學術交流網絡具有顯著的小世界效應特征。盡管兩個博客圈之間的交互并不密切,但是從網絡整體來看,該網絡交流環境是比較好的,專業人員之間具有很好的信息交流渠道。
5結論
本文通過社會網絡分析法對圖情與互聯網博客構成的交流網絡進行了實證分析,分別從網絡個體屬性和整體屬性分析了該網絡的整體特征和兩個博客圈的不同結構特征以及兩者的交互情況,結論如下:
·兩個博客圈均有各自的核心博客。點度中心度分析得出了如下核心博客:圖情博客中的“編目”、“數圖”等,互聯網博客中的“keso”、“增輝”等。其中,“keso”是整個網絡“最核心”的博客。
·兩個博客圈有一些重要的聯結者,這些“橋”博客大都也是點度中心性較高的核心博客。中間中心性分析和可視化網絡圖表明“keso”、“laolu”、“編目”等博客是連接兩個圈子的重要中介。
·圖情博客圈整體交流活躍,但影響力相對缺乏。從網絡的密度、小世界效應來看,圖情博客圈內部的交流互動比互聯網博客圈要頻繁。然而圖情博客的“出鏈”較多,而“入鏈”相對較少,因此博客影響力有待提高。
·兩個圈子有一定的交流互動,但是并不密切。派系分析的結果表明兩個博客圈有明顯的界限,交流是通過少數幾個博客連接的。因此,圖情博客圈應該跳出專業的圈子,拓展研究視角,尋求更大的發展。
6 不足與展望
本研究利用搜索引擎獲取了博客之間的網絡鏈接關系作為測度博客之間的社會網絡關系的數據,然而這種方法往往存在一定的局限性。一方面,由于網絡的動態性和Linkrot現象的廣泛存在使得博客URL更換、鏈接失效等問題影響了鏈接數據測度的準確性;另一方面,搜索引擎本身存在著覆蓋率有限、檢索結果不穩定等現象,這對鏈接數據的測度也有一定的影響。解決的方法之一是:對于專項研究可以下載所有的網頁,然后抽取其中的鏈接,這樣可以得出相對更準確的結果。
另外,鏈接關系的測度中并未準確區分鏈接的性質。博客鏈接作為社會網絡關系測度的假設就是博客之間的鏈接關系可以類比文獻中的引證關系。然而博客鏈接之間的關系并非如此簡單,其可以是對博文的引用,也可以是留言或友情鏈接中的鏈接。若要得出更準確的結論,需要區分不同鏈接的性質和動機。這將是本研究接下來的研究方向。
參考文獻:
[1] 劉允.我國圖書館人博客的現狀與展望[J].新世紀圖書館,2005(2):73-75.
[2] 馬愛芳.國內圖書館學人學術性博客淺析[J].信息系統,2005(5):527-529.
[3] 李修波.淺議圖林博客[J].數字圖書館論壇,2006(9):32-37.
[4] 吳超.圖書館學專業博客發展模式研究[J].現代情報,2006(4):31-33.
[5] 岳凱軍.我國圖書情報界博客對比研究[J]. 圖書館學研究,2006(8):21-24.
[6] 孔慶杰,王紅波.圖林博客的知識交流與共享探析[J].圖書館學研究,2007(9):14-16.
[7] 田潔.我國圖情博客研究[J].新世紀圖書館,2008(5):91-93.
[8] 祝小詩.基于學術Blog的評價及實證研究[D].上海:華東師范大學,2008.
[9] 邱均平,于長福,馬瑞敏.圖林博客的社會網絡分析[J].圖書情報工作,2008(11):6-9.
[10] 黨洪莉,孫紅霞.圖書情報學博客的社會網絡分析[J].情報雜志,2009,52(1):180-182.
[11] 張玥,朱慶華.學術博客交流網絡的核心——邊緣結構分析實證研究[J].圖書情報工作,2009(12):25-29.
[12] 網絡編輯.40個互聯網主題知名博客.[2011-07-17]. http://www.bianews.com/news/24/n-24924.html.
[13] 劉軍.整體網分析講義[M].上海: 致格出版社,2009:10-11.
[14]維基百科.小世界網路.[2011-07-17].http://zh.wikipedia.org/zh-cn/小世界網路.
[作者簡介]郭金龍,男,1988年生,碩士研究生,發表論文1篇。
許鑫,男,1976年生,副教授,博士,發表論文60余篇,出版專著2部。