(黑龍江大學信息管理學院 黑龍江哈爾濱 150080)
在國際數據開放運動愈演愈烈并取得顯著成果的情況下,國內相關的政府數據開放度也有待提升。國外學者Anneke Zuiderwijk[1]等認為在制定開放數據政策時,目標是刺激和引導政府數據的發布,并從其使用中獲得優勢;高木聡一郎[2]通過分析發現歐洲開放數據使政府機構擁有的公共數據被私人機構重用后,積極推動日本開放數據政策發展。我國學者通過研究國外的政府開放數據進程,分析了部分國家該領域現狀,如馬海群[3]等通過比較得出目前國內的相關研究基本處于介紹國外先進開放數據政策實例的階段;朱貝[4]等通過文獻資料的收集闡述了對英國政府開放數據政策研究;陳美[5]闡述了澳大利亞中央政府開放數據政策的發展歷程。通過對已有文獻的分析發現,有關作者合作網絡視角的研究還比較缺乏。文章通過對于政府開放數據領域作者合著關系研究,希望能夠為相關研究提供參考,促進國內政府開放數據的發展。我國研究政府開放數據方面的文章起步較晚,最早的文獻出現于2010年,至今僅僅有8年多的歷程,但是相關研究的發展很迅速,通過各項指標對比分析發現,作者合著網絡連通不緊密,整體中心度較低。文章運用社會網絡分析法從作者合著角度分析國內政府開放數據領域,力求展示國內政府開放數據領域作者合著現狀,以促進該領域研究的交流度提升。
文章選擇CNKI,以“政府開放數據or政府數據開放or開放政府數據”作為檢索式進行檢索,時間截止到2018年5月31日,期刊來源上選擇核心期刊與CSSCI,選擇學科領域為全部學科,檢索得到文獻375篇。除去一些不相關文獻后得到367篇文獻。
文章用Ucinet分析國內政府開放數據領域作者合著狀況。社會網絡分析方法分析社會網絡中各種關系結構及其屬性具有實踐上的可行性,因此該方法可應用于作者合著分析以及網絡結構闡釋[6-7]。另外文章輔助使用了Excel軟件與書目共現分析系統,對在CNKI上檢索到的關于政府開放數據領域研究的發文進行了統計,通過形成的作者合著網絡圖中作者的合著狀況,對軟件得出的結果進行分析。
文章對367篇文獻的作者合著論文狀況初步分析(見表1)。可知,2015年之前,國內政府開放數據領域作者合作率由于整體論文數量少,所以起伏較大。2015—2017年,相關領域的作者合作率呈現穩定增長率,最高達到72%;2018年論文數量只有36篇,原因是僅僅選取前5個月,但足以說明近些年政府開放數據領域的學者進行信息交流、知識共享度較高。但由于相關研究者數量欠缺,因此近年來我國政府開放數據領域的整體發文量呈快速增長的趨勢,而合著量呈相對穩定趨勢。

表1 我國政府開放數據領域論文合作統計
通過Excel和書目共現分析系統得出,在367篇論文中共有227篇合著論文,占總數的62.00%。論文作者數量463位,其中合著者323位,占論文總作者數量的69.76%。作者合著分析主要用合作度和合作率:合作度=作者總人次/論文總數;合作率=合作論文數/論文總數[8](文獻均為特定時期內相關文獻)??捎嬎愠鰢鴥日_放數據領域的作者合作度和合作率分別為1.26和62.00%,總體合著率比較穩定。作者合著論文情況見表2。

表2 作者合著論文情況
由于國內政府開放數據領域的研究起步較晚,研究者略少,多篇作者不多,故將發文2篇以上的作者作為該研究領域的核心作者,共有95位(獨著者24人)。文章統計了71位有合作關系的核心作者(見表3)。

表3 有合作關系的核心作者
文章通過SATI軟件構建了表3中71位核心作者71*71的共現矩陣后,導入Ucinet軟件中得出作者合著網絡圖。分別從子網、密度、中心性、凝聚子群與結構洞5方面進行分析[9]。
由圖1可得,圖中共存在4種典型的子網[10]:①單點型:沒有合作關系的單個節點,有陳美等24名作者;②雙核型:指兩人合作發文的子網絡,有岳麗欣、劉文云等7名作者;③核心型:網絡中有一個核心節點與其他節點有連接關系,比如以馬海群為中心的7人網絡;④橋梁型:其中部分節點對兩個子網具有連接關系。如在黃如花、王春迎等人的17人子網中,黃如花對兩個子網有連接關系;在張勇進、楊道玲等人的5人子網中,張勇進對兩個子網具有連接關系。由作者合著網絡圖中合著數量可知,部分作者之間的合著發文量較大,如翟軍與林巖兩者數值高達7,說明兩者合作發文量最大;岳麗欣與劉文云、黃如花與劉龍、黃如花與李楠、翟軍與袁長峰的合著數值都達到4。
對圖1分析可得:①整個政府開放數據領域核心作者合作關系網絡連通性不足。據圖1可知,單節點和雙核心節點較多,多節點偏少。各個節點關聯度低、獨立性強,故整體網絡節點連通度低。②大規模的子網偏少,合作機構數量不足。由圖1明顯看出,除規模最大的子網黃如花的17人團隊,其次是馬海群的7人團隊,其余團隊較小。可知我國政府開放數據研究方面形成了部分初具規模和高交互性的合作團隊,但有待提高。③同一機構內作者合著數量差異較大,同一團隊內作者相互合著率低。例如,在黃如花團隊內,除少數幾位作者相互合著過外,其余作者都未能相互合作過;在馬海群團隊內,其余作者除與馬海群合著外,其他成員相互沒有合著。④不僅在我國政府開放數據核心作者合著中,而且在同一機構的相關領域信息交流不足,作者合著率低,需進一步提升相關知識的共享度。
網絡密度是反映網絡中各區域之間關聯關系的疏密情況的指標,網絡中關聯關系的數量越多,則網絡密度越大[11]。利用Ucinet軟件得出,在國內政府開放數據領域(截至2018年5月份),所有合作作者網絡密度為0.0331,71位核心作者網絡密度為0.2875。該數值較小,網絡整體中心度低,即該領域學者合著率有待提升。
網絡中心性是群體集權的程度,也就是互動集中在少數人的狀況[12]。其分為點度中心度、中介中心度和接近中心度3種形式。點度中心度是指社會網絡中一個節點與多個節點有直接聯系,該節點就處于中心地位從而擁有較大的權力。中介中心度指如果一個節點處于許多交往網絡的路徑上,可認為該節點居于重要的地位。接近中心度指的是當節點越是離其他節點接近,則越是在信息傳播中處于核心點[13]。文章運用Ucinet軟件得出核心作者網絡中的點度中心度、中介中心度和接近中心度(見表4)。

圖1 國內政府開放數據領域核心作者合作關系網絡

表4 網絡中心性分析(Top15)
3.3.1 點度中心度分析
點度中心度即行動者的局部中心指數,與其他點連接較多。從表4可知:黃如花等三位學者點度中心度指數明顯較高。黃如花達到23,翟軍18,林巖17,可知政府開放數據領域作者合著關系低,這幾位作者中心指數較高,其余作者溝通度不足;黃如花的點度中心度高達23,即她的溝通度較高,其次是翟軍、林巖和馬海群,他們也與較多的作者進行合作,從圖1子網圖可看出。利用Ucinet軟件得出網絡整體點度中心度為3.09%,可知網絡中大多數作者合作度不足。
3.3.2 中介中心度分析
中介中心度指處于其他許多節點的關鍵節點上的節點。中介中心度越大,該點媒介力越強,其控制力也越大。由表4可知:①該領域有15位作者有中介中心度。②黃如花的中介中心度達到103,說明黃如花的中介能力最強,她控制的資源最豐富。中介中心度大于10的還有王迎春、唐長樂、唐曉娟和馬海群。③利用Ucinet得出網絡整體中介中心度僅為2.32%,數值較低,可知合著網絡中作者存在整體網絡溝通度不足的狀況,需要不同機構作者提升合著率來改善。
3.3.3 接近中心度分析
接近中心度越高,表明一個節點越處于網絡的核心[14]。與其他節點越遠者中心性越高,與其他節點越近中心性越低。據表4可知:第一:黃如花的接近中心度最小,可以看出她處于整個網絡核心點。第二:合作子網規模越大,其子網中的作者有越高的接近中心度。即整個政府開放數據領域作者合著網中,子網的合作規模與其是否具有核心地位呈正相關,子網合作規模越大,其越接近核心地位。第三:只有在完全連接的合作網中才能計算接近中心度,從圖1可以看出網絡圖分散為規模不一的大小網絡和節點,故不能計算。
在某個社會網絡分析中,社會網絡群體聚類常利用小團體分析[15]。通過n-clique指數計算,在Ucinet中,設定最小的小團體大于2個節點(不包括2),當n的值等于6時,得到10個小團體,與圖1中情況相一致。
團體1:該團隊由黃如花、溫芳芳、賴彤、陳萌、劉龍、苗淼、李楠、周志峰、何乃東、李白楊、林焱、王春迎、唐長樂、王文強、張曉娟、孫成、向錦鵬組成。只有陳鵬來自武漢音樂學院,其他作者均來自武漢大學。該團體主要研究點集中在開放政府數據、科學數據、政策研究、數據素養、研究數據等方面,該團體整體合作程度較強。
團體2:該團隊由馬海群、蒲攀、呂紅、陶易、繆瑞生、王本剛、王今組成。團隊作者都來自黑龍江大學,主要集中研究數據安全、信息政策、政策協同、政府數據開放、知識產權、數字圖書館、檔案管理等。
團體3:團隊由莫荔媛、黃躍萍、趙龍文、陳明艷組成。團隊作者都來自華南理工大學,主要集中研究政府開放數據、電子政務、關聯數據、數據檢索、元數據、信息生態等方面。
團體4:該團隊由羅晉、王慧茹、楊東謀、項靖組成。作者都來自同一地區不同機構,羅晉來自臺灣東華大學,王慧茹來自臺灣政治大學,楊東謀來自臺灣大學,項靖來自臺灣東海大學。主要研究集中在中國政治與國際政治、行政學及國家行政管理、新聞與傳媒等方面。
團體5:該團隊由李永先、龔掌立、高國偉組成。作者都來自東北地區,但不在同一機構。李永先來自大連理工大學,龔掌立和高國偉來自遼寧師范大學。主要研究集中在政府信息資源、電子政務、政府大數據、知識管理、信息安全等方面。
團體6:該團隊由李曉彤、林巖、翟軍、袁長峰、于夢月、翁丹玉組成。團隊作者都來自大連海事大學,主要集中研究政府開放數據、電子政務、開放數據平臺、元數據、數據門戶、供應鏈管理等方面。
團體7:該團隊由才世杰、夏義堃、丁念組成。團隊作者都來自武漢大學,主要集中研究公共信息資源、開放政府數據、信息獲取、信息利用、信息化戰略等方面。
團體8:該團隊由才世杰、夏義堃、丁念組成。團隊作者均來自武漢大學,主要研究集中于知識交流、大數據、科研評價、政府數據、網站建設等方面。
團體9:該團隊由鄭磊、劉新萍、徐慧娜、陳玉梅、Sharon S.Dawes組成。除Sharon S.Dawes來自美國紐約州立大學奧本尼分校、陳玉梅來自暨南大學外,其他作者均來自上海地區,鄭磊和徐慧娜來自復旦大學,劉新萍來自上海理工大學。該團體主要研究點集中在公共服務、開放政府、電子政府、信息服務、知識共享等方面。
團體10:該團隊由鮑靜、張勇進、黃瑝、楊道玲、王璟璇組成。該團隊成員組成比較分散,來自不同地區和不同機構。楊道玲和王璟璇來自國家信息中心,張勇進來自復旦大學,黃瑝來自湖南農業大學,鮑靜則來自中國行政管理學會。該團隊主要研究政府信息資源、信息社會、政府網站、頂層設計、電子政務、數據開放等方面。
結構洞指的是兩個關系人無直接關系或者關系間斷[16]。博特(Burt)認為結構洞分析中最重要的四個指標是有效規模、效率、限制度、等級度[17]。其中有效規模和限制度更能評判學者是否在相關領域內享有權威性。一般而言,有效規模越大,表明網絡重復程度越小,出現結構洞的幾率越大;限制度即網絡中某個節點與其他節點的連接緊密程度[18]。根據表5(按約束力數值排名)可以看出,限制度最小的四位學者是林巖、翟軍、馬海群和黃如花,他們的有效規模數值位于前幾位,可知他們在政府開放數據領域享有較高權威性。

表5 結構洞四項指標排序(Top10)
合著分析是科學研究領域的一個重要研究方向。文章從合著作者子網、密度、中心性、子群和結構洞5個方面對政府開放數據領域的合著網絡進行了分析,但選取特定時間段數據的研究存在一定局限性,只能得到特定時間內的研究現狀。從以上分析可以看出,我國開放數據領域的合著者人數和合著數量逐年增加,合著關系多以學校機構為主,但合著關系不夠緊密,仍需加強學者間的科研合作、提高科研合作率,以促進該領域研究的進一步提升。