999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

開放政府數據領域文獻計量學相關定律實證分析*

2022-04-07 11:04:04陳曉鈺馬海群
圖書館研究與工作 2022年4期
關鍵詞:研究

陳曉鈺 馬海群

(1.黑龍江大學信息管理學院 黑龍江哈爾濱 150080)(2.黑龍江大學信息資源管理研究中心 黑龍江哈爾濱 150080)

在大數據時代的背景下,開放數據浪潮席卷了全世界[1]。2009年美國政府門戶網站的正式啟用是開放數據的一個里程碑事件,各國政府、公司、高校等都緊隨其后進行了自己的研究。而在這次開放數據浪潮的帶動下,由政府信息公開制度嬗變而來的開放政府數據(Open Government Data,簡稱 OGD)進入到了國內信息管理、法學及相關領域的學者和專家們的研究視野[2]。而伴隨著近年來學者們對開放政府數據研究的深入發展,越來越多的研究方向得以顯現,例如以開放政府數據為根據研究經濟增長模式、研究開放政府數據的理論與體系建設、深入探索國內開放政府數據政策演變路徑等。短時間內,大量且駁雜的文獻涌入使用戶的信息搜集與篩選處理變得更為困難,該領域的真實發展狀況也變得模糊不清。因此,運用文獻計量法對開放政府數據領域進行全面系統的趨勢分析就顯得尤為重要。

本文對2004年10月至2021年4月期間發表的有關開放政府數據的研究文獻進行了整體分析,以便未來的學者了解這一領域的研究現狀,找到研究空白,為開放政府數據的發展打下堅實基礎。另外,從整體的角度對開放政府數據領域進行深入研究,還可以提高信息獲取利用的高效性與準確性,在當前國家總體安全觀的背景下更好地推動我國社會與技術發展。

1 數據來源及研究方法

由于大多數學者或研究人員對中國知網的檢索方式與數據庫比較熟悉與認同,因此本文所采集到的數據均是來自于中國知網CNKI,采用高級檢索方式,檢索主題為“主題”=“開放政府數據”,時間一欄的截止日期選取為2021年4月,將匹配設置為“精確”,共檢索到符合要求的文獻1992篇,包括1576篇學術期刊論文、208篇學位論文及其他相關知識成果。

本文擬采用適當的文獻計量方式,結合布拉德福定律、齊普夫定律、洛特卡定律等規律,分析開放政府數據領域的文獻增長規律、老化規律等,以期得出該領域的發展趨勢。與此同時,本研究還借助了文本挖掘與可視化分析軟件——CiteSpace,呈現其相關因素的知識圖譜。庫恩范式、普萊斯理論、格蘭諾維思理論、馬爾科夫模型理論、知識單元離散與重組理論是該軟件分析與研究的理論基礎[3]。與其他可視化軟件相比,CiteSpace具有更加清晰的數據處理能力、理想的可視化效果,其清晰明確又簡潔大方的界面為用戶帶來了最大程度的便利,因此更適合描述總結我國開放政府數據領域的演進歷程和研究態勢。

2 文獻增長規律分析

筆者經過篩選,考慮到信息不全的情況,如無作者、無年代等現象,再排除書評、會議記錄、圖書推介、時論摘要、新聞等無關文獻,最終得到有效論文1441篇。

對這些文獻的年度發文量和累積發文量進行統計分析可發現,開放政府數據領域相關文獻的總體研究趨勢基本可以劃分成三個階段。第一階段,在2004年到2012年之間,有關開放政府數據的論文發行量基本為個位數,說明在這一時期,還很少有人將情報學領域的研究重點放在開放政府數據上,這還是一個尚未形成完整研究體系的研究空白。第二階段,2013年至2018年,在這近6年的時間里,人們對這一領域的研究探索正在不斷地深入。從整體的態勢來看,年度發文量穩步增長,甚至是大幅度躍進,都從方方面面顯示出了開放政府數據的地位正在逐步加強,人們對這一領域的研究工作也不斷地重視。第三階段,即從2019年至2021年,這一階段處于該領域的成熟穩定期。2019年后每年的發文量基本都持續穩定在最高點附近,說明近幾年相關學者對該領域已經有所建樹,建立了一批比較穩定與固定的研究團隊,進而推動此領域的成熟發展(見圖1)。這樣的趨勢呈現也與2009年美國建立開放政府門戶網站后我國大力推廣的數據開放觀念有關[4]、與近些年來圖書情報及大數據等相關領域技術的高速發展有著密切聯系。在技術和相關理論強力支撐的基礎上,眾多學者關于開放政府數據的研究成果才得以發展產生。

圖1 2004—2021年國內開放政府數據研究論文年度發文量趨勢圖

另外,隨著社會的發展,文獻發表年代與累積量二者之間逐漸呈現出了一定的規律。普萊斯曾經提出科學文獻增長規律,即F(t)=aebt,這就是著名的普萊斯指數,它以指數函數的形式清晰地反映出了當今時代文獻發表的增長規律。本文的研究對象的整體趨勢基本符合指數增長規律,即研究初期文獻發表量極少,且增長速度極慢,2015年后文獻增長速率逐漸變大,增長速度逐漸加快,符合普萊斯指數特點。這一趨勢說明了現階段開放政府數據領域的研究正處于發展時期,越來越多的學者涉足該領域豐富了知識成果庫。但由于如檢索誤差和研究領域不同等原因的存在,實際曲線與擬合指數曲線F(t)=0.3814e0.4828t之間還存在著一定的偏差(見圖2),但我們也可以以此為依據大致推斷出未來開放政府數據領域的研究狀況基本呈上升或持平趨勢,處于成熟期。

圖2 2004—2021年國內開放政府數據研究論文累積增長圖

3 布拉德福定律

3.1 布拉德福定律的提出過程

塞繆爾·克萊門特·布拉德福于1878年在倫敦出生,早期是一位化學家,后進入圖書館工作,是英國著名的圖書館員與科學文獻分類專家,他創立了英國國際書目學社,并提出了布拉德福定律[5],成為了現在圖書情報領域文獻計量學著名三大定律之一的提出者。

布拉德福長期從事于文獻的研究,在圖書館開展有關科學和技術期刊中文章的收集、分類和摘錄統計等具體工作。他在工作中發現,在學科期刊上發表非對應學科文章是一種非常常見的現象。因此,布拉德福假設在期刊發表上的文章分布有某種模式:在某一領域內更具有權威性的文章可能集中在少數專業期刊上,而與這一領域有關的“邊緣雜志”和“普通雜志”上發表的文章則占據了該領域研究成果的大部分。為了證實這一想法,布拉德福及其助理瓊斯分別選擇了兩個專題“應用地球物理學”和“潤滑學”,對圖書館收藏的期刊中與此專題有關的論文逐一進行統計[6],并順利得出了結論。這樣布拉德福就證實了他最初的猜測,為布拉德福定律的得出打下了最堅實的根基。1934年1月,布拉德福在《工程》周刊的“圖書與文獻”部分發表了一篇題為《特定學科的情報源》的文章[7],提出了與某一特定主題有關的出版物在期刊上的分布并不均勻,而是顯現出集中和離散狀況的文獻分散規律,即具有里程碑意義的布拉德福定律。該定律可以用文字表述為:如果將科技期刊按其刊載某專業論文的數量以遞減順序排列,則可分出一個核心區和相繼的幾個區域,每區刊載的論文量相等,此時核心期刊和相繼區域期刊數量成1∶a∶a2的關系[8]。布拉德福定律的產生推動了學術界發展,提高了文獻信息的利用率。

3.2 期刊分析

筆者將2004年10月—2021年4月開放政府數據領域內所選取的研究論文數據的期刊分布情況,按照布拉德福定律,歸納成三部分,且三部分之間的論文發表數量大致相等。第一部分,選取的是期刊載文量在21—91篇之間的9本期刊,可稱為“核心”期刊領域;第二部分,稱為“相關區”期刊,即載文量在3—20篇之間的71本期刊;第三部分,可作為“離散區期刊”,期刊載文量為1—2篇,期刊數量為283本。從數量分布規律來看,三個區域之間的關系近似符合布拉德福文獻離散規律,即每個區域發表的論文數量基本相等,期刊區域之間的數量成1∶a∶a2的關系(見表1)。

表1 期刊分區表單位:篇

期刊刊載文章的數量可以有效反映和說明開放政府數據領域的研究現狀、研究情況和期刊分布狀況。開放政府數據領域中的核心期刊大致有以下9種,以《電子政務》為首,緊跟其后的是圖書情報領域的各個重要期刊,而位列最后的是《中國行政管理》。從這種現象中不難發現,目前國內關于開放政府數據領域的研究大部分還是集中在圖書情報領域的研究學者之中,但仍有其他方向例如政法領域的學者參與涉獵,并提出重要想法建議,推動整個開放政府數據領域的發展。9大“核心期刊”共發表期刊論文386篇,占全部論文的34.526%。這說明開放政府數據研究的文獻發表情況相對比較集中,已經形成了相對成熟穩定的重要期刊集合,得到了廣大研究學者的充分肯定,獲得了國內重要期刊的認可,具有一定的權威性(見表2)。

表2 開放政府數據領域核心期刊載文量分布

3.3 文獻數量分散分析

由于本文數據的選取截止到2021年4月,并不是一個完整的年度,所以數據圖像僅供現階段參考。用布拉德福曲線展現開放政府數據領域的文獻數量分散情況,橫坐標表示期刊數量累計和對數[9],縱坐標代表論文累計數(見圖3)。從圖3可以看出,開放政府數據領域的文獻數量分散曲線基本可以分成兩個部分進行歸納:在圖像的前半部分,各個數據點之間間隙較大,數據點集合形成的趨勢呈上升狀,說明該部分期刊數量較少,但各期刊的發文量均較多,研究成果在開放政府數據領域中有一定的分量,屬于核心期刊區域;而圖像的后半部分,數據點比較集中相互連接,基本呈現直線狀,期刊間離散程度較小,分散程度較低,其中有69種期刊發表了2篇論文,214期刊發表了1篇論文,后半部分曲線分別與“相關”和“邊緣”期刊區域相對應。從整體來看,數據點之間的離散程度越來越低,論文累計數卻在持續增加,這種趨勢剛好與布拉德福定律描述的某一專業內期刊論文在期刊信息源上發表不平衡的現象相吻合,并說明現階段開放政府數據領域正處于成熟發展時期,越來越多的學者參與研究并在不同學科的期刊上發表了研究成果。

圖3 開放政府數據領域文獻數量分散曲線圖

4 齊普夫定律

4.1 齊普夫定律的發展歷程

美國哈佛大學教授、著名語言學家和情報學家喬治·金斯利·齊普夫最早提出了“最省力法則”的概念,此理論提出初期強調的是運動和道路的概念,但卻為齊普夫定律解釋了內在成因,為其創建提供了堅實的基礎[10]。早在1898年, 德國語言學家F.W.Kaeding就開始了對詞頻的研究,并編寫了世界上第一部頻率詞典《德語頻率詞典》[11],隨后,艾思杜、貢東兩位學者也分別著眼于詞頻這一方向進行了自己的研究。齊普夫在前人研究成果的基礎上,采用大量的數據系統鉆研,經過艱巨的統計計算和結論再驗證后,最終確定了常數C的性質, 成功論證了詞的頻率與等級序號之間關系的定量形式,將文獻中詞匯出現頻率的分布規律以定量的形式表現出來。人們為了向齊普夫表示尊敬,感謝他為揭示這種分布規律而作出的巨大貢獻,將這一定律命名為“齊普夫定律”[10]。齊普夫定律的內容可以大致概括為:若用f表示頻次,r表示等級序號,則有: f*r=C(C為常數),其中C是一個圍繞中心數值而波動的值,并不是恒量。

齊普夫定律作為文獻計量領域的三大定律之一,為用戶進行信息搜尋、文獻檢索、文獻標引等提供了有效保障,使廣大學者在詞匯的使用控制方面有了更深層次的理解,為其他學科的進步奠定了良好的理論基礎,有效推動社會共同進步發展。

4.2 數據分析

高頻詞的數量對研究結果有決定性影響。為了排除低頻詞干擾研究結果,確定一定數量的高頻詞是進行詞頻分析的基礎。本文共選取了1441篇論文作為原始數據,其中提供關鍵詞的文章共1395篇,檢索到有效關鍵詞2354個。由于關鍵詞具有一定程度的主觀性,常常會出現一種意義多種表達形式的情況,因此本文對高頻關鍵詞進行了合并統計,如將“政府數據開放”“開放政府數據”“政府數據公開”等關鍵詞統一歸納為“政府數據開放”;將“大數據時代”“大數據”合并為“大數據”一詞等。經過筆者歸納整合,統計出開放政府數據領域排名前50位的高頻關鍵詞,并根據齊普夫定律進行了相應數據的排列整理(見表3)。

表3 開放政府數據領域前50位高頻關鍵詞

齊普夫定律主要研究的是關鍵詞的詞頻,而文章的關鍵詞在某種程度上也反映出了該篇論文的研究主題,能夠簡要概括此篇論文的研究方向,使讀者能夠迅速識別獲取研究重點。統計某一專業研究領域內的高頻關鍵詞更是能很好地反映出目前該領域的研究現狀、研究熱點,進而有效預測整體發展方向。

由表3可以發現,在開放政府數據領域的研究中,排在前幾位的關鍵詞分別是政府數據開放、數據開放、政府數據、大數據、開放政府等詞語。政府數據開放是該領域研究成果關鍵詞的首選,能夠直接點明主題,其次是數據開放和政府數據二詞,二者均是比較廣義的類型且覆蓋面寬泛,再次是大數據的時代背景和技術支持,然后是電子政務一詞,能夠與前文中核心期刊的歸納相互呼應。除此之外,從表中可以看出,各組序號和頻次的乘積均為上下波動的常數。由此不難發現,開放政府數據領域的關鍵詞詞頻規律與齊普夫定律基本相符,即f*r=C。表3中的50位高頻關鍵詞高度概括了開放政府數據領域的研究熱點,若將數據選取的截止時間變動后再進行對比,就能夠發現該領域近些年的研究趨勢與發展變動情況。

4.3 關鍵詞頻次分布分析

以表3中已按照齊普夫定律處理好的數據為依據,以序號r為橫坐標,以頻次f為縱坐標繪制,可得到開放政府數據領域關鍵詞頻次分布曲線散點圖圖像(見圖4)。在圖像初期各散點之間離散程度較大,變化較快,說明該部分關鍵詞在領域內出現概率較大,是整個開放政府數據領域的研究主體,熱度較高;而圖像的后半部分趨勢較平緩,因變量隨自變量波動變化不明顯,表明該領域內研究成果的關鍵詞逐漸變得復雜多樣,研究面不斷拓寬,吸引了更多學者加入探討,反映出了開放政府數據領域高速發展并逐漸走向成熟的客觀現象。再從圖像的整體趨勢來看,圖像呈遞減趨勢,頻次隨著序號的增大而降低。添加擬合曲線后可以發現,該散點圖與冪函數y=557.03x-1.06圖像基本相近,符合齊普夫詞頻分布的基本圖像走勢。

圖4 開放政府數據領域關鍵詞頻次分布曲線散點

在此基礎上,再分別以表3中序號r與頻次f的數值取對數作為橫縱坐標,繪制開放政府數據領域關鍵詞頻次分布對數曲線圖(見圖5)。由于散點連線與直線y=-1.0598x+2.7459之間的擬合度達0.9646,因此序號r對數與頻次f對數之間的關系可以近似地看作線性關系,這就說明開放政府數據領域內的關鍵詞詞頻規律是基本符合齊普夫定律內容的。

圖5 開放政府數據領域關鍵詞頻次分布對數曲線圖

5 洛特卡定律

5.1 洛特卡定律的發展歷史

美國著名學者和科學計量學家洛特卡(Alfred J .Lotka)于1926年首先提出了文獻計量領域三大經典定律之一的洛特卡定律,它從文獻計量學、科學計量學、圖書情報學等角度,深入探討學者著作的科學文獻數量與學者數量之間的定量關系,是一個研究著者生產率頻率分布的重要定律[12]。1926年,洛特卡首先研究了科學文獻數量與作者人數之間的關系,并創造性地提出了“科學生產率”的概念。在此概念的基礎上,洛特卡針對化學和物理學兩大領域內的學科專家及其著作情況進行了數據統計歸納,在龐大數據庫支撐的背景下才得出了規律性結論, 為洛特卡定律的形成準備好了基石。因此,該定律的形成是以“科學生產率”為基礎經大量統計研究而出現的。洛特卡定律可以用文字表示為:在某一段時間內,寫x篇論文的作者占作者總數的比例與其撰寫的論文數x的平方成反比關系。即,其中f(x)為寫x篇論文的作者占作者總數的百分比,x為論文篇數,C為某特征常數[12]。

洛特卡定律反映出了論文數量與論文作者二者之間的不平衡分布現象,即少數作者寫出了大量的文獻,而大多數作者所著知識成果卻只占已發表文獻中的一小部分。洛特卡定律的出現,為人們進行信息資源管理與信息有效利用提供了便利條件,能夠起到“風向標”的作用,指引領域研究動向,方便該領域內的學者之間相互交流;為研究人才分布、尋找并掌握領域精英學者信息提供理論支撐,便于文獻管理,引領發展,共同進步。

5.2 高產作者與核心作者分析

由于洛特卡定律也適用于作者合著的情況,因此在本文的研究中,只要是參與文獻發表的作者就被視作單獨發表了1篇文章,經統計,在本文所選取的1441篇文獻中,剔除掉空白作者等無法統計的情況外,共收集到為開放政府數據領域作出貢獻的有效作者1547名。在文獻作者分布領域,普萊斯首先注意到高產作者研究的重要性。他發現75%的學者在他的一生中只發表了1篇文章,而另有10%的科學家在其一生中所發表的論文數量占所有論文庫的二分之一[9]。在開放政府數據領域僅發表1篇論文的學者占整體著作者的80.2844%,大致符合普萊斯定律,且說明了當前開放政府數據領域的研究作者群體相對龐大,研究人員較分散的現狀。普萊斯定律可以定量地用數學公式表示為,其中I代表著該領域內發表論文數量最多的作者的論文數,n(x)代表編寫了x篇文獻的作者數量,N是該領域內的著者總數,該公式意在表明撰寫了論文數據庫中一半論文的高產作者數量等于全部科學作者總數的平方根。將本文所選取的作者數量數據代入,則N是1547,則開放政府數據領域內高產作者數量為1547的平方根,可以近似地看作該領域共有40位高產作者。除此之外,普萊斯根據洛氏定律, 借用數學結論, 經推導得出:m≈0.749,因此高產作者最低發文量,其中 maxn代表最高產作者的論文發表數量,將表4數據 maxn=33代入后可得N≈4.30,即發文量在5篇以上的作者屬于開放政府數據領域內的核心作者[15],即黃如花、馬海群、陳美、翟軍、鄭磊等人是這個領域的核心作者,如表4所示。

表4 作者發文分布數據

5.3 數據分析

洛特卡定義描述的是在某一段時間內,寫了x篇論文的作者總數的比例與撰寫數量x平方之間的關系,即,其中c為洛特卡定律常數[14]。為了計算方便減少誤差,且能夠使圖像更加干凈簡潔,文章將刪除核心作者即發文量在5篇以上的作者的相關數據。為了對此定義進行驗證,本文采取最小二乘法的方式來求取自變量x的指數n的具體數值。表5所顯示的是開放政府數據領域所發表著作作者的分布情況,而表6所顯示的是將論文數x與作者數y分別進行對數運算后求得的n的結果。

表5 開放政府數據領域論文作者分布數據

表6 x指數n的計算數據

5.4 論文著作者洛特卡分布分析

圖6所示的是開放政府數據領域內發文量不多于5篇的論文作者的洛特卡分布散點圖。該圖像以論文數x的對數為橫坐標,以作者數y的對數為縱坐標,采用表6中的數據繪制而成。散點之間的連線可以擬合成表達式為y=-2.9131x+3.1222的一次函數圖像,該函數圖像與散點連線圖之間的擬合程度高達0.9947,基本重合。其斜率-2.9131的絕對值與5.3數據分析部分中利用最小二乘法求得的指數n值基本無差,均與洛特卡定律給出的數值2相接近,這就說明無論采取什么樣的辦法,從何種角度對杰出作者進行分析統計后都會得到一樣的結果,則可以近似地看作開放政府數據領域論文發表情況與領域內學者之間的數量關系符合著名的洛特卡定律。

圖6 開放政府數據領域論文著作者洛特卡分布曲線

6 引文共現分析

6.1 數據來源

由于大多數學者或研究人員還是對中國知網的檢索方式與數據庫全面程度比較熟悉與認同,因此本部分中所采集到的數據均是來自于中國知網CNKI,采用高級檢索方式,標簽選擇“期刊”,檢索主題為“主題”=“開放政府數據”,文獻來源為“CSSCI”,時間跨度為2019年至2020年,共檢索到相應文獻196條,排除書評、圖書推介、序等無關文獻,最終得到有效論文193篇。

6.2 研究方法

對所選取的數據進行有效引文分析能夠從大量的文獻中研究開放政府數據的熱點與發展趨勢,并對其進行歸納分析與深層刨析,總結近幾年來此領域的發展,對開放政府數據日后的研究方向預測具有重大意義。

本部分研究采用引文分析法與定性定量法相結合的方式,以Citespace的可視化分析圖譜為根據,在JAVA的大環境下,將抽象數據轉換為可以生動表明該領域發展熱點重點的關鍵詞共現圖譜以及研究熱點聚類圖譜等。采用CitespaceV5.8.R1軟件,時間切片中的# Years Per Slice設置為1年,年限為對應年限;節點類型根據研究方向不同而改變;Selection Criteria中的g-index選擇k=25;連線強度(Links)選擇Cosine;Pruning選擇為Pathfinder + Pruning sliced networks + Pruning the merged network;Visualization選擇為Cluster View-Static + Show Merged Network[3]。將CNKI中按要求檢索出來的文獻根據以上參數設置進行可視化處理,研究2019年至2020年兩年內開放政府數據領域的共引關鍵詞、共引作者等情況。

6.3 關鍵詞共現分析

關鍵詞圖譜中節點的大小代表關鍵詞出現頻率的大小;節點的顏色代表著該關鍵詞常出現的年份,節點顏色越深代表這一年與這一關鍵詞相關的文獻越多;節點之間連線的顏色代表著產生關聯的年份,粗細代表兩者的關聯性情況,連線越粗,共現頻率和關聯性越大。圖7中灰色代表2019年,黑色代表2020年。

在最終繪制而成的共詞網絡圖譜中,如果文獻中關鍵詞共同出現的頻次越高說明其關系越密切,同時也證明這一組關鍵詞已經成為了學術界和研究領域內的重要話題。從圖7所呈現的信息來看,政府數據、開放政府數據、政府數據開放、數據治理等都是與開放政府數據研究有關的重要關鍵詞。若從量化的視角看文章之間關鍵詞的緊密關系,則如表7所示,以政府數據開放、數據開放、政府數據三個關鍵詞的頻次最高。值得注意的是,關鍵詞的頻次與中心度并不完全一致,如政府數據的頻次為34,中心度為0.59,卻高于頻次以數據45排在榜首,但中心度僅有0.3的“政府數據開放”一詞,這一現象說明政府數據方向在短時期內成為了學術界研究的重點和熱點。除此以外,由圖7我們也可以清晰地發現,眾多關鍵詞不斷涌現,研究人員對于開放政府數據以及相似領域研究的涉及面正在不斷延伸擴寬。

圖7 研究關鍵詞共現圖譜

表7 2019—2020年開放政府數據研究的主要高頻關鍵詞(排名前8)

6.4 作者共現分析

運用CitespaceV5.8.R1軟件,選擇“Author”,最終輸出研究作者共現圖譜。如圖8所示,圓圈代表作者發文量,顏色深淺程度代表相應的發文年份,名字字體越大代表著該作者在此領域的研究成果越豐厚、越具有權威性,比如陳美、陳朝兵、翟軍等。圓圈之間的連線代表著作者之間的合作關系,顏色的飽和度分別代表其合作的年份,例如以翟軍為中心的作者集群為首,多位學者的研究均嘗試以合作的方式進行,并不斷向新的領域邁進,且翟軍的研究在2019年和2020年均取得了一定的知識成果。若將數據庫中數據的檢索面擴展到2016—2020年這5年,再對其進行作者共現圖呈現則如圖9所示。通過兩張圖片的橫向對比后可以發現,曾經在開放政府數據領域作出突出貢獻的學者,如黃如花團隊針對該方向的研究基本遍布在2016—2018年這三年內,并在近兩年漸漸脫離此方向的研究,著手更廣闊的領域。

圖8 2019—2020年研究作者共現圖譜

圖9 2016—2020年研究作者共現圖譜

6.5 機構共現分析

運用Citespace軟件,選擇“Country”,最終可輸出研究機構圖譜。當前該領域的主要研究機構以四川大學、華中師范大學、西南財經大學等高校為主,且各高校之間基本獨立研究,基本沒有機構間的連線合作,缺少機構間的相互配合。研究中發現,華中師范大學在開放政府數據領域的研究基本集中在2020年。上海大學等機構雖然研究的數量不如上文中提到的那些機構,但是也在2019和2020兩年內對開放政府數據領域進行了一定數量與質量的研究探索,為豐富CSSCI數據庫貢獻了力量。從以上這些信息中我們可以得到這樣的結論:近年來,以四川大學為首的高校研究機構致力于獨立研究,機構間的相互配合合作較少。雖然有的機構在某些年份沒有新的理論成品輸出,但是從整體的角度來說,在該領域的發展過程中不斷地有傳統的機構離開也有新的機構加入,所以關于開放政府數據的研究效果成就依舊可觀。

6.6 高被引文獻分析

高被引文獻反映的是文獻被引用情況,能夠作為這一研究領域的前沿狀況高度概括當前領域內的研究熱點,能夠有效指引該領域的學術發展方向。被引用的文章是豐富該領域知識成果庫的重要知識來源,文獻被引用頻次能夠反映出該篇論文在領域內的重要程度,引用頻次越高說明在此領域內受到的關注程度越高。如表8所示,在2019—2020年中國知網收錄的CSSCI期刊中,被引量最大的一篇論文是由王偉玲和王晶共同著作的《我國數字經濟發展的趨勢與推動政策研究》,它以45的頻次位列榜首,這就說明在開放政府數據的學科范圍內,該篇文章所研究的方向是現階段領域內的研究熱點,在眾多學者中受到了最廣泛的關注并且研究內容觀點得到了大部分領域學者們的肯定,能夠有效啟發研究者的思路,具有十分重要的借鑒參考意義,為開放政府數據領域的建設發展提供了最堅實的理論基礎。

表8 前10篇高被引文獻

7 文獻老化規律

文獻和其他有機生命體一樣也會涉及到“老化”的問題,會隨著時間的推遲而降低使用效果,面臨著老舊現象,而文獻過時就會大幅度降低其存在價值,影響整個領域的發展動態。1943年高斯納爾首次提出了“文獻老化”一詞并于1944年專門針對高校圖書館的文獻老化現象作出了具體的研究論述,這就是當今時代文獻計量學六大規律之一的文獻老化規律的產生期始。目前,備受認同的揭示文獻老化程度與速度,定量分析文獻過時規律的方式主要有以下兩種:(1)文獻半衰期指數。1958年,美國的專家貝爾納就提出了半衰期指數的概念[15],這一計算方式是從某一領域整體的角度來衡量文獻老化規律的,即在整個領域內的全部文獻中,50%尚存在參考價值的文獻的發表時間跨度。時間間隔越短,半衰期越短,就說明該領域文獻更迭速度越快,可供參考引用的高價值文獻越豐富,大量的論文得以流通,學科進步高速。(2)普萊斯指數。1971年普萊斯針對文獻老化現象提出了一個衡量指標,即后人所稱的“普萊斯指數”。這一指數的出現同樣是為了衡量文獻的老化程度與速度,但與半衰期指數相比它更具優勢[15],普萊斯指數能夠具體地針對某一時期甚至是某一本特定期刊的發展情況作出大致判斷,判斷該期刊的走向與新陳代謝速度。普萊斯指數可以被具體地表示為在某一知識領域內, 把年限不超過5年的文獻的引文數量與引文總量相比較而得到的數值,即半衰期與普萊斯指數呈現反比的關系,半衰期越短,普萊斯指數越大,領域內知識成果更新越快,文獻過時的速度越快。因此,不同學科之間的文獻老化指數不可以橫向比較,領域不同,文獻的老化速度就不一致。

對文獻老化規律進行統計分析有利于指導文獻收藏利用[16],減少用戶及圖書館員的檢索工作負擔,使學者們能夠跟隨最新的知識成果進行知識再創造,提升研究人員的研究效率,為各行業人才提供更好的服務。此外,對文獻進行老化速度統計對文獻的價值評價也起到了可靠的參考作用,間接反映出整個領域的科學發展規模與趨勢,為更全面徹底地對領域發展現狀進行了解提供有效支撐。

8 結論

不同于現有的國內開放數據研究進展與趨勢分析成果[17],該篇文章針對中國知網數據庫中開放政府數據領域符合要求的相關文獻進行了文獻計量統計,以期對該主題的文獻計量學經典規律進行檢驗總結。利用Excel和Citespace軟件分別從文獻增長規律分析角度[18]、布拉德福定律角度、齊普夫定律角度、洛特卡定律角度以及引文共現分析和文獻老化規律的角度對開放政府數據領域做出統計研究并得到了以下結論:

(1)現階段,開放政府數據領域的發展正處于成熟階段。2019年后發文量波動不大,趨于穩定,領域的發展正處于興盛時期。

(2)經過數據統計、整理與匯總,開放政府數據領域的發展情況大致符合布拉德福定律1∶a∶a2的規律,有些許偏差但屬于誤差范圍內,產生這種現象的原因可能是數據清洗有出入等主客觀方面。

(3)開放政府數據領域的詞頻分布規律符合齊普夫定律,可以被表達為y=557.03x-1.06的形式。

(4)洛特卡定律詳盡地解釋說明了論文數量與論文作者之間的數量關系。在經過本文的研究后可以發現開放政府數據領域的發展狀況與該定律之間相差不大。

(5)通過引文共現與文獻老化規律從關鍵詞等方面對該領域進行全面分析后可以得出:一是該領域的機構與作者之間缺乏合作、缺少配合,多產作者大多都分屬不同院校,且研究著力點不太一致,所以作者與機構之間的相互溝通協調就困難重重。二者之間的互幫互助互補或許會是開放政府數據研究領域磨合產生新的探索之路的機會。其二,近年來情報學領域保持高速發展態勢,研究范圍不斷拓廣,正在形成獨立強大的作者群。其三是該領域的文獻更替老化速度與其他學科相比而言比較緩慢。這也與學科性質相關,理科的論文發表需要大量復雜而重復的實驗推斷,或許會降低其文章的發表速度。

猜你喜歡
研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關于遼朝“一國兩制”研究的回顧與思考
EMA伺服控制系統研究
基于聲、光、磁、觸摸多功能控制的研究
電子制作(2018年11期)2018-08-04 03:26:04
新版C-NCAP側面碰撞假人損傷研究
關于反傾銷會計研究的思考
焊接膜層脫落的攻關研究
電子制作(2017年23期)2017-02-02 07:17:19
主站蜘蛛池模板: 亚洲无码免费黄色网址| 91精品伊人久久大香线蕉| 国产色偷丝袜婷婷无码麻豆制服| 亚洲欧美在线精品一区二区| 视频国产精品丝袜第一页| 久久精品人人做人人综合试看| 国产综合另类小说色区色噜噜 | AV在线天堂进入| 欧美精品三级在线| 三上悠亚在线精品二区| 18禁高潮出水呻吟娇喘蜜芽| 国产成人av大片在线播放| 97人妻精品专区久久久久| 99999久久久久久亚洲| 男人的天堂久久精品激情| 欧美成人综合视频| 四虎精品国产AV二区| 国产在线观看精品| 天堂中文在线资源| 日韩AV无码免费一二三区| 综合色区亚洲熟妇在线| 午夜成人在线视频| 一区二区三区四区在线| 欧美日韩中文字幕二区三区| 国产高颜值露脸在线观看| 欧美一级特黄aaaaaa在线看片| 91欧洲国产日韩在线人成| 国产大片喷水在线在线视频| 亚洲欧美成人综合| 国产精品网址你懂的| 一级毛片在线播放免费| 日本欧美精品| 欧美中文字幕无线码视频| 午夜老司机永久免费看片| 十八禁美女裸体网站| 亚洲精品视频免费| 免费看久久精品99| 色老二精品视频在线观看| 久草国产在线观看| 精品国产免费观看| 毛片在线区| 国产成人免费视频精品一区二区 | 99re热精品视频中文字幕不卡| 成人久久精品一区二区三区| 亚洲成综合人影院在院播放| 久久77777| 中文字幕久久波多野结衣| 精品综合久久久久久97超人该| 国产午夜福利片在线观看| 欧洲极品无码一区二区三区| 波多野结衣久久高清免费| 欧美日韩久久综合| 精品自窥自偷在线看| 欧美中日韩在线| 亚洲欧美不卡中文字幕| 国产在线八区| 日本尹人综合香蕉在线观看| 成人一级黄色毛片| 国产精品妖精视频| 成人午夜久久| 99久久亚洲综合精品TS| 美女潮喷出白浆在线观看视频| 久久久久人妻一区精品色奶水| 九九这里只有精品视频| 国产综合欧美| 日日噜噜夜夜狠狠视频| 国产在线观看第二页| 成人综合在线观看| 国产成人啪视频一区二区三区| 天堂成人av| 国产制服丝袜无码视频| 日本午夜网站| 999精品免费视频| 88av在线| 美女视频黄频a免费高清不卡| 亚洲女同一区二区| 456亚洲人成高清在线| 天天综合网色| 国产男女XX00免费观看| 特级aaaaaaaaa毛片免费视频| 天天综合网站| 亚洲精品男人天堂|