姚瀾
摘 要:本文以Webof Science數據庫中2003年到2018年年初收錄的國外關于開放存取期刊的427篇研究成果為對象,通過使用Excel,XMind與CiteSpace等軟件對目前國外開放存取期刊(OAJ)研究的作者、文獻、熱點與機構作為分析目標并作出分析后的可視化圖表,總結出目前國外對開放存取期刊(OAJ)研究的現狀、進展與動態。
關鍵詞:開放存取期刊;發展狀況;CiteSpace;Web;of;Science
1引言
開放存取(OA)是一種主要用于學術出版的出版模式。根據圖書館協會的解釋,開放存取作為一種技術與出版模式,是在基于訂閱的傳統出版模式以外的另一種選擇[1]。開放存取的產生源于20世紀末的“學術期刊危機”。當時,由于技術的發展,學術傳播和交流擁有了全新的平臺和模式,學術期刊數據庫大量的崛起,導致學術期刊的數字化的邊際成本極為低廉,使得學術期刊首當其沖。針對這一情況,從20世紀90年代開始,國際學術界、出版界、信息傳播界和圖書情報界大規模地開始討論 “學術期刊危機”的應對方法[2]。于是,人們漸漸把目標聚集到“開放存取”這個概念身上。
因此,開放存取的初衷與目的就是為了解決學術期刊的出版危機,推動科研成果的自由傳播、促進學術信息的交流與出版、提升科學研究的公共利用程度、保障科學信息的長期保存[3]。基于開放存取的概念下,只要通過新的數字技術和網絡化通信,任何人都可以及時、免費、不受任何限制地訪問互聯網的各類文獻——這些文檔包括經過同行評議過的期刊文章、參考文獻、技術報告、學位論文等全文信息。而將這些文檔用于科研教育及其他活動,就能促進學術信息的交流與出版,提升科學研究的共利用程度,從而便于科學信息的廣泛傳播,保障科學信息的長期保存。
2001年,隨著人們關注度和討論度的增加,《布達佩斯開放獲取倡議》(Budapest Open Access Initiative,BOAI)的提出成為了開放存取這一概念在國際學術界的正式“提名”[4]。而作為開放存取的實現方法,OA出版作為一種學術信息共享的自由理念與出版方式也開始興起,從2002年開始逐漸演變成為了一種出版的商業模式。OA出版的實現途徑有OA倉儲與OA期刊兩種。而開放存取期刊(OA期刊)作為開放存取出版的一種實際應用類型,其作用更是不可小覷。
本文以主要以Webof Science數據庫中2003年到2018年初的15年時間收錄的關于開放存取期刊的文章為對象,通過使用可視化工具分析研究目前國外對開放存取期刊(OAJ)研究的現狀、進展與動態。
2前期分析準備
要研究國外“開放存取期刊”的發展狀態,筆者前期為保證檢索結果的全面性和準確性,準備先對相關課題進行了解。筆者先在CNKI(中國知網)數據庫中的期刊數據庫中用題名字段,檢索“開放存取期刊”,得到相應的檢索結果。選取檢索結果中20多篇具有代表性、相關度高的論文,進行了詳細地閱讀。通過深入閱讀開放存取期刊的相關論文,不僅可以了解本次研究對象“開放存取期刊”的同位詞,還可以厘清研究對象的上位詞與下位詞,為之后檢索式中的檢索詞的安排打下基礎。
在閱讀中筆者為了形象地厘清關于開放存取期刊的內涵與外延,使用了Xmind思維導圖軟件,通過閱讀學習,記錄下了關于“開放存取期刊”概念的知識脈絡圖如圖2.1。從圖中我們看出,開放存取期刊這個概念在名稱上常有不同的表述,同時也有不少相關的平臺與出版社頗具代表性,所以在檢索時也要對這些檢索詞語加以考慮。
3數據收集
3.1選擇數據庫
本文選擇的是WOS數據庫作為檢索數據庫,以筆者為例,可以打開南京大學圖書館網站,在首頁中找到電子資源項并點擊進入,在數據庫頁面中檢索Webof Science,進入“ISI Webof Science平臺”,即可在平臺中使用WOS數據庫檢索。
由于本次檢索“開放存取期刊”作為檢索詞,在Web of Science數據庫中選取的核心合集中包括Science Citation Index Expanded (SCI-EXPANDED)、Social Sciences Citation Index (SSCI)、Arts & Humanities Citation Index (A&HCI;)數據庫。
3.2列出檢索式
在列出檢索式時,首先考慮上下位詞的關系。在先期的試檢索中,發現大部分的開放存取數據平臺影響力有限,所以在檢索中筆者決定在列出檢索式時國內部分只考慮最具代表性的Socolar開放存取數據平臺,同時兼顧圖2.1中開放存取期刊的其他國外平臺及出版社。其次,筆者認為在檢索式的列出時,可以把“開放存取期刊”的關鍵詞進行分解——開放存取作為一個整體概念是一個部分,期刊是另一個部分。最后,要考慮檢索式中的同位詞關系。在前期的檢索中,筆者注意到以檢索詞“開放存取期刊”檢索到的論文中也常常直接使用其英文縮寫OAJ作為表達。同樣還要注意的是,Journal作為期刊的單詞,在檢索中可能是復數或者其它形式,所以使用了*截斷符。
結合上述考慮,在Web of Science數據庫中選擇相應核心合集后,通過使用高級檢索檢索框輸入檢索式為(ti=(oa or open access)and ti=(journal*))or ti=oaj or ti='DOAJ' OR TI='OPEN J-gate' or ti=arXiv or ti='PLo s' or ti='BioMed Central' or ti=handawi or ti='MDPI AG' or ti=socalar檢索中限制年份為2003年到2018年(檢索時間為2018年1月初,所以最后一年的數據是2017年整年)。
3.3檢索結果
在WOS數據庫中輸入前文中準備好的檢索式進行檢索,截止在2018年1月檢索時,共在2003年到2017年末的時間區間檢索得到了有427條檢索結果。
4數據分析
4.1分析的工具
在對檢索結果進行可視化與數據分析前,筆者準備使用WebofScience數據分析工具,CiteSpace可視化軟件,Excel軟件這三種工具對已知的427條結果進行分析。并且在接下來根據不同的分析目標,選擇不同的分析工具,以求得到不同的呈現效果。
4.2整體論文發表趨勢
在Web of Science中得到檢索結果后,使用Web of Science數據庫中的分析檢索結果功能來研究開放存取期刊論文的每年發表數量。選擇“出版年”,按照此字段排列結果,在設置顯示選項中選擇顯示前25個分析結果,由于檢索時有15年的年份限制,只顯示出15個年份。于是得出2003到2017(在2018年年初檢索,所以2018年的樣本較少,不計入圖表)的每年度發表數量。根據所得數據在excel中列出表格后,做出折線統計圖如4.2.1。
通過計算,在15年間共發表文章427篇,平均每年發表文章28.5篇。從圖中可以看出,開放存取期刊的相關文獻在2003年到2017年間,整體上基本處于逐年增長的趨勢。其中從2013年到2017年間,文章發表數量波動較大,在此階段中整體來看論文發表的數量較為反復,起伏波動比較大,在間隔的年份數量都有回落;2016年是近年的發文的最高峰,共有58篇文章發表;2017年整年的發表數量降到2010左右的發表數量水平。
4.3作者關系
在CiteSpace軟件中,選擇網絡節點類型為“Author”,對導入的數據進行分析之后,可以獲得作者合作關系的知識圖譜
在圖中,可以看出作者圖譜的節點有21個,連接有5條。由于顯示數量較少,在軟件的articlelabeling選項中調節threshold數值為1,得到的信息如圖4.3.1。在圖中我們明顯可以看到的相互合作的作者有有Bjork·BC分別與Laakso·mo與Solomon·DJ,Yngve·A與Calder·PC,Horri·A與Sotudeh·H,Walters·WH與Linvill·AC。其中Bjork·BC獨立與合作發表研究開放存取期刊的文章次數最多,共有9次。處于發表次數第二位的是匿名作者,具體信息不可知。
4.4被引分析
4.4.1被引作者
在CiteSpace軟件中,選擇網絡節點類型“Cited Author”,對導入的數據進行分析之后,可獲得高被引作者的知識圖譜。在圖中,可以看出圖譜的節點有254個,連接有927條。
在圖中可以看出,對開放存取期刊研究方面產生重要影響的學者前三名有Bjork·BC(被引頻次:61,中心度:0.03),Harnad·S(被引頻次:54,中心度:0.10),Suber·P(被引頻次:48,中心度:0.08)。
對此,我通過資料的收集,了解到被引作者表現出有重要影響力的幾位作者中Suber·P是哈佛大學OA項目的負責人,他主要關注OA鄰域的實踐進展,在網絡上建立了名為“Open Access Overview”的網站,該網站能夠及時提供國際上OA相關的實踐進展列表。Harnad·S是英國南安普頓大學教授,他關注自存儲政策以及自存儲績效評價等內容。Bjork·BC為美國密歇根州立大學與芬蘭的漢肯經濟學院的教授,同樣關注OA鄰域,在研究中注重研究開放存取期刊的類型研究。
4.4.2被引文獻
在CiteSpace軟件中,選擇網絡節點類型“Cited Reference”,對導入的數據進行分析之后,可獲得被引文獻知識圖譜。在圖中,可以看出圖譜的節點有178個,連接有500條。
從圖表中可以看出,被引文獻較多的作者與高被引作者是比較重合的。比如Bjork·BC和Laakso·M在最為被引文獻最多的作者被引文獻次數節點上都有表現。被引頻次最高的兩篇文章分別為Bjork·BC在2010年的發表的Open Access to the Scientific Journal Literature: Situation 2009(被引頻次17,中心度0.12),這篇研究文章中調查研究后指出三大類OA期刊中直接完全開放存取的期刊是主流,占62%;延遲開放存取的期刊占14%,采用混合模式的OA期刊占總數的24%。還有Laakso·M在2011年發表的The Development of Open Access Journal Publishing from 1993to2009(被引頻次18,中心度0.35),這一篇文章則是系統地研究了OA興起的20世紀90年代到2009年期間開放存取期刊的發展情況。值得注意的是這兩篇文章兩位作者都有作為第二作者參與,且都發表在Plos One上,說明兩位作者互相之間合作緊密。
被引頻次較高的前五篇文章中,2010年之后的占據大部分。依據此與之前的文章整體發表折線圖可以了解,大部分被引次數較高的文獻都是在開放存取期刊發表快速增長的時期中出現的。這說明了整體研究的發展潮流中,個人在整體學術研究氛圍中也產出了高質量作品。
4.5文獻分析
在Web of Science中使用檢索式進行檢索,在檢索結果頁面左側欄目中有“文獻類型”。通過獲得數據文獻類型分別的數據,在Excel中根據所得數據列出表格后,做出餅狀圖,直觀了解各種類型所占比。從餅狀圖中可以看出,占比最多的是論文占比為43%,第二位的是編輯資料占比41%。簡訊與新聞所占比相同均為6%。其余的為回憶摘要占4%左右。
從中可以知道,在15年中的發表的這427篇中,真正對開放存取期刊進行研究的文章只有183篇左右??梢妵庠陂_放存取期刊的研究方面,一直處于較為小范圍的研究熱潮。
4.6機構分析
在CiteSpace中,使用網絡節點類型“Institution”,繪制機構的共現知識圖譜。對導入的數據進行分析之后,可獲得高被引機構的知識圖譜。在圖中,可以看出圖譜的節點有26個,連接有4條。
其中可以看到機構之間的相互合作有漢肯經濟學院(芬蘭)與密歇根州立大學(美),康乃狄克大學(美)和杜克大學(美),設拉子大學(伊朗)和德黑蘭大學(伊朗),奧斯陸阿肯修弗斯大學(挪威)和南安普頓大學(英國)。
從圖中的情況來看,研究開放獲取期刊方向的,多為大學機構。從合作機構中觀察,可以發現合作機構有比較明顯的地域限制,大多為同一國家的大學之間,或者是同一大洲的大學之間,而其中有芬蘭與美國大學合作情況的特例存在是因為Bjork·BC教授在不同時期段在兩校任教。
4.6.1 檢索結果機構圖譜
4.6.2 檢索結果機構圖表
4.7熱點分析
在CiteSpace中,使用網絡節點類型“keyword”,繪制關鍵詞共現知識圖譜,圖譜中有50個節點,160條連接。在軟件的articlelabeling選項中調節threshold數值為2,可以得到更多的關鍵詞顯示,并調節關鍵詞的字體大小,使圖譜顯示更清晰。
4.7.1 關鍵詞圖譜
4.7.2 關鍵詞圖表
從圖譜及圖表中可以看出,除去“開放存取”,“開放存取期刊”這兩個必有關鍵詞,其它出現頻次較高的關鍵詞有影響因子、科學、出版、文獻、引用分析、網絡、文獻版面費用、學術交流等詞語。在對關鍵詞進行分析之后,可以看出在開放存取期刊主題中,2003年到2017年主要研究熱點有OA期刊影響力研究、OA期刊與圖書館、OA期刊與出版、OA期刊數字化領域、OA期刊的運營方面。從中可以看到熱點主要還是集中在OA期刊與圖書館、出版行業的交叉領域中,也正復合當前圖書館與出版行業中融合發展、探索前行的趨勢。
5結語
5.1檢索過程總結
本次檢索中,主要對檢索結果進行了其整體趨勢、作者、被引、機構以及熱點的分析,通過這些分析可以大致了解國外的開放存取期刊研究的狀況。在數據庫的選擇上,使用了Web of Science數據庫進行檢索。在檢索式的組織上,筆者參考了自己Xmind繪制的思維導圖,并基于Web of Science數據庫的檢索式中只能單語言檢索的情況,筆者列出英文檢索式,檢索得到的基本為英文文獻數據結果。雖然不能完全展現除英文之外的國家研究狀況,但是由于本身開放存取期刊的研究一直不算火熱,整體數量本身就不多,所以英文文獻在國外開放存取期刊的整體研究中,比較具有代表性。在檢索出結果后,對檢索結果的分析中使用Excel,CiteSpace與Web of Science分析工具進行分析數據與可視化分析,并對于呈現出的特殊關系進行二次檢索,理清情況,并作出說明。
5.2檢索結果總結
本文中,通過使用Web of Science的核心數據庫,Excel和CiteSpace工具,對開放存取期刊的整體發展狀況進行了解后發現,雖然對“開放存取期刊”研究的文章數量波動上升,由此看來整體研究態勢不夠火熱,整體漲幅不大。研究只在2010年至今的特定年份呈現小的研究高峰。在此領域影響力最大的作者為Bjork·B,他的被引次數與文獻被引數量均處在首位,研究者缺乏多樣化。研究中的合作在地域上多有限制,這不僅在被引作者與被引文獻之間的總體可互相印證,在作者合作與機構合作的知識圖譜中也可以共同看出。也就是說,國外的開放存取期刊的這個學術領域中較為封閉,專注此領域發展的專家學者較少。同時從出現的較高頻率關鍵詞中分析可以看出,開放存取期刊在關于圖書館及文獻的計量學方面的相關研究熱度已經衰退。近年的熱點開始向學術出版、數字化資源、版權問題以及OA期刊的經濟機制轉變,開放存取期刊的研究主要與出版與圖書館行業結合,這正符合當下出版學中的融合熱點。
通過本次的檢索,我們可以了解到,近年國外的開放存取期刊并沒有成為新的研究熱點,在研究中研究對象開始相對集中,研究人員比較孤立,研究相關信息流動比較緩慢。通過這些對國外情況的了解,也希望可以此可視化研究,為接下來國內的開放存取期刊研究做一份前期的工作。
參考文獻:
[1]相國慶,土麗艷.開放存?。荷甾k科技期刊的新模式[J].科技與出版,2012(10):102-104.
[2]郭書菊,劉宇.國內外學術期刊價格研究綜述[J].現代情報,2013,33(09):171-177.
[3]趙媛斌.論共建機構資源庫的必要性和可行性[J].湖北檔案,2007(06):9-10.
[4]曹平.論學術信息資源開放獲取政策的構建[J].情報探索,2011(05):93-95.