王玲(西安石油大學圖書館 陜西西安 710065)
數據期刊帶給圖書館的影響與挑戰
王玲
(西安石油大學圖書館 陜西西安 710065)
在數據密集型科研環境下,數據特別是存在巨大價值的科學數據成為了社會發展的重要戰略資源和科學研究的主要對象,對科學數據的保存、共享與利用引起了社會的共同關注。數據期刊作為一種新型的出版物在一定程度上解決了人們所關注的數據發布、分享與再利用問題,但也對圖書館、讀者作者、出版界等利益相關者帶來了機遇與挑戰。文章首先對數據論文、數據期刊、數據出版等相關概念和數據期刊的出版模式、學術引用、數據控制等進行了概述,主要對數據出版帶給圖書館影響與挑戰進行了分析,認為數據期刊進一步沖擊了圖書館社會知識交流中心地位、豐富了圖書館館藏資源建設、為圖書館利用數據期刊資源帶來風險、為圖書館的數據期刊知識組織與資源整合帶來障礙。
數據論文;數據期刊;數據出版;科學數據;大數據;圖書館
信息技術的發展和大量移動、智能終端數據的產生,使得全社會進入到了一個以數據驅動社會發展的大數據時代,對數據的識別、管理、計算和應用正前所未有的改變著社會的諸多方面,并引發了全社會對數據的共享渴望與關注討論。在這種環境下,有望從機制上改變目前數據共享所面臨的根本問題的數據論文、數據期刊與數據出版便應運而生,并且,由于數據出版具有強調數據直接出版而非傳統的分析或獲得結論、詳細的數據集獲得過程等說明、規范的數據鏈接標示符與著錄格式等特點而得到了學術界、出版界、圖情界的重視與熱捧。圖書館是與出版機構聯系最為緊密的機構之一,也是出版產業鏈的主要下游行業,因而圖書館事業與出版業有著強關聯性。如果能站在圖書館的視角去研究數據期刊帶給圖書館的影響,將為圖書館的未來發展事業建設提供些許參考價值。
數據出版是一種新型的通過數據特別是科學數據共享的出版方式,而以發布描述數據集收集、處理等過程細節的數據論文(Data Papets)為主要內容的數據期刊(《Data Joutnal》)則是數據出版的主要出版形式。從出版模式來看:數據期刊期刊主要有以出版短數據論文為特征的數據期刊(如《Geoscience Data Joutnal》)、以整合出版為特征的數據期刊 (如《Biodivetsity Data Joutnal》)和以補充資料出版的數據期刊(如《Eatth System Science Data》)等三種類型。從數據期刊的特點來看:首先,數據論文的篇幅較短,能使讀者快速地明白所描述數據集的所有相關細節信息,對數據的保存管理也有較為細致的說明與要求,以為讀者提供一個可到達數據集的永久、可解析路徑;其次,由于在數據論文的發表過程中需經同行評議(可以是發表前,也可以是發表后),所發布的數據經過了一個嚴謹的數據認證過程,因而數據具有較高的透明度、可信度與公正度;再次,數據期刊沒有固定的出版周期,科學數據可隨時通過數據倉儲來提交發布,以實現數據最大范圍、最快速度的傳播、共享與復用,因而數據具有開放性、快捷性。
數據期刊盡管近幾年才開始發展起來,不同的科研資助組織、數據期刊、學術機構也頒布了不同的數據管理政策,但作為一種新型的出版形式,其發展勢頭如此迅猛,究其緣由則是數據期刊的利益相關者(出版商、數據倉儲、科研工作者、科研資助機構)均對數據期刊的發展給予了積極支持與推動。如:出版商方面:PLoS One從2008年開始就有了自己的數據共享政策,Wiley于2012年推出了主要發布篇幅比較短的地球科學數據論文期刊 《Geoscience Data Joutnal》,Natute集團于2014年推出了 《科學數據》(《Scientific Data》)的數據期刊;數據存儲方面:2012年,歐盟提出了“地平線2020”(Hotizon 2020)研究與創新計劃,以支持將發表后的研究論文存放到開放知識庫,2009年由德國和歐洲其他國家于倫敦成立的Datacite,要求所有數據都采用DOI標識,以幫助用戶發現、訪問和再利用數據;Thomson Reutets于2012年推出了研究數據引文索引(DCI),希望通過文獻與數據之間的相互引用建立針對數據的評價指標,進而推動數據發現和知識互聯;科研資助機構方面:美國國家科學基金會于2012年宣布創建和參與一個旨在促進全球科學家研究數據共享的國際組織——研究數據聯盟,以實現全世界對數據共享的需求,加速基于數據的創新。
出版業與圖書館密不可分,一方面,圖書館不但是最大的出版物購買者,也是最大的出版物收藏機構和服務機構,更是出版物知識輸出的最主要終端途徑,對于出版物的市場發行、知識傳播等具有不可替代的影響;另一方面,出版物也是圖書館的主要收藏與利用對象,其對于豐富館藏、吸引讀者、優化服務也具有不可替代性。因此,出版業與圖書館息息相關并相互影響,數據出版這一新興的出版模式,自然也就影響到了圖書館的資源建設、讀者服務等領域。
2.1 對圖書館知識傳播中心地位造成進一步沖擊
在信息技術日新月異的今天,圖書館的服務已經開始轉向面向各種顯性知識和隱性知識組織、分析和利用的個性化、在線化、智能化、集成化服務,以解決用戶的問題和提供內容解決方案為目標。大數據時代的帶來,則為圖書館的知識服務提供了更為豐富的知識資源選擇余地、知識資源分析手段和知識資源分布結構,但其中蘊含的商機和圖書館知識服務存在的發展缺陷致使圖書館受到了更多商業機構的沖擊。越來越多的咨詢機構、信息檢索機構和知識資源發現機構提供著讓用戶越來越滿意的知識服務,一站式檢索服務、云平臺存儲與運算服務、大數據分析挖掘服務、知識可視化服務等服務內容層出不窮。受此影響,圖書館用戶的服務預期值也不斷提升,用戶對圖書館的認可程度日漸降低。美國Ithaka研究所發布的《圖書館調查2010》顯示,讀者對圖書館作為信息門戶的認同逐漸下降,圖書館教學支持和科研支持服務尚未得到認可,這種情況下出版與傳播模式的任何變化都可能使圖書館的地位變得岌岌可危,數據期刊的出現及其在學術資源出版、信息傳播、數據增值等方面的優勢體現,使數據期刊必將受到越來越多科學研究者的重視與利用,而獲取與利用數據期刊的途徑也將不以圖書館為必由途徑,致使圖書館的知識中心地位將繼閱讀習慣的數字化、網絡化和移動化之后又一次受到沖擊。
2.2 為圖書館帶來了豐富的圖書館學術資源
數據期刊在為圖書館學術資源中心造成沖擊的同時也為圖書館帶來了積極的影響,最顯著的一點就是豐富了圖書館的學術資源,特別是對于大數據時代的以服務科研型用戶為主要任務的高校圖書館、科研院所圖書館來說將會顯得尤為明顯。這是因為在大數據時代,研究報告、會議資料、交流訪談等都是科研人員所注重和利用的數據來源與組成部分,在以簡單的信息組織為媒介的傳統出版物、數字出版物不能滿足用戶的大數據環境下,數據出版不僅激活了原有出版資源組成結構,還催生了新的學術資源存在形態,極大地豐富了圖書館的館藏資源。尤其是通過數據出版的原始數據系統展現與傳統出版的多維研究分析,將使圖書館館藏數據價值得到進一步釋放,并能在圖書館用戶需求呈現專業化、精準化發展態勢的語境下使圖書館的館藏資源數據逐步實現“互聯網+思維”、“大數據思維”所倡導的“連接一切”社會發展驅動要素建設目標。更為重要的是,在“一切皆相連”的圖書館資源(這里主要指數據期刊、數據論文)、圖書館載體(這里主要指實現服務的空間,如物理空間、網絡空間與虛擬空間)、圖書館產品 (主要指基于數據期刊的數據服務,如資源推送、數據空間等)的三維驅動服務生態下,圖書館將實現依據用戶個體需求的資源(數據)相關主題統計與運算(如學科主題的核心作者分布及影響力計算)及圖書館載體(空間)的任意設置與配置(如創客空間、學習空間等),從而創新出新的圖書館服務(如用戶的嵌入式學科化服務、專題定制服務等),使圖書館向真正的智慧圖書館、融合圖書館方向發展和轉型。
2.3 使圖書館的館藏資源進一步優化和增值
數據期刊能在一定程度上豐富圖書館館藏的資源類型與范圍,同時,因為數據期刊的出版內容不以數據的分析、加工和所得結論為目的,而是經過科學家基于大量實證調研或實驗所得,耗費了大量的人力與財力,并在數據發布過程中受到了同行評審、數據組織等數據的準確性、規范性驗證過程,因而不管是這些數據的科學質量與獲得途徑,還是數據的準確性、科學價值、用戶遴選資源所用時間,都相較于也受同行評議、不端學術檢測、編輯出版等質量把關的傳統期刊、開放存取期刊、期刊知識服務平臺,以及質量控制、數據校對檢驗等相對較差的其它出版物、自建數據庫而言更具優勢且更受科學研究者的青睞,這對開始收藏數據期刊的圖書館來說無疑是優化了圖書館的館藏結構。同時,在大數據時代的數據重復利用、多次挖掘環境影響下,數據將依賴于數據期刊等途徑將受到更大范圍的傳播,數據特別是受科研資助機構資助研究的課題數據不再只由少數人擁有和利用,數據將在共享傳播后得到更大范圍與領域的重復、多次使用,且由于數據期刊發布的數據來源更為詳實、說明更為具體、標準更為規范,因此數據的權威性及數據分析、引用相較其它數據來源更易簡便,數據期刊的數據將被多次挖掘、引用和應用,增加了圖書館館藏數據的價值。
2.4 為圖書館的期刊評價帶來新的困難
上世紀60年代開始的STM(指科學、技術和醫學)出版業與圖書館在學術期刊肆意漲價與圖書館有限購刊經費之間的矛盾沖突,使得學術界、出版界和科學界開展了一場至今乃至未來都將產生影響的開放存取運動,并鼓勵學術論文與成果通過不同的交流途徑進行分享發布,如個人學術站點、在線知識分享平臺、開放存取倉儲等,科研成果知識得到了多途徑的流動與生產力轉換,推動了學術繁榮,然而不可否認這一繁榮背后也帶給圖書館在期刊選購、資源整合方面的挑戰,即采購的期刊資源無法做到重點(核心)期刊與全部期刊的平衡協調,采取傳統的期刊評價指標體系評價來分析傳統期刊、開放存取期刊、在線期刊、電子期刊,如影響因子、論文下載量、期刊載文量等,使得本來就存在爭議的期刊評價弊端無限放大,并遭受諸多非議,進而影響到圖書館的資源采購科學說服力。數據期刊的出現為圖書館期刊評價原本就沒有最佳解決對策的現狀帶來了新的困難。
仔細分析數據期刊帶來這一困難的原因,最主要是由于數據期刊還是一個新興的出版模式,發展時間不長;其次是目前業界還缺乏對數據期刊以及數據論文的價值評價體系。盡管有一些用于評價數據期刊或數據論文價值的新技術和新方法,如湯森路透(Thomson Reutets)集團推出的數據引用索引數據庫(Data citation index)以及正在嘗試的文章影響力計算方法(Atticle Level Mettics)、業界正在熱議和研究的替代計量研究方法(Altmettics)等,但這些新技術新方法目前仍處于嘗試階段,并未被納入到研究者成果評價體系當中。
2.5 為圖書館的數據期刊資源整合利用帶來困難與風險
數據期刊為圖書館帶來的挑戰還有數據期刊的資源整合與分享應用。首先,對圖書館的數據期刊資源整合來說,由于數據期刊資源分布在不同的存儲平臺上,如何合法、合理、科學的獲取并加以資源組織為自己的資源所應用并不是易事,這主要是因為不同的數據期刊對所收錄發布的數據在資源組織結構、說明標準等方面均存在差異,如:以出版短數據論文為特征的數據期刊《Geoscience Data Joutnal》要求作者提交的數據論文對連同提交的數據集進行詳細描述,如原始數據集的收集、處理方式、格式、大小等細節信息。同時要求作者在提交數據論文之前還需作者為數據集找到合適的數據倉儲,并獲得DOI;而以整合出版為特征的數據期刊《Biodivetsity Data Joutnal》要求作者在提交數據論文的時候,應該統一將其底層支撐性數據公開可用,同時必須在文章中保留單獨的“數據資源”部分,在此部分中列出數據集名稱以及數據存儲地址 (DOI或者其他永久鏈接標識)。因此,圖書館在沒有足夠的權限(如未購買用戶檢索到的數據資源)情況下,能提供給用戶的用戶資源一站式檢索服務、下載與再利用服務都將經受考驗,即使獲得權限的情況下是實現對其資源的內容組織還是對其DOI的映射鏈接也都是圖書館在之前所沒有遇到的。
其次,對圖書館的數據期刊應用來說,存在的風險主要是知識產權風險。期刊的知識產權保護主要是期刊開放共享的作者著作權保護,在目前通行的CC協議下,期刊知識產權的作者著作權主要是通過引用著錄來實現,以從法律的角度承認科研人員的數據收集、處理和結論、觀點、思想的貢獻與付出,但由于目前的期刊引用主要是對傳統期刊的引用,對數據期刊的引用也還僅處于初步研究現狀,所以還不能正確表達對數據作者的貢獻,容易使得數據作者的正當權益如著作權被侵犯和讓渡轉移。可喜的是,學術界已看到了數據期刊發展中存在的引用問題,并開展了一定的學術研究,如候經川、張靜蓓、王丹丹等盡管沒有完全聚焦于數據期刊的學術引用研究,但在對科學數據的引證與引用研究時,均都涉及到了數據論文、數據期刊的引用問題。
基于篇幅所限,本文主要對數據期刊影響圖書館的積極與消極因素進行了分析列舉,對于同時影響到圖書館讀者閱讀及數據期刊運營發展的因素如數據期刊的認可度、數據期刊的應用推廣等不在本文研究范圍,本文也不做詳細研究。隨著數據期刊和數據密集型科研環境的深入發展,數據期刊還將在其它方面帶給圖書館新的挑戰與影響,需要圖書館面對這些挑戰時對圖書館服務、資源建設進行轉型與變革,也需要更多業界學者后續深入的相關學術研究來指導圖書館的事業建設。
[1] 劉鳳紅,崔金鐘,韓芳,等.數據論文:大數據時代新興學術論文出版類型探討[J].中國科技期刊研究,2014,25(12): 1451-1456.
[2] Vision TJ.Open data and the social conttact of scientific publishing[J].Bioscience,2010,60(5):330-331.
[3] Molloy JC.The open knowledge foundation:Open data means bettet science[J].Plos Biology,2011,9(12):e1001195.
[4] 中國產業信息.出版行業與上下游行業之間的關聯性及影響分析[EB/OL].[2015-09-10].http://www.chyxx.com/industty/201412/295607.html.
[5] 雷秋雨,馬建玲.數據期刊的出版模式與發展研究[J].圖書與情報,2015(1):112-116.
[6] Thomson Reutets.Data Citation Index[EB/OL].[2014-09-20].http://wokinfo.com/ptoducts-tools/multidisplinaty/dci/.
[7] 張曉林.顛覆數字圖書館的大趨勢[J].中國圖書館學報,2011(5):4-12.
[8] 許晶晶.“大數據出版”對圖書館知識服務的機遇與挑戰[J].出版發行研究,2015(7):97-100.
[9] 肖冬梅.開放存取運動緣何蓬勃興起?[J].圖書情報工作,2006(5):130-133.
[10] 歐陽崢崢,青秀玲,顧立平,等.國際數據期刊出版的案例分析及其特征[J].中國科技期刊研究,2015,26(5):437-444.
[11] Atticle Level Mettics[EB/OL].[2015-09-10].http://atticle-level-mettics.plos.otg/alm-info/.
[12] Tananbaum G.Atticle-Level Mettics:ASPARC Ptimet[EB/OL].[2015-09-10].http://spatc.atl.otg/sites/default/files/spatcalm-ptimet.pdf.
[13] Mike Buschman,Andtea Michalek.Ate Altetnative Mettics Still Altetnative?[J].Bulletin of the Association fot Infotmation Science and Technology,2013,39(4):35-39.
[14] Geoscience Data Joutnal[EB/OL].[2015-09-10].http://onlinelibtaty.wiley.com/joutnal/10.1002/(ISSN)2049-6060.
[15] Biodivetsity Data Joutnal[EB/OL].[2015-09-10].http://biodivetsitydatajoutnal.com/.[]雷秋雨,馬建玲.數據期刊的出版模式與發展研究[J].圖書與情報,2015(1):112-116.
[16] 版權游戲:版權制度改變 “創作共用”才是未來 [EB/OL].[2015-09-10].http://tech.163.com/14/1127/08/ AC2051HK000915BF.html.
[17] 候經川,方靜怡.數據引證研究:進展與展望[J].中國圖書館學報,2013(1):112-117.
[18] 張靜蓓,呂俊生,田野.國外科學數據引用研究進展[J].圖書情報工作,2014,58(8):91-96.
[19] 王丹丹.科學數據規范引用關鍵問題探析[J].圖書情報工作,2015,59(8):42-47.
The lnfluences and Challenges of Data Journals on Library
Data,especially,the scientific data with great values are important strategic resources and the retention,sharing,and utilization of data have aroused social attention.As a new form of publications,data journals have solved the problems of data publication,sharing,and reuses,but it brings opportunities and challenges to library,writers and readers,and publishing industry.After a brief description of the concepts of data paper,data journal,and data publishing,and the publishing form of data journals,citation and data control,analysis is made about the influences and challenges of data publishing on library and it is concluded that data publishing enriches the resources of library,challenges library’s status as the center of knowledge exchange,brings risks the use of data journals and obstacles to the organization and integration of resource in library.
data paper;data journal;data publishing;scientific data;big data;library
G237.9
A
10.11968/tsyqb.1003-6938.2015102
王玲(1962-),女,西安石油大學圖書館副研究館員。
2015-09-20;責任編輯:魏志鵬