


摘 要 論文選取英國10家具有代表性的圖書館為調查對象,通過網絡調研法,在政策性文件、數據管理計劃、數據存儲與備份、數據共享、數據組織教育培訓等方面進行比較分析。我國圖書館界應學習其在科研數據管理方面的做法,明確圖書館及各部門在科研數據管理中的角色和責任,加強相關基礎設施建設,推動圖書館和科研機構聯合制定科研數據管理共享平臺,加強宣傳教育推廣,使科研數據管理服務在各科研項目中得以普及和實施。
關鍵詞 英國 圖書館 科研數據管理 數據管理計劃 數據共享
分類號 G252.7
DOI 10.16810/j.cnki.1672-514X.2020.11.013
Investigation and Analysis of Scientific Research Data Management Services in British Libraries
Wang Youzhuan
Abstract Ten representative libraries in the United Kingdom are selected as the research objects in this paper. Through the network research method, the policy documents, data management plan, data storage and backup, data sharing, data organization, education and training are compared and analyzed. The library field in China should learn from its practice in scientific research data management, clarify the roles and responsibilities of libraries and departments in scientific research data management, strengthen the construction of relevant infrastructure, promote the joint development of scientific research data management and sharing platform between libraries and scientific research institutions, and strengthen publicity, education and promotion, so as to make scientific research data management service in various scientific research projects popularized and implemented.
Keywords The United Kingdom. Library. Research data management. Data management plan. Data sharing.
0 引言
科研數據管理是指機構或組織為了避免數據丟失、驗證科研成果、提升科研成果的曝光度和影響力、實現科研數據共享、提高科研效率等目的,對科研數據進行計劃、組織、分析、存儲、獲取、分享、再利用的一系列活動 [1]。英國是科研數據管理的先行者,其政府部門和相關機構對科研數據管理與數據共享非常重視,發布了若干科研數據管理辦法及其計劃,在科研數據管理和數據共享等服務方面取得了不少實踐經驗,例如英國研究理事會(RCUK)發布《RCUK數據政策共同原則》,明確規定了數據管理的使用政策,在鼓勵科研人員完成科研項目后及時公開科研數據[2]方面促進了高質量研究和創新。英國研究理事會下設的工程和物理科學研究理事會(EPSRC)著重對研究機構提出了數據共享責任,要求它們在全部數據生命周期上至少提供十年的數據管理服務[3]。圖書館作為數據管理服務提供方,具有豐富的文獻資源和管理經驗,在科研數據管理服務中發揮著重要作用。英國圖書館開展科研數據管理服務的時間較早,服務相對成熟,內容也較豐富。因此,本文選取英國10家具有代表性的圖書館為調查對象,其中9家為研究型大學圖書館,1家為專業圖書館。通過網絡調研法,在政策性文件、數據管理計劃、數據存儲與備份、數據共享、數據組織、數據引用和教育培訓等7個方面進行比較分析,梳理英國圖書館在科研數據管理方面的經驗,以期為我國圖書館開展科研數據管理服務提供借鑒和啟示。
1 英國圖書館科研數據管理政策及其計劃
1.1 政策性文件
科研數據管理政策性文件是圖書館開展科研數據管理的基礎和保證。英國的科研資助機構大都制定了科研數據管理政策,要求被資助的研究者更好地管理科研數據,從而推動了英國圖書館對科研數據管理政策的制定[4]。
英國圖書館近幾年對科研數據管理的重視程度越來越高。10家圖書館中,除大英圖書館參照資助機構的科研數據管理政策,布里斯托大學圖書館和華威大學圖書館未表明外,其余7所高校圖書館均發布了本??蒲袛祿芾碚?,見表1。從政策內容來看,除了政策頒布的背景、目的外,都有一項共性內容,就是對各方的職責進行了詳細的規定。職責涉及數據收集、數據管理、數據保存、數據保護、信息安全、數據共享等方面。就政策發布時間和版本更新情況來看,除了愛丁堡大學圖書館一直延用2011年發布的政策外,其他6所圖書館均采用了更新版。其中,倫敦大學圖書館和牛津大學圖書館現用版本更新于2018年12月,倫敦帝國理工學院、劍橋大學圖書館、曼徹斯特大學圖書館和倫敦國王學院更新于2019年。
除了科研數據管理政策外,一些圖書館還發布了與科研數據相關配套輔助政策,如牛津大學圖書館將新版科研數據管理政策改名為《數據支持科研成果管理政策》,曼徹斯特大學發布了《曼徹斯特大學檔案管理政策》 《曼徹斯特大學數據保護政策》《曼徹斯特大學知識產權政策》等。
1.2 科研數據管理計劃
數據管理計劃(DMP)概述了研究項目在研究期間和項目完成后將如何管理數據。制定DMP具有以下好處:(1)節省時間和資源;(2)可以更輕松地查找和理解數據;(3)有助于避免或管理風險(例如數據丟失,意外或惡意泄露敏感數據);(4)確定需要提前計劃的任務和職責(例如管理道德和法律義務);(5)預先確定進行數據管理活動所需的額外成本和資源。在英國,越來越多的資助機構要求其資助者在投標準備階段和資金獲得后制定和維護DMP,也可稱為“數據共享計劃”(NIH)或“技術計劃”(AHRC)。
調查的10家圖書館均鼓勵科研人員在項目開始到項目結束時編寫DMP,見表2。其中,倫敦大學圖書館、牛津大學圖書館、曼徹斯特大學圖書館、布里斯托大學圖書館和華威大學圖書館的DMP編寫以英國數據監管中心(DCC)創建的免費工具DMP online為主,編寫內容在DCC提供的清單中,包括基本信息、數據收集、文檔和元數據、道德與法律合規、數據保存與備份、數據選擇與保護、數據共享、責任與資源等。大英圖書館根據資助機構提供的模版來編寫數據管理計劃。倫敦帝國理工學院圖書館依據資助機構的模版,若資助機構未規定,則用圖書館提供的通用模版(通常包含數據類型、數據創建、數據保存、數據共享、數據安全等)。劍橋大學圖書館采用DMP online工具或本圖書館提供的模版。愛丁堡大學圖書館和倫敦國王學院采用DMP online工具或資助機構提供的模板。由于DMP在科研項目的實施過程中非常重要,應根據項目而作出相應調整,因此,一些圖書館還要求定期檢查DMP,并根據需要進行修改或更新。
2 英國圖書館數據管理內容及其服務
2.1 數據存儲與備份
數據存儲與數據備份都是數據保存的方式,數據備份用于應對數據丟失、損壞等問題,而數據存儲用于解決數據存放和讀取問題。選擇存儲時,應考慮備份數據的位置、時間和次數,數據安全性和訪問控制,還要考慮是否需要在項目結束時存檔數據。
10家圖書館中,除了華威大學圖書館未提供數據存儲和備份服務外,其他9家圖書館均提供了相關服務,見表3。其中,倫敦大學圖書館、牛津大學圖書館、曼徹斯特大學圖書館、倫敦國王學院圖書館和布里斯托大學圖書館針對不同類型的數據提供了兩項以上的數據存儲服務。不同項目的科研人員可根據數據本身需求,選擇適合的數據存儲服務。倫敦大學圖書館、倫敦帝國理工學院、劍橋大學圖書館和布里斯托大學圖書館專門提供長期數據存儲服務,存儲年限有10年以上和20年以上。不同的存儲服務提供的免費數據存儲容量不同。如布里斯托大學圖書館提供的科研數據庫服務,目前對數據存儲容量不設限制;牛津大學圖書館的HFS(分層文件服務器)備份服務可接受最高50TB的容量;倫敦國王學院圖書館的SharePoint Online服務提供25TB的存儲容量,但其Personal File服務僅提供2GB的存儲容量。
2.2 數據共享
共享數據可以使科研人員不必重新創建和收集相同的數據,就能開辟新的研究和查詢渠道。數據共享的好處包括:(1)防止數據重復;(2)減少數據丟失的風險;(3)加強對已發表研究的審查;(4)協作研究和數據重用;(5)提高科研數據和相關出版物的知名度。因此許多主要的研究資助者和學術出版商呼吁共享科研數據,并以“數據訪問聲明”的形式發布訪問信息。例如,由英國研究與創新局(UKRI)資助的科研人員將在“默認情況下”提供科研數據,而英國國家醫療服務體系(NHS)道德審查程序則鼓勵科研人員“確定樣品或數據是否可用于現有的生物庫或數據共享庫”。
調查的10家圖書館均表明了數據共享的可能,并對在何時共享、如何共享作了相關說明。凡是建立了存儲數據庫或是提供存儲服務的圖書館,均可通過存儲服務提供數據共享服務。如倫敦大學圖書館在項目完成后,要求科研人員根據資助機構的要求確定項目數據的存儲位置、開放程度和共享的時間范圍。大英圖書館制定了《2015—2018年館藏元數據戰略》,強調通過館藏元數據的對外開放讓館藏資源與社會信息資源相關聯,形成社會廣泛認可的二次利用數據[12]。牛津大學圖書館建立了機構知識庫ORA-Data,用于數據保存與共享。愛丁堡大學的研究人員可以使用其自建的數據存儲庫DataShare上傳、共享和許可自己的數據資源,以供他人在線查找和重用。倫敦帝國理工學院要求科研人員確??晒蚕淼目蒲袛祿诔霭婧蟮?0年內保持公開。而未提供數據存儲服務的華威大學圖書館,也明確表示科研人員需根據資助機構的要求共享科研數據。
2.3 數據組織
數據組織包含對數據文件的構建和相關規則標準的描述,如文件組織規則、文件命名規則、元數據標準、數據格式要求等。在創建、收集和處理數據的時候,如果不能很好地組織數據,則會出現數據混亂、容易丟失等風險。因此,圖書館會要求研究人員在文件/文件夾命名、文件格式以及文檔和元數據等方面遵循一定的規則。
調查的10家圖書館中,牛津大學圖書館、劍橋大學圖書館、曼徹斯特大學圖書館、倫敦國王學院圖書館和華威大學圖書館對數據組織提供了相關建議,涉及文件/文件夾命名、文件格式、文件夾結構、文檔和元數據、參考文獻管理、電子郵件整理、版本控制等內容。
在數據組織的具體建議上,可歸納為:(1)文件/文件夾命名:文件夾命名應簡單明了,可在不打開文件的情況下知道文件的內容;項目組成員應該在文件命名上保持一致性,方便文件查找;文件命名時可按日期、作者或者主題等規則進行,方便排序;建立文件訪問系統,確保可以備份數據和避免數據重復;將已完成工作的文件夾和正在進行工作的文件夾分開,以免混淆;定期將不再使用的文件移動到其他文件夾或位置;定期或在項目結束時評價文件的重要性,刪除不必要的文件等。(2)文件格式:選擇適當的文件格式(標準形式、未加密、未壓縮、適用于提取和查看的數據、易于使用元數據進行注釋的數據等),確??蒲袛祿捎煤涂稍L問。(3)文件夾結構:主推使用分層文件夾結構,并在文件的深度和廣度之間取得平衡,即不要使文件夾的類別太大,不必單擊很多文件夾來查找文件。英國數據服務公司建議將文件夾級別限制為三到四個,并且每個列表中的項目不要超過十個;為每個文件分配一個或多個標簽,可更容易區分重疊類別,并可以同時以多種方式對文件進行分類;不定時重新評估文件夾或標簽結構,以免文件混亂。(4)文檔和元數據:在研究項目開始時記錄數據,在項目進行過程中繼續添加信息,在DMP中包含文檔編制過程;通過嵌入式文檔、支持文檔等方式將文檔添加到數據中;采用開源ISA元數據跟蹤工具提供實驗元數據的豐富描述,從而使所得數據可發現和重用。(5)參考文獻管理:使用參考文獻管理軟件,在研究中存儲使用的所有論文、書籍和其他資源的詳細信息,并自動生成書面作品中的引用。(6)電子郵件整理:刪除不需要的電子郵件;定期(最好是每天)從收件箱和已發送郵件中刪除所有瑣碎或過時的郵件;使用文件夾存儲郵件;按主題、活動或項目建立結構化的文件目錄。(7)版本控制:針對同一文件修改的不同版本,可在文件命名時增加版本號進行區別,如v01、v02等。
4 結語
科技創新越來越依賴于大量、系統、高可信度的科學數據,我國在科學數據開發利用、開放共享和安全保護等方面還有很大改進空間。我們應吸取國外從政府部門到各機構在科研數據管理方面的做法,明確圖書館及各部門在科研數據管理中的角色和責任,加強相關基礎設施的建設,推動圖書館和科研機構聯合制定科研數據管理共享平臺,從各個層面提升科研數據管理意識、加強宣傳教育推廣,使科研數據管理服務在各科研項目中得以普及和實施。
參考文獻:
韓金鳳.加拿大高校圖書館科研數據管理服務調研及啟示[J].國家圖書館學刊,2017,26(1):38-46.
UK research and innovation. common principles on data policy[EB/OL].(2017-08-10)[2019-10-08]. https://www.ukri.org/funding/information-for-award-holders/data-policy/common-principles-on-data-policy/.
Clarifications of EPSRC expectations on research data management[EB/OL].(2014-10-09)[2019-10-10].https://epsrc.ukri.org/about/standards/researchdata/expectations/.
HIGMAN R, PINFIELD S. Research data management and openness: the role of data sharing in developing institutional policies and practices[J]. Program,2015,49(4):364-381.
UCL research information and IT services group(RIISG)[EB/OL].(2018-12-12)[2019-10-13]. https://www.ucl.ac.uk/isd/sites/isd/files/uclresearchdatapolicy_2018.pdf.
Policy on the management of data supporting research outputs[EB/OL].(2018-12-08)[2019-11-13].http://researchdata.ox.ac.uk/wp-content/uploads/sites/126/2018/12/Policy-on-the-Management-of-Data-Supporting-Research-Outputs.pdf.
Research data management policy[EB/OL].(2019-12-15)[2019-12-17].https://www.imperial.ac.uk/media/imperial-college/research-and-innovation/research-office/public/Imperial-College-RDM-Policy.pdf.
University of cambridge research data management policy framework[EB/OL]. (2019-12-04)[2019-12-18].https://www.data.cam.ac.uk/university-policy.
Research data management policy[EB/OL].(2019-02-01)[2019-12-19]. http://documents.manchester.ac.uk/display.aspx?DocID=33802.
Research data management policy[EB/OL].(2011-05-16)[2019-12-20]. https://www.ed.ac.uk/information-services/about/policies-and-regulations/research-data-policy.
Research data management policy[EB/OL].(2019-05-09)[2019-12-21]. https://www.kcl.ac.uk/governancezone/assets/research/research-data-management-policy.pdf.
侯茹.大英圖書館館藏元數據戰略報告研究[J].圖書館學研究,2016(5):75-79.
李丹丹,吳振新.研究數據引用研究[J].圖書館雜志,2013,32(5):65-71.
項英,賴劍菲,丁寧.高校圖書館科學數據管理服務實踐探索:以武漢大學社會科學數據管理為例[J].情報理論與實踐,2013,36(12):89-93.
張計龍,殷沈琴,張用,等.社會科學數據的共享與服務:以復旦大學社會科學數據共享平臺為例[J].大學圖書館學報,2015,33(01):74-79.
邢文明. 我國科研數據管理與共享政策保障研究[D].武漢:武漢大學,2014.
王友轉 廣東省科技圖書館(廣東省科技信息與發展戰略研究所)館員。 廣東廣州,510070。
(收稿日期:2020-04-29 編校:陳安琪,劉 明)
*本文系廣東省科學院建設國內一流研究機構行動專項資金項目“圖書館科研數據管理需求與服務模式研究”(項目編號:2019GDASYL-0105080)、廣東省省級科技計劃項目“粵港澳大灣區城市群創新要素流動、集聚及其配置優化策略研究——基于空間測度、社會網絡與政策分析方法”(項目編號:2019A101002039)的研究成果。