劉敬儀 江洪 廖宇
(1.中國科學院文獻情報中心,北京 100190;2.中國科學院大學經濟與管理學院圖書情報與檔案管理系,北京 100190;3.中國科學院武漢文獻情報中心,武漢 430071)
目前,科學研究已進入“第四范式”——數據密集型科學,這代表著科學數據在當今時代占有極其重要的位置,是科學事業發展的基礎。“第四范式”最早由吉姆·格雷于2007年1月發表的《e-Science:一種科研模式的變革》學術演講中提出[1],其指出科學模擬連同實驗產生大量的數據,這些數據經軟件處理形成信息和知識,最終被存儲到數據中心,科研人員只需從數據中心中查找所需數據,由于數據密集型研究具有獨特技術支持需求的鮮明特點,使其與“第三范式”——計算科學區別開來,獨立為“第四范式”——數據密集型科學。而在新范式的科學研究環境中,海量的科學數據是最重要的資源,這就要求科學界針對數據密集的特點,利用新技術對科學數據進行更有效的管理,不僅在意識上提升對數據中心重要性的認識,同時應更加注重建設數據中心過程所涉及的方方面面工作。國務院辦公廳于2018年4月2日發布《科學數據管理辦法》,在第三章“采集、匯交與保存”中多次提到應將有關科學數據匯交至科學數據中心,且應在建設較好的科學數據中心基礎上,進行優化與整合,以形成國家科學數據中心[2]。綜合可見,科學數據中心是開展與某特定學科相關科學數據管理工作(數據生產、數據采集、數據分析、數據保存、數……