耿志杰,陳佳慧
科學數據管理已成為全球科學事業的重點工作,歐盟地平線2020計劃、歐洲科學數據永久性保存計劃項目(PARSE.Insight)、開放存取Plan S等項目不斷發起,推動區域內科學數據的保存與共享??茖W數據長期保存工作是指為維護數據的真實完整性,“無限期提供對科學數據持續訪問的能力”[1]所采取的一系列存儲與管理行為。對科學數據進行長期保存是開放存取的前提,能夠為大規模開放活動積累數據資源,并在信息集成過程中提供新方法和創新點[2],從而提升研究成果質量,加速世界科學發展步伐。
隨著對科學數據價值認識的加深,我國開始相關嘗試,各類科學數據平臺建設初具雛形,《科學數據管理辦法》更是站在國家高度,為保障科學數據安全、提升數據開放共享水平提供制度規范。相較于國外,我國科學數據長期保存工作屬于“短板中的短板”[3]:政策體系不完善,科學數據保存工作令出無門;長期保存工作未成體系,各領域數據平臺各行其是;技術策略的統一性、全面性不足,制約數據的整合與存儲。
荷蘭數據歸檔和網絡服務中心(Digital Archiving and Networked Services,DANS)成立于2005年,由荷蘭皇家藝術學院(KNAW)和荷蘭研究委員會(NWO)共同組建,以促進人文、藝術、社會科學等領域的數據開放獲取和持續訪問為使命[4]。在16年實踐中,DANS不斷完善存儲技術設施建設、優化保存方式,形成了系統的長期保存機制。本文在對DANS長期保存機制進行調查與分析基礎上,總結其保存舉措的特點及優勢,為我國科學數據長期保存工作提出優化建議,以期促進數據保存技術和管理方式的優化創新。……