湯子鈺 歐石燕
(南京大學信息管理學院,南京 210023)
在e-Science和大數據環境下,數據密集型科學研究正在成為當代科學研究的主流范式,科研活動逐步轉向以科學數據為中心,但同時面臨著數據量大、數據類型繁多、數據價值密度低等諸多困難。數據監護將數據管理由靜態、消極的保存上升到動態、積極的監護,極大地提升了數據的應用價值,受到學術界、企業界和政府等各方面的廣泛關注,國外相繼涌現了大批數據監護平臺。數據監護平臺是為數據監護服務提供載體的基礎設施平臺,是數據監護由理論走向實踐的重要支撐。本文對國外代表性數據監護平臺的技術規范、組件、軟件工具、功能等各方面進行全面調研、分析和比較,旨在為我國數據監護平臺的開發與建設提供參考。
數據監護萌生于20世紀90年代中期的數字資源長期保存研究與實踐。隨著研究的深入,研究者們的關注重點從確保數據的完整、真實逐步轉變為對數字資源的積極利用[1]。2001年,數字保存聯盟(Digital Preservation Coalition)與英國國家空間中心(British National Space Centre)在倫敦聯合舉辦了“Digital Curation:Digital Archives,Libraries and e-Science Seminar”國際研討會,首次提出數字監護(Digital Curation)和數據監護(Data Curation)概念[2]。這兩個概念雖然前者多用于人文社科領域,后者多用于自然科學領域[3-4],但并沒有本質區別,都是指主動管理處于生命周期中的科學數據,從而促進數字資源共享的活動[5],在很大程度上可以互用。因此,在本文中我們統一使用數據監護一詞。
數據監護與原有的數據保存(Data Preservation)和數據存檔(Data Archiving)這兩個概念既有區別又有聯系。……