崔佳偉 吳思竹 鄔金鳴 修曉蕾 錢慶
(中國醫學科學院醫學信息研究所,北京 100020)
隨著數據密集型科學研究成為常態,各類科學數據呈爆炸式增長,這為科研人員存儲、管理以及共享數據帶來了巨大的困難與挑戰??茖W數據倉儲的出現雖然為科學數據的存儲和共享提供了途徑,但如何實現對倉儲內數據進行有效管理和統一檢索則成為另一個重要問題??茖W數據元數據是對科學數據外部形式和內部特征的詳細描述[1],能夠為科學數據的組織、整合、交換、發現和獲取等提供信息。為充分發揮科學數據倉儲的功能與作用,必須構建、應用能夠滿足倉儲功能目標、資源特點和用戶需求的科學數據元數據標準,鑒于此類科學數據元數據標準主要應用于科學數據倉儲,故也可稱之為科學數據倉儲元數據標準。國外的科學數據倉儲元數據標準發展已經較為成熟,但國內的相關標準還大多處于建設之中。本文擬對國外現有科學數據倉儲相關的元數據標準的內容設計及實際應用情況進行系統梳理與深入探究,以期為我國科學數據倉儲元數據標準的構建和應用提供可資借鑒的參考。
在過去的幾十年里,為實現跨學科、跨領域的科學數據發現與共享,生物醫學、物理學和社會科學等領域都建立了相應的元數據標準與規范。尤其在生物醫學領域,隨著高通量測序技術的快速發展,臨床實驗和……