張建勇,于倩倩,黃永文,董智鵬(中國科學院文獻情報中心,北京 100190)
NSTL統一文獻元數據標準的設計與思考*
張建勇,于倩倩,黃永文,董智鵬
(中國科學院文獻情報中心,北京 100190)
分析了NSTL統一文獻元數據標準建設的必要性,介紹了統一文獻元數據的設計目的是為保證NSTL發展戰略目標的實現。元數據的適用對象涵蓋NSTL所有科技資源。元數據的設計原則包括前瞻性原則、協同化原則、最小粒度原則、模塊化原則和兼容國際標準原則。提出元數據設計思路,并詳細介紹了其中的功能需求分析,構建了領域模型。本研究在元素和屬性的選取方面主要參考JATS標準。
NSTL;元數據;JATS;設計
當前,數字出版已經成為科技文獻資源的主要出版形態,描述科技文獻的元數據規范日漸增多,有些是國家標準,有些是公司內部標準。例如NISO JATS Version 1.1[1]作為美國國家標準,得到了廣泛應用和認可[2];科技平臺資源核心元數據[3]于2014年成為中國國家標準,為國家科技基礎條件平臺門戶提供統一的元數據;Web of Science[4]、Scopus[5]作為具有較大影響力的數據庫,其元數據規范已成功應用于數字化生產過程;Dryad元數據規范[6]被稱為科學數據倉儲元數據的最佳實踐;DC元數據[7]具有較強通用性,但相對來說數據元素簡單。縱觀現有元數據規范,雖各有特色,卻也有很多相同之處。如通過一套Schema描述多種類型文獻,數據項豐富、多用屬性進行描述,具有多種唯一標識符等。這也較好地印證了大數據時代,資源組織顆粒度細化、資源靈活挖掘與整合日益重要的特點。……