
摘 ?要:檔案元數據互操作對檔案信息資源整合意義重大。通過分析我國新舊《檔案著錄規則》、不同格式檔案元數據標準、不同門類間檔案元數據標準和不同領域間檔案元數據的互操作情況,提出結構、語義和技術三個層次的互操作問題,并從重視檔案元數據標準制定、切實提高檔案元數據質量、加強檔案資源整合實踐和重視語義本體技術應用四方面提出對策。
關鍵詞:檔案元數據;檔案著錄;互操作
Abstract: Archival metadata interoperability is of great significance to the integration of archival information resources. By analyzing the interoperability of Rules for Archival Description(1999) and Rules for Archival Description(2022), archival metadata standards in different formats, archival metadata standards among different categories and archival metadata among different fields, we propose the interoperability problems at three levels: structure, semantics and technology, and then we propose four countermeasures: attaching importance to the formulation of archival metadata standards, effectively improving the quality of archival metadata, strengthening the practice of archival resource integration and attaching importance to the application of semantic ontology technology.
Keywords: ?Archival metadata; Archival description; Interoperability
從“互聯網+政務”“一網通辦”的服務要求,到政府開放數據、開放科學數據的興起,大數據時代給檔案信息資源整合開放提出了更新、更高的互操作要求。2021年中辦、國辦發布《“十四五”全國檔案事業發展規劃》,要求“加強本區域檔案信息資源共享平臺建設,實現本區域各級綜合檔案館互聯互通,推動共享平臺向機關等單位延伸,促進檔案信息資源館際、館室共建互通,推進檔案信息資源跨層級跨部門共享利用”。檔案元數據互操作是在數字轉型、在線公共服務和開放數據背景下的新需求,也是檔案資源整合和提供多元利用服務的必經之路。
1 引言
1.1 概念界定。互操作是指兩個或多個系統及其組成部分之間交換數據并相互使用已交換數據以實現協同共享的能力。互操作概念最早應用于鐵路工程系統領域,用于解決鐵路和列車零部件、信號系統以及操作規范等兼容性問題。隨后,開始應用于各個領域的信息系統中,如軍事領域美軍基于C4I作戰指揮系統、電子政務領域的泛歐洲互操作框架(EIF)、電子醫療領域的健康信息系統等。
所謂互操作,那么就至少需要存在兩套不同系統。如果系統間采用相同的數據編碼、命名、格式、結構和傳輸方式,那么就不存在元數據互操作問題。一般而言,規定元數據的元素、結構和描述方法等規則集合稱之為元數據標準或元數據方案。因此,本文所討論的元數據互操作是指不同元數據標準或方案之間映射問題。
1.2 文獻綜述。元數據互操作并不是一個新的研究領域,在圖書情報、電子政務等領域較早受到廣泛關注。研究主要集中在二個方面:
一是元數據互操作的層次和方法。國內張曉林[1]較早提出應從元數據結構分析,從數據內容、元素語義、編碼規則等七個層面來實現元數據互操作,并指出其中語義、描述規則和語法結構三項互操作是核心,后續張東[2]、畢強[3]、彭靜[4]等也提出了各自關于元數據互操作的劃分層次觀點。國外方面,William Y. Arms等[5]根據實現互操作的效果和性價比程度將元數據互操作分為聯盟(Federation)、采集(Harvesting)和搜集(Gathering)三個級別。Lois Mai Chan 和Marcia Lei Zeng,[6,7]從元數據標準構建、元數據記錄產生到信息檢索應用的全過程將元數據互操作分為模式級(Schema)、記錄級(Record)和倉儲級(Repository),并總結了14種互操作方法,對后續學者研究元數據互操作范式影響深遠。總的來看,從語義、語法、結構等層面的互操作已基本成為共識。
二是元數據互操作核心技術,主要可以概括為互操作規范、互操作描述語言、數據轉換技術和符號標識技術四類,其中互操作規范包括OAI、Z39.50等,互操作描述語言包括XML、RDF、JSON等,數據轉換技術包括中間庫、WebService、XSLT、RestfulAPI等,符號標識技術主要指唯一標識符如DOI、Handle、CSTR、ORCID等。
目前國內檔案領域關于元數據互操作的研究成果較少,主要包括元數據互操作協議[8-11]、元數據互操作技術[12-14]以及互操作框架構建[15]等,大多以理論層面介紹和分析為主,缺乏互操作實際應用場景的視角研究。
2 我國檔案元數據互操作現狀
本文篩選了我國有代表性的元數據標準或方案,包括通用的著錄規則以及不同門類、不同領域的元數據方案,通過映射的方式對比總結互操作現狀。美國檔案學者David Wallance曾指出“元數據是著錄的替代策略(an alternative strategy)”,[16]劉越男也曾提出“電子環境中可以將文件管理元數據理解為著錄信息”。理論上所有的元數據標準/方案中值域和類型都應遵循通用的《檔案著錄規則》的相應要求,故本文也將檔案著錄標準視為元數據標準的子集,納入討論范圍。
2.1 新舊《檔案著錄規則》的互操作情況。2022年,國家檔案局時隔23年正式發布了修訂《檔案著錄規則》(以下簡稱“《規則》”),新《規則》在實現多級著錄、調整著錄項目和適應電子環境的著錄等方面做了較大調整。[17]
從著錄項來看,新《規則》較好地兼容了舊《規則》原有的著錄項目,僅刪除了不常用的“電子文檔號”,以及將“提要”修改為“范圍和提要”,其他著錄項目均得到保留。但是新《規則》同時新增了17個著錄項,其中必著的有著錄層級、開放標識等,這也意味著從舊《規則》轉向新《規則》時可能需要補充缺失的必要信息。
從著錄層級來看,舊《規則》僅適用于文件級、案卷級的著錄,而新《規則》著錄層級包括文件級、案卷級、類別級和全宗級四類,其中包含一些必填著錄項如著錄層級(所有)、檔號(所有)、題名(所有)、檔案保管沿革(全宗級)等,這導致新舊《規則》相互映射時可能無法對應層級,造成互操作障礙。
從著錄細則來看,由于舊《規則》是基于傳統手工整理和檢索需求編制,如今看來許多格式要求已不再有必要,因此新《規則》在內容格式上也做了修改。比如,舊《規則》要求在第一個責任者前加“/”,新《規則》無此要求;對于文件責任者不完整、有誤的情況,舊《規則》要求照原文著錄,并直接附上加“[]”的考證結果,新《規則》要求將原文責任者注明在附注項目;舊《規則》要求主題詞和關鍵詞之間用空格分割,新《規則》要求用“;”分割。這種格式上細微差異雖然不影響人的正常識讀,但是會影響機器理解,為后續資源開發帶來阻礙。
2.2 我國不同格式檔案元數據標準的互操作情況。我國現行的通用檔案元數據標準主要包括基于置標語言的XML封裝格式(即《DA/T 48-2009 基于XML的電子文件封裝規范》和《DA/T 46-2009文書類電子文件元數據方案》)和基于MARC檔案機讀目錄格式(即《GB/T 20163-2006 中國檔案機讀目錄格式》)兩類。
從結構上看,檔案機讀目錄數據由頭標區、目次區、數據區和記錄分隔符四部分構成,其中數據區主要記錄著錄信息。一條機讀目錄數據可對應一個全宗、類別、案卷或文件,整體呈現扁平的結構。基于XML封裝的檔案元數據由聲明、元素和注釋組成,其中元素包括標簽、文本、屬性等信息,且元素可以嵌套,整體呈現多層次的樹結構。
從著錄項數量上看,檔案機讀目錄格式包括10個記錄塊和77個字段,《文書類電子文件元數據方案》包括88個元素(如果加上封裝元數據,共有129個),考慮到機讀目錄中的字段仍可包含多個子字段和數據元,因此檔案機讀目錄格式的著錄粒度實際上遠超過XML封裝格式的元數據。
從映射情況看,兩種不同格式的元數據標準基本能夠相互映射,主要存在“一對多”或“多對一”映射障礙。《基于XML的電子文件封裝規范》只是封裝規范,要結合具體元數據方案使用,以《文書類電子文件元數據方案》為例,如:
①以日期著錄項為例,《文書類電子文件元數據方案》中的“日期”著錄項對應《中國檔案機讀目錄格式》的“100通用處理數據”和“210檔案形成時間”兩個字段中數據元。
②《中國檔案機讀目錄格式》將“附注”分為一般性附注、標識號附注、編碼信息附注等25種不同類型的附注,而在《文書類電子文件元數據方案》中僅有“M75附注”一種,無法完整映射。
③《中國檔案機讀目錄格式》將“主題詞”分為受控主題詞(如600人名、601機關團體名、602家族名、606職能、607地名等)和非受控主題詞,可從多維度進行主題標引。而《文書類電子文件元數據方案》中僅有“M26主題詞”“M27關鍵詞”“M28人名”,兩者對于主題詞的詳略以及采用主題詞表、著錄規則不完全一致,無法完整準確映射。
④《文書類電子文件元數據方案》中“M87關系”字段的值域包括轉發/被轉發、來文/復文、正文/附件等若干常用關系,而《中國檔案機讀目錄格式》的“4--記錄連接塊”僅提供了繼承/由……繼承、替代/由……替代4種可選關系,無法完整映射。
⑤《文書類電子文件元數據方案》中“M56圖像壓縮方案”對應《中國檔案機讀目錄格式》中的“135編碼數據字段:電子檔案”中子字段“電子檔案的壓縮級別”,雖然含義相近,但是值域范圍不同,無法準確映射。
⑥《中國檔案機讀目錄格式》中缺少關于電子簽名、權限管理、實體及實體關系相關的元數據項。《文書類電子文件元數據方案》中缺少關于著錄行為、國別地區、歷史沿革、獎懲、參見關聯等元數據項。
雖然檔案機讀目錄格式是出于檔案數據共享、交換和傳輸的目的而產生,但是由于結構規則復雜、人工可讀性差等缺點,目前實際中應用并不廣泛,因此互操作需求并不旺盛。
2.3 我國不同門類間檔案元數據標準的互操作情況。我國目前針對電子文件/電子檔案的現行檔案元數據方案共涉及三個門類,分別是《DA/T 46-2009 文書類電子文件元數據方案》《DA/T 54-2014 照片類電子檔案元數據方案》和《DA/T 63-2017 錄音錄像類電子檔案元數據方案》。其中文書類的檔案元數據方案制定最早,為后續其他門類檔案元數據奠定了基礎。照片類和錄音錄像類院屬方案制定較晚,結構和內容上兩者較為相似,即使考慮各自個性化的元素,它們之間能夠相互映射元素的比例也分別達到了73.96%和72.34%。錄音錄像類電子檔案元數據方案作為制定最晚的元數據方案,在元數據項的數量上略多于其他兩者。
《DA/T 46-2009 文書類電子文件元數據方案》《DA/T 54-2014 照片類電子檔案元數據方案》和《DA/T 63-2017 錄音錄像類電子檔案元數據方案》中必選元數據項映射關系如表1所示。考慮到涉及元數據項較多,表中僅展示了三個門類元數據方案中的必填項映射情況,可以發現主要存在以下映射問題:
①《文書類電子文件元數據方案》中“立檔單位名稱”“年度”“脫機載體編號”等字段無法映射到其他兩個門類元數據方案中。《照片類電子檔案元數據方案》中“生成方式”“圖像參數”等字段無法映射到其他兩個門類元數據方案中。《錄音錄像類電子檔案元數據方案》中“時間長度”等字段無法映射到其他兩個門類元數據方案中。
表1 各類方案中必選元數據項映射關系
②由于容器型元數據并不實際著錄信息,因此容易出現容器型元數據與字符型元數據的映射障礙。如《文書類電子文件元數據方案》中“檔號”字段是需要組配多個元數據形成,無法直接對應其他兩個門類元數據的中“檔號”字段。
③同樣的字段在不同元數據方案中的必選、可選或條件選屬性差異,導致無法完整映射。如“密級”在《文書類電子文件元數據方案》中屬于必填,但是在其他兩個門類元數據方案中屬于選填。
④同樣的字段實際定義不同,導致無法準確映射。如《錄音錄像類電子檔案元數據方案》中的“責任者”描述的是對錄音錄像內容負有責任的組織或個人,而在《照片類電子檔案元數據方案》中與之含義相對應的實際應為“人物”字段,并不是名為“責任者(容器型)”的字段。
⑤相似字段在定義上有所差異,導致無法完整映射。如《照片類電子檔案元數據方案》中“軟件信息”字段包括創建、形成、處理電子檔案的軟件名稱、版本等信息,而對應《文書類電子文件元數據方案》中“文檔創建程序”字段僅包含創建電子文件的軟件信息,在定義范圍上有所差異。
2.4 我國不同領域間檔案元數據的互操作情況。除了按照檔案門類劃分元數據,各領域也根據自身特點形成了各自的檔案元數據,如《LD/T 03-2021 社會保險業務檔案元數據規范》《QX/T 514—2019 氣象檔案元數據》《NB/T 20418-2017核電電子文件元數據》《CJJ/T 187-2012建設電子檔案元數據標準》等。經過比對,大部分領域的檔案元數據方案制定是參考了《文書類電子文件元數據方案》,理論上都可以《文書類電子文件元數據方案》為中間元數據從而實現互操作。但也有學者通過專門比對發現,即使不考慮標準之間的結構差異,《文書類電子文件元數據方案》與《核電電子文件元數據》之間相互能夠映射的元素比例也很低(分別為23.86%和12.85%),而其中完全映射的也僅占65%,同時兩個標準與DC元數據映射的覆蓋率也十分不樂觀(分別為6.82%和5.03%)。[18]
值得一提的是,一些領域針對檔案目錄數據交換制定了專門的規范和格式要求,如《GJB 4500-2002 軍隊檔案機讀目錄信息交換格式》《HJ/T 79-2001 環境保護檔案機讀目錄數據交換格式》《QJ 2878A-2005 航天檔案數據采集規定》等,雖然不是元數據方案,但也提供一條可行的互操作路徑。
3 我國檔案元數據互操作問題
從上述我國檔案元數據互操作現狀可以看出,我國檔案元數據互操作在結構、語義和技術三個層面存在問題。
3.1 結構互操作問題。結構問題包括語法結構和內容結構兩方面,目前國內大多數學者習慣將語法互操作和結構互操作分開闡釋,但是這忽略了元數據的語法和結構往往是一體的,很難區分開。比如XML和MARC,既規定了數據結構,也是標記語法/句法規則,元數據的語法和結構往往取決于采用什么定義語言(Definition Language)及建模語言(Modelling Language)來表達,因此在本文將內容結構和語法結構統一概括為結構問題。語法結構沖突指不同元數據方案在命名、表達、定義能力和方式上的問題,包括命名及標識沖突、語法/句法沖突和元素定義沖突。內容結構問題主要指兩種或兩種以上元數據方案在結構映射時出現的問題,包括一對多/多對一、層次錯位、無對應。
①命名及標識沖突。命名沖突是指不同元數據方案中同一實體的元素被賦予不同命名名稱所帶來的沖突。
②語法/句法沖突。語法/句法(syntax)規定了機器可讀的編碼方式,語法沖突是指不同元數據方案采用了不同的編碼方式帶來的互操作差異。
③元素定義沖突。不同元語言提供不同的定義能力,例如XML描述語言一般可以從約束性(必選/可選)、可重復性、元素類型、數據類型、值域、缺省值等方面提供豐富的定義。即便是同一實體的元素在不同的元數據方案中也可能采取不同的定義。
④一對多/多對一映射沖突。元數據方案映射時,源元數據中的一個元素可能對應目標元數據中的多個元素,即一對多沖突。考慮到映射的雙向性,也必然存在源元數據中的多個元素對應目標元數據中的一個元素,即多對一沖突。
⑤層次映射錯位。一般領域的元數據方案僅起到多角度描述作用,元素之間的層級簡單,結構扁平,而檔案元數據方案通常有著明顯的多層著錄特征,因此在與其他元數據方案映射時常常會出現層次錯位現象。即便同是檔案元數據方案,也可能因為元素屬性(如容器型、復合型和字符型)造成準確對應層次。
⑥無對應映射關系。無對應是指源元數據中的一個元素無法對應到目標元數據中的任何一個元素。這在跨門類、跨領域元數據之間互操作時最常見。
3.2 語義互操作問題。語義問題是目前元數據互操作研究的共識,主要包括領域沖突、術語沖突、表達沖突、多語言等問題。
①領域沖突。這里的領域沖突皆可以指元素概念之間的相交、包含或相離關系帶來的語義沖突,也可以指定義語言表達能力之間的差別帶來的語義沖突。比如電子文件領域的元數據和地理信息領域的元數據之間領域重疊范圍小,互操作存在沖突。再比如OWL可以表示兩個元素之間的相等關系,而XML Schema并不能做到。
②術語沖突。術語沖突是元數據互操作中最常見的問題之一,是指將相同域的概念映射到不同名稱的元素(即命名沖突)會發生同義詞沖突。
③表達沖突。表達沖突主要表現為單位不一致和編碼規則不一致。當元數據元素值涉及測量數字時,往往可能出現由于單位不一致導致的互操作沖突。如在DC中規定采用厘米作為長度單位,而在照片類電子檔案元數據方案中采用分辨率(即像素)作為單位。此外,編碼規則不一致問題在諸如日期表達中常見,不同的表達規范會在語義上造成歧義。
④多語言。不同語種之間也存在互操作的要求,跨語言的互操作一般使用受控詞表及多語言的敘詞表,通過翻譯建立不同元素之間的關聯。我國是一個多民族多語言國家,解決好多語言間的互操作問題也是語義互操作關注點之一。
3.3 技術互操作問題。①文件格式不一致。目前檔案領域常用的XML格式作為元數據存儲和交換格式,但使用MARC機讀目錄格式、DBF數據庫文件格式甚至Excel格式的情況也仍然存在,不同的文件格式在轉換過程中會造成數據失真、缺失等情況,影響元數據互操作效果。
②數據交換協議/接口缺失。系統之間及系統內部各組件之間常用的元數據交換方式包括Web Service、SOAP、OAI-PMH、Restful API等。目前我國各領域內的信息壁壘、信息煙囪現象較常見,信息系統間普遍缺少數據交換接口。
③安全問題。互操作打破了原有封閉環境,引進了新的數據必然會帶來新的風險。互操作安全問題如未鑒權訪問、元數據傳輸泄露、跳板攻擊、惡意爬蟲及DDOS攻擊等。
4 促進我國檔案元數據互操作對策
4.1 重視檔案元數據標準制定。通過現狀總結不難發現,我國檔案元數據標準的制定相對滯后,嚴重限制了元數據互操作以及檔案資源開發。在檔案元數據互操作中,檔案元數據標準/方案無疑是處于核心地位,其制定和實施將直接影響檔案元數據的格式和形態,決定了與其他元數據互操作的難易程度。因此重視檔案元數據標準的制定尤為重要。
一是遵循制定元數據標準通用原則。元數據標準設計原則包括簡單性和準確性、專指度和通用性、易轉換性、可擴展性和用戶需求導向等。[19]目前我國的《文書類電子文件元數據方案》《照片類電子檔案元數據方案》和《錄音錄像類電子檔案元數據方案》在元數據元素的選擇和定義上體現的通用性不足,沒有復用國際上通用的檔案元數據元素,未來制定我國通用檔案元數據標準時需要注意這一點。可以通過制定檔案元數據標準框架,明確設計檔案元數據標準時需要遵守的規則和方法。
二是參與國際元數據標準研究。國際上主要的元數據標準主要包括由DCMI主導的DC、SAA主導的EAD和EAC-CPF、ICA主導的RiC等,這些標準大多以專業組織為單位,廣泛結合國際各國的力量和實踐經驗展開研發。元數據標準規定了數據在電子環境下的存儲和傳輸方式,可以說元數據標準就是網絡空間的話語權。隨著我國經濟和政治影響力不斷提升,我國檔案界有責任和義務在國際元數據標準舞臺上發聲,積極融入國際檔案元數據標準的研究進程中,努力與世界水平接軌。
三是引入國際成熟標準,加快研究檔案語義本體。EAD、EAC-CPF等標準已經成為事實上的通用國際標準,現有的大多數檔案語義本體標準也是基于此研制。由于我國尚無類似的檔案通用元數據標準,導致檔案資源開發和利用很難直接借鑒國外的經驗和方法。為了保障和其他國家檔案資源的互操作,有必要引入成熟的國際標準,并在全國范圍內推行,同時加強研究中文語境下的檔案本體,構建具有中國特色的檔案元數據標準。
4.2 切實提高檔案元數據質量。受限我國各地區、各領域參差不齊的信息化水平以及著錄人員的負責程度,檔案元數據質量水平高低不等令人擔憂。有調查曾指出,現有檔案目錄數據庫建設中存在諸如著錄格式不規范、數據庫設計不合理、分類標引工作停滯等,為建設統一元數據目錄中心以及后續合并數據帶來了困難。[20]因此,必須首先提高檔案元數據質量,才能為后續互操作打下堅實基礎。
一是要加強檔案信息化建設。檔案信息化是資源整合的前提,也是元數據互操作的前提。加強數字檔案資源建設,尤其是原生電子文件的管理,確保檔案元數據及時準確捕獲。二是加強檔案元數據著錄工作。新《規則》對檔案內容著錄提出了更高的要求,檔案著錄不再是“一次性”工作。檔案元數據著錄工作必須嚴格遵守相關的著錄規則,確保在格式和內容上保持統一。三是開發元數據自動著錄技術。面對海量的存量檔案資源,僅依賴人工手動著錄是不現實的,也不可能完全避免錯誤,因此開發基于AI的自動著錄技術是有必要的,再通過人工審核進一步確保檔案元數據質量。
4.3 加強檔案資源整合實踐。目前我國檔案元數據互操作實踐大多還停留在以地域為單位或特定類型檔案資源整合方面,表面看起來問題并不突出,但在整合理念、整合主體和整合范圍等方面都有較大的提升空間。
一是轉變重藏輕用思想,加快檔案開放共享。開放共享數字檔案資源是實現檔案元數據互操作的重要基礎。加快開放共享檔案資源具體可以從法律、政策和社會環境幾個角度著手。法律層面,盡快給檔案資源“松綁”,確定檔案開放的法律義務和責任,針對信息公開和檔案開放之間的不適應,及時做出修訂和調整,為開放共享打下基礎。政策方面,政府和檔案部門要積極推動檔案資源的開放,更加強調檔案資源的文化屬性而不是政治屬性,發布促進檔案資源開發和利用的政策和保障措施。社會層面,努力改善公眾對檔案的認識,提高檔案利用意識,通過開發歷史檔案資源激起社會對檔案研究價值的重視。
二是積極開展跨領域檔案資源整合。首先,檔案機構要革新自我定位,要認識到除了有保存的職能,更有傳播和開發文化遺產、歷史記憶的職能,樹立為公民服務的理念,為公眾提供一站式服務。其次,積極和其他領域文化機構合作,如圖書館和博物館等,以專題項目為契機,關聯共性資源,提供更豐富的檔案元數據信息。最后,探索與非公共文化領域的合作,鼓勵跨界合作,比如與百度百科鏈接,提供專業詞條撰寫和鏈接;與國際相關數據集建立(如人名、地名、事件)關聯,充實元數據內容;建立眾包平臺,吸引不同專業背景的用戶參與添加標簽,豐富檔案著錄信息等。從整合內容看,可以保持目前以整合歷史檔案為主做法,同時適當放開其他類型檔案的利用限制,如民生檔案、名人檔案、非遺檔案等,以特色檔案資源整合服務為抓手,擴大檔案元數據互操作的實踐面。
4.4 重視語義本體技術應用。結構/語法和技術層面的互操作問題目前已經通過統一XML和API技術基本解決,語義互操作成為下一步關注的核心問題,因此重視語義及本體相關技術的應用就顯得尤為重要。
一是積極開發和應用檔案本體標準。RiC作為檔案領域最新的國際著錄標準,在設計理念上引入了本體概念,構建了一套基于實體的概念體系。目前國外已經在PIAAF、Docuteam、SNAC等多個項目中開始應用實施RiC。
二是語義網環境下的敘詞表開發。敘詞表、分類表、主題詞表等作為傳統手工管理常用的標引工具,具有良好的檢索性能,但是并不能被機器直接讀取和理解。通過SKOS數據模型規范、統一組織后可以形成各類知識組織系統,并且彼此相互映射、相互兼容,共同組成了語義網的重要部分。
三是關聯技術的廣泛應用。目前比較常用的關聯技術包括OWL、知識圖、知識圖譜等,其本質都是構建實體之間的RDF關系三元組,再將彼此鏈接起來形成一張復雜的語義網,從而實現語義關聯。
參考文獻:
[1]張曉林.元數據研究與應用[M].北京:北京圖書館出版社,2002.
[2]張東.論元數據互操作的層次[J].情報理論與實踐,2005(06):91-93.
[3]畢強,朱亞玲.元數據標準及其互操作研究[J].情報理論與實踐,2007(05):666-670.
[4]彭靜,高林,張展新.元數據互操作技術研究[J].信息技術與標準化,2008(11):50-53.
[5]Arms W A,Hillman D,Lagoze C,et al.A Spectrum of Interoperability,The Site for Science Prototype for the NSDL[J].D-Lib magazine;2002(08):1,2002.
[6]Chan L M,Zeng M L.Metadata interoperability and standardization-a study of methodology part I[J].D-Lib magazine,2006,12(06):1082-9873.
[7]Zeng M L,Chan L M.Metadata interoperability and standardization-A study of methodology,Part II[J].D-Lib Magazine,2006,12(06):1082-9873.
[8]王芳,王小麗.基于OAI協議的數字檔案館元數據互操作問題研究[J].現代圖書情報技術,2007(03):18-24.
[9]王萍,鄧君,高漸.開放獲取理念及技術在檔案領域中的應用[J].檔案學通訊,2007,No.179(06):43-46.
[10]包海峰,陳剛.基于OAI互操作協議的檔案信息資源整合模式研究[J].檔案與建設,2012,No.286(12):13-16.
[11]彭楨,包海峰,徐濼燚.支持元數據和服務共享的三類互操作協議比較[J].檔案與建設,2016,No.336(12):23-27.
[12]安海寧,程子彧.檔案系統互操作問題研究[J].合作經濟與科技,2013,No.466(11):125-126.
[13]房小可.OAI環境下基于本體的DC元數據與檔案元數據EAD的映射[J].蘭臺世界,2018,No.554(12):41-45.
[14]郭學敏,Ryan Shaw.基于關聯數據的檔案語義轉換實踐分析[J].檔案學通訊,2019(05):50-57.
[15]呂元智.數字檔案資源體系的語義互操作實現研究[J].檔案學通訊,2013,No.214(05):53-57.
[16]Wallace D A.Managing the present:Metadata as archival description[J].Archivaria,1995,39.
[17]王熹.《檔案著錄規則》修訂解讀[J].中國檔案,2022,(09):28-29.
[18]蘇洲,劉娟.核電文檔元數據比較研究[J].浙江檔案,2014(12):12-16.
[19]肖瓏,陳凌,馮項云,馮英.中文元數據標準框架及其應用[J].大學圖書館學報,2001(05):29-35+91.
[20]浙江省檔案數據庫建設調查組 ,韓李敏.檔案信息化建設 數據質量是關鍵──浙江省綜合檔案館信息數據庫建設調查報告[J].檔案學研究,2002(03):45-48.
(作者單位:中國科學院檔案館 孔祥盛,碩士,館員 ?來稿日期:2022-10-20)