摘要:在檔案資源對象發展演化的過程中,數據態檔案作為新型資源對象,具有信號和語義雙重離散的本質特征。因此,有必要對已有檔案管理理念和實踐進行重塑,建立能夠解除語義離散帶來的高階邏輯依賴的數據態檔案管理模式。本文在檔案資源連續空間演化圖景的指導下,明確數據態檔案管理模式的概念及功能定位,闡明其區別于其他形態檔案資源管理模式的特征,并對模式構建所面臨的主要挑戰進行分析。研究認為數據態檔案管理模式以體系性、連續性、可理解性和專業性為主要特征,在空間管控、證用價值維系、管理機制協同與技術能力建設等方面面臨挑戰。
關鍵詞:數據態檔案 數據態檔案管理模式 概念內涵
Abstract: In the development and evolution of archival resource objects, data-state archives as a new type of resource objects has the essen? tial characteristics of signal and semantic double discrete.Therefore it is necessary to reshape the existing archival management theory and practic? es, and establish a management model for datastate archives that can relieve the higher-order logical dependence brought about by semantic discrete. Guided by a scenario of continuous space evolution of archival resources, this paper clarifies the concept and function of the manage? ment model for data- state archives, elucidates its characteristics that distinguish it from other forms of management models, and analyses the main challenges faced in the construction of the model. The study concludes that the manage? ment model for data-state archives is character? ized by systematicity, continuity, comprehensibili? ty and professionalism, and that it faces challeng? es in terms of space control, maintenance of the value of evidence and utilization, coordination of management mechanisms and development of technical capacity.
Keywords:Data- state archives;Manage? ment model for data- state archives;Concept connotation
數據作為新型生產要素,正伴隨著數字中國戰略的深入實施成為數字化、網絡化、智能化的基礎,深刻改變著生產生活方式和社會治理方式。由中國人民大學主辦的2023年“中國電子文件管理論壇”的主題為“面向數字中國戰略的檔案數據創新與發展”,精準抓住了數據時代檔案管理的核心主題。數據是檔案資源體系的重要組成部分,數據態檔案是檔案資源對象演化在數據時代的新形態,具有信號和語義雙重離散的核心特征。在國家政策肯定、信息技術賦能和業務數據驅動的多重動力之下,數據態檔案在業已形成的數據環境中產生并培育。數據態檔案體量指數級增長、類型不斷豐富,為檔案事業提供新發展機遇的同時,也對前一階段逐漸探索完善的電子文件歸檔和電子檔案管理模式提出挑戰。不同于實體檔案對象的序化載體管理、數字檔案對象的可信內容管理,數據態檔案對象面對的是數據理解與復用、業務邏輯與規則表達、語義整合與復現等新問題,需要與之匹配的數據態檔案管理模式提供新的解決方案。基于此背景,本文從管理模式的維度對數據態檔案的管理與維護展開探索,以充分挖掘并發揮數據態檔案在數智時代的多元價值,構筑起凝結過去、基于當下、面向將來的檔案信息化完整發展空間。
數據態檔案是在新一代信息技術條件下以數據形式存在的新型檔案形態,具有信號和語義雙重離散的核心特征。相較于紙質檔案管理所強調的載體管理、電子檔案管理所強調的文件管控,數據態檔案管理在歸檔、管理和長期保存等核心業務環節都表現出極大的差異性。這種檔案資源形態演變所呈現出的新樣態,同樣反映在政策法規的規制與理論研究的探索方面。
檔案領域相關政策法規以積極融入國家大數據戰略為導向,開始重點探索數據與檔案協同以及數據歸檔等問題。《“十四五”全國檔案事業發展規劃》要求“實現對國家和社會具有長久保存價值的數據歸口各級各類檔案館集中管理”以及“大力推動科學數據與科研檔案協同管理”。地方檔案部門如浙江省檔案局形成了《政務服務網電子文件歸檔數據規范》,對政務服務網電子文件歸檔過程中存檔信息包的數據結構、命名規則和材料形成整理要求等進行了規定,嘉興市檔案館更是探索形成了《嘉興市市級機關政務業務系統數據歸檔暫行標準》。
理論研究在法規政策引導、檔案部門響應、學界研究推動下,其研究已初具規模。筆者在2018年率先提出了包括模擬態、數字態和數據態的“三態”演化的觀點,明確用“數據態”指代數據檔案空間。此后代表學者如趙生輝認為檔案與數據分屬信息世界和機器世界,二者存在著相互依賴的雙軌共生關系[1];陳永生強調由電子數據條目構成的電子檔案是真正意義上的原生性電子檔案,其信息內容富語義化和價值增強,但也易于失去解析情境[2];金波認為檔案數據顆粒度細化,開發方式屬于內容控制,其數據價值是檔案在數據時代的價值新發現[3];劉越男指出數據治理是大數據時代檔案管理的新職能,檔案管理分擔歷史性業務數據和文化記憶數據的治理,以文檔和內容管理為立足點[4];趙躍提出檔案科學介入數據資源管理的檔案化模式,變控制為干預,實現數據資源的檔案化認同和數據資源管理過程的“檔案化”轉變[5]。可見,數據態檔案研究在概念認知、核心內容、業務與規則等方面均取得了一定進展。
但檔案學研究的“數據熱”中,缺少針對普遍問題與困境展開的通用管理體系構建,對數據態檔案管理模式的系統研究基本空白,這種只見樹木不見森林的研究態勢容易導致對這一新生對象的探討流于片面,不利于從整體對數據態檔案本質進行把握,從而阻礙空間整體管理能力形成。為有效管理數據態檔案,充分挖掘并發揮數據態檔案在數智時代的多元價值,亟須探索適應數據態環境的檔案管理新模式。
數據態檔案管理模式的研究尚處于起步階段,但可以確定的是其相關研究必須堅持以數據態對象本質特征為核心,應包含從全局角度對數據態檔案對象管理的理論重塑,以及對這一新型檔案對象核心業務的實踐重構。
(一)數據態檔案管理模式是基于數據本質的理論重塑
筆者在前序研究使用檔案管理對象空間概念來涵蓋特定態別檔案資源特質及其相應技術體系、管理環境、適用規范等要素[6],并在2023年“中國電子文件管理論壇”中以“檔案資源連續空間演化圖景分析”為主題,對管理空間的概念進行了較為完整的闡釋。不同態別資源空間之間存在發展的連續性和動態的轉換關系,數據態在連續空間中既是模擬態和數字態空間轉換的結果,也是知識態和價值態空間演化的基礎,具有承上啟下的樞紐作用。但資源管理對象空間概念偏重于宏觀與整體表達,旨在汲取空間立體性、綜合性、動態性和連續性的精義,其相對抽象的表述不能與諸要素組成的管理情境直接聯系。因而本文提出將相應態別的檔案管理模式作為空間表達的具體化形式,在與具體工作銜接時更能體現出特定態別對象的管理程序、方法、結構等核心內容。
數據態檔案管理模式是數據態空間在管理環境中的具象化,是該空間范疇內相關理論、規范和業務規則的綜合。數據態檔案管理模式立足于檔案對象信號與語義雙離散的特點,從理論層面回應如何重構離散數據語義的核心問題。數據態檔案對象離散的特點為信息對象的連續理解帶來困難,但其離散的顆粒度形式同時也為多視角、多維度、多層次的數據敘事和數據價值開發提供了嶄新的空間。為此,數據態檔案管理模式應開展細致的理論重塑工作,要對維系數據語義連續、管控數據之間關聯與結構的方法進行研究,并在此基礎上對受其影響而發生變化的業務流程和規范進行更新再造。例如,在將關系數據庫轉換為XML文件進行歸檔保存時,利用XML處理工具或編程語言,根據數據庫中的外鍵約束,將數據模型中的對象進行關聯,建立表與表之間、表與主鍵之間的關聯關系,或者將存儲過程與相關的表進行關聯。這種關聯使得XML文檔能夠清晰地反映數據庫中的結構和關系,為后續的數據存儲、查詢和處理提供便利。數據態管理模式需要將此類關聯方法抽象為數據關聯的恢復和固化,并將其嵌入業務流程和管理系統中。[7]
(二)數據態檔案管理模式是面向業務環節的實踐重構
數據態檔案管理模式不是虛化的理念,也不是實際模型,是介于二者之間的兼有理論導向與實踐指導功能的層級。該模式確定了對于數據態檔案這一特殊對象管理的基本理念和實踐方向,在抽象層級上與具體的管理方法仍有區隔,是指導管理方法形成的基礎,具有豐富的實踐內涵。
數據態檔案管理模式需要在資源管理的各業務環節實踐中解決由于雙重離散帶來的矛盾,這種疊加管理需求直接導致大量業務環節需要進行實踐重構,典型的如歸檔、保存、鑒定、編研、開發利用等。此外,處于連續空間樞紐環節的數據態,還產生了不少業務增量,如數據檔案化、數據語義化等新型業務形態。這些存量與增量業務都需要根據數據態檔案的對象特征進行針對性的業務創新。歸檔方面,王強初步研究了業務系統中數據態對象的識別與歸檔策略,結合石油行業業務場景,將業務系統分為生產運行類系統、連續監測類系統、經營管理類系統、綜合管理類系統四類。[8]檔案數據化方面,楊建梁等提出包含轉錄識別、描述增強、圖譜構建和矢量處理在內的開發流程。[9]保存方面,筆者提出了包括態勢感知、環境構建、語義表達、反饋前端在內的數據態長期保存基本策略。[10]語義化與開發方面,夏天等提出檔案數據語義化重組模型[11];房小可與段榮婷則研究了在檔案著錄工具基礎上增強語義分析等手段,建立了將檔案描述數據融入語義網的橋梁[12-13]。
數據態檔案管理模式在將抽象的檔案數據對象管理空間與具體實踐場景結合的過程中,總體上呈現出體系性、連續性、可理解性、專業性的典型特征。
(一)體系性
數據態檔案管理模式的體系性特征,本質上是由數據態對象的雙重離散特點激發的。因為離散,之前許多統一于載體管理、內容管理的問題化整為零地出現,這些問題涉及不同要素的統籌,如技術、組織、領導力等,需要一個有組織、有結構的整體框架來確保數據安全、數據質量和合規性。此外,檔案數據本身的構成情況也相當復雜,包含大量的數據源、數據類型和數據使用場景,來自不同系統、部門的數據關聯著各種業務流程和操作,只有體系性的數據態檔案管理模式才能夠駕馭數據原生環境的業務背景,使得數據在全生命周期中得到協同管理。而且在環境的持續變動和不確定性之中,新興的技術、業務需求和法規標準可能影響甚至改變數據態檔案管理的方式,體系性的數據態檔案管理模式能夠更靈活地應對變化、識別和防范風險,保證檔案管理體系的穩定性和可持續性,在管理上體現聚合的能力。
數據態檔案管理模式涉及不同層級管理要素的疊加與統籌。模擬態和數字態對象信息顆粒度粗,整體表現力強,如載體與信息統一的白紙黑字和語義與語法統一的非結構化文件,而離散程度最高的數據態空間,需要完備程度更高的管理框架進行管控,自然要求管理模式具有體系性,需要綜合考察前端復雜的業務背景、全生命周期涉及的各類系統與平臺要求、涵蓋數據合規與安全管理的各項數據治理規范,以及需要解決兩個離散帶來的長期保存問題等。這些都要求數據態管理模式要具備體系性,統籌考慮各類管理要素,從而使數據態對象在全生命周期中得到協同管理。國家數據局局長劉烈宏對《“數據要素×”三年行動計劃(2024—2026年)》[14]進行解讀時強調加快形成數據基礎制度體系和數字治理體系,明確了從體系層面進行思考和布局的必要性,與數據態檔案管理模式的體系性特征高度契合,可見對數據對象的體系性管理已成為政策和戰略層面的共識。
(二)連續性
筆者提出的用于表達檔案資源形態與語義關系的U型曲線理論直觀地反映了檔案資源演化的連續性特征。[15]在該曲線中,數據態處于奇點樞紐位置,是計算活性最強的資源態別,發揮著承上啟下的作用。一方面,數據態是模擬態和數字態檔案資源持續向下破析,不斷計算增強的結果;另一方面,數據態也是朝著知識態、價值態進行語義增強的起點。數據態檔案管理模式也繼承了資源空間的連續性特征,與紙質檔案管理模式、電子文件管理模式前后相續,共同塑造了檔案資源形態演化的連續譜系。良好的連續性特征使得數據態能夠在多個空間中實現銜接,充分發揮數據態在U型曲線的樞紐通衢作用。如數據檔案化、檔案數據化就是數據態與數字態之間的雙向轉換,語義化則使得數據態檔案很自然地面向知識態和價值態空間進行數據增值和語義增強。
不單資源形態具有連續性,從資源模型角度看,數據態與周邊態別空間都存在模型內在的連續性,根據筆者的研究,模擬態的序化模型、數字態的實體聯系模型、知識態的本體模型都與數據態的關聯模型存在較強的連續性,這使得多態空間資源的大批量轉換成為可能,為資源空間的有序和規范遷移提供了保障。[16]
(三)可理解性
可理解性實質是表達了可見、可讀、可理解在內的“三可”要求。從資源連續迭代的角度看,數據態檔案管理模式需要滿足“三可”要求,使得載體可見、文件可讀、數據可理解。“三可”要求反映了檔案對象在不同態別空間的應然狀態,即從物理上的存續、計算機系統的讀取再到人類用戶的理解。可見是指數據的存在可以被識別和觀察到,對應的工作包括對物理空間和各類型載體實體的管理工作。可讀是指數字文件按照某種模式或協議進行組織,保證能夠被計算機正確地讀取和處理,對應的工作包括數字資源的長期保存,如格式管理、遷移仿真、備份恢復等。可理解是指數據以人類能夠理解的方式呈現,是數據態檔案管理模式的重點與難點。元數據是通向可理解性的橋梁,基本數據屬性、背景元數據、過程元數據動靜結合刻畫出數據發展變化過程,重新接續斷裂的語義,建立起機器與人的初步鏈接。數據可視化是可理解性的直觀表現,通過使用圖表、時間軸等多種手段展示數據的模式和關系。數據管理強調數據生產要素價值的發揮,用戶無需理解數據也可以享受數據開發利用的成果,但檔案的可理解性需要面向社會全體,且要在檔案保存期限之內持續維護可理解性。
進一步細究,從依賴關系看,模擬態管理模式需要通過“八防”手段應對載體的物理保存問題,從而解決載體依賴。數字態需要解決以軟硬件依賴性為核心的低階邏輯依賴,應對信號離散帶來的保存問題。數據態需要解決以語義關聯為核心的高階邏輯依賴,管控諸如算法、規則、約束、模型等可解釋性要素。“三可”要求需要解決的依賴關系可以簡單表達為物理依賴(載體可見)-低階邏輯依賴(語法可讀)-高階邏輯依賴(語義可理解),從這個遞進關系也能看出可理解性是“三可”要求的最高點,是建立在可見和可讀基礎上的。
(四)專業性
專業性主要是指特定數據態對象語義復現需要相應的專業知識提供支撐,專業性特征可視為對可理解性的回應,著眼于解決語義離散這一核心矛盾。以數據形態存在的檔案資源,在機器理解方面,需要專業計算機人員進行模式設計、流程預置與操作;在用戶理解方面,需要與業務內容直接相關的行業專家進行數據解讀、降維與呈現,具有明顯的專業性特征,對管理主體的知識水平和業務能力提出了較高的要求。一般來講,信號離散需要應對軟硬件系統依賴性,其解決方案通常是進行持續的系統運維,面對的是具有一定的普適性的、共同性的問題,如硬件、軟件、格式的升級換代和版本更迭,抓住這幾個關鍵點,就奠定了維護可讀性的基礎條件。而語義離散通常需要專業組織維持,從某種意義上講,語義離散的問題相對小眾,通常依附于特定的專業技術領域,因而需要針對不同類型的數據態對象進行專門研究,具有較強的專業性。如LOTAR(Long Term Archiving and Retrieval)[17],是國際航空工業合作項目發布和維護一系列用于3D CAD/CAM和PDM數據長期保存和檢索的標準,包括基礎部分、通用流程和特定領域部分,其中特定領域就包括基于PMI的3D CAD機械信息、產品結構信息、混合設計及先進制造、電線束、基于模型的系統工程、工程分析和仿真,體現了該領域特定的專業性。類似的如數據庫領域用于簡化關系數據庫存檔的SIARD規范[18]和用于定義和記錄數據庫模式和結構的DBML開源語言[19],再如用于網絡資源歸檔保存的WARC存儲格式標準[20],都體現了各自數據態對象管理的專業性。
現有檔案管理模式與以體系性、連續性、可理解性和專業性為主要特征的數據態檔案管理模式之間仍存在差距,在空間管控、證用價值維系、管理機制協同與技術能力建設等方面都面臨巨大挑戰。
(一)需要建設保障“三可”特征的管控體系
數據態檔案管理模式構建的直接挑戰就是搭建維系數據態檔案“三可”特征的相對完備的管控體系,“三可”的疊加要求使得數據態管理模式需要有效集成在模擬態、數字態積累的各核心要素。從依賴性角度看,一個相對完備的數據態管控體系應包含對各類型依賴的應對措施,包括物理依賴、語法依賴和語義依賴等。總體上,模擬態以物理依賴的研究已臻于成熟,集中體現在對載體、字跡、材料三要素以及環境控制的“八防”要求上;數字態以軟硬件依賴為代表的低階依賴的研究也一直在持續,可以說數字保存就是專門針對降低電子檔案軟硬件依賴性的研究領域。數據態檔案管理模式明確提出可理解性要求,需要直面語義離散帶來的語義依賴問題,對規則、模型、算法等語義關聯要素進行管控。在檔案資源形態的演化過程中,較之于模擬態和數字態低態別對象,適應高態別對象特征的管理模式對于所涉及的管理要素的完備性要求更高。例如,作為數字態環境中單套制管理的綜合性標準的《電子檔案單套管理一般要求》(DA/T 92-2022),是一個類似單套制準入清單的綜合標準,明確涉及的參照標準或要求多達28項,可行性評估指標包括前置性條件和26個指標,如果任何一個前置條件暫不具備,則評估結果直接為“未通過”。后續在構建更為復雜的數據態管理模式時,同樣需要拓展管理要素,滿足與數據細小顆粒度特征相適應的精細化管理要求。
(二)需要探索兼顧證用價值的實現路徑
檔案學基礎理論揭示了檔案具有憑證價值與信息價值,在系統中通常表現為存證與利用服務,而不同資源態別的證用價值實現路徑存在較大差異。數據態在U型曲線中處于承上啟下的奇點位置,可計算性最高但語義含量最低,檔案出證或提供利用時都需要經歷語義恢復的長鏈處理過程,過程中需要基于規則與模型從數據體中對于原件進行顯性化,對技術和語義依賴層層解離。
因而,數據態管理模式應實現以數據態對象為中心的兼顧證用價值的長鏈管理,探索包括數據檔案化(數據態→數字態→模擬態)、數據故事化(數據態→知識態→價值態)在內的實現路徑。《最高人民法院關于民事訴訟證據的若干規定》提到“以檔案管理方式保管的”電子數據,人民法院可以確認其真實性。由此可見,在價值定位上,檔案的證據價值得到了證據法相關法律法規的確認和認可。而在實際操作中數據檔案化通常需要按照事先約定的證明模板將離散的數據整合成語義連續且被認可的原件形式,如成績數據庫生成的成績單、銀行系統開具的存款證明等。知識化和故事化的利用服務則需要層級豐富的檔案數據基礎設施與專業分化的協同支持才能實現。
(三)需要協同數據管理與檔案管理
數據態對象是業務前端技術環境變遷的直接結果,大量數據驅動類系統和應用最大限度地提升了業務數據的共享集成水平,也在相當程度上模糊了傳統前端與后端的邊界。與此同時,伴隨而來的技術復雜度也導致原先集中在特定物理空間(如辦公室)中的文檔管理職能在數字空間中的延展和離散,這都使得“文檔一體化”之類的協同理念在數據態環境中面臨巨大挑戰。協同不是簡單的交互和接口,追求的是各要素的整體性和柔性效果。如數字態環境下提倡的“文檔一體化”與此處論述的數檔協同在理念上是一致的,但在協同精細度上二者存在明顯差異。傳統的“文檔一體化”協同對象是非結構化的文件與檔案,實現方式依靠規范的元數據接口、協調的收發設置、通用的文件格式等相對硬性的協同手段;數據態管理模式協同對象是顆粒度趨于最小化的各類數據,要進行數據質量、數據標準、數據權限等治理層面的要素全方位對接,需要更多潤物細無聲的規則與操作。
由于涉及治理層面,數據管理和檔案管理之間需要在管理主體、方法、理論等多方面加強協同,這是當前乃至今后一段時間數據態檔案管理模式的難點與重點。譬如,深化數據與檔案的概念協同,梳理數檔協同管理的多元路徑,探索數據態管理相關主體間的協同模式,實現包括檔案部門、數據管理機構、第三方服務平臺、云服務商、業務部門、信息部門等在內的跨領域跨部門協同。
(四)需要彌合兩個離散的技術能級
數據態是所有資源空間中離散程度最高的態別,即信號離散(第一離散)與語義離散(第二離散),在面向人進行證用服務時需要相應的解除依賴能力。由于離散性質不同,可以將所需要的技術范疇分別視為兩大技術能級。其中,解決第一離散問題的技術能級包括傳統的數字保存手段和較為完善的軟硬件運維能力等;解決第二離散問題的技術能級則是基于特定數據態對象的語義解析和彌合能力,通過搭建語義臺階彌合離散數據,使檔案資源對象躍遷為可理解的知識對象和價值表現,包括本體建設、關聯數據、知識融合等具體技術。因此,數據態所依托的語義基礎設施客觀上需要能夠更精確地表達依賴關系,需要運用更為專業的工具和方法。
顯然,數據態檔案管理模式需要相對厚實的技術能力作為支撐,要求具備彌合兩個離散的技術能級,尤其要滿足數據態對象脫離原生環境后用戶可理解性的要求,構建相關行業專家深度合作形成的專業小生態,包括檔案專家指導數據歸檔及長期保存、數據管理專家指導數據質量維護與數據利用開發、業務專家指導數據解讀與語義呈現,滿足特定數據態對象全生命周期管理的各類技術需要。對于數據態檔案管理模式而言,其技術能力的挑戰并不來自是否能及時把握技術前沿或者攻克技術難關,而是對于技術的了解是否能夠支持客觀審慎的評估的形成,在面對供應商的方案時是否有能力進行獨立判斷,形成平衡安全、收效、成本的選型決策。另外,在促進數據態檔案對象向知識態等高級態別躍遷的過程中,可能會涉及潛在的安全與隱私問題,即使數據體本身不涉密、不包含隱私信息,但是在知識融合推理形成新的數據洞察之后,可能就會產生預料之外的隱私問題,這使得數據安全和隱私保護的難度再度提升。
在深化檔案信息化戰略轉型、推動檔案工作走向現代化的背景下,檔案部門需要以“空間觀”的戰略視野把握資源形態演變趨勢,洞察數據態新檔案對象雙重離散本質及其帶來的業務流程與規則變化,在現實管理環境中進行理論重塑和實踐重構,形成以體系性、連續性、可理解性和專業性為特征的數據態檔案管理模式,應對維系“三可”特征、兼顧證用價值、協同數檔管理、搭建技術能級的挑戰,最終解除離散語義帶來的高階邏輯依賴,在檔案對象管理空間中恢復數據的連續語義,為檔案數據資源開發利用奠定良好基礎。
*本文系國家社會科學基金項目“數據態環境下檔案管理模式創新研究”(23BTQ108)的階段性研究成果。
注釋及參考文獻:
[1]趙生輝,胡瑩,黃依涵.數據、檔案及其共生演化的微觀機理解析[J].檔案學通訊,2022(2):4-12.
[2]陳永生,楊茜茜,王沐暉,等.基于互聯網政務服務平臺的文件歸檔與管理:記錄觀[J].檔案學研究,2019(3):16-23.
[3]金波,添志鵬.檔案數據的內涵與特征探析[J].檔案學通訊,2020(3):4-11.
[4]劉越男.數據治理:大數據時代檔案管理的新視角和新職能[J].檔案學研究,2020(5):50-57.
[5]趙躍,孫晶瓊,段先娥.檔案化:檔案科學介入數據資源管理的理性思考[J].檔案學研究,2020(5):83-91.
[6]錢毅.技術變遷環境下檔案對象管理空間演化初探[J].檔案學通訊,2018(2):10-14.
[7]錢毅,劉力超.數據庫電子文件歸檔與長期保存技術路徑研究[J].檔案學研究,2017(4):67-72.
[8]王強,高強.業務系統數據歸檔研究——以中國石油業務系統數據歸檔實踐為例[J].浙江檔案,2019(12):36-39.
[9]楊建梁,劉越男,祁天嬌.文檔數據化:概念、框架與方法[J].中國圖書館學報,2022,48(3):63-78.
[10]錢毅.數據態環境中數字檔案對象保存問題與策略分析[J].檔案學通訊,2019(4):40-47.
[11]夏天,錢毅.面向知識服務的檔案數據語義化重組[J].檔案學研究,2021(2):36-44.
[12]房小可,王巧玲.檔案著錄、知識關聯與社會記憶重構[J].檔案學通訊,2021(03):27-33.
[13]段榮婷,夏子涵,王昊.檔案著錄關聯數據化實現研究[J].檔案學研究,2021(04):100-110.
[14]新京報.劉烈宏:釋放數據要素價值,是把握發展機遇的重點[EB/OL].(2024-01-07)[2024-03-24].https://baijiahao. baidu.com/s?id=1787433965437256213&wfr=spider&for=pc.
[15]錢毅.破析與融合——析檔案資源形態與語義表現相互作用的U型曲線現象[J].檔案學研究,2022(04):108-115.
[16]錢毅,潘潔敏.基于模型視角的檔案對象連續空間演化路徑[J].檔案學通訊,2024(2):4-12.
[17]LOTAR(Long Term Archiving and Retrieval).LO? TAR standards[EB/OL].[2024- 03- 24].https://lotar- interna? tional.org/lotar-standard/.
[18]Digital Information LifeCycle Interoperability Stan? dards.SIARD(SoftwareIndependentArchivingofRelationalData? bases)[EB/OL].[2024-03-24].https://dilcis.eu/content-types/ siard.
[19]Holistics.DBML- Database Markup Language[EB/ OL].[2024-03-24].https://dbml.dbdiagram.io/home/#intro.
[20]曾薩,黃新榮.WARC標準推廣策略研究[J].圖書館,2019(6):81-87.
作者單位:1.中國人民大學信息資源管理學院2.中國人民大學電子文件管理研究中心3.多模態檔案保護與開發國家檔案局重點實驗室