
摘 要:檔案文獻遺產內容信息豐富,具有重要的開發價值。數據以數字化為基礎,能夠實現對檔案文獻遺產的深度開發。文章從數據化與檔案文獻遺產保護開發的理論邏輯與現實邏輯契合點入手,探究目前數據化手段應用于檔案文獻遺產開發在主體、客體和環境方面存在的難點,進一步從多元主體協同、客體資源整合、構建可持續發展環境體系等方面提出針對性的方向,探討用數據化手段實現檔案文獻遺產可持續發展的進路。
關鍵詞:檔案文獻遺產;數據化開發;信息價值;內容開發
隨著數字人文、智慧檔案館、云計算、人工智能以及大數據等“數據”驅動因素不斷發展,檔案行業也逐漸實現數智化轉型。2021年,中辦國辦印發《“十四五”全國檔案發展規劃》,指出要“加快推進檔案信息化建設,引領檔案管理現代化”,推動檔案全面納入國家大數據戰略。檔案文獻遺產指的是歷史上遺存下來的具有一定歷史、文化、藝術、科學、技術或社會價值的檔案文獻。檔案數據化則是對其開發利用的有效手段,以用戶需求和業務需要為導向,將數字檔案資源轉換為可供閱讀、分析和處理的檔案數據資源,實現檔案利用價值的深度挖掘,有助于突破檔案信息資源深度開發瓶頸、創新以需求為導向的檔案服務模式。
目前,學界對檔案文獻遺產數據化開發的探討主要集中在四個方面:一是利用數字化技術對檔案文獻遺產的信息資源整合;二是直接從數據建設角度切入,利用數字技術實現檔案文獻遺產數據收集與數據庫的全面建設;三是介紹國內外檔案文獻遺產數據化典型案例,以提供經驗借鑒;四是對檔案文獻遺產的元數據管理和利用的探討。
現有研究較好地結合了技術因素、經驗推廣等方面對檔案文獻遺產數據化保護展開探討,也開始關注檔案資源數據庫的縱深建設、檔案文獻遺產元數據的管理利用,但并未針對檔案文獻遺產數據化管理和開發等問題進行系統全面的介紹。我國檔案文獻遺產獨具特色,數據化工作的應用需求和現實困境凸顯。
基于此,本研究梳理檔案文獻遺產數據化開發的邏輯,結合實際闡明當下檔案文獻遺產數據化開發的難點,針對難點所處時空場景提出數據化靶向性方向,以期做好檔案文獻遺產的開發和傳承工作,保護歷史文化遺產,滿足社會需求。
一、檔案文獻遺產數據化開發的邏輯
1.數據化開發的理念符合檔案文獻遺產的開發要求
檔案數據化可以看作以檔案價值挖掘、滿足檔案受眾需求為宗旨,以數據思維為意識形態引領,將數字檔案資源轉換為可供閱讀、分析和處理檔案數據資源的過程。
我國檔案文獻遺產的載體形式多樣,各具特色。一方面,囊括了各種形式和特點的載體;另一方面,涉及的內容非常豐富,包括政治、經濟、文化、宗教、外交等多領域。從時間維度上來看,從西周到近代20世紀,橫跨中國2000多年的歷史;從語言文字維度看,其中不乏用古漢語或少數民族文字書寫的檔案文獻。可見,檔案文獻之間的差異大、開發難度大,且具備極大的存儲記憶價值。將其存儲的記憶內容實施數據化轉化,開發其內容信息和知識價值,進一步開展文化創新,不僅是檔案文獻遺產開發的要求,還符合數據化開發的邏輯。
2.檔案文化遺產的數據化開發利用實踐彰顯數據化開發效果
檔案文獻遺產數據化的實踐成果彰顯了數據化的效能,以CyArk國際組織聯合谷歌開展的開放遺產項目(Open Heritage)為例,其以3D建模數據的形式重現文化遺產景觀,能夠為我國數據化工作提供先導經驗。
在資源建設及技術層面,該項目綜合多元技術創建文化遺產模型數據,聚焦于文化遺產的3D數據化及數據保存。在開放利用層面探討面向公眾的數據集開放形式。OpenHeritage 3D網站中設置了數據集檢索板塊,提供文化遺產3D數據集的項目名稱、所屬國家等基本信息,用戶可以通過瀏覽項目清單或者利用關鍵詞檢索。其中,檔案部門大多已被咨詢者或資源提供方的角色參與。可見,該項目從資源建設、公眾利用以及檔案部門的角色定位等方面為我國圖情檔案領域參與文化遺產數據開發提供了多層次借鑒意義,彰顯了數據化效能,提供檔案文獻遺產數據化開發的方向參考。
二、檔案文獻遺產數據化開發難點
1.數據化開發主體開發條件不足
(1)不同地區主體信息化差異明顯
檔案文獻遺產涉及范圍大,涵蓋地區多,地域間不同主體的信息化差異會導致全國檔案文獻遺產資源建設的均衡性失調,對檔案文獻遺產整體性的開發利用產生明顯的影響。
目前,地域間的信息化差異還涉及技術和基礎設施存在差異。部分地區檔案館已經完成了大規模的數字化工作,將檔案文獻轉換為電子格式并建立了相應的數據庫和信息系統,便于有效檢索和利用。而其他地區可能仍處于數字化轉型的初級階段,檔案文獻仍以紙質形式存在,信息化程度較低,限制了其開發利用的效率和范圍。
(2)各數據化主體之間協作程度低
檔案文獻遺產本質上屬于文化遺產的一部分,其來源不局限于檔案機構,還包括博物館、圖書館等公藏機構。機構間實現對接關聯,能夠形成檔案文獻遺產的知識島群和智慧海洋,促進檔案文獻遺產的整體性開發。
目前,有關檔案文獻遺產保護開發的項目主要以檔案行業為“牽頭人”。2000年, 國家檔案局啟動“中國檔案文獻遺產工程”,有計劃、有步驟地保護中國檔案文獻遺產;2006年, 重點實施“國家重點檔案搶救工作”。除此之外,圖書行業也采取了一定的措施。2011年,國家圖書館推出“民國時期文獻保護計劃”和“中國記憶”項目;2022年,組織申報2022年革命文獻與民國時期文獻整理項目,2023年發布“國家珍貴古籍名錄知識庫”。檔案行業和圖書行業推出的項目雖然不少,但大多數都局限在本行業內,行業間合作承擔的項目少,缺乏必要的合作經驗。
2.客體檔案文獻遺產數據化難度大
客體檔案文獻遺產數據化難度大體現在檔案文獻遺產客體受損和檔案文獻保存分散兩個方面。
目前,我國部分檔案文獻遺產由于不當自然和人為因素的影響,受損嚴重。以清代大金榜為例,清代大金榜形成于17世紀,由于保護條件不適,部分檔案存在著蟲咬及墨水浸漬的現象,損壞程度近50%,急需搶救保護。受損客體在數字化和數據化之前需要大量人力、物力修復,加大了檔案文獻遺產數據化的負擔。
檔案文獻遺產保存分散可能是戰爭、遷徙等歷史原因以及行政事務和機構改革造成的。2022年,第五批入選中國檔案文獻遺產名錄的檔案文獻遺產共55項,其中由博物館、圖書館、文化研究院、紀念館等機構獨立申報的有15項,兩家及以上單位聯合申報的6項,屬于多頭、分散管理的狀態,增加了資源整合的復雜性,限制了檔案文獻遺產數據化的深入性和全面性。
3.法規政策環境建設不足
在檔案行業領域,檔案文獻遺產保護的法律體系建設包括保護標準和法規體系。據不完全統計,從20世紀 90 年代到 2023 年,與檔案文獻保護技術有關的標準共計57 項,其中包括國家標準 25 項,行業標準31項,其他標準1項。在法規體系建設方面,保護檔案文獻遺產的法律依據主要是《中華人民共和國檔案法》,而《檔案法》并未對檔案文獻遺產做出專指性的規定,而是以“檔案”代稱,不具有專指性。除此之外,與檔案文獻遺產數據化直接相關的保護和數字化政策、數字資源共享政策建設不足,保障檔案文獻遺產數據化成果的知識產權保護政策、數據標準和互操作性政策缺失,無法為檔案機構和文化遺產保護機構提供必要的支持和激勵。
三、檔案文獻遺產數據化開發方向
檔案文獻遺產數據化開發路徑是由開發主體、開發客體體制環境三大要素構成并相互作用的有機過程,能夠反映出檔案文獻遺產數據化活動的融合通暢,如圖1所示。
1.多元主體協同:彌補數字化差距
數據化本身蘊含著跨界協同等跨越學科邊界的思想內核,數據化能夠融合資源提供方、技術方和研究方等多方力量,各主體取長補短,由檔案部門單打獨斗到多元主體合作參與的方向擴展。
首先,要明確檔案機構的定位,確定主導作用。一方面,檔案機構是保護規劃制定、項目發起和實施的主導者。例如,我國“中國檔案文獻遺產名錄”項目由國家檔案局建立和組織,在國家檔案局的帶領下,各省級國家綜合檔案館也開展了面向本省的珍貴檔案文獻遺產選拔工作;另一方面,檔案機構是數據化的資源提供者,要積極利用技術提供方的技術手段,活化館藏資源,彌補檔案機構的技術缺陷。
重視其他公共文化事業機構、科研機構、高校、企業以及社會公眾對檔案文獻遺產數據化所起到的作用。博物館、圖書館等其他公共文化事業機構和社會公眾能夠為檔案機構補充重要的檔案文獻遺產,是重要的資源互補主體;企業、科研機構憑借其技術、資金和人員優勢能夠發揮在數據化過程中的重要作用。社會公眾在享用檔案文獻遺產“活化”保護成果的同時,也以合作者或志愿者的身份參與保護,如基于“影谷項目”開放存取的“在線互動性”,公眾可以在獲取檔案資源的同時,自主創建標簽和筆記,實現數據化檔案文獻遺產的共建共享。
2.分散客體整合:數據化整合檔案文獻遺產
檔案文獻遺產作為歷朝歷代的重要文獻記錄,其信息內容蘊含著豐富的價值。對于其物質實體,要加強保護與搶救,對損壞檔案的修復技術做出探究。而要留住檔案文獻遺產最本質的內涵,就要從其信息價值入手,挖掘其內容蘊含的價值,并采取豐富多樣的形式表現出來。
一方面,做好基礎工作,建設檔案文獻遺產數字化資源體系。這種資源體系包括在檔案保護技術基礎上實現的實體檔案的數字化收集,并將“側面反映檔案形成及流轉的時空特質的信息”納入檔案數字化資源體系的建設,實現對檔案文獻遺產的全方位描述和多維揭示,為數據化做好數字資源的儲備;另一方面,在數據資源體系下對檔案文獻遺產的數據開發。在數字化資源層面,可以實現與博物館、圖書館等機構的合作,實現跨機構、跨地域的數據共享,通過資源主題聚類保證同一主題檔案文獻資源的全面性。在內容層面拓寬檔案文獻遺產整合的深度、廣度,依托語義描述、數據關聯等技術,深層次地開發與挖掘檔案文獻遺產的內容。
3.法規制度建設:構建可持續的保障體系
要根據多元主體、資源分散的現狀進一步完善法律法規體系建設,為檔案文獻遺產保護提供更為有力的法治保障。國家需要制定有關檔案文獻遺產保護的相關法律,明確檔案文獻遺產的價值、保護的目標和原則等。這些法律應當包括檔案管理法、文化遺產保護法、圖書館法、博物館法等,涵蓋不同類型的檔案文獻。此外,建立健全檔案管理體制和機構,設立專門的管理部門,制定相應的組織架構和管理體系,明確數據化檔案文獻遺產檔案的分類、整理、存儲、檢索等程序和標準。為檔案機構提供必要的資源和支持,包括人員培訓、設備設施等,確保檔案文獻遺產的保護與管理的效力。
除國內法律體制的建設之外,還要開拓國際視野,加強國際合作與交流,推動檔案文獻遺產保護的國際標準和合作項目,共享保護經驗和技術,提高本國檔案文獻遺產數據化保護的水平。
四、結語
“世界記憶遺產”的選拔熱持續,我國“中國檔案文獻遺產工程”有序開展,對提高社會各界保護檔案文獻遺產的意識起到了積極作用。但是,對于檔案文獻遺產的保護不應該僅局限于延續其實體生命的物理保護,還要探索發掘其內在價值、維持其長久生命力的保護方式——檔案文獻遺產的數據化。從開發主體到客體資源再到環境體系的構建,探討檔案文獻遺產數據化的難點和路徑,實現檔案文獻遺產的“內容開發”,信息服務方式由“傳統館藏提供”向“數據信息資源存取”發展,使檔案文獻遺產的內容信息價值得到充分釋放,助力檔案文獻遺產實現在數字時代的可持續發展。
參考文獻:
[1]黃天嬌,邱志鵬,于雯青.數字人文視域下南僑機工檔案文獻遺產開發路徑研究[J].浙江檔案,2021(10):21-23.
[2]周耀林,吳 化.數字人文視野下少數民族檔案文獻遺產數字化保護研究[J].檔案學研究,2022(05):123-129.
[3]黃霄羽,高 艷.檔案文獻遺產數據化開發的國外典型案例及啟示——以荷蘭GLOBALISE項目為例[J].中國檔案,2023(09):67-69.
[4]牛 力,黃賴華,賈君枝,等.本體驅動的檔案文獻遺產元數據設計與應用研究——以蘇州絲綢檔案為例[J].信息資源管理學報,2023,13(05):15-31.
[5]宋雪雁,梁 穎.面向專業用戶的檔案文獻遺產元數據質量標準研究[J].情報科學,2023,41(11):8-17.
[6]趙 躍.大數據時代檔案數據化的前景展望:意義與困境[J].檔案學研究,2019(05):52-60.
[7]周耀林,朱 倩.論我國檔案文獻遺產保護資源的共享[J].檔案管理,2013(02):19-20.
[8]鄭丹妮.基于信息空間理論的歷史檔案數據化及其生存模式研究[J].檔案管理,2018(03):9-12.
作者單位:山東大學
基金項目:2022年度山東省檔案科技項目“立德樹人視閾下高校名人檔案信息化建設及價值開發路徑研究”(2022-10)。
作者簡介:路云生(1979—),男,漢族,山東招遠人,講師,碩士,研究方向:檔案管理、教育史;陳萌雨(2003—),女,漢族,山東濰坊人,本科在讀,研究方向:檔案數據化;耿德良(1971—),男,漢族,山東金鄉人,碩士,副研究館員,研究方向:檔案管理、校史文化。