Abstract: This report focuses onthe archival technologyapplicationand innovation development in 2024.By analyzing the scienceandtechnologyprojectapproval,excelentsientificesearchesultsawardsoftheNationalAchivesAdmiistration, andarchivalscienceandtechologypatents,itisfoundthatteaplicationofrchivaltechnologiesinChinathisyarprsets a cuting-edgeanddeepdevelopmenttrend.Fromthe projecttheme,it iscloselyrelatedtothe14thFive-Year PlanNational ArchivesDevelopmentPlan,focusingonarchivaldataelectronicrecordsandother fields;theexcelentscientificrsearch resultsaward pays moreatention tothe appicationonthebasis ofthe theorycovering the archivedata governance,etc.; the patent authorization shows thatthe percentage ofpatented technologies used in archival management has increased.The electronicrecords management and single-set system are valued.Further analysis concluded thatthe archival technology applications andscenarioshotspots mainlyinclude sixaspectssuchasdata archival management technologyanditsaplication, the applicationof large language model for the development and utilization of archival resources,andthe value mining technologyofarchivedataelements.Atthesametime,relevantsuggestionsarealsoputforwardfortheproblemsexisting inthe development of archival technologies in China.
Keywords:ArchivalTechnology;TechnologyApplication;Technological Innovation;ArchivalScienceandTechnologyPatent
在《中華人民共和國檔案法》(下文簡稱《檔案法》)宏觀指導及《“十四五”全國檔案事業發展規劃》(下文簡稱《規劃》)全面落實的背景下,我國檔案工作數字化、智能化水平穩步提高,檔案技術應用與創新水平不斷提升,檔案科技事業正邁入全新的發展階段。為全面了解和分析2024年我國檔案技術應用與創新發展狀況和整體特征,本報告采用編碼統計、文本挖掘、主題網絡分析等方法,對國家檔案局科技項目立項、國家檔案局優秀科技成果獎、檔案科技專利和典型技術應用情況進行分析。
12024年度國家檔案局科技項目立項分析
國家檔案局檔案科技項目立項是我國檔案技術應用及創新發展的重要風向標。2024年2月27日,國家檔案局發布了《2024年國家檔案局科技項目立項選題指南》。該指南緊密貼合當下檔案事業發展的新形勢與新需求,詳細列出了檔案治理體系、檔案資源體系、檔案利用體系、檔案安全體系和檔案信息化建設五個方面的選題方向,并提出了十個重點項目選題,為本年度的科技項目選題提供了方向性指導。同年6月25日,國家檔案局科技信息化司公示了2024年度科技項目擬立項情況:100多家單位承擔的108項科技項目被批準立項,其中常規項目98項,重點項目10項。
圍繞科技立項項目主題,本報告建立了以二元詞組和關鍵詞為主體的主題詞表,結合人工編碼的方式,確定了相關主題詞,通過文本分析工具對主題詞的詞頻進行了統計,并進一步通過詞云的方式進行了可視化。
從圖1可知,2024年國家檔案局科技項目的主題詞涵蓋了檔案數據、電子文件、檔案管理、人工智能、數據安全、開發利用、體系構建等。相關主題涉及大數據、數字化實驗實訓、版式文檔格式轉換、知識圖譜、電子文件、人工智能等檔案數據開發相關技術以及檔案管理技術。與2023年相比,2024年的項目主題呈現出四個顯著特點:一是對新興技術應用的拓展與深化。2024年不僅延續了2023年對人工智能等技術在檔案領域應用的關注,還進一步拓展到更多細分場景和新興技術融合。如2024年出現了將人工智能用于修復字跡涸化擴散檔案、企業檔案多模態信息智能管理大模型等更具針對性和創新性的應用研究。二是對多元檔案資源保護與開發的全面升級。2024年在檔案資源的關注范圍上更加廣泛,除了延續對紅色檔案資源開發利用的重視外,文化遺產和非物質文化遺產的檔案保護與利用也成為重點。三是對檔案數據安全與治理的高度聚焦。隨著數字化轉型的深入,2024年更加突出檔案數據的安全管理和治理。這反映出在數據時代,檔案管理對數據安全這一關鍵要素的高度重視,以保障檔案數據在數字化環境下的可靠存儲、利用和共享。四是檔案管理智能化與服務創新的協同發展。2024年檔案管理的智能化和智慧化趨勢更為明顯,且與檔案服務創新緊密結合。
為了進一步探究國家檔案局科技項目立項項目主題之間的關聯和分類,本報告采用主題共現網絡分析方法對立項主題進行了分析。具體來說,在主題詞表的基礎上,進一步根據主題詞與主題詞在同一個題目中出現的頻次,構建了主題共現矩陣,并基于該矩陣構造了主題共現網絡。為了便于觀測核心主題之間的關聯,本報告采用K核分解法對網絡進行分解,形成了科技項目主題網絡的核心網絡。為了進一步對主題關系進行量化分析,本報告采用網絡社群發現的相關方法,基于共現關系對主題詞進行網絡聚合(見圖2)。結果發現,2024年度國家檔案局科技項目立項主題主要分為四類:第一類以檔案數據為核心,涉及檔案數據治理、服務、安全、標準等問題,該類別在整個主題網絡中處于中心位置,說明該主題在本年度的檔案科技項目中是一個相對核心的主題,這也與上文主題詞詞頻分析的結果相互印證。第二類以檔案資源的建設與應用為核心,涉及檔案數字化建設、人工智能模型構建及智能化技術等,在主題網絡中也占據重要地位。第三類以電子文件(檔案)為核心,關注電子文件(檔案)的歸檔和管理,同時著重強調單套制管理模式下電子檔案的證據效力維護、質量控制等問題。第四類以檔案資源服務創新為核心,開發利用各類檔案資源,構建資源庫并開展編研,同時搭建平臺,借用大模型新技術實現便捷、個性、智能服務,滿足多元需求。

22024年度國家檔案局優秀科技成果獎分析
國家檔案局優秀科技成果獎是國家檔案局為了鼓勵在推動檔案科學技術發展中做出重要貢獻的單位和個人而設立的檔案科技獎項。獲獎成果是體現本年度具有創新性、實用性、可推廣性,高科學水平和技術難度,以及顯著社會效益和經濟效益的檔案科技成果。2024年度共有25個科技成果獲得國家檔案局優秀科技成果獎。其中,一等獎2項,包括“超大型跨海集群工程交通建設項目電子檔案全域管理體系及成套關鍵技術研究與應用”等;二等獎7項,包括“人工智能技術在音視頻檔案數據治理工作中的應用研究”等;三等獎16項,包括“館藏檔案內容結構化分析及知識化應用研究”等。
圍繞檔案優秀科技成果獎獲獎成果的主題,本報告采用主題共現網絡分析方法進行分析。由圖3可知,2024年度國家檔案局科技成果主題主要分為三類:第一類是圍繞檔案管理體系及資源建設的相關成果,主要包括電子檔案全生命周期單套制歸檔體系研究、數字人文技術在檔案資源開發與保護中的實踐、人工智能助力檔案資源專題知識庫構建等。第二類是圍繞電子文件管理歸檔技術及系統的相關成果,主要包括人工智能與檔案管理的結合、電子檔案全域管理體系及成套關鍵技術的研究與應用、區塊鏈技術及多模態檔案檢索技術研究等。第三類是圍繞檔案館建設的相關研究成果,主要包括智能檔案管理系統建設研究、檔案數據智能開放鑒定及審核研究、館藏檔案內容結構化分析及知識化應用研究、基于全程管控的檔案智慧治理及專題數據庫建設方法研究等。綜合分析可看出,2024年度國家檔案局優秀成果獎的獲獎成果更多地集中在電子文件管理、人工智能助力檔案資源開發以及數字技術應用檔案館綜合建設三個領域,基本符合2024年度檔案局科技項目的立項要求。
32024年度檔案科技專利分析

科技專利是一個領域技術發展的重要體現,也是整個社會對該領域的技術需求和關注點。本報告選取2024年授權公告的專利作為分析對象,通過在專利數據庫檢索并采集了共計2013項與檔案技術相關的專利。其中,外觀設計專利161項、實用新型專利1226項、發明專利626項。結合專利分析的相關方法與工具,本報告對專利的題名、摘要、分類、所在區域、所屬機構等數據進行分析,以期深入揭示2024年度我國檔案技術應用及創新的主題分布特征、區域發展特征和機構類型特征,從而更好地把握和解讀我國檔案技術應用及創新的實踐規律。
3.1區域發展及機構人才特征
圍繞區域發展特征,本報告分析了檔案科技領域專利在我國各省、自治區、直轄市的數量分布情況。一般來說,申請專利數量越多的省份,對該領域有足夠的重視程度,或擁有一定的優勢。2024年省級行政區域的檔案科技專利授權規模呈現明顯的“東高西低”的整體特征,華東地區檔案科技授權專利數最多,其次是華南和華北地區,再次是華中、東北、西南地區,這種分布形態與我國經濟發展的空間特征以及人口分布有著一定的關聯,也在一定程度上說明了檔案科技的發展需要以經濟和人才為基礎和支撐。此外,2024年我國檔案技術專利授權規模最多的五個省份(山東、廣東、江蘇、浙江、北京),共計獲得授權專利770項,占全國檔案科技專利授權數的 63.77% 。結合2024年的專利授權情況來看,上述省份基本形成了檔案科技研發的人才隊伍和檔案技術應用的市場需求,檔案技術在上述省份更有可能實現突破和創新。
本報告圍繞檔案科技專利申請機構和人才發展特征,進一步分析了該領域授權專利的申請人類型分布和申請人數分布情況,并根據不同類型申請人的授權專利數量進行深入分析。相較于2023年,2024年各類申請人的申請數量排序基本一致,企業和社會組織申請占比略有升高,個人和院校申請占比則略有降低。其中,企業的授權專利數最多,這是由于企業對于檔案技術有著直接的研發和應用需求,在檔案科技專利申請方面比較重視。一般情況下,某個機構所申請的相關專利涉及發明人數量越多,說明該申請人在該領域掌握更多的高級人才,具有絕對的優勢,因此本報告進一步統計了各企業檔案科技授權專利所涉及的發明人數。據統計,在2024年的企業檔案科技專利申請中,吉林銀瑞信息技術服務有限公司以15項發明領先,顯示了其在該領域的領導地位,緊隨其后的是浙江星漢信息技術股份有限公司和江蘇迅捷裝具科技有限公司,分別擁有13項和12項發明。與2023年相比,2024年的前十名中出現了更多的信息技術服務公司和科技公司,這反映了檔案科技領域正逐漸向數字化和智能化轉型。據相關數據顯示,專利申請相對集中于少數企業,這表明這些企業在檔案科技領域具有較強的技術積累和市場競爭力。此外,2024年的前十名中沒有出現高等院校,說明高校更重視科研項目、論文成果,忽視了專利成果,這種傾向不利于推進檔案技術應用與創新。同時,這也進一步凸顯了企業在檔案科技專利申請中的主導地位。檔案科技領域的專利申請活躍度可能預示著該市場的巨大潛力和快速發展的趨勢,隨著數字化轉型的推進和信息技術的不斷進步,檔案科技領域有望吸引更多的研發投入、激發更多的創新活力。
3.2主題分布特征
本報告通過對檔案科技專利的題名、摘要、技術關鍵詞進行分析,以統計、抽取、編碼、篩選、建模等方式,獲得專利的主題詞并對主題進行共現分析(見圖4)
利申請的重要領域,這體現了對提高檔案管理效率、促進檔案數字化和智能化的持續追求。這些技術的發展有助于實現檔案管理的自動化和智能化,提高檔案的可訪問性和安全性。總的來說,2024年的檔案科技專利主題分布揭示了檔案存放設備、檔案管理系統、電子檔案管理技術以及智能化和自動化解決方案的持續重要性。這些趨勢不僅反映了檔案管理行業對提高管理效率、保障檔案安全、促進數字化轉型和應用新技術的不斷追求,也顯示了對檔案存放設備設計與研發的特別關注。
為了進一步探究檔案科技專利主題之間的關聯和分類,本報告采用主題共現網絡分析的相關方法對專利主題進行分析并構造主題共現網絡。為了進一步對主題關系進行量化分析,本報告采用網絡社群發現算法對主題詞進行網絡聚合。
由圖5可知,2024年度檔案科技專利可以分為兩大主題:一是檔案存放設備相關主題,這一主題依然占據主導地位,表明此類專利在2024年的高研究熱度。圍繞檔案柜、檔案盒、檔案架等存放設備及其部件,形成了龐大且突出的主題區域。此外,檔案存放設備數字化、機械化特征愈發凸顯,旨在提升檔案存放的便捷性、空間利用率和安全性。這一主題更聚焦于檔案管理實際業務中存放設備的創新設計與技術升級,與國家檔案局科技項目立項多聚焦于檔案應用、數據等宏觀層面形成鮮明對比,致力于解決檔案存儲過程中的具體問題。二是電子檔案與智能化管理技術主題,其廣度和深度較2023年均有拓展,電子檔案管理系統的研發正朝著與人工智能、大數據等技術深度融合的方向發展,如通過計算機程序實現電子檔案的智能分類、檢索以及利用大數據分析挖掘檔案價值等。同時,智能化和自動化貫穿檔案管理全流程,涵蓋數據采集、處理、存儲、利用等環節,側重于前沿技術在電子檔案管理中的應用創新以及實際操作層面的技術解決方案,以提升電子檔案管理的效率、安全性和可利用性。總體來看,2024年檔案科技專利主題在延續2023年部分方向的基礎上,更加注重新技術的融合應用以及對檔案管理實際業務問題的針對性解決,充分展現了檔案科技領域不斷創新和發展的態勢。
4檔案技術應用與場景熱點討論
4.1數據檔案化治理技術及其應用
在數字化轉型的大背景下,數據檔案化治理成為檔案事業發展的關鍵領域。面對數據量的爆發式增長和對數據管理要求的不斷提高,如何運用先進技術實現數據的有效治理,成為研究的重點方向。[]數據檔案化治理旨在將檔案學理念融入數據管理,確保數據的長期保存、安全性和穩定性,為各領域決策和發展提供有力支持。
在數據檔案化治理技術的研究與實踐中,相關成果不斷涌現。2023年,杭州易康信科技有限公司攜手嘉興市檔案部門深入推進檔案數字化改革,采用“數據級 + 文件級”存證方式,制定樣表規范采集項,實現了現役原生業務系統連續性歸檔,并采用區塊鏈和數字摘要等技術數據存證,保障數據可靠合規。[2]嵊州市的“個人全生命周期數據檔案化治理”項目,創新應用大數據技術,通過統一標準、代碼和建模,搭建智能算法對歸集的數據進行驗證和加工,建立個人數據專題檔案庫。[3]王強等學者在結構化數據歸檔方面提出了根據業務對象組織數據體的歸檔路徑,并以石油天然氣勘探開發結構化數據歸檔實踐進行驗證。在這一過程中,運用ETL工具進行數據抽取,將關系型數據庫轉換為XML格式存儲,以降低軟件依賴性,確保數據能夠有效歸檔與長期保存。[4]
盡管數據檔案化治理技術取得了一定進展,但仍面臨采集標準規范缺乏、存證技術不成熟、“數據孤島”現象普遍等問題。在未來,應著重加強標準規范建設,統一數據采集、存儲、利用等環節的標準,確保數據的一致性和互操作性;深化技術創新,持續探索人工智能、區塊鏈等新技術的應用,提升數據管理的智能化水平和安全性。
4.2面向檔案資源開發利用的大語言模型應用
《規劃》強調:“檔案工作環境、對象、內容發生巨大變化,迫切要求創新檔案工作理念、方法、模式,加快全面數字轉型和智能升級,積極探索知識管理、人工智能、數字人文等技術在檔案信息深層加工和利用中的應用。”大語言模型(LargeLanguageModel,LLM)作為參數量級在十億及以上的大型預訓練語言模型,在自然語言理解、知識發現、邏輯分析處理等方面具有顯著優勢。在大規模文本語料數據庫和自監督預訓練技術的加持下,大語言模型為人工智能領域的研究帶來了革命性的變化,現已成為各領域的研究熱點,同時也使得檔案資源開發利用具有良好的發展前景。
我國檔案學界面向檔案資源開發利用的大語言模型應用展開了廣泛的研究。李根在梳理大模型技術特點的基礎上,分析其在圖情檔領域的應用現狀,并圍繞領域知識庫構建、大模型與知識庫融合的問答、檔案知識可視化、問答質量評估等關鍵技術進行深入探討。[5]牛力等從大模型核心技術出發,分析檔案工作數智轉型現狀、大模型實踐場景和理論研究,明確大模型技術嵌入檔案工作的必要性和可行性,并結合CVP技術棧思想提出知識空間檔案工作“大模型 + ”技術嵌入框架,探索檔案知識“收管存用”新模式。[傅予等從數字人文視角關注數字化開發傳播的深層效果,系統性探究深層與表層效果影響機理的異同,在大語言模型等新興技術的加持下,從文化信息分析的三個階段進行方法改進,并為文化資源數字化開發和傳播實踐提供科學參考和有力支撐。[7]劉文俏的研究則深入探討大模型技術賦能古籍檔案文化遺產數字化保護與利用的路徑設計,并站在理論與實踐相結合的高度,充分挖掘大模型技術在傳統檔案文化遺產保護與傳播中的變革性作用,為推動古籍檔案資源保護和文化創新利用提供有力的技術支撐。「8]徐擁軍在探討2023年中國檔案學研究現狀、特點及發展趨勢時認為,數智轉型的大趨勢也為檔案學拓展出多元研究空間,檔案學科與新興信息技術大模型等不斷疊合交融,為推動理論邊界的拓展和應用實踐的豐富作出重要貢獻。[9]
盡管現有研究針對大語言模型技術在檔案資源開發利用領域取得了較多的分析性成果,但是研究依舊停留在較為初級、淺層、非技術的階段。而人工智能領域的發展日新月異,亟待學者緊跟技術前進的步伐,堅持檔案工作主體地位,開發出真正面向檔案管理與資源開發的大語言模型技術。
4.3檔案數據要素價值化挖掘技術
在數字化浪潮下,數據成為關鍵生產要素,深度融入經濟社會各領域,檔案領域也受其影響。檔案數據要素成為研究與實踐焦點,其海量增長成為檔案資源新形態和管理新對象。[10]檔案數據要素價值,指檔案數據作為經濟、管理、知識、文化、生態等特色要素,能支撐經濟運行、行政決策、知識創新、文化傳承以及生態和諧。國家高度重視數據要素發展,《“數據要素 × ”三年行動計劃(2024—2026年)》《國家數據基礎設施建設指引》等發布出臺,為檔案數據要素的價值化發展提供了政策支持。在此背景下,檔案數據要素價值化挖掘技術的研究與應用意義重大。
檔案數據要素價值化挖掘,旨在從海量檔案數據中提取有價值的信息,且轉化為可利用的資源。2023年中國文化研究院推出“與抗日戰士AI對話平臺,該平臺運用AI、配音、語音合成及3D立體采樣等技術,根據口述檔案合成可互動的虛擬老兵,為香港學校開展愛國主義教育提供創新途徑。[11]2024年,甘肅省科學院應用自主研發的多光譜圖像超高分辨率采集設備,完成館藏大寶積經等珍貴檔案數字采集,并運用多維度數字資源信息深度挖掘算法,推動檔案的深度開發與利用。[12]黎安潤澤等認為,通過語義挖掘、知識圖譜、機器學習等技術,對企業檔案數據進行細粒度開發利用,可釋放其價值潛能。[13]張達提出將區塊鏈技術與IPFS的分布式存儲技術結合,可解決師德檔案信息數據在存儲、共享和安全傳輸中的問題。[14]
當前檔案數據要素價值化挖掘技術的研究進展呈現出多技術融合、注重實際應用場景和強調數據安全的特點。未來,技術發展將聚焦智能化知識發現、深度化語義關聯與跨域協同共享三大方向,推動檔案數據從靜態資源向動態生產要素轉化,為數字中國建設提供基礎性戰略資源支撐
4.4智能化技術在檔案開放審核中的深化應用
檔案開放審核工作是各級國家綜合檔案館的一項基礎性業務工作,是檔案資源從保管到利用必要且關鍵的環節,也是檔案資源走向開放的前提和保障。《檔案法》在檔案開放方面提出了更高的要求,積極探索檔案智能開放審核,有助于解決當前檔案開放審核滯后的問題,對提高檔案開放審核效率和檔案利用水平意義重大。
北京市昌平區檔案館積極建設輔助鑒定系統,構建“人工智能 + ”檔案開放審核模式。該館建立了具有館藏特色的鑒定詞庫及成果模型,能夠實現對館藏數據敏感詞的快速匹配。[15]卞咸杰的研究通過分析敏感詞識別技術與方法,從理論上構建了基于大模型與多模態訓練的敏感詞庫,通過系統架構設計、數據庫設計、界面設計等,實現檔案開放智能審核中敏感詞的自動化、智能化處理,以增強檔案信息的安全性和可靠性。[16]聶博馨等在研究中探討利用人工智能、大語言模型以及自然語言處理技術,構建一個基于自然語言處理的綜合檔案館檔案分級開放審核機制與應用程序,以期提高檔案開放審核的效率與準確率,促進檔案管理工作的智能化發展。[17]劉越男等針對當前智能檔案開放審核所面臨的挑戰,即智能開放審核規則構建依據不清、訓練數據可獲取性不強、審核結論可解釋性不足等問題,提出基于大語言模型的檔案開放審核任務框架,并設計具體實施的技術路徑,強調通過提示工程引導大模型完成復雜多樣的檔案開放審核任務。[18]
當前AI輔助檔案開放審核的工作實踐成效顯著,不少檔案館將自然語言處理、深度學習等智能技術融入開放審核流程,有效提升了審核效率,但該領域工作仍處于起步探索階段,檔案智能開放審核目前依舊面臨著巨大挑戰,在體制機制、技術獨立、人才隊伍等方面仍存在諸多亟待解決的問題。在未來,應持續推進檔案開放審核等工作的智能化、數智化,助力檔案信息化建設,實現檔案領域的數字化轉型、智能化升級。
4.5自主可控的電子檔案真實性保障技術
在數字化轉型加速的當下,電子文件單套歸檔與電子檔案單套管理成為檔案管理重要趨勢。隨著電子文件、檔案的廣泛應用,其真實性保障成為檔案管理領域的熱點議題。[19]電子檔案的真實性是指其內容始終保持與最初形成文件時的原始狀態一致,未被篡改、偽造或濫用。這一特性是電子檔案作為可靠信息資源和法律證據的基礎。因此,如何通過技術手段和管理措施確保電子檔案的真實性,成為檔案管理實踐中亟待解決的關鍵問題。
在該領域,諸多成果涌現。山東省檔案館開展“基于政務云的統一政務數據和電子文件歸檔體系建設研究”項目,探索使用區塊鏈技術,在電子檔案證據保全系統中實現電子檔案全流程真實性驗證[20]許振哲分析了數字摘要、時間戳、電子簽名、區塊鏈等技術在電子檔案真實性維護中的應用,提出將數字摘要技術與離線歸檔模式相結合的復合型檔案真實性維護路徑。[21]丁海斌等針對電子印章“去技術化”問題,提出在電子文件歸檔前將電子印章相關信息轉化為管理元數據,并利用輕量級區塊鏈技術強化安全管理的解決方案。[22]夏天等構建了銀行數字函證歸檔策略體系框架,運用區塊鏈、數字摘要等技術保障銀行數字函證歸檔的真實性和完整性。[23]
未來電子檔案真實性保障技術將朝著更加智能化、高效化、自主可控的方向發展。隨著人工智能、量子計算等新興技術的發展,電子檔案真實性保障技術須不斷創新和完善,以應對新的挑戰。
4.6文化遺產多模態知識服務技術
國家對文化遺產的重視和保護程度在日益提升,通過檔案載體將其記錄,并以數字化形式長久保存,形成大量文化遺傳數字檔案資源。數字時代,檔案資源形態逐步從單一模態向文字、圖像、音頻、視頻等多模態轉變。文化遺產的開發利用與保護迫切需要在融入新興技術的同時提供多模態檔案資源的知識服務,以最大限度實現文化遺產檔案資源的價值。
基于此,王曉光等從文化遺產信息資源、敘事性架構、數字化呈現、系統本身的功能建設和知識服務等層面,打造文化遺產數字敘事信任模型,以提升文化遺產的數智化活化利用水平、文化遺產內容的深度挖掘、敘事內容的創意演繹、文化內涵的有效闡釋與呈現等,助力文化遺產數字化轉型發展。[24]鮑志芳等從數字人文視域出發,注重對非遺數字檔案價值的深層挖掘,并提出以資源為基礎、知識服務為目標、用戶需求為導向的知識服務原則,以期豐富社會記憶并推進非遺檔案智庫建設。[25]王玉等基于檔案文獻遺產領域數字技術應用于知識服務略顯不足的現狀,依據本體和圖譜建構設計出數據驅動的檔案文獻遺產價值挖掘與活化方案,從數據抽取、知識組織、知識發現到價值表達等面向知識服務提出可行活化路徑。[26]周樹斌等立足非遺資源的數字化保護和傳承需要,對多模態非遺數字資源的知識內涵進行細粒度挖掘和語義關聯建構,引入本體構建面向茶類多模態非遺數字資源語義描述模型,為非遺領域跨場景、跨時空、跨資源的多維組織與融合應用提供借鑒,也為非遺系統性保護的數字化方案提供一定參考。[27]
文化遺產數字資源知識內涵豐富,應在現有研究基礎上對知識粒度作進一步細化,并結合最新的技術方法從更廣泛的渠道去提取深層次、多維度、細粒度的知識內涵,推進文化遺產資源的開發利用與知識服務延展,使之實現創造性轉化與創新性發展。
5問題與建議
5.1問題
本報告認為,我國2024年度檔案技術及相關技術的應用取得了顯著進展,深度契合數智社會的發展趨勢。從國家檔案局科技項目立項主題及優秀科技成果獎來看,2024年度的立項主題緊密圍繞新時代檔案事業高質量發展需求,重點聚焦電子檔案與電子文件的管理和歸檔、多元檔案資源保護與開發、檔案數據化建設等。從2024年度我國檔案科技專利授權情況來看,檔案科技專利主題詞網絡中有關檔案管理方向的專利技術是最大熱點詞,其中電子檔案管理技術成為重要組成部分,反映出電子文件管理及單套制受檔案領域高度重視,且在實踐上有序推進。同時,檔案存放設備相關專利在數量上仍占據優勢,且數字化、機械化特征愈發凸顯,提升了檔案存放的便捷性、空間利用率和安全性。當然,2024年我國檔案科技事業在取得進步的同時,也存在以下問題:
一是新興技術與檔案科技事業融合不深入。盡管國家檔案局科技項目立項已對新興技術在檔案領域的應用有所關注,如研究人工智能用于檔案字跡修復等,但多局限于特定場景,未形成系統性、全方位融合。實際應用中,許多檔案管理部門對新興技術理解掌握不夠,缺乏融入工作流程的能力。以區塊鏈為例,其潛力雖大,但因技術門檻高、與現有系統兼容性差,推廣速度較慢。同時,新興技術快速迭代,檔案工作者難以跟上,導致技術應用效果欠佳,限制了檔案科技事業創新,無法充分發揮新興技術優勢。
二是檔案技術區域、機構發展不均衡與創新主體協同困難。檔案技術在區域和機構層面存在顯著的發展不平衡現象。從區域上看,專利分析顯示我國檔案科技專利授權規模呈現“東高西低”的特征,華東、華南等地因經濟和人才優勢,在檔案技術研發和應用上處于領先地位。而中西部地區則因資金短缺、基礎設施薄弱而相對滯后,其差距體現在專利數量、新技術應用水平等多方面。在機構方面,企業主導檔案科技專利申請,院校和科研機構參與度低。其主要原因是企業重實用性和商業價值,院校和科研機構側重理論研究,各方未能形成有效協同。
三是數據安全技術瓶頸制約檔案科技事業發展。在數據存儲環節,面對海量檔案數據,如何確保長期存儲的完整性、可靠性和可讀性是難題。現有存儲介質和技術有壽命限制,數據遷移易丟失或損壞。在數據傳輸和利用環節,其面臨著網絡攻擊、泄露等威脅,現有加密技術難以應對黑客技術升級。在檔案數據共享中,平衡開放利用與安全保護關系較為棘手,由于缺乏有效的數據安全技術手段,檔案部門在推進檔案數據共享和開放時往往有較多顧慮,影響資源開發利用效率。
四是資金和人才培養支持力度較為薄弱。資金方面,檔案科技研發投入不足且來源單一,主要依靠政府財政撥款,社會資本投資積極性不高,導致項自因資金短缺難以開展。人才培養方面,既懂檔案業務又掌握先進技術的復合型人才比較匱乏。院校檔案專業教育課程與新興技術接軌不足,培養的學生尚無法滿足行業需求。此外,檔案科技領域薪酬待遇和職業發展空間有限,難以吸引和留住人才,加劇了人才短缺困境。
5.2建議
一是加快新興技術與檔案科技事業的融合。檔案科技創新是檔案事業發展的關鍵驅動力和檔案工作走向現代化的重要支撐要素。本報告認為,應該持續加大檔案數字化的投入,對紙質檔案進行全面數字化轉換并建立大規模的數字檔案資源庫;同時,利用云計算技術構建統一的檔案管理云平臺,實現檔案資源的集中存儲、彈性擴展和統一管理,方便檔案的檢索、共享和備份;最后,應面向檔案領域的重難點及待突破的問題開展自主可控的技術研發工作,提升我國檔案科技事業發展的獨立自主性,并加強現代信息技術與檔案管理的整合,使得檔案專利質與量同時達到突破。
二是協同創新主體并平衡區域機構發展。本報告認為,為解決檔案技術區域、機構發展不均與創新主體協同困境,可從多方面著手。首先,在區域層面,政府可以通過政策扶持與資金傾斜,搭建技術共享平臺促進區域合作并助力中西部地區發展;其次,針對機構問題,政府可制定激勵政策并鼓勵院校、科研機構和企業積極參與搭建產學研合作平臺,促進各方溝通協作;最后,在協同層面,應明確各方定位,企業負責技術轉化,院校和科研機構專注理論研究與技術突破,以此形成協同創新的良好局面。
三是加強檔案數據安全保護技術的研發應用。新興技術的發展必然向數據安全管理發起挑戰,加強獨立自主的數據安全防護技術的研發至關重要。一方面,檔案安全風險評估和安全漏洞審查是開展安全保護的前提,提前捕獲風險對于數據管理尤為重要,同時應加強對加密技術、數據備份和恢復技術等檔案安全保護技術的研發投人。另一方面,檔案工作人員的信息安全意識和技能培訓工作依舊任重道遠,應建立一套完善的信息安全管理制度,通過制度約束與規范進一步筑牢檔案數據安全防線,多管齊下,檔案數據安全問題的解決便更有保障。
四是加大檔案科技事業資金和人才投入力度。針對資金支持不足的問題,建議檔案及科技部門增加對檔案科技領域的研發投入,如增設專項基金支持、拓展社會融資渠道、加強資金使用效率等,最終實現科技創新項目的順利開展和科技成果的轉化應用。同時,在人才問題上,前沿新興技術需要高端復合型人才以保障檔案科技創新事業創新能力和應用成果持續輸出,因此應通過與高校、研究機構的合作建立檔案科技人才培養交流機制及獎懲機制、提高人才待遇福利給予人才關懷、加強檔案科技事業職業培訓等,最終夯實檔案科技人才隊伍的建設基礎。
*本文節選自中國人民大學檔案事業發展研究中心著、人民日報出版社出版的《中國檔案事業發展報告(2025)》。轉載已獲相關授權。
作者貢獻說明
楊建梁:設計研究思路,確定論文框架,撰寫和修改論文;鄭夢霏:參與撰寫論文;楊格秀:參與撰寫論文。
注釋與參考文獻
校師德檔案信息數據共享平臺建構策略[J].檔案學研究,2024(2):126-133.
[1」仇壯麗,劉敏.數據檔案化治理的協調路徑探析[J].山西檔案,2024(8):12-19.
2張雷.結構化數據環境下政務類原生數據采集的研究[J].中國信息界,2024(3):114-116.
[3]張雷,王青云.嵊州:數據有“檔”智治智用[EB/OL].[2024-12-25].https://zjrb.zjol.com.cn/html/2024-02/07/content_3719736.htm?div =-1 :
[4]王強,符京生.根據業務對象組織數據體的結構化數據歸檔路徑探析—基于勘探開發結構化數據歸檔實踐的思考[J].檔案學通訊,2024(4):22-29.
[5]李根.基于大模型技術的檔案文化遺產自動問答平臺構建研究[J].山西檔案,2024(9):156-158.
[6」牛力,金持,黎安潤澤.大模型在檔案工作數智轉型中的應用:新機遇、新模式和新轉變[J].檔案學通訊,2024(6):30-38.
[7]傅予,李博然,徐擁軍.數字人文視角下文化資源數字化開發和傳播要素與影響機理研究[J].圖書情報工作,2023(20):45-57.
[8]劉文俏.大模型與古籍檔案文化遺產數字化:價值、挑戰與應對[J].山西檔案,2024(1):104-107.
[9」徐擁軍,張群群,嘎拉森.2023年中國檔案學研究現狀、特點及發展趨勢[J].檔案學研究,2024(2):13-21.
[10」金波,楊鵬,劉娟娟.檔案數據要素價值內涵要義與生成機理[J].檔案學通訊,2024(6):4-12.
[11]中國文化研究院.與抗日戰士AI對話路[EB/OL].[2024-12-25] .https://aistory.chiculture.org.hk/.
[12]甘肅省檔案館甘肅省科學院舉行檔案超高 精度數字采集成果交接儀式[EB/OL].[2024-12- 25].https : //www.cngsda.net/gjdt/48280.jhtml.
[13]黎安潤澤,牛力,王睿.積聚、激活與實現:新質生產力背景下企業檔案數據要素價值化探析[J].檔案學通訊,2025(1):46-55..
[14]張達.基于區塊鏈和星際文件系統技術的高
[15]北京昌平激活智能新引擎打造鑒定新模 式[EB/OL].[2024-12-25」.https://www.saac.gov. cn/daj/c100163/202406/8fdd81300db74889a2e6d92b8b ef3812.shtml.
[16」卞咸杰.檔案開放智能審核中的敏感詞識別與控制技術研究[J].檔案管理,2024(5):29-32.
[17]聶博馨,曹月.利用人工智能及自然語言技術輔助檔案分級開放審核研究[J].黑龍江檔案,2024(2):14-17.
[18]劉越男,張茜雅,楊建梁.大語言模型在檔案開放審核中的應用框架與路徑探究[J].檔案學通訊,2025(2):31-38.
[19]陳永生,楊茜茜,侯衡,等.電子政務系統中的檔案管理:問題與思考[J].檔案學研究,2015(2):28-37.
[20]李世華.基于政務云的統一政務數據和電子文件歸檔體系[J].中國檔案,2024(3):44-45.
[21]許振哲.電子檔案真實性維護—唯技術論與去技術化之爭[J].檔案,2024(2):72-76.
[22]丁海斌,馬超.電子檔案中電子印章“去技術化”的實質及其解決方案[J].檔案管理,2024(6):20-27.
[23]夏天,余芊蓉,彭欣然.銀行數字函證歸檔策略與方法研究[J].檔案學研究,2024(6):100-109
[24]王曉光,趙珂.文化遺產數字敘事信任模型:概念與框架[J」.中國圖書館學報,2024(2):30-41.
[25]鮑志芳,馬嘉悅,湯沛儀,等數字人文視閾下非遺數字檔案資源知識服務研究[J」.資源信息與工程,2024(6):118-122.
[26」王玉,程爍.數據驅動的檔案文獻遺產價值挖掘與活化研究[J].圖書與情報,2024(4):65-80.
[27]周樹斌,高勁松,高琳霞,等.我國茶類多模態非遺數字資源知識圖譜構建[J].圖書館論壇,2024(9):79-89.
(責任編輯:馮婧愷張帆)