文/李 軍
檔案工作是維護黨和國家歷史真實面貌、保障人民群眾根本利益的重要事業。建檔與檔案保管的真正目的是開發利用檔案。2020年新修訂的《中華人民共和國檔案法》中,縮短了檔案開放時間、明確了檔案開放職責、規定了檔案開放的審核辦法、新增了檔案信息化建設,這些規定都將有力推進檔案的開發利用。《“十四五”全國檔案事業發展規劃》中進一步指出檔案利用服務要達到新水平,做到以人民為中心的檔案服務理念深入人心,檔案開放力度明顯加大、共享程度顯著提高、利用手段更加便捷,檔案資政服務、公共服務、文化教育能力明顯提升。同時,發展規劃中還提出“完善檔案科技創新和應用”“開展新一代信息技術在檔案管理中的應用”,指導檔案管理工作中積極應用人工智能等創新技術,深入推進檔案利用體系建設,充分實現檔案對國家和社會的價值。本文結合檔案管理需求與人工智能技術特征,論述在檔案開發利用中人工智能技術的應用場景及實施建議。
檔案開放劃控是各級各類檔案館館藏檔案達到開放年限后經過組織鑒定審查、劃控、審核、審批,向社會開放的過程,是檔案館業務建設的基礎工作之一,也是一項政治性、政策性很強的工作。這項工作必須根據國家檔案法定程序進行,將有用的和可用的檔案向社會開放,實現檔案信息資源共享,發揮其應有的社會效益和經濟效益。
傳統的檔案開放劃控都是依據檔案管理人員的經驗進行,費時費力且主觀性較強。利用人工智能技術可實現檔案自動開放劃控,保證檔案劃控更加科學、有依據,有效解決檔案管理人手不足的問題。
檔案智能開放劃控是通過對檔案進行自動分類,參照每類檔案人工劃控的結果,通過機器學習技術,讓劃控系統“學會”自主劃控初審,初審結果再由人工進行抽樣復審,不僅能夠解決劃控工作人手不足的問題,更能使劃控工作更加標準規范,結果更為客觀。
檔案資政參考通過充分挖掘館藏檔案資料,切實提升檔案工作服務大局的能力和水平,是發揮檔案鑒往知今作用的重要服務形式。
利用人工智能技術能夠更全面收集檔案內容、充分挖掘檔案信息,并自動化、智能化地完成編目工作、生成摘要信息。例如,針對某一政務主題,找到相關背景、政策、實施、調研、報告等文件,進行深度加工分析,從而得到在一定背景下面對一個問題制定的政策取得的效果及原因報告,為政府提供有價值的咨詢建議。
運用文本挖掘、語義分析、自動聚類、知識表示等自然語言處理技術,可實現根據資政主題自動聚合高關聯性文件,對編研素材進行加工處理,協助人工完成素材的整理,并能夠通過自動摘要、自動編目,輔助完成資政參考的編寫。
檢索是檔案利用的重要應用場景,是把開放的檔案高效展現給使用者的保障手段。利用OCR、自然語言理解、圖像識別、視頻解析、知識圖譜等技術,可以在傳統全文檢索基礎上提供更為豐富、便利的檢索能力。
多模態檢索。通過圖像識別、視頻解析等技術對圖像、音頻、視頻類檔案預處理,提取對應檔案內容特征,實現文字、圖片、音頻多模態檢索,全方位、多維度地挖掘檔案信息,滿足用戶以圖搜圖、以文搜音等豐富的檢索需求。
基于檔案領域知識圖譜的智能化檢索。隨著語義網絡、深度神經網絡的發展,知識圖譜、圖數據庫、深度學習等相關技術也逐漸滲透到檔案研究領域。通過對數字檔案資源的本體提煉、知識抽取和語義關聯,可以準確提取數字檔案資源的核心,為用戶提供更精準的基于深度語義理解的檢索服務,并通過簡潔明了的可視化形式把檢索結果展現給用戶。
基于用戶畫像的精準檔案推薦。針對檔案用戶特征、檢索歷史、頁面瀏覽習慣等識別用戶偏好構建用戶畫像,基于用戶畫像技術為用戶提供個性化的檔案內容推薦,并進一步提供內容聯想服務,將相關內容以統一且連貫的方式展現給用戶,減少用戶檢索次數和檢索步驟,提高檢索效率,提升服務質量。
人工智能在檔案開發利用中的應用是一個復雜的工程,需要所有檔案從業者以科學的方法積極參與,才能有效推動檔案開發利用工作提質增效。
1.加強組織領導。各級檔案管理部門要高度重視檔案人工智能工作,認真學習中央和國家、國家檔案局相關文件精神,結合本地區實際,積極探索“人工智能+檔案工作”模式,統籌推進檔案人工智能各項試點任務的部署落實。
2.增強人才儲備。人才是檔案管理人工智能發展的關鍵,檔案管理部門要形成培訓方案,分類開展綜合型、應用型、技術型培訓,培養一批既懂業務又懂技術的高層次檔案人工智能理論與實踐人才,打造檔案人工智能骨干團隊。
3.打好數據基礎。檔案管理中人工智能技術的應用,行業數據積累是基礎、數據質量是關鍵,因此要在檔案管理工作中扎實推動檔案管理電子化、數字化,為智能檔案開發利用打好基礎。
4.建立科技支撐體系。借助國家科技資金扶持、政策引導,達成科技服務檔案管理工作、科技引領檔案利用工作,形成產、學、研、用相結合的智慧檔案管理、檔案開放利用的生態體系。
5.遵循行業標準。智能化檔案開發利用中,要嚴格遵循行業標準,并充分利用行業標準體系,增強研究成果的實用性。《中國檔案主題詞表》《中國檔案分類法》《檔案著錄規則》等文件積累了檔案管理行業多年的行業管理經驗,可以為人工智能技術應用提供基礎的專家經驗。