摘要:數字時代,集團型企業建設數字檔案館(室)成為一種必然趨勢。論文從集團型企業三種不同的檔案管理模式入手,比較建設數字檔案館(室)的成本投入,提供優選方案,同時通過分析建設過程中可能遇到的困難與挑戰,從頂層設計、接口建設、科技賦能、安全防護等角度出發,提出建設策略,以供集團型企業參考。
關鍵詞:集團型企業 數字檔案館(室) 電子檔案
隨著信息技術的不斷發展,大數據、人工智能、區塊鏈等新興數字技術帶來重大產業變革,檔案管理與利用正向著自動化、數字化、智能化的方向發展。2017年,國家檔案局制定《企業數字檔案館(室)建設指南》(以下簡稱《指南》),對企業建設數字檔案館(室)的標準要求做出明確規定。[1]2021年,《中華人民共和國檔案法》頒布實施,提出要加強檔案信息化建設、保障檔案信息安全、推進電子檔案管理信息系統建設、推進傳統載體檔案數字化等,為促進集團型企業數字檔案館(室)建設奠定了堅實的法律基礎。[2]近年來,“數字中國”也頻頻登上熱搜,在中共中央、國務院2023年印發的《數字中國建設整體布局規劃》中,明確要夯實數字基礎設施和數據資源體系“兩大基礎”,強化數字技術創新體系和數字安全屏障“兩大能力”,[3]為未來發展指明方向。集團型企業作為當今社會非常重要的組成部分,應響應國家號召,順應數字化轉型趨勢,推動數字檔案館(室)建設。
集團型企業是以一個或多個大型企業為核心,以若干個在資產、資本、技術上有密切聯系的企業、單位為外圍層,組合形成的一個穩定的、多層次的經濟組織。集團型企業各成員單位既接受統一領導,又保持相對獨立,多存在跨行業、跨地域情況,在業務的不斷變化發展中,兼并、重組時有發生,這就導致集團型企業形成了不同的檔案管理模式。
(一)集團型企業檔案管理模式介紹
集團型企業檔案管理模式主要有三種:集中式、分級式、分散式。
1.集中式,即建立一套檔案系統,建立一個集團檔案館,將所有實物檔案及電子檔案都集中到一起進行統一管理。此種管理模式多存在于集團成員單位性質單一、數量較少的企業。
2.分級式,即建立一套檔案系統,建立多個成員單位檔案室,對電子檔案進行統一管理,而對實物檔案進行分散管理。此種管理模式多存在于集團成員單位性質單一、數量多且分散的企業。
3.分散式,即建立多套檔案系統,建立多個成員單位檔案室,對實物檔案和電子檔案都自行管理。此種管理模式多存在于通過兼并其他企業形成的集團型企業,或是成員單位分屬不同行業的集團型企業。
(二)集團型企業檔案管理模式投入比較
筆者對三種檔案管理模式下集團型企業可否通過一次性投入完成數字檔案館(室)建設進行比較分析,形成表1。“一次性投入”是指主要由一個機構完成軟硬件設計、配備、測試,其他機構則可在此基礎上直接應用,或是主要由一個機構制定標準,投入一定人力、物力、財力,即可實現工作正常運轉。“一次性投入”占比越多,代表資源利用效率越高,并且成員單位數量越多,效果越明顯。
從表中對比情況可以看出,采取集中式、分級式管理的集團型企業通過一次性投入即可滿足建設要求的任務數量占比較多,而采取分散式管理的則占比較少。
對于采取集中式管理的集團型企業而言,“歸檔數量”和“歸檔過程”兩項任務能否通過一次性投入完成,主要取決于檔案系統及業務系統在歸檔前能否實現自動分類、智能鑒定等自動化功能,如能實現,則可通過一次性投入完成;“傳統載體檔案數字化”“數字化場所及數字化工作安全保密”兩項任務取決于集團總部制定的政策,即檔案數字化是選擇集中一起完成,還是在業務開展過程中完成,如為前者,則可通過一次性投入完成;“專題數據庫建設”取決于制定的專題是屬于全局性的,還是某成員單位特有的,如為全局性專題,可由集團總部或獨立的集團檔案館通過一次性投入完成。
對于采取分級式管理的集團型企業而言,在與系統有關的任務中一般可通過一次性投入完成,而與實物檔案有關的任務則多由各級成員單位自行完成。
對于采取分散式管理的集團型企業而言,除了制度、存儲格式由總部進行統一外,其他大部分需由各成員單位自行建立。
綜上,在建設集團型企業數字檔案館(室)時,如各方面條件允許,集團總部可以提高系統自動化管理水平,統籌多方需求,做好整體布局,采用集中式或分級式檔案管理模式推動相關工作開展。
集團型企業數字檔案館(室)建設涵蓋總部和成員單位兩部分內容,總部在相關系統、設施設備、制度標準建設方面,需要以上率下,指導協調各成員單位共同推進。在此過程中,集團型企業經常會遇到以下困難。
(一)成員單位檔案管理水平不均

集團型企業通常規模較大、駐地分散,一些政治、經濟、文化水平相對落后地區的成員單位,其接受新思想、新技術的速度較慢,檔案管理水平相對不高。一些集團擁有橫跨不同行業領域的成員單位,檔案在其中發揮的效用不一樣,所受重視程度不同,比如軍工企業的科研檔案多是技術核心,單位對檔案的重視與保護程度高,而服務企業的文書檔案多起記錄備查作用,管理方面很容易被忽視。此外,因各成員單位的歷史背景、發展階段、所在層級不同,其檔案管理水平也往往呈現出不均衡的特點。例如,筆者所在單位有總行、省級分行、市級分行、縣級支行四級機構,越到基層,專職檔案人員越難配備,在檔案方面投入精力越少。有些成員單位從事檔案工作的人員頻繁更換,新來的人員缺乏專業知識和經驗,在實際操作過程中,對標準要求掌握不準、不透,容易在檔案管理方面出現問題。
(二)系統之間數據交互存在障礙
“系統之間”既包含“上下級單位檔案系統之間”,也包含“業務系統和檔案系統之間”。而數據交互的前提是在系統之間建立接口,很多系統在早期建立時未考慮系統間的關聯性,彼此相互獨立,致使形成數據孤島,跨系統的業務流程出現斷裂,數據依賴手動導出或導入,耗時且易出錯。對于已建立接口的系統,數據交互時還可能出現以下情況:數據傳輸失敗,如接口調用超時、網絡中斷、請求被拒絕等;數據格式不兼容,如數據解析失敗、字段缺失或不匹配等;數據不一致,如上游業務系統流程已辦結或數據進行了變更,而下游檔案系統數據未能及時獲取或更新;在性能方面存在瓶頸,如接口響應緩慢、高并發下檔案系統崩潰等。
(三)系統建設過程中對新技術使用不足
數字檔案館(室)系統建設的目的在于輔助完成檔案的收集、整理、保存、利用等。近年來,新技術層出不窮,但很多集團型企業在開展數字檔案館(室)系統建設時,未能充分利用好這些新技術,導致處理基礎性、事務性工作依然需要耗費大量人力,并且使用效果不盡如人意。例如,在信息采集時,系統不能自動分析和提取,需要人工完成篩選和著錄;在檔案整理和收集過程中,系統不能自動判斷,需要人工對照保管期限表判定并審核大量信息;在檔案利用時,設計的檢索工具使用起來不夠靈活,檢索結果與用戶需求差異大、檢索速度慢等。
(四)檔案面臨的安全威脅不斷增多
檔案安全主要涉及檔案載體安全和檔案信息安全。在以紙質檔案為主的時代,人們對于檔案安全的更多關注點在于如何建立一個堅固的、防護措施完備的庫房,從而預防自然災害,確保檔案載體安全。而當前建設數字檔案館(室),檔案信息所面臨的安全威脅已遠超檔案載體,“檔案數據存在信息倫理、知識產權保護、隱私侵犯、系統平臺漏洞、技術更新換代、黑客病毒侵襲、載體壽命不確定等各種安全風險”[4]。總體來看,一是可能存在技術安全風險,如由于系統漏洞或隔離措施不足而遭受攻擊、加密不足而導致敏感信息泄露、缺少防護手段而無法及時有效應對新型網絡威脅等;二是可能存在設定機制缺陷,如權限與訪問控制設定混亂,檔案可能被無權限人員調閱等;三是可能存在物理與環境隱患,如設備與載體管理不當,造成檔案數據無法讀取等。這些隱形的風險都具有難以察覺、關聯性強、影響面大的特點。
集團型企業建設數字檔案館(室)是檔案工作轉型的必經之路,考驗企業的協調能力、系統建設的設計能力、科技力量的運用能力、應對風險的防范能力。在實際操作過程中,集團型企業可從以下四個方面著手改善。
(一)做好統籌規劃,協調成員共同發展
集團總部發揮著頂層指導的作用,應秉承“立足現狀、確定目標、合理分工、有序推進”的基本思路開展工作。在建設數字檔案館(室)之前,集團總部要先進行全面系統的調研,可協調總部及成員單位檔案人員、業務人員、技術人員成立調研組,對集團的檔案情況(類別、數量、分布情況,是否需要遷移)、數字化情況(已完成檔案類別、數量、質量,未完成檔案類別、數量)、基礎設施設備情況(是否已配備,是否符合標準;是否經過相關權威部門測評取得證書,是否安全)、檔案系統情況(功能是否滿足要求,性能是否達標,安全策略是否建立)、業務系統情況(業務系統數量,業務系統內需要歸檔的電子文件情況,與檔案系統建立接口情況)、與檔案相關的制度標準制定情況(是否全面、彼此之間是否有沖突)等進行全面摸底。在充分掌握各成員單位現實情況及面臨的困難后,集團總部從整體考慮,制定頂層規劃,統一制度標準,做好人員、資金保障工作,定期組織培訓,提高檔案人員的專業能力和技術水平,確保總部與成員單位在建設企業數字檔案館(室)時,可以實現同頻共振、協同發展。
(二)完善接口生態建設,搭建數據互聯通道
無論是“上下級單位檔案系統”還是“業務和檔案系統”之間,完善接口生態建設,實質上是構建數字世界的“神經脈絡”,既可以解決當下系統互通的“血栓”問題,更可以為未來業務創新鋪設高速通道。其中,接口質量直接決定企業數字機體的“供血能力”,通過制定統一的接口規范,明確通信協議與請求方式、數據格式與結構、安全與權限、錯誤處理機制等,可提高數據完成自動化交互的質量。同時,接口規范要注意版本控制,避免因系統升級導致數據交互中斷。集團總部可以選擇1~2個關鍵業務流程,優先開發接口,后續再逐步擴展接口范圍。在數據交互時,集團型企業要注意使用穩定的網絡協議,部署負載均衡以分散請求壓力;通過建立元數據標準,在系統間使用統一的數據字段、類型,或構建語義本體庫,實現業務和檔案的同義詞對應,同時做好數據校驗,確保數據交互的完整性和準確性;通過消息隊列實現異步通信,下游系統定時監測鏈路健康度,每天比對上下游系統間數據的一致性,設立消息反饋、錯誤重試機制,確保數據傳輸成功;進行大數據量交互時,系統可采用分頁傳輸,提升響應速度。此外,對于集團型企業,為了提高管理效率、節約管理成本、縮短建設周期等,在上下級單位檔案系統建設中可以采取“統一建設、集中部署”的方式,即總部在搭建完成檔案系統后,可直接為成員單位開放檔案數據空間,實現標準化采集、自動化管理、跨區域利用。
(三)加強機器學習,催化科技賦能反應
“隨著信息技術的發展,數字檔案館的管理和服務模式會不斷發生變化,倒逼數字檔案館朝著智慧型、知識型方向發展,出現生態位變化。”[5]機器學習就是其中的一個催化劑,近年來,它在圖像識別、自然語言處理、個性化推薦等領域都取得了突破性進展。在數字檔案館(室)系統建設過程中,集團型企業可以提高機器學習能力,在多個環節中通過與技術的融合,實現自動化處理、智能分析和深度挖掘,催化科技賦能反應,變現科技賦能價值。在檔案著錄環節,可通過計算機視覺技術,識別照片、圖紙或手寫的文檔內容,生成描述性元數據;通過不斷訓練手寫體識別專用模型,識別模糊、復雜的手寫檔案;可利用自然語言處理技術,提取文字中的關鍵信息完成自動標引。在歸檔環節,可在形成電子檔案的業務系統里,內置檔案分類方案、保管期限鑒定、歸檔格式審核等功能,減少人工判定,提高電子文件歸檔效率。在檔案檢索方面,可借助Embedding模型實現“以意搜文”;“基于卷積神經網絡(CNN)和循環神經網絡(RNN)的文本分類和檢索方法,在處理中文文本時表現出了優異的性能”[6],這兩種方法在檔案的內容理解、特征提取、語義檢索等方面具有重要意義,可以提高檢索效率;對于檢索結果,可以通過提取點擊率、瀏覽時長、下載行為等動態調整排序,或者使用協同過濾,推薦相似用戶偏好的檔案。
(四)增強安全措施,構筑安全保障防線
數字檔案館(室)的安全防護措施涉及技術防御、權限控制、環境管理等,需全面考慮各個因素,從而建立數據安全保障機制,提高數據資源保護能力。集團型企業具體可從以下幾個方面著手實施:一是進行技術加固,“采取包括入侵檢測系統(IDS)、入侵防御系統(IPS)和防火墻在內的多層防護措施,構建安全的網絡環境以防范外部攻擊”[7],同時,對檔案本身進行安全保護,在存儲和傳輸過程中,通過加密技術進行加密,采用哈希算法等確保數據的完整性。二是嚴格控制訪問權限,可通過系統自身的角色設置,對文檔的瀏覽操作權限進行細粒度區分,實現檔案用戶權限和檔案數據權限組合控制,限制對敏感數據資源的訪問。三是對周邊環境進行監測與管控,包括檔案保管環境、網絡環境、信息存儲環境等,定期對檔案數據進行掃描、比對校驗,如有異常情況,及早發現修復。同時,堅持數據級備份和應用級備份相結合,可采用異地、異質、實時、在線等多種備份形式,避免出現數據損毀丟失無法挽回的情況。
推動數字檔案館(室)建設是大勢所趨,集團型企業要以此為契機,提升檔案整體管理水平。在此過程中,集團總部要注重發揮頂層指導作用,制定清晰的戰略目標,全程跟蹤和控制,定期評估,根據反饋意見進行調整和優化,從而有效推動集團型企業數字檔案館(室)的建設和發展。
注釋及參考文獻:
[1]中華人民共和國國家檔案局.國家檔案局辦公室關于印發《企業數字檔案館(室)建設指南》的通知[EB/OL].(2017-09-19)[2024-08-01]. https : //www. saac.gov.cn/daj/tzgg/201709/ 520f7404ff78448f85edc3109bb64e2b.shtml.
[2]中華人民共和國國家檔案局.中華人民共和國檔案法[EB/OL].(2020-06-20)[2024-08-01].https://www.saac.gov. cn/daj/falv/202006/79ca4f151fde470c996bec0d50601505.shtml.
[3]中共中央國務院印發《數字中國建設整體布局規劃》[N].人民日報,2023-02-28(1).
[4]金波,楊鵬.大數據時代檔案數據治理研究[J].檔案學研究,2020(4):29-37.
[5]王潔菲.數字檔案館生態位提升策略探究[J].北京檔案,2022(9):13-16.
[6]吳晨.面向內容的信息檢索模型研究[D].北京:中國科學院聲學研究所,2007.
[7]王曉萌.基于云環境的檔案安全管理及數字檔案館構建策略[J].中國信息化,2024(7):79-80.
作者單位:中國農業發展銀行