彭蒙蒙


[摘要]數字時代加強電子文件歸檔和電子檔案管理,不僅是時代所需,也是提高檔案管理效率和提升檔案服務質量的重要保障,對企業具有重要意義。論文以國泰君安為例,從電子文件歸檔、電子檔案管理、電子檔案利用三個方面,對企業電子文件歸檔和電子檔案管理模式進行了探索。
[關鍵詞]電子文件歸檔電子檔案管理電子檔案利用
[分類號]G271
Research on the Mode of Enterprise Electronic Filing and Electronic Archive Management in Digital Era
——Taking GUOTAI JUNAN Securities as an Example
Peng Mengmeng
(GUOTAI JUNAN Securities Company, Shanghai, 200444)
Abstract: Strengthening electronic filing and electronic archive management is not only necessary in the digital time, but also is an important guarantee for improving the efficiency of archive management and the quality of archive service, which is of great significance to enterprises .This paper explores the mode of enterprise electronic filing and electronic archive management from electronic filing, electronic archive management and electronic archival utilization.
Keywords: ElectronicFiling;ElectronicArchiveManagement;ElectronicArchivalUtilization
當今人類社會發展正處在數字時代,數字化、網絡化、智能化正日益融入人們生產生活的方方面面,極大地推動了社會的發展進步。數字化浪潮對現代檔案管理帶來了深刻的影響,數字信息的出現改變了檔案記錄和讀取方式,產生了形式多樣、規格各異且數量巨大的電子文件,打破了傳統檔案管理模式,為檔案工作帶來了新的要求和挑戰。[1]2016年,國家檔案局及上海、安徽、江西等地方檔案行政機構紛紛把加強電子文件歸檔與電子檔案管理寫入了檔案事業發展“十三五”規劃。對于企業而言,加強電子文件歸檔和電子檔案管理,不僅是時代所需,也是提高檔案管理效率和提升檔案服務質量的重要保障,從長遠來看還有利于節省管理成本,可謂意義重大。本文在電子文件歸檔相關規范的基礎上,以國泰君安證券股份有限公司(以下簡稱“國泰君安”)為例,探索企業電子文件歸檔和電子檔案管理模式,力求形成通用性較強、具有指導意義的電子文件歸檔和電子檔案管理經驗。
1電子文件歸檔
電子文件歸檔是指將具有憑證、查考和保存價值且辦理完畢、經系統整理的電子文件及其元數據管理權限向檔案部門提交的過程,可采用在線歸檔或離線歸檔方式。由于離線歸檔需要人工先把電子文件從業務系統中導出,之后再導入到電子檔案管理系統,耗費較多的時間和精力,而且還存在重復性大、易出錯等弊端,而在線歸檔是通過系統接口實現電子文件直接歸檔,人工干預較少,所以綜合而言,在線歸檔整體上要比離線歸檔更合理、科學。
1.1歸檔接口
在線歸檔中,歸檔接口的設計與開發是關鍵點和難點。作為業務系統與電子檔案管理系統的銜接,歸檔接口一方面要確保電子文件及其元數據在待歸檔時的真實性、完整性、可靠性、可用性(簡稱“四性”),另一方面要保障其在整個歸檔過程中的“四性”要求,為此,歸檔接口需要具備“四性”檢測功能。下文將對“四性”檢測內容進行詳細闡述。
歸檔接口通常采用Web Service、中間庫或歸檔電子文件及其元數據規范存儲結構的方式,三種方式各有特點,處理方式也不相同。以中間庫為例,歸檔業務系統(上游系統)將數據推送到中間庫后,歸檔接口實時采集“中間庫”數據進行“四性”檢測,對檢測結果進行狀態回寫,并要求歸檔業務系統(上游系統)定時全部依次訪問中間庫,采集檢測失敗的數據重新進行推送歸檔,整個流程如圖1所示。該方式可同步處理多重任務,效率較高,但在推行時可能會遇到接口開發周期長、需要歸檔業務系統(上游系統)密切配合、比較耗費系統資源等問題,企業應根據本單位實際及業務系統建設情況選擇合適的接口實現方式。
1.2歸檔環節的“四性”檢測
在電子文件歸檔環節,由于電子文件在歸檔過程中存在業務部門與檔案部門之間的權屬交接以及電子文件到電子檔案的轉變,因此需要對電子文件的“四性”進行檢測,確保電子文件歸檔的質量?!八男浴睓z測具體內容如圖2所示。電子文件真實性檢測,包括:①電子文件來源真實性檢測:MD5算法檢測歸檔電子文件的固化信息和數字摘要值是否有效;②電子文件元數據真實性檢測:依據元數據方案檢測歸檔電子文件元數據數據類型、長度、格式、值域是否符合要求;③電子文件元數據與內容關聯真實性檢測:檢測電子文件元數據與內容數據是否關聯,檢測元數據中記錄的文件存儲位置與電子檔案內容數據的實際存儲位置是否一致;④電子文件內容電子屬性真實性檢測:檢測電子檔案內容數據中包含的電子屬性信息與電子文件元數據中記錄的信息是否一致;⑤電子文件歸檔信息包真實性檢測:XML封裝與MD5算法檢測比對電子文件歸檔信息包的文件名、文件大小和原始記錄,以及歸檔信息包的數字摘要值。
電子文件完整性檢測,包括:①電子文件數據總量檢測:檢測電子文件歸檔接收信息登記表中文件數量和大小;②元數據完整性檢測:檢測電子文件元數據項是否填寫齊全,具有連續編號的目錄數據(案卷號、件號、文號)是否有漏號;③電子文件內容完整性檢測:人工檢測電子文件對應的實體內容是否齊全完整;④電子文件歸檔信息包完整性檢測:系統自動檢測歸檔信息包中實際包含的電子文件數量,以及人工檢測元數據和內容數據是否存在遺漏或錯誤情況。
電子文件可用性檢測內容包括:①元數據、目錄數據可用性檢測:檢測電子文件歸檔信息包中存放元數據的XML文件或目錄數據存放的EXCEL文件是否可以正常解析、讀取數據;②電子文件內容可用性檢測:檢測電子文件實體是否可以被正常打開和瀏覽;③電子文件歸檔信息包可用性檢測:檢測電子文件歸檔信息包是否包含非公開壓縮算法、是否加密、是否包含不符合歸檔要求的文件格式;④電子檔案內容軟硬件環境監測:檢測電子屬性信息中記錄的軟硬件環境信息是否符合歸檔要求。
電子文件可靠性檢測,包括:①電子文件歸檔信息包可靠性檢測:系統或人工監測電子文件歸檔信息包是否感染木馬或病毒;②歸檔載體可靠性檢測:系統及人工檢測載體內是否含有非歸檔文件,載體讀寫速度、載體外觀、光盤質量;③歸檔過程可靠性檢測:人工檢測歸檔信息包在歸檔和保存過程中是否安全、可控。
2電子檔案管理
2.1電子檔案存儲
在電子檔案管理過程中,電子檔案存儲方式直接關系著電子檔案的安全,選擇合適的存儲方式有利于保證電子檔案的真實、完整、可靠、可用。需要注意的是,不同的業務階段電子檔案存儲的作用范圍和技術要求有所不同,具體而言,在電子文件歸檔時需使用交換存儲,在電子文件在線收集、電子檔案管理、長期保存和提供利用時需使用在線存儲,在電子檔案長期保存、電子檔案備份時需使用離線存儲,各業務環節存儲要求規劃如圖3。在線存儲可采用磁盤陣列(SAN)設備,離線存儲可采用一次性寫入專用移動硬盤、磁盤。
電子檔案存儲內容應包括電子檔案及其元數據、電子檔案管理系統及其配置數據、日志數據等。電子檔案存儲時,應在不改變源文件的情況下自動批量轉換成PDF、MP3、MP4等長期保存格式,無法轉換的則應以TIFF或JPEG文件格式將紙質文件掃描后歸檔。電子檔案的實體對象應按照“三庫分離”原則,在系統中實施分別管理:長期保存庫獨立于電子檔案管理系統,用于存放電子檔案長期保存封裝包;管理庫用于支持檔案管理員開展檔案的檢測、鑒定、銷毀、統計、查閱、檢索和編研等業務工作;利用庫則是根據檔案的開放利用屬性、檔案利用者的要求生成多元化的利用庫。
2.2長期保存環節的“四性”檢測
電子檔案在長期保存過程中,需通過制定檢測策略進行定期和不定期檢測,檢測內容如圖4所示。檢測策略設置主要包括:電子檔案的封裝格式以及電子檔案元數據與內容數據的關聯方式、電子檔案的存儲路徑與存儲方式、電子檔案各項檢測指標與檢測周期等。在未發生系統更新、數據遷移、格式轉換等影響電子檔案元數據和內容數據的行為的情況下,只需要對電子檔案的固化信息進行檢測。反之,則需要進行全面檢測,檢測內容包含長期保存封裝包、電子檔案元數據和電子檔案內容。在電子檔案長期保存過程中,針對電子檔案所做的檢測、遷移、格式轉換、備份恢復、提取出庫應記錄在電子檔案管理系統的長期保存庫中,并補充到電子檔案的元數據中。
3電子檔案利用
電子檔案管理的最終目的是實現檔案資源的有效利用,充分實現檔案價值,為企業經營、管理等工作提供服務。數字時代,檔案數據資源急劇增加,檔案利用需求日益增長,檔案部門不能僅被動地提供檔案查詢、借閱等傳統檔案服務,而是要樹立現代管理思維,合理運用先進的信息技術和龐大的檔案數據資源,積極挖掘檔案價值,發揮資源優勢,主動為業務發展服務,努力提高檔案部門在企業發展過程中的角色定位。在此,本文以國泰君安為例,介紹其在電子檔案利用方面的幾項創新做法。
3.1運用大數據技術,助力業務拓展
近年來,大數據在社會實踐與理論研究上影響巨大,作為一種數據技術,它也被運用到各個行業和領域中。面對數量龐大的檔案資源,檔案部門也可通過利用大數據技術對檔案數據進行價值挖掘、分析預測等資源管理,從而發揮檔案數據價值。為使分析結果更為準確,檔案部門可與信息技術部門合作,將檔案數據與底層數據進行整合,形成海量檔案信息數據池。國泰君安整合了檔案部門與信息技術部兩個部門的客戶檔案信息資源,并以客戶檔案信息數據池為基礎,通過大數據技術、人工智能技術形成客戶全檔案生命周期圖譜,以時間軸的方式,完整展現客戶辦理各個業務的時間,并從多維度對客戶進行賬戶評級,形成客戶畫像,如圖5所示。客戶全檔案生命圖譜,一方面會被推送至業務前端,助力精準營銷、業務拓展;另一方面,也會通過公司相關業務系統軟件推送給客戶本人,從收益能力、選股能力、倉位控制、盤面感知、風險控制五個維度為客戶提供全面、專業的投資分析,從而發揮檔案利用價值。
3.2運用人臉識別、簽名比對,協助風險管控
人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術,用于人員身份確認,實現智能預警,可有效輔助企業合規風控工作和編研工作。通過采集特定人員的人臉照片或身份證信息形成面像文件,建立面部特征素材索引庫,將面部特征素材索引庫中的素材照片進行特性化處理,并與數據庫中相關聲像資料作對比,找出聲像檔案中含有該面部特征的片段、幀及時長等信息,從而在海量的影像中快速找出特定的人物信息。國泰君安對于公司內部員工與信用業務類客戶人臉數據的采集,一方面,將特定的人物臉部素材照片信息匹配相關影像資料,提取相關片段,應用于公司人物、專題等檔案編研;另一方面,將特定人物臉部素材照片信息匹配對應業務影像檔案(如客戶視頻)進行身份對比稽核,從而應用于業務合規性檢查,協助風險管控。
簽名比對是一種通過對手寫簽名進行分析得出簽名是否由本人書寫的識別技術,和人臉識別一樣,也可協助企業合規風控工作。通過提取有效的簽名檔特征信息建立模板庫,包括:簽名的位置、形狀、比劃方向,比劃間的搭配以及偽動態信息等,之后由后臺引擎對模板庫中的簽名檔特征信息進行實時對比,比對任務結束后輸出相似度,并通過接口反饋給前端平臺。該功能可對客戶簽名文件進行批量對比發現可疑的簽名文件,有效協助合規、風控、審計等工作的非現場、電子核查開展,為公司風控稽核工作提供了便捷。
3.3應用自然語義分析,實現智能檢索
在系統查詢時,可能會因題名不規范導致表意出現偏差,影響查詢結果,而自然語義分析能使電子檔案管理系統實現智能檢索,提高查準率、查全率,從而提高用戶查詢體驗。通過研發PIndex全文檢索技術,以中文分詞為核心技術,使用Spider程序對Web頁面、磁盤文件以及數據庫中文本內容三種數據源中的數據進行抓取,再通過索引服務建立索引信息,形成分類索引,最終形成完備索引庫。同時,通過建立同義詞庫,使索引服務具備“自主學習”能力。例如,當要檢索有關中國工商銀行檔案時,輸入“工商銀行”“工行”“中國工商銀行”中的任何一個關鍵詞,均可檢索成功,保證查全率。
數字時代,電子文件大量產生,對現代檔案管理帶來了深刻影響。提高重視并不斷加強電子文件歸檔和電子檔案管理,不僅是時代發展的需要,也是提高檔案工作效率和檔案服務質量的重要保障。現階段,有關電子文件歸檔和電子檔案管理理論研究與實際應用都還存在不足之處,如制度不健全、歸檔電子文件門類不全、提供利用仍舊側重傳統紙質檔案、元數據管理有待加強、對信息資源挖掘效果偏弱、檔案管理系統歸檔接口少等[2]。對此,企業應樹立現代管理思維,依托技術手段和專業管理,不斷推動電子文件歸檔和電子檔案管理邁上新臺階,充分發揮檔案資源價值,更好地服務于企業各項業務發展。
參考文獻
[1]李明華.中國的數字檔案資源建設[N].中國檔案報,2016年9月15日(第3版).
[2]盛曉明,周妍,劉春波,趙杰.我省企業電子文件歸檔和電子檔案管理試點工作情況[J].黑龍江檔案,2016(3).