摘 要:核電運營階段業務系統具有系統數量多、數據結構復雜以及電子文件種類多等特點,從文件產生到歸檔多個步驟需要人工展開處理。文章闡述了業務系統電子文件歸檔內容確定、標準接口建立、人工智能(AI)智能賦值以及實現歸檔流程實例全流程自動化,并針對電子文件歸檔難點問題給出了解決方案,為核電行業業務系統電子歸檔全流程自動化提供建設指南。
關鍵詞:核電;業務系統;電子文件歸檔;人工智能(AI);全流程;自動化處理
中圖分類號:G271 文獻標識碼:A
一、業務系統歸檔內容的確定
按照核電行業歸檔范圍與要求梳理運營期間業務系統產生的文件,匯總需要歸檔的業務系統中的歸檔內容,核電運營期間需要歸檔的系統主要有OA、ECP、財會、生產日志、大修管理、SAP、維修作業過程系統以及排放申請系統等,對系統中需要歸檔的內容按照類型分主要有:
數據:運營期間的數據有非結構化、半結構化與結構化。結構化數據主要有SAP系統、維修程序結構化平臺等產生的結構化數據。
電子文件:電子文件格式以版式文件為主,同時,有Docx、XLSX、PPT及vsdx等格式。
流程日志類:審批日志、分發記錄和辦結信息。
電子簽章:主要有圖像類簽章、數字簽名。

二、業務系統電子歸檔標準接口
核電運營期間,業務系統存在三種情況:一是新建的業務系統能夠直接利用歸檔標準接口實現電子文件歸檔;二是已有系統在運行中可通過改造其歸檔功能,按照標準接口實現歸檔;三是已有系統無法再改造,以符合標準接口的歸檔要求。針對上述三種情況,制定歸檔標準接口方案:業務系統執行歸檔操作→進行四性檢測→調用檔案管理系統提供的標準歸檔服務,將數據推送至檔案管理系統。對于無法改造的現有業務系統,則利用檔案管理系統提供的工具,部署在業務系統所在服務器上運行,生成歸檔數據→由檔案管理系統工具調用標準歸檔服務,同步數據。
三、業務系統電子歸檔標準流程
業務系統電子歸檔標準流程如下:
(1)根據文件材料歸檔范圍,確定業務系統電子文件歸檔范圍。
(2)業務系統關鍵用戶與檔案管理人員就業務系統需歸檔電子文件的類型或范圍、歸檔方式以及歸檔時間等展開共同確認,制定具體業務系統歸檔方案說明,如OA系統的歸檔說明方案。
(3)檔案管理人員根據確定的業務系統歸檔元數據集,給出與檔案管理系統中數據字段的映射關系,包括部分數據的規范化轉換說明。結合歸檔文件性質和類型給定電子文件的整理方式(按卷整理或按件整理)。
(4)業務部門與檔案管理部門分別組織業務系統開發人員和檔案管理系統相關人員開發歸檔接口。
(5)業務系統關鍵用戶、開發人員與檔案管理人員測試和確認歸檔接口的功能,確保滿足所有歸檔要求。
(6)接口經測試合格后正式投用,由業務系統根據歸檔方案確定的時間要求向固定的歸檔位置(例如sftp)服務器推送歸檔信息包和歸檔的電子文件。
(7)檔案管理系統向sftp服務器獲取歸檔信息包并解析,業務人員/檔案管理人員負責對歸檔電子文件展開檢查,確認無誤后,實施入庫操作,并反饋結果。對于檢查有問題的歸檔電子文件,需將解析的信息包刪除后反饋結果,由業務系統修改后重新推送。同時,業務系統和檔案館系統保留相應的操作日志。
以流出物排放單歸檔為例,首先在業務系統中啟動流程,由業務人員填寫排放信息。經過審批和排放后,流程流轉至歸檔環節,業務人員在此確認數據完整且準確后提交歸檔。歸檔完成后,進行數字簽名和四性檢測,隨后流轉至數字檔案館接口平臺。在接口處,再次實施數字簽名認證和四性檢測,檢測通過者被接收進入部門文件庫,未通過者則退回。在部門文件庫中,檔案分類和保管期限自動固化并組卷,組卷后的檔案由業務人員移交至公司檔案庫。文檔人員檢查檔案,確認無誤后進入長期保存階段的四性檢測。檔案檢測通過后入庫封卷,未通過者可退回。

四、業務系統電子歸檔全流程自動化難點解決實施方案
1.檔案分類碼、擴展碼及保管期限智能編取
根據核電行業檔案分類標準和歸檔要求,檔號中包括檔案分類碼、擴展碼等,檔案信息包括保管期限等,不同的電子文件需要根據內容確定檔案分類、擴展碼和保管期限,通過如下三種方案可以實現檔案自動分類,確定檔案分類碼、擴展碼和保管期限。
方案一:將檔案分類表嵌入業務系統中,或者業務系統直接調用檔案管理系統檔案分類表,在業務系統產生文件時賦予檔案分類,該方法適用于在業務系統中生成的文件,需通過檔案分類來確定文件編碼的情形。
方案二:對于業務系統產生的電子文件,若屬于單一檔案分類,可在生成歸檔數據包時直接賦予固定的檔案分類。此外,也可在檔案管理系統中針對該類型電子文件配置歸檔信息,并在檔案分類環節設定固定的檔案分類。
方案三:在業務系統中,文件檔案的分類需由人工判斷,由于一類文件可能同時歸屬多個檔案類別,且在文件生成時并未被賦予明確的檔案分類信息。例如,OA公文需依據每份公文的主題來確定相應的檔案分類碼、擴展碼及保管期限。針對此類情況,適合運用人工智能(AI)技術實現檔案的自動分類。通過整合檔案分類表、歸檔范圍表和保管期限表,并結合歷史檔案數據的分類情況,構建數據集。實現的方式是在AI Agent平臺上搭建智能體,如公文需要根據標題內容分到不同的檔案類別中,并確定擴展碼和保管期限,提示詞示例如下:
```xml
lt;instructiongt;
lt;descriptiongt;根據用戶輸入的公文標題{{name}}內容在上下文中基本范圍列進行匹配,找到匹配度較高的行,將這行的分類碼列的值、擴展碼列的值、保管期限列的值返回給用戶。lt;/descriptiongt;
lt;stepsgt;
lt;stepgt;1. 接收用戶輸入的公文標題{{name}}。lt;/stepgt;
lt;stepgt;2. 在數據集中查找與{{name}}匹配度最高的行。lt;/stepgt;
lt;stepgt;3. 確定這行的分類碼列、擴展碼列和保管期限列的值。lt;/stepgt;
lt;stepgt;4. 將分類碼列的值賦給變量{{category_code}},將擴展碼列的值賦給變量{{extension_code}},將保管期限列的值賦給變量{{period}}。lt;/stepgt;
lt;stepgt;5. 返回結果格式如下:
分類碼:{{category_code}}
擴展碼:{{extension_code}}
保管期限:{{period}}lt;/stepgt;
lt;/stepsgt;
lt;examplegt;
公文標題:關于廣西防城港核電廠二期工期初步設計的評審意見
返回結果
分類碼:G130
擴展碼:項目
保管期限:永久
lt;/examplegt;
lt;/instructiongt;
數據集構建:構建檔案分類數據集,通過實踐驗證,采用檔案分類規定范圍+歷史分類數據,準確率高、效果佳,數據分段示例如下:

自動分類效果示例如下:

2.自動賦予檔案保管期限
梳理歸檔范圍、檔案分類與檔案保管期限對照表(即“三表合一”的工作成果),并將其內置至業務系統的歸檔功能模塊中。確定檔案分類后,賦值相應的檔案保管期限。對于類型單一的文件保管期限,亦可在檔案管理系統的相應文件類型歸檔規則設置中,賦予其固定的保管期限。對于不確定檔案分類的文件,可以采用智能體直接確定分類與保管期限。
3.自動組卷
每類歸檔文件均需配置相應的歸檔規則,這些規則支持多項條件和過濾機制。例如,在待歸檔文件中,可根據標題、編碼、時間、產生部門及作者等信息展開過濾。在設定的歸檔規則中,字段可通過固定值設定、獲取業務系統元數據、依據檔案管理系統數據或截取已有字段等多種方式來配置。規則的設定是保障自動組卷功能順利運行的關鍵環節。設定歸檔規則后,檔案管理系統將自動創建定時任務,依據歸檔規則中設定的過濾條件,篩選符合條件的待歸檔文件。系統會按照既定規則自動生成檔案條目,并完整填充條目所需的元數據信息,包括介質類型、歸檔單位、擴展碼、密級及保管期限等,從而實現系統的自動組卷功能。在檔案管理系統中針對每類歸檔的文件類型配置歸檔規則模塊,自動組卷規則可以由檔案人員/業務人員根據組卷規則或者業務的變化自行方便配置,無須IT專業人員編碼開發,如下是賦予歸檔規則的實施方法。
(1)在每類文件中添加歸檔規則模塊。檔案系統建設時在每類文件配置規則中增加歸檔規則模塊,當有新增的文件類型時可直接選擇該模塊。

(2)配置歸檔規則。可以在歸檔規則中設置歸檔方式、檔案分類、保管期限、過濾條件以及文件排序規則等信息固化規則,數字化檔案歸檔規則。配置歸檔規則后,系統定時如每天/每月按照歸檔規則中設置的過濾條件篩選符合條件的待歸檔文件,按照規則自動生成檔案條目,并且將檔案條目所需的元數據信息完成填充,自動完成組卷。

4.自動檢查校驗
按照業務系統電子文件歸檔規范,四性檢測歸檔電子文件,包括對真實性、完整性、可用性和安全性檢測的45個項目。四性檢測為標準的中臺服務,并且45個檢測項目可以根據不同的業務系統、不同階段,如歸檔階段、長期保存階段等展開調整配置。同時,四性檢測服務可以被業務系統調用,滿足業務系統的四性檢測、歸檔接收時的四性檢測與長期保存時的四性檢測要求。核電運營階段業務系統電子文件歸檔,除了四性檢測外,在入庫前還需細致審查檔案。檔案自動檢查可通過RPA(流程自動化機器人)技術逐項驗證各項元數據,也可在檔案管理系統中預設檢查校驗邏輯,如檔案產生日期、密級、保密期限與解密日期之間的相互驗證以及卷內文件與案卷介質類型的相互校驗等。
五、結語
本文利用生成式人工智能、業務系統電子歸檔以及流程機器人(RPA)等實現業務系統電子文件歸檔全流程自動化處理,可以提高歸檔的效率和質量,縮短檔案從產生到歸檔入庫的時間,能夠迅速提供給用戶使用。同時,檔案人員自主構建的檔案自動分類智能體和自動組卷規則配置等成果,不僅能廣泛應用于其他行業的電子文件歸檔領域,還可賦能紙質及其他載體文件材料的歸檔工作,從而助力檔案領域的發展。
參考文獻:
[1]中國國家檔案局.國家檔案局電子文件歸檔與電子檔案管理規范GB/T18894-2016[S].北京:中國標準出版社,2016.
[2]吳志杰,王 強.組織機構視角下的業務系統電子文件歸檔:問題、理念與策略框架[J].檔案學通訊,2020(04):79-86.
[3]洪佳惠.生成式人工智能在檔案實踐中的應用及其限度探究[J].中國檔案,2024(11):68-71.
[4]肖靜媛.人工智能技術在企業檔案管理中的應用研究[J].陜西檔案,2024(05):26-27.
作者單位:廣西防城港核電有限公司
作者簡介:玉炎玲(1987—),女,漢族,廣西梧州人,本科,館員,研究方向:文檔數字化轉型。