詹超銘
(中核國電漳州能源有限公司 漳州 363300)
隨著科學技術的飛速發展,大數據和人工智能已經成為引領時代的兩大核心力量,要貫徹落實好檔案法和習近平總書記“四好”“兩服務”的重要批示,就必須堅持“科技是第一生產力”,主動適應開啟全面建設社會主義現代化國家新征程的要求,將檔案工作融入科技革命的浪潮,深入探索大數據和人工智能在檔案工作中的應用。文檔知識管理,就是核電企業在檔案信息化建設過程中,不斷融合知識管理的新產物。本文以中核國電漳州能源有限公司(下文簡稱漳州能源)為例,探析核電企業在核電文檔知識管理中的創新實踐。
隨著人工智能的快速發展,文檔領域的信息化建設越來越注重人工智能技術對電子文檔的管理的智能化提升與優化,并取得了一定的研究成果。邢高生采用實體識別、關系抽取、知識表示等技術對HKBZ領域的文檔進行數字化轉換,提升了文檔數據的檢索效率與質量,并構建了完整的文檔知識管理體系,提高了文檔的利用率,實現知識的關聯與共享。[1]楊強、胡心宇等人基于圖像識別技術對電子文檔進行文字識別,從而輔助文檔管理人員進行日常管理,即通過圖像識別技術拆分文檔中的原始信息,并與文檔錄入信息進行自動對比,保證了文檔的準確性,提升了員工的工作效率。[2]華為對其檔案管理工作的重視程度,提出了“四位一體”的全球化文檔管理框架,即一套規則、一套流程、一站式平臺、一套組織和一套運營體系,其目的是簡化業務流程,促進企業合 法合規運行。推進了文檔知識數字化管理,有效提升檔案管理工作水平,對于充分發揮文檔知識信息資源的作用具有重要的現實意義。[3]
雖然文檔知識管理在企業管理過程中有較為突出的研究,但面對核電領域龐大的知識體系,核電文檔知識管理的研究仍然存在較大的問題。例如:核電企業業務系統多,系統集成少,大量的數據、信息和文檔分散在各個系統中,容易形成“信息孤島”,不利于信息查詢;中核在文檔知識關聯方面比較薄弱,程序計劃的編制、審批和變更以及程序生效后的培訓等業務流程都是在線下進行,程序之間的關聯弱,上游程序的變動在人工未干預的情況下無法觸發下游程序的升版,無法有效落實核安全文化強調的相關要求。
在數字經濟時代,新技術的成功應用為我國核電企業開展文檔知識管理研究實踐提供了參考和借鑒。
首先,江蘇核電新一代信息技術在文檔管理中的應用。江蘇核電以支撐公司發展戰略為目標,打造高效便捷、全流程貫通的文檔管理體系,圍繞文檔管理內部外用戶的實際需求,利用大數據、人工智能、移動技術、云計算等先進科學技術來實現文檔管理的標準化、高效化和智能化。[4]實現了信函智能分發、文檔資源整合利用、移動上架、業務系統文件自動歸檔、工程文件自動交換等應用場景,為后續智慧檔案館建設奠定基礎。其次,三門核電基于機器學習的核電文檔個性化推薦系統建設。三門核電面向提升文檔利用及服務水平的需要,采用基于機器學習的個性化文檔推薦方式來提升用戶使用文檔的便利性,讓系統可以根據用戶歷史的輸入或者行管崗位人員的輸入以及用戶對于搜索結果的反饋來綜合推薦出用戶想要的搜索結果,變被動搜索為主動推薦,實現知識的快速獲取,最大化發揮文檔資源的價值。[5]最后,福清核電基于機器人技術在文檔管理中的應用。福清核電將“AI+RPA”技術引入文檔管理領域,打造“文檔管理、綜合利用、數據分析”服務型、智慧型機器人,以服務檔案業務、數據采集、數據管理、數據分析。以“華龍一號”建設運營階段文檔數據為基礎,嘗試使用文檔智能機器人對核電行業使用最廣泛的文種進行智能化管理的探索和研究,實現對紙質文檔、電子文件等不同來源的文檔數據原料的采集及預處理,將日常文檔管理中繁瑣、重復性的工作,遵照成熟的技術規范與標準,通過智能機器人的“眼+腦+手”技術達到全部或部分取代的效果。[6]
總之,江蘇核電、三門核電、福清核電對于文檔知識管理的研究實踐切實提高了文檔管理效能,有利于文檔資源的檢索利用,具有一定的推廣價值,但研究內容局限于文檔工作本身,與核電其他業務的融合度不高,賦能業務作用有限。
漳州能源初步構建了核電文檔知識管理體系,建設了漳州能源文檔知識管理平臺——“華龍智庫”知識管理系統(下文簡稱華龍智庫),為員工提供學習、共享知識的平臺,并依托華龍智庫建設推動文檔與業務創新融合,以核電程序體系管理為試點,探索建立文檔與業務雙向驅動的核電文檔知識管理長效機制。
漳州能源圍繞研究目標,制定了“統籌規劃、以點帶面、分步實施”的文檔知識管理實施總體戰略,以滿足對核電數據的全生命周期管理為主線,結合文檔知識管理過程,從數據、技術、知識、應用四個維度進行分析,制定了“一線四核”的技術路線(見圖1)。

圖1 技術路線圖
以需求為導向。在華龍智庫的頂層設計上,漳州能源充分調研了用戶需求、市場需求和技術趨勢,將分析結果轉化為系統的設計需求,并對華龍智庫的業務架構、應用架構、數據架構和技術架構進行了詳細規劃。業務架構主要關注系統的業務邏輯和流程,數據架構主要關注數據的結構、數據之間的關系以及數據的存儲、訪問、管理和保護等方面,應用架構主要關注系統有哪些子系統、子系統之間如何分工和合作,技術架構主要關注系統的高可用、高性能、可擴展、安全性和穩定性等非功能性特征。先形成業務架構,再根據業務架構,做出相應的應用架構,最后技術架構落地實施。
系統功能是用戶使用系統時最直接、最關鍵的體驗。華龍智庫具有智能檢索、程序智庫、知識地圖三大功能模塊。
3.2.1 智能檢索
智能檢索是華龍智庫的核心功能,但要實現智能檢索,首先需要整合、構建一個全面的、結構化的知識庫。
3.2.1.1 知識庫
整合、構建知識庫需要對大量的文檔數據進行清洗、分類、歸集和存儲,這就需要運用到自然語言處理、數據挖掘、信息抽取等人工智能技術(見圖2)。華龍智庫采用自然語言處理技術,將業務系統中已有結構化和非結構化的文檔數據進行解析提取,通過數據同步技術將解析后的數據定期同步存儲,通過數據挖掘和信息抽取等技術將文檔數據的實體、屬性、關系進行抽取,利用算法推理技術挖掘數據之間的關系(例如文檔與文檔間的關聯關系,如參考文件、依據文件等),構建出知識圖譜(見圖3),最終以圖數據庫的形式將知識進行存儲,形成知識庫。

圖2 知識庫構建

圖3 知識圖譜構建
3.2.1.2 檢索引擎
知識檢索引擎要根據知識庫進行開發。基于Elastic Search 搜索框架、大數據分析引擎和已建立的知識圖譜,將海量數據在搜索引擎中進行搜索模型構建、快速索引、智能分詞和模型調優,零代碼嵌入現有業務系統,解決系統文檔查詢速度慢的問題。
大數據分析引擎可以對系統采集的海量的用戶行為進行分析計算,結合協同過濾算法和系統設定的規則,實現基于用戶行為的智能推薦(見圖4),用戶檢索次數越多,系統智能推薦的文檔越準確。

圖4 基于用戶行為的智能推薦
3.2.2 程序智庫
華龍智庫開發的程序智庫業務模塊,功能包括程序的計劃管理、編制管理和上下游關聯關系管理,程序生效發布后的培訓管理、變更管理和定期審查管理,實現了程序從編制到升版內循環的閉環管理和全流程電子化管理,以文檔+業務的模式推進程序體系管理提升,實現程序業務一體化、程序編制智能化、程序培訓信息化、數據統計自動化、文件變動關聯化、意見系統專業化和程序管理敏捷化。
3.2.3 知識地圖
基于文檔知識庫和知識圖譜,華龍智庫創建了知識地圖模塊,便于用戶瀏覽和尋找自己所需的知識。用戶進入知識地圖以后,可以選擇按核電領域或程序層級展示程序體系,再通過點擊體系地圖中的節點查詢該程序的相關知識。根據知識管理試點范圍,目前僅開發公司管理制度體系這一類基于概念的知識地圖,同時具備擴展功能,用于后續開展其他類型的知識地圖開發。
3.3.1 構建文檔知識關聯關系,實現文檔知識高效檢索
華龍智庫通過知識抽取、算法推理、知識融合等技術,建立了文檔和數據之間的知識關聯模型,為用戶提供了定義檢索、關鍵詞檢索、組合檢索、全文檢索等多種檢索方式,同時,華龍智庫會采集用戶的行為數據(檢索、查看、收藏、下載等)和個人信息(部門、職位、領域等),通過大數據分析引擎和機器學習算法,結合用戶偏好為用戶智能推薦文檔知識。此外,華龍智庫自動提取了文檔的目錄結構,并根據規則關聯了依據文件、參考文件等上游文件和文檔的附件,為用戶提供了快速定位文檔章節和一鍵跳轉瀏覽關聯文件的功能,大大提升了用戶文檔瀏覽體驗。
通過構建文檔知識關聯關系,華龍智庫實現了文檔知識檢索效率質的飛躍。用戶進行文檔檢索時,可以通過定義搜索、組合篩選和全文檢索的方式得到更為精確的檢索結果,系統會結合用戶行為數據和個人信息智能推薦其他文檔知識;用戶在線瀏覽文檔時,可以通過點擊目錄章節快速跳轉瀏覽頁面,快速查看和下載關聯上游文件和文檔附件。相較于ECM,華龍智庫從檢索速度、結果準確度和文檔關聯度三個維度實現了檢索效率的提升,不僅解決了用戶的痛點,還提升了用戶對于文檔知識的瀏覽體驗。
3.3.2 建設核電企業級知識庫,實現文檔知識高度歸集
華龍智庫將ECM、ASP-1 系統、經驗反饋系統等所有會形成文檔的業務系統作為知識挖掘的主要對象,進行文檔知識庫的集成,并通過自然語言處理等人工技能技術,將企業結構化、半結構化和非結構化的數據進行整合和解析,構建了核電企業級知識庫。
通過建設核電企業級知識庫,華龍智庫集成了漳州能源主要形成文檔的業務系統,針對性地實現了文檔與經驗反饋的知識互聯互通。用戶在開展業務工作時,可以通過華龍智庫快速獲取與該業務工作相關的管理程序、技術文件和經驗反饋等文檔知識。華龍智庫高度歸集了漳州能源各業務系統的文檔和知識,統一了用戶文檔知識的檢索平臺,結合搜索引擎和知識模型實現了對知識庫的高效整合利用,為后續建設服務于公司全局的系統性知識庫奠定了堅實的基礎。
3.3.3 推進程序體系管理電子化,實現文檔+業務創新融合
華龍智庫將程序計劃的編制、審批、變更和程序文件的編制、審批、分發、培訓、升版等程序體系管理全流程進行了電子化,并基于數字孿生概念構建了程序體系知識地圖,強化了上下游程序之間的關聯關系,地圖在程序體系發生變更時會自動更新。此外,華龍智庫在瀏覽頁面中設計了程序意見反饋欄,促進用戶個人隱性知識顯性化。
通過推進程序體系管理電子化,華龍智庫將文檔工作與體系管理進行了基于數字孿生概念的創新融合。用戶在編制程序時,華龍智庫會根據編制或導入的程序計劃自動為用戶生成程序編制任務,并提供一鍵排版和協同編輯等程序文件編制功能,當程序的上游文件發生變化時,華龍智庫會自動識別并觸發分析任務至編制處室,確保程序始終滿足上游管理要求;用戶在查閱程序時,可以通過頁面中的意見反饋欄反饋程序存在的問題,將個人隱性知識顯性化。華龍智庫不僅實現了程序體系管理業務流程電子化,也為建立文檔與業務雙向驅動的核電文檔知識管理長效機制提供了有效范例。
華龍智庫是漳州能源開展核電文檔知識管理探索與實踐的核心成果,為用戶提供更加智能的文檔知識服務。
華龍智庫自2023年3月29日上線運行以來,日均文檔瀏覽量超過550 次,直接取代了ECM 成為漳州能源文檔檢索利用的核心系統,運行處和維修處等生產部門的系統訪問量遙遙領先。從局部看,原先用戶想要從ECM 檢索到某個知識,平均需要大約5 分鐘的時間,而通過華龍智庫的智能檢索,用戶僅需大約10 秒鐘的時間就可以得到檢索結果,華龍智庫有效解決了漳州能源文檔檢索利用效率低的問題。從全局看,漳州能源規劃建設6+2 臺核電機組,系統用戶將有2000 余人,在項目連續建設直至全部建成投產發電的過程中,每年新增加各類文檔數量約有3-5T,按文檔知識管理體系治理入庫的知識約有2-3T,華龍智庫將持續幫助漳州能源積累智力資產,推動企業文檔工作的現代化進程,從而助推漳州能源實現高質量創新發展。
漳州能源知識管理實踐成效顯著,但實踐過程中也存在著一下問題和不足:
一是前期缺乏明確的知識管理策略。知識管理項目團隊對于知識和知識管理的認知不統一,導致知識管理工作一度推進緩慢,這個問題在明確項目負責人,統一思想后得到解決。
二是知識管理流程尚不規范。知識管理需要規范化的流程來確保知識的有效傳遞和利用,漳州能源以程序為試點推進知識管理工作,華龍智庫上線以后,程序仍可以通過ECM 進行審批,未制定明確的業務流程切換時間點,導致用戶在使用過程中產生疑惑。
三是知識庫數據同步不及時。根據策略,知識庫會在每天零點同步業務系統的數據,受ECM 的權限設置影響,有些文檔分類下的文檔和知識無法下載,導致數據同步失敗,用戶在訪問這些文檔時就會跳轉到ECM。
四是知識共享意識有所不足。在知識管理實踐中,知識共享是至關重要的,漳州能源作為在建電廠,正面臨1、2 號機組生產準備,3 號機組即將開工的工程建設緊張時期,同時又處于中國核電集約化改革時期,導致員工忙于日常工作,在知識共享方面有所欠缺,導致知識無法有效傳遞和利用。
漳州能源未來的知識管理改進方向應包括新技術的迭代升級和優化,提高數據抽取的質量,建立標準化和規范化的知識管理流程,進一步統一和明確管理要求,并制定激勵機制,鼓勵員工分享自己的知識和經驗,促進知識的有效傳遞和利用依托國家檔案局科技項目——“基于系統工程的核電文檔知識管理體系構建研究”繼續推進漳州能源文檔知識管理工作。
隨著國家治理活動的豐富,檔案工作正通過各種方式,為黨和國家各項事業建設與發展提供真實憑據、歷史經驗、記憶媒介、文化源泉、信息支撐,為國家立足當下和面向未來提供戰略性信息資源、基礎性文化資源、支撐性知識資源、特殊性經濟資源、工具性治理資源等支持,促使檔案工作成為國家治理體系和治理能力現代化的基礎性、支撐性和保障性力量。在這樣的時代背景下,核電企業通過開展文檔知識管理探索與實踐,提出了一種基于人工智能的核電文檔知識管理系統,建立了文檔與業務雙向驅動的核電文檔知識管理長效機制。持續推進文檔知識管理,有助于核電企業更好地管理和利用企業自身的知識資源,提高知識的共享和利用率,增強企業的競爭力和創新能力。