999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多維級聯知識抽取的核電建造經驗反饋圖譜研究

2025-02-12 00:00:00李池璐熊世權雷瑋劍劉疏桐李英敏易茜易樹平
中國機械工程 2025年1期

摘要:針對核電裝備建造過程中經驗反饋時效性弱、各參與方對經驗知識認知不統一、經驗反饋知識復用率低等問題,將經驗知識化,構建統一的經驗反饋圖譜。分析了經驗反饋信息的特征,構建了經驗反饋關鍵知識域結構與圖譜框架;提出的多維信息感知模型和改進PCNN關系抽取模型在核電企業數據集上取得了良好效果,并基于Neo4j圖數據庫生成了經驗反饋圖譜。研究結果表明該方法可完成核電產品的隱性知識深層次檢索,輔助核電專業技術與管理人員快速解析、傳遞經驗反饋知識,實現核電建造經驗反饋沉淀應用模式從以文檔為中心向以知識為中心的轉變。

關鍵詞:核電裝備;經驗反饋;知識圖譜;自然語言處理

中圖分類號:TL372

DOI:10.3969/j.issn.1004-132X.2025.01.019

開放科學(資源服務)標識碼(OSID):

Research on Experience Feedback Graph of Nuclear Power Constructions

Based on Multi-dimensional Cascading Knowledge Extraction

LI Chilu1"XIONG Shiquan1*"LEI Weijian2"LIU Shutong1"LI Yingmin2

YI Qian1"YI Shuping1

1.College of Mechanical and Vehicle Engineering,Chongqing University,Chongqing,400044

2.China Nuclear Power Engineering Co.,Ltd.,Shenzhen,Guangdong,518124

Abstract: Aiming at the problems of weak timeliness of experience feedback in the process of nuclear power equipment constructions, inconsistent perception of experience knowledge by each participant, and low reuse rate of experience feedback knowledge, the experience knowledge was intellectualized, and a unified experience feedback mapping was constructed. The characteristics of experience feedback information were analyzed, and the structure of key knowledge domains and mapping framework of experience feedback were constructed. The proposed multi-dimensional information perception model and improved PCNN relationship extraction model achieved good results on nuclear power enterprise dataset, and the experience feedback mapping was generated based on Neo4j graph database. The results show that the method may complete the deep-level retrieval of tacit knowledge of nuclear power products, assist the nuclear power professional technology and management personnels to quickly parse and transfer the experience feedback knowledge, and realize the transformation of the application mode of nuclear power construction experience feedback precipitation from document-centered to knowledge-centered.

Key words: nuclear power equipment; experience feedback; knowledge graph; natural language processing

0"引言

核電建造須嚴格遵守《中華人民共和國核安全法》《核電廠質量保證安全規定》(HAF003)等相關法律法規建立核安全經驗反饋制度,即將質量活動的執行情況詳細記錄為文本,形成專業知識和經驗并傳承給各參與方。

經驗反饋作為核電建造過程中一種重要的知識管理方法和改進機制,能幫助核電建造團隊識別有價值的問題和潛在風險,以便及時采取相應措施進行改進和優化,防止類似事件和問題重復發生,對提升建造質量、提高協同管控效率、優化資源配置等具有不可忽視的作用。為此,國內外核電企業建立了較為完善的經驗反饋與運作信息化系統,以便和參與方共享經驗反饋信息。

隨著核電工程的發展和智能制造技術的提高,核電企業開始研究如何進一步利用和傳遞經驗反饋信息,從傳統的以文檔為中心向以知識為中心轉變。趙棟等[1]開發的經驗反饋管理系統為核電工程設計經驗的歸檔、總結、發布及再利用提供了統一的平臺。鄒象等[2]提出一種基于AHP的核動力廠安全相關經驗反饋信息重要性評價方法,通過對信息進行相對重要性評價得到反饋價值,以識別重要的經驗反饋信息。上述方法傳遞的經驗反饋信息顆粒度比較大,其中隱含的關鍵要素仍需通過專業人員作進一步分析處理,經驗反饋信息難以被直接有效利用。核電領域迫切需要借助智能化技術來分析和提取經驗反饋信息并獲取重要內容,將建造過程產生的大量質量事件記錄梳理整合為結構化的經驗反饋知識,輔助相關人員快速分析關鍵要素,實現核電建造質量信息的跨企業高效流轉和復用。

近年來,自然語言處理(natural language processing,NLP)利用計算機處理、理解、規范表達人類語言文本,能智能化解析經驗反饋信息中的重要知識,提高可利用性。SINGHAL[3]提出的知識圖譜(knowledge graph)可將經驗反饋關鍵領域中的重要知識進行統一形式的可視化表達,有利于大規模經驗反饋信息的高效利用和傳遞[4]。基于NLP技術的知識圖譜能有效減輕核電經驗反饋信息處理過程對人工先驗知識的依賴,減少了人因失誤,提高了數據要素賦能作用,同時滿足了跨企業信息傳遞的需求。CHOI等[5]采用基于規則的信息提取方法在核電站的運行程序中提取語法和語義信息。鄧志光等[6]通過改進長短時記憶神經網絡,在核電廠反應堆出口溫度現場數據中提取故障特征。吳庭偉等[7]采用預訓練語言模型和門控循環神經網絡挖掘出核電質量缺陷的相關要素。ZHAO等[8]采用字典與規則相結合的方法訓練關系抽取模型,提取出核電質量事件中的因果關系。劉曉瑛[9]通過雙向網絡和改進的卷積神經網絡模型從各類文檔中抽取出核電設備相關知識,并用知識圖譜進行儲存。上述研究多依賴于手工與規則模版或是單一的算法,模型的泛化能力較弱、應用支持能力不足,針對核電建造經驗反饋信息的多維度關聯挖掘研究還存在一定空白。

知識圖譜通過結構化和語義化的數據表示,提供了更加精確和豐富的信息組織方式,并且可進行邏輯推理和推廣,有助于呈現與傳遞經驗反饋文本中的知識。

為此,筆者利用多維級聯知識挖掘構建經驗反饋圖譜,根據經驗反饋信息特點建立結構化圖譜框架,利用自然語言處理方法搭建基于深度學習的知識抽取模型,通過圖數據庫統一規范化表達與關聯,實現核電建造經驗反饋的知識化。

1"核電建造經驗反饋問題描述

1.1"價值鏈協同下的核電建造經驗反饋內涵

核電建造[10]過程積累的大量質量相關知識、經驗需要被傳承,但由于核電裝備的復雜性和特殊性,產業鏈涉及上千家企業,因此在多方協作參與建設的環境下,大規模的企業群顯然無法通過專項會議等方式學習同期經驗,更為直接有效的方式是各方將質量數據收集、記錄形成的經驗反饋知識與團隊共享。

作為PDCA循環質量改進的重要體現和資源配置的有效手段,經驗反饋能通過前期質量事件的發生和處理經驗指導后續同類工作,避免在工程中犯同樣的錯誤,實現持續改進。這既是進行質量管理的重要依據,又是“預防為主”質量方針的具體內容。同時,數據聯動、業務合作、資源和技術優勢互補等方式能幫助企業盡量避免和減少價值減少環節,擴大產業鏈整體價值,實現核電裝備全生命周期整體價值創造和增值效益的最大化發展[11]。

1.2"經驗反饋信息特征分析

核電建造中的經驗反饋信息絕大部分是以質量事件文本形式記錄的,包括事件描述、原因分析、改進行動,如表1所示,并具有以下特征。

1.2.1"經驗反饋信息收集與傳遞有時效要求

一個典型成熟的2臺百萬kW級機組的壓水堆核電站平均包括400余個工藝系統、48 000余臺套設備與備品備件[12],建造過程涉及數千家供應商,核電產品有多維度的質量指標、多層次的質量控制、長期的運營監測。核電站建造期間產生并記錄的變更、意外事件、不符合項報告等質量文本共計十余萬份。這些用作經驗反饋的信息在各階段活動會根據業務需求進行多個版本的迭代更新,并不斷增長,需要在一定時間內及時反饋給相關單位開展糾正工作。

1.2.2"經驗反饋信息內容復雜

核電裝備作為典型的復雜產品,其建造是一個高度復雜的過程,涉及多個專業領域和大量技術要求。核電建造經驗反饋信息記錄了質量事件發生的全部過程,涵蓋核電領域全生命周期中各活動的專有名詞和縮略語,如主蒸汽過濾器法蘭、常規島高壓管道支吊架、勵磁涌流影響、氫脆等。這些信息相互之間產生的關聯關系更復雜,需要借助專業人員及技術充分融合并挖掘利用。

1.2.3"經驗反饋信息來源離散

核電建造協同質量活動離不開各信息系統的參與,隨著信息技術的發展,工作形式逐漸從現場辦公轉為互聯網遠程辦公,產生大量經驗反饋信息的見證簽點工作也通過移動端在線上開展。多方協同環境下的工作方式變化給各個企業帶來更多的自主性,導致質量事件往往由不同公司不同部門的質保人員在信息系統中進行記錄和撰寫,造成信息的孤立與分散。

1.2.4"經驗反饋業務鏈條“以人為主”

據統計,單臺壓水堆核電機組在設計建造期間平均產生約3萬項業務變更。受背景知識、變更或真實事實資料(過程、原因、趨勢)掌握完整度、深度等差異因素影響,業務變更與經驗反饋鏈條上各參與方對同一數據的理解、觀點存在偏差,導致在文字組織、結論選擇上存在“取舍”。另外,僅依靠人工記憶難以避免相關人員在部分經驗反饋的范圍、層級等維度上存在信息盲區。

1.2.5"經驗反饋歷史數據與增量數據具有強關聯性

隨著增量數據的不斷累積,在新核電項目開工前,需對歷史項目經驗反饋數據開展分析,導致后續項目的數據累積增加,而人工判定會導致數據利用的廣度與深度受限,很難發現和處理經驗反饋數據之間的關聯性,造成部分高價值信息難以有效反饋。

1.3"核電建造經驗反饋現狀及不足

核電建造業務活動包括設計、采購、施工、調試階段,涉及三維建模、核島布置、現場安全、輻射與屏蔽、環保等29個專業,各個環節都會產生大量、實時的經驗反饋信息[13]。

針對發生的質量事件,一般的經驗反饋流程如圖1所示。首先,由現場人員記錄業務變更情況并進行初步分析,經所在部門主管生產的領導審核后交生產處的經驗反饋部門。生產處的經驗反饋工程師根據質量事件對來自不同渠道的信息進行甄別分類,并將經驗反饋報告下發給對應部門的負責人繼續跟蹤。各參與方通過收集與整理問題和事件記錄、總結經驗教訓,為后續的核電建造提供有益的借鑒和參考,避免類似錯誤的重復發生,優化資源分配,持續提高核電質量水平。

實際執行過程中的經驗反饋存在如下問題:

1)企業間經驗反饋時效性弱。核電建造過程中,來自不同企業、部門的質量數據日益增長,需要各部門的經驗反饋工程師花費大量的時間和精力來收集和整合。信息過載的情況下,缺乏有效的篩選機制和工具會導致單純依靠人工難以從海量數據中快速準確地獲得有效的質量信息并傳遞給其他企業,這使得經驗反饋信息供給不及時、不充分,缺陷失去糾正窗口或短時期內二次發生,造成物料資源、數據資源的浪費和建造進度滯后。

2)各參與方對經驗知識認知不統一。核電建造中產生的經驗反饋信息通常是由現場人員在質量事件發生時記錄,并以非結構化文本形式存在,包含豐富的核電領域知識和專業術語,信息之間的層次關系復雜。由于缺乏統一的格式和標準,“以人為主”的經驗反饋方式使得個人的記錄習慣與方式不同,導致信息提取和分析變得困難,一些重要的隱性知識和經驗需要專業經驗反饋工程師的理解和解讀才能獲取。文本形式的信息容易受當事人表達能力和主觀意見影響,可能存在表述模糊、錯誤或主觀偏見的問題。接收信息的工程師理解視角與評判尺度等個人因素會導致其對質量事件最終定級、核心屬性字段的認定結果不同,從而導致重要的經驗反饋知識丟失或誤解,無法確保信息的可靠性和可信度。由于沒有統一的知識表達規范,知識在企業間的傳遞和共享變得困難,各參與方對經驗反饋信息認知不統一容易導致經驗反饋失效。

3)經驗反饋知識復用率低。經驗反饋信息蘊含豐富重要的數據,但核電建造過程中碎片化的經驗反饋信息分散在各個系統,沒有被集中組織和高效管理,形成特定知識庫,這導致集成度差、知識間缺少有機關聯,簡單依靠各方人員在對應系統中檢索,甚至存在相同或相似的問題重復錄入、在不同項目中重復出現的情況。企業難以充分挖掘和進一步利用已有的經驗反饋信息,關聯性的隱性知識大量流失,降低經驗反饋的效果。

2"核電建造經驗反饋知識化

2.1"經驗反饋知識化的概念

核電建造經驗反饋的知識化是指將從實踐中獲得的經驗反饋文本信息轉化為結構化、可管理、可共享、可復用的知識的過程。這個過程旨在將核電建造經驗反饋信息中的關鍵內容、特征、洞察和最佳實踐等關鍵信息內容系統化地提煉出來,并整合到一個核電建造領域知識庫,以便指導各參與企業未來的行動、決策和問題解決。這有利于價值鏈協同模式下核電建造經驗反饋信息的融會貫通和多企業合作下的有序協同,從而實現全生命周期的價值創造最大化。

2.2"經驗反饋知識化的流程

經驗反饋知識化流程是將經驗反饋文本數據轉化為知識的系統化過程。

針對經驗反饋時效性弱的問題,需對經驗反饋信息涉及的知識化范圍進行界定,通過梳理核電質量文本數據的來源去除重復、不相關或低質量的內容,篩選有反饋價值的信息,減少投入在不必要信息處理上的精力,提高經驗反饋效率。

針對建造中各參與方對經驗知識認知不統一的問題,需將質量數據進行整理和篩選,通過分類、歸納、總結等方法建立統一的規則表示知識,以便融合智能化技術提取知識,確保上下游經驗反饋知識理解的一致。

針對經驗反饋知識復用率低的問題,需提高經驗反饋信息的集中性和可檢索性,通過建立領域知識庫并結合核電內部業務邏輯映射知識間的關聯關系,構建隱性知識索引解析與呈現表達體系,給經驗反饋信息價值賦能。

具體而言,實踐中獲得的經驗和教訓轉化為系統化、結構化的知識需經過范圍界定、分類與組織、知識庫建立等步驟。

2.2.1"經驗反饋知識化范圍界定

核電建造的經驗反饋信息來源廣泛,主要包括內部與外部。外部經驗主要來自世界核電業主聯合會(WANO)的重大事件報告(SER)、重大運行事件報告(SOER)。對本電站和世界同行電站已發生的問題與事件進行根本原因分析,可防止類似問題與事件的重復發生,例如福島核事故后,核電企業紛紛汲取經驗教訓,將安全改進納入設計標準,對嚴重事故的預防提出了更加明確的要求,并加大了對核電建造的概率安全評價(PSA)技術體系的研究[14]。核電企業還吸收世界同行電站的良好實踐經驗,進行內部比較檢查,提出改進行動計劃并跟蹤落實,以降低重大事故的二次發生率。

相比于外部反饋,核電建造過程中更為及時有效的是來自內部的經驗反饋。核電建造過程產生且累積了大量設計變更通知、意外事件單、不符合項報告、現場變更申請等記錄,內容涵蓋核電工程項目設計、采購制造、施工安裝、調試運維等全生命周期各個階段各個方面的質量信息,如設計圖紙不符合要求、現場質量見證不通過等。其中,升級為質量事件的信息包含詳細事件過程、原因、具體整改措施和改進方案等內容,信息的記錄具有參考性和反饋價值,需要及時處理與傳遞。

因此,為提高經驗反饋效率,本文研究的經驗反饋知識化的范圍主要為核電建造過程中內部產生的質量事件記錄。

2.2.2"經驗反饋知識的分類與組織

核電建造過程中內部產生的質量事件記錄包含的內容及類別眾多,但并非所有的信息都具有傳遞價值,為實現經驗反饋知識化,需從中篩選和界定出具有反饋價值的要素,形成統一規范的知識域,確保信息的一致性和可解釋性。

經驗反饋的關鍵知識域是經驗反饋信息中關鍵知識的集合,是對建造過程質量事件的層次化描述,其內容主要包含關鍵領域實體和領域關系。前者指核電建造領域中具有重要意義和作用的實體,包括事件、對象、原因、行動、人員等;后者描述了關鍵領域實體之間的聯系、依賴或影響關系,如因果關系、依賴關系、層次關系、時間關系等。

統計分析核電企業中記錄在檔的經驗反饋信息具體內容可知,關于故障問題的描述性信息出現頻率較高,是各參與方在建造過程中需要掌握的重點數據要素,也是影響核電建造效率和質量的關鍵。基于這一分析結果,結合相關領域專家意見,以“故障問題”這類實體為核心,通過實體聚類形成故障表現層;進一步分析評判與故障表現緊密相連的各類關鍵信息,其中,設備故障信息有利于篩選重點關注對象,并在后續階段持續跟蹤與對比項目其他機組,防止同類型設備再次發生質量問題;提取故障產生的原因能幫助企業或部門更有效地處理問題,從根源上預防問題,減少質量事件;提取故障對應措施的信息便于相關人員在同樣問題發生后能快速查詢解決,提高解決問題的效率。此外,時間、階段、設備、人員、企業部門及解決效果等均為具有傳遞價值的必要信息,如表2所示。

梳理不同維度上的關鍵知識要素可形成經驗反饋關鍵知識域的故障設備層、故障原因層、對應措施層等知識層。同時通過層間交互關系實現關聯耦合,將離散的知識要素轉化為具有語義關聯和邏輯推理能力的空間知識結構,集成核電建造經驗反饋資源。經驗反饋關鍵知識域的結構如圖2所示。

2.2.3"經驗反饋知識庫建立

經驗反饋知識化的目的是使經驗反饋的關鍵信息在實際核電建造中能被傳遞、檢索和共享。

利用知識庫將核電建造經驗反饋關鍵知識域集中管理,能改變關鍵知識獨立分散的性質,確保經驗反饋知識能統一、清晰地呈現。在此基礎上,利用交互關系將經驗反饋信息轉化為具有語義關聯和邏輯推理能力的知識結構,實現知識之間的耦合交互,即根據特定條件觸發相應的推理過程,使關聯知識能被獲取,圖3所示為經驗反饋知識化應用的框架。

結合機器學習和數據挖掘技術,通過分析大量的經驗反饋數據,自動發現潛在的規律和模式,輔助建立更智能和高效的推理規則。利用知識圖譜或專家系統建立推理引擎,將推理規則轉化為計算機可理解和執行的形式,提高知識的可解釋性,實現核電建造經驗反饋知識的自動推理和應用。

3"核電建造經驗反饋圖譜構建

為滿足跨企業環境下核電建造經驗反饋知識化的需求,需借助智能化技術挖掘和組織經驗反饋知識。

區別于傳統的文本記錄方式,本文利用知識圖譜技術呈現經驗反饋知識化的結果。該方法主要基于經驗反饋關鍵知識域,利用自然語言處理技術來智能地抽取經驗知識,構建統一數據格式的經驗反饋圖譜,通過圖數據庫存儲結構化知識,并為相關人員提供知識檢索工具,實現經驗反饋知識化。

3.1"經驗反饋圖譜構建的總體框架及組織流程

知識圖譜的構建方式通常分為自頂向下(top-down)和自底向上(bottom-down)兩種[4],前者先為知識圖譜定義數據模式,從最頂層的概念開始構建,逐步向下細化形成本體模型,再將數據添加到知識庫;后者通過對實體的歸納組織形成底層概念,再逐步向上抽象成上層概念。

本文采用自頂向下的構造方法,先梳理與重整核電企業中產生的大量繁雜、冗長的質量信息,將經驗反饋關鍵知識域作為知識圖譜的模式層;再根據核電經驗反饋文本的特點,利用自然語言處理技術,針對性地設計命名實體識別方法和關系抽取方法,從文本中抽取出結構化形式的關鍵知識組并映射到圖譜的本體模型,如圖4所示。

3.2"經驗反饋圖譜本體建模

基于前文對經驗反饋知識的分類與關聯組織,將經驗反饋關鍵知識域作為經驗反饋圖譜模式層,通過本體建模方法顯性化表示,為文本知識抽取提供框架。利用Protégé軟件將經驗反饋關鍵知識域中不同層別的領域知識層構建為類(owl:Class),各層之間的關聯關系構建為對象屬性(owl:Object property),以建立節點類型及概念或實例之間的語義關系,獲得〈實體-關系-實體〉結構的知識形式,并將經驗反饋關鍵知識域顯性化表征,形成經驗反饋圖譜本體模型,如圖5所示。

通過以上方式定義的經驗反饋關鍵知識域統一數據規范能明確知識挖掘目標,為經驗反饋圖譜的構建提供模式支撐。

3.3"基于多維級聯知識抽取的經驗反饋信息挖掘

為構建完整的經驗反饋圖譜,在經驗反饋關鍵知識域框架的指導下,利用知識抽取的方法分析和挖掘核電領域質量信息的重要語義特征,向經驗反饋圖譜本體模型填充數據。

核電建造經驗反饋信息文本內容復雜、關系類別繁多,單一的網絡模型無法較好地識別和學習關鍵特征,經驗反饋知識不易被挖掘、組織和表征。為提高在核電領域的挖掘效果,本文提出多維級聯知識抽取方法,即搭建多層神經網絡模型對核電領域的經驗反饋信息進行多維度特征挖掘,高效抽取出關鍵領域知識。

3.3.1"基于多維信息感知的知識識別方法

核電質量事件所含的關鍵知識元素需要通過命名實體識別(named entity recognition,NER)方法從語料文本中自動識別并抽取。基于深度學習的方法可實現自動化的實體抽取,將文本以向量的形式嵌入到神經網絡,實現端到端的命名實體識別,該方法可在短時間內處理大量的經驗反饋文本,節約挖掘成本和時間。

結合核電領域經驗反饋信息內容復雜性的特點,本文構建了包含以Transformer為核心的詞嵌入層、以雙向長短時記憶(bi-directional long short-term memory,BiLSTM)和注意力機制(attention)為核心的知識感知層、以條件隨機場(conditional random fields,CRF)為核心的知識預測層的三層功能網絡,從多個維度感知和抓取核電質量事件中的關鍵要素,如圖6所示。在知識感知層融合注意力機制,加強對核電領域重點詞的關注,有效解決核電領域知識識別效果不佳的問題。

1)詞嵌入層。為讓計算機模型能識別核電領域文本,設計基于Transformer的雙向編碼器表示(bidirectional encoder representations from transformers,BERT)[15]的詞嵌入層,將詞匯映射到實數向量。BERT是預訓練網絡模型,具備較強的泛化能力。該模型的輸入具有三個不同的嵌入層,分別表示輸入質量事件文本的詞語信息(token embedding)、句子段落信息(segment embedding)和句子位置信息(position embedding),將三層信息向量拼接作為BERT的最終輸入,經過多層Transformer得到含有多個維度語義特征的輸出向量,為后續模型提供數值型數據的輸入。

2)知識感知層。核電建造中產生的質量事件文本通常比較長,模型在學習識別過程中容易遺忘過去的信息,因此采用BiLSTM[16]雙向挖掘質量事件文本中的歷史信息和將來信息,將長時間的特征全面聯系起來。為進一步加強文本對核電相關要素的敏感度,本文采用融合注意力機制[17],計算核電經驗反饋信息中詞與詞之間特征的關聯程度,使模型在處理信息時將注意力集中在核電有關的區域,獲得更有效的語義信息。

3)知識預測層。知識感知層的輸出結果只是對核電質量事件文本中的每個字進行了學習,并沒有考慮標簽之間的約束關系,如“壓力容器”是核電領域中的固定專業詞語,字與字之間不能調整順序,因此需對標簽的連接順序有所約束。引入條件隨機場對知識感知層的輸出結果進行優化。該模型在預測時結合發射矩陣和轉移矩陣,通過上層輸出的狀態分數和轉移分數來獲得句子標簽對應得分最高的標注序列,從而確保最后預測的經驗反饋知識合理有效。知識預測層中,文本對應的標簽概率P(y|x)的計算公式為

P(y|x)=1z(x)exp(∑kwkfk(y,x))(1)

z(x)=∑Ny=1exp(∑kwkfk(y,x))(2)

式中:x為經過知識感知層輸出的語義特征向量;y為一個狀態序列概率;wk為參數向量;fk(y, x)為特征函數;z(x)為歸一化因子。

最后利用維特比(Viterbi)算法得到最佳預測標簽:

Y*=argmaxy P(y|x) (3)

3.3.2"基于改進PCNN的知識關系抽取

核電建造經驗反饋信息關系復雜、難以梳理,需利用關系抽取(relation extraction,RE)技術提取核電質量文本關系特征。表達質量事件的核電經驗反饋信息較長,使用基于詞法、句法特征抽取關系的傳統方法正確率不高,同時為避免引入噪聲數據,采用基于多實例學習的分段卷積神經網絡(piece-wise-CNN, PCNN)[18]方法完成關系抽取。在CNN模型的基礎上調整特征提取方案,將關系抽取視為多實例問題,僅將每個實例中最接近真實類別的一個示例作為輸出。同時為減少誤差的傳播和積累,在句子的向量表達中引入位置向量,根據核電經驗反饋信息中關鍵信息的位置將句子分成三段,每段單獨作最大池化操作,提取出更細粒度的關系特征,最后將分段池化層的輸出結果送入softmax層,獲得核電經驗反饋信息關系的分類。PCNN網絡模型的具體結構如圖7所示。

由于核電經驗反饋信息具有內容專業性強的特征,所以對PCNN關系抽取模型進行改進,引入正則化的思想,將具有更平滑非線性特征的高斯誤差線性單元GELU[19]作為激活函數,提高經驗反饋信息關系抽取模型的泛化能力并避免模型學習過程中的梯度消失問題。GELU函數的具體表達式為

GELU(x)=x2(1+tanh(2πx(1+0.047715x2)))(4)

式中:x為輸入。

3.4"經驗反饋圖譜知識的映射與生成

3.4.1"數據來源與預處理

核電裝備涉及到數據保密問題,當前相關研究和語料庫都較為匱乏,核電建造經驗反饋信息領域暫無可用于訓練的公開數據集。為驗證本文構建的多維級聯知識抽取模型的有效性,筆者將項目合作核電企業信息系統中的質量事件記錄作為原始訓練數據。通過前期規則化采集、篩選、清洗訓練數據后,根據文本的特點規范數據長度,并進行預實驗,再按照預實驗驗證結果,利用自然語言處理任務中常用的標注策略進行標簽標注和關系標注,完成數據的預處理,為文本挖掘工作提供數據基礎。通過上述處理建立的數據集由350條質量事件記錄組成,將數據按照7∶1.5∶1.5的比例分割為訓練集、測試集、驗證集,以便計算模型的具體評價指標。

3.4.2"模型參數設置

通過文獻檢索和預實驗結果,設置知識挖掘模型中主要的超參數,如表3所示,運行環境為Python3.7,使用PyTorch1.11.0框架,將預處理的經驗反饋數據集投入模型進行訓練。

3.4.3"知識抽取效果

為驗證多維信息感知模型和改進PCNN關系抽取模型對經驗反饋信息中的語義特征提取效果,在同一數據集下,選取幾種知識挖掘模型進行實驗,結果如表4所示。在經驗反饋信息的實體識別任務中,本文使用的融合注意力機制的BERT-BiLSTM-CRF模型的準確率、召回率和F1值分別為91.49%、93.14%、92.31%,模型識別效果較好。

根據表5可知,本文提出的改進PCNN關系抽取模型的準確率、召回率和F1值均比PCNN的大,能更好地識別核電質量文本的關系特征,為構建完整的經驗反饋圖譜提供數據支撐。

3.4.4"經驗反饋圖譜生成

通過多維級聯知識抽取模型提取經驗反饋信息后,原始的大量非結構化質量事件文本轉化成了結構化的經驗反饋關鍵域。在此基礎上使用Neo4j圖數據庫構建知識圖譜中的節點和邊,完成本體模型映射和知識規范存儲,實現經驗反饋知識的可視化集成,形成核電建造經驗反饋圖譜(圖8)。

3.5"基于經驗反饋圖譜的深度知識挖掘

基于Neo4j圖數據庫生成的經驗反饋圖譜使用Cypher語言指令進行知識深度挖掘與應用。

3.5.1"質量問題處理措施的查詢與復用

通過經驗反饋圖譜檢索特定知識庫,能輔助相關人員針對性查詢具體質量問題的處理措施,如在核電建造過程中發生齒輪碰摩的質量事件,則可在經驗反饋圖譜中通過指令

MATCH (n)-[r]-()

WHERE n.gz CONTAINS ‘碰摩’RETURN n,r

檢索過去的經驗知識,獲得有關“碰摩”的故障節點,展開節點可獲得對應的經驗反饋圖譜和節點的統計信息,如圖9所示。

與文字記錄質量事件的傳統方式相比,統一規范的圖結構更利于管理人員組織和管理經驗反饋知識,所有的質量事件記錄都按相同的結構和規范進行組織和存儲,能確保各類復雜信息都以一致的方式進行表達。非專業人員無需閱讀大量的文字文檔也能通過瀏覽知識節點和連接關系,快速理解經驗反饋信息中的重點內容,獲取質量問題的處理措施及其他相關知識。經驗反饋圖譜還能避免不同人或團隊對不同行文風格的經驗反饋信息產生認知偏差,提高經驗反饋信息的可理解性和可復用性,進而提高經驗反饋的效率和質量。

3.5.2"質量問題關聯實體的查詢與推送

核電建造過程中,經驗反饋工程師并非檔案專業人員,信息檢索能力有限,往往以關鍵詞查詢資源,查全率和查準率低、顆粒度大,這導致經驗反饋信息的隱性知識難以發掘、傳遞滯后。基于經驗反饋圖譜的關聯知識檢索突破了傳統的關鍵詞檢索方式,管理人員可根據質量問題節點和關聯關系等條件快速查詢特定質量問題相關的各種實體。例如,設備所屬機組和故障發生階段之間原本沒有直接關系,但利用知識圖譜多跳檢索方式可查詢到實體間隱含的路徑關聯,輸入指令

MATCH q=(a)-[*1..3]-n

WHRER n.jd CONTAINS ’施工階段’

AND a.jz CONTAINS ’3號機組’

RETURN q

在圖數據庫中進行多級跳躍查詢到“3號機組”節點與“施工階段”節點的間接關系,結果如圖10所示。

由圖10易知,3號機組在施工階段有3臺設備發生過不同類型的質量問題,在Neo4j圖數據庫中進一步展開設備類型的節點可獲得對應的故障原因、人員等信息,能輔助管理人員明確企業間相關質量業務的接口和責任,從而向對應的部門反饋。相關人員在調試階段需要重點關注這些設備的質量狀態,降低相同設備相同質量問題二次發生的可能性。將查詢結果推送到報告生成工具、數據分析平臺等進行進一步的數據分析,有助于了解質量問題的影響范圍和相關實體的狀況,支持決策制定和改進措施的實施,使協同質量管控更精準、全面與高效。

3.5.3"經驗反饋譜系知識統計與預防

通過聚類經驗反饋圖譜中記錄的同一標簽類,可得到用于表征特定類型知識的經驗反饋知識譜系。基于經驗反饋知識譜系,各類經驗知識可被快速訪問和檢索,經驗反饋工程師無需花費大量時間和精力去查找和收集。例如,輸入指令

MATCH (n:gz) RETURN n

可得故障知識譜系,如圖11所示。該指令能統計項目中質量事件發生次數,分析發生次數最多的同類型故障,有利于識別潛在的風險和預警信號,并采取相應的預防措施,減少質量問題的發生。

基于經驗反饋譜系的關鍵知識管理與統計,可為用戶提供強大的搜索和過濾功能,有助于發現核電建造過程中存在的問題和數量趨勢,幫助管理者識別常見的質量事件、故障模式和風險因素,輔助決策者和團隊更好地了解和應對問題。

4"案例研究

基于上述研究,將經驗反饋圖譜和深度知識挖掘功能集成到核電企業的經驗反饋系統。該系統具有原始文本記錄、圖譜展示、關聯檢索和數據分析等功能,輔助管理人員進行核電建造決策,將以人工經驗為主的決策轉變為知識驅動的智能決策,有效提高核電建造過程中經驗反饋信息的可解釋性。

反應堆壓力容器(RPV)是核電主設備之一,零部件較多,其質量對核電站安全至關重要。安裝或調試過程中,RPV某零部件發生質量問題時,可通過現場人員記錄至項目經驗反饋系統,通過多維級聯知識抽取方式智能解析文本庫,在“圖譜展示”功能模塊中實時生成可視化的經驗反饋圖譜。基于統一規范的圖譜,相關管理人員可通過推理引擎查詢指令,在“關聯檢索”功能模塊中針對反應堆壓力容器這一設備進行深度信息挖掘,得到RPV故障發生的關聯知識,如圖12所示。

管理者可從RPV經驗反饋圖譜快速了解結構化的關聯知識,即在該項目歷史記錄的質量事件中,屬于3號機組和4號機組的保溫支承體、頂蓋組件、接管座等RPV的關聯設備(含子設備)發生過5種不同類型的故障,進一步可獲得故障的根本原因和對應措施。通過“數據分析”功能模塊可得到故障發生階段的統計信息、常發生質量問題的零部件類別、過去質量事件的應對措施及涉及人員,以此生成統計報告并反饋給相關企業或部門,達到經驗反饋信息精準傳遞的目的,促進高效、科學、綜合地規劃和制定核電裝備建設方案,確保核電裝備協同質量管控的高效與安全,具體應用流程見圖13。

5"結論與展望

本文根據核電裝備的協同質量管控需求,針對企業間經驗反饋時效性弱、各方經驗反饋知識認知不統一、經驗反饋信息復用率低等問題,在質量事件文本數據的基礎上構建了統一數據模式的經驗反饋圖譜。分析了核電建造過程中經驗反饋信息的特點、人工處理為主方式面臨的困境,提出將經驗反饋信息知識化處理的思路,詳細論述了經驗反饋關鍵知識域的構建方案。針對經驗反饋圖譜的數據挖掘任務,設計了多維信息感知模型,利用上下文和重點語義特征提高了命名實體識別和關系抽取技術在核電領域的知識挖掘效果。該技術在某核電建造企業實際產生的經驗反饋信息上得到驗證,形成了可視化圖譜,并利用圖譜進行了以反應堆壓力容器為對象的深度知識挖掘,為相關質保人員提供了智能化、精細化的質量知識管理工具并能夠輔助管理決策,有助于核電企業深度復用質量數據資源,打破異地分布式企業之間的信息隔閡,提高核電建造的質量和效率。

未來將繼續優化經驗反饋圖譜構建過程,擴充語料數據并動態更新知識圖譜,開發基于經驗反饋圖譜的智能問答系統,優化知識檢索方式。

參考文獻:

[1]"趙棟, 景曉冬. 工程經驗反饋推薦系統在核電設備設計中的應用研究[J]. 制造業自動化, 2017, 39(10):123-127.

ZHAO Dong, JING Xiaodong. Research of the Engineering Experience Feedback Recommendation System in the Equipment Design of Nuclear Power[J]. Manufacturing Automation, 2017, 39(10):123-127.

[2]"鄒象, 張浩, 雷蕾, 等. 基于層次分析法的核動力廠安全相關經驗反饋信息重要性評價方法研究與應用[J]. 核動力工程, 2023, 44(3):189-195.

ZOU Xiang, ZHANG Hao, LEI Lei, et al. Research and Application of Significance Determination for Safety-related Feedback Information Based on Analytic Hierarchy Process in Nuclear Power Plants[J]. Nuclear Power Engineering, 2023, 44(3):189-195.

[3]"SINGHAL A. Introducing the Knowledge Graph:Things, not Strings[EB/OL].[2012-05-16]. https:∥blog.google/products/search/introducing-knowledge-graph-things-not/.

[4]"吳信東. 知識圖譜[M]. 北京:科學出版社, 2022.

WU Xindong. Knowledge Graph[M]. Beijing:Science Press, 2022.

[5]nbsp;CHOI Y, NGUYEN M D, KERR T N Jr. Syntactic and Semantic Information Extraction from NPP Procedures Utilizing Natural Language Processing Integrated with Rules[J]. Nuclear Engineering and Technology, 2021, 53(3):866-878.

[6]"鄧志光, 吳茜, 朱加良, 等. 基于改進LSTM的核電廠傳感器故障診斷研究[J]. 自動化儀表, 2023, 44(6):115-120.

DENG Zhiguang, WU Qian, ZHU Jialiang, et al. Research on Sensor Fault Diagnosis in Nuclear Power Plants Based on Improved LSTM[J]. Process Automation Instrumentation, 2023, 44(6):115-120.

[7]"吳庭偉, 王夢靈, 易樹平, 等. 多尺度核電質量文本故障信息語義抽取方法[J]. 中國機械工程, 2023, 34(8):976-981.

WU Tingwei, WANG Mengling, YI Shuping, et al. Semantic Extraction Method of Multi-scale Nuclear Power Quality Text Fault Information[J]. China Mechanical Engineering, 2023, 34(8):976-981.

[8]"ZHAO Yunfei, DIAO Xiaoxu, HUANG J, et al. Automated Identification of Causal Relationships in Nuclear Power Plant Event Reports[J]. Nuclear Technology, 2019, 205(8):1021-1034.

[9]"劉曉瑛.基于知識圖譜的核電設備健康管理系統設計與實現[D].杭州:浙江大學,2022.

LIU Xiaoying. Design and Implementation of a Nuclear Power Equipment Health Management System Based on Knowledge Graph[D]. Hangzhou:Zhejiang University, 2022.

[10]"馮毅雄, 趙澤田, 胡炳濤, 等. 核電裝備全生命周期價值鏈協同平臺研究[J]. 計算機集成制造系統, 2022, 28(9):2633-2649.

FENG Yixiong, ZHAO Zetian, HU Bingtao, et al. Collaborative Platform of Lifecycle Value Chain for Nuclear Power Equipment[J]. Computer Integrated Manufacturing Systems, 2022, 28(9):2633-2649.

[11]"胡炳濤, 馮毅雄, 密尚華, 等. 面向核電裝備的全生命周期價值鏈協同模式研究[J]. 機械工程學報, 2022, 58(13):213-227.

HU Bingtao, FENG Yixiong, MI Shanghua, et al. Novel Collaborative Mode of Lifecycle Value Chain for Nuclear Power Equipment[J]. Journal of Mechanical Engineering, 2022, 58(13):213-227.]

[12]"雷瑋劍, 單玉忠, 王理, 等. 核電站建安調試文本語料抽取與語義圖譜構建技術研究[J]. 信息技術與信息化, 2024(1):6-12.

LEI Weijian, SHAN Yuzhong, WANG Li, et al. Research on Corpus Extraction and Semantic Map Construction Technology of Nuclear Power Plant Jianan Debugging Text[J]. Information Technology and Informatization, 2024(1):6-12.

[13]"昝云龍.質量管理[M].北京:原子能出版社,2002.

ZAN Yunlong. Quality Management[M]. Beijing:Atomic Energy Press,2002.

[14]"汪南. 基于風險管理的H核電項目調試進度控制方案研究[D]. 大連:大連理工大學, 2020.

WANG Nan. Research on Control Scheme of Commissioning Schedule of H Nuclear Power Project Based on Risk Management[D]. Dalian:Dalian University of Technology, 2020.

[15]"DEVLIN J,CHANG M W,LEE K,et al. BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding[J].arXiv,2018:1810.04805.

[16]"HOCHREITER S, SCHMIDHUBER J. Long Short-term Memory[J]. Neural Computation, 1997, 9(8):1735-1780.

[17]"VASWANI A, SHAZEER N, PARMAR N, et al. Attention Is All You Need[C]∥Proceedings of the 31st Conference on Neural Information Processing Systems. Long Beach, 2017:6000-6010.

[18]"ZENG D,LIU KCHEN Y,et al. Distant Supervision for Relation Extraction via Piecewise Convolutona Neural NetworksiCW/ACL[C]∥Procedings of the 2015 Conference on Empirical Methods in Natural Language Processing.Lisbon,2015:1753-1762.

[19]"HENDRYCKS D, GIMPEL K. Gaussian Error Linear Units (GELUs)[J]. ArXiv, 2016:1606.08415.

(編輯"張"洋)

作者簡介:

李池璐,女,1999年生,碩士研究生。研究方向為知識圖譜、質量管理。E-mail:chichi@stu.cqu.edu.cn。

熊世權*(通信作者),男,1975年生,博士、講師。研究方向為質量管理、智能制造、人因工程。發表論文20余篇。E-mail:xiongshiquan@cqu.edu.cn。

本文引用格式:

李池璐,熊世權,雷瑋劍,等.基于多維級聯知識抽取的核電建造經驗反饋圖譜研究[J]. 中國機械工程,2025,36(1):177-189.

LI Chilu, XIONG Shiquan, LEI Weijian, et al. Research on Experience Feedback Graph of Nuclear Power Construction Based on Multi-dimensional Cascading Knowledge Extraction[J]. China Mechanical Engineering, 2025, 36(1):177-189.

收稿日期:2024-03-23

基金項目:國家重點研發計劃(2020YFB1711700);中央高校基本科研業務費專項資金(2021CDJKYJH022)

主站蜘蛛池模板: 国产精品永久免费嫩草研究院| 亚洲另类色| 国产第一福利影院| 亚洲综合欧美在线一区在线播放| 久久婷婷综合色一区二区| 欧美激情视频在线观看一区| 一本大道无码日韩精品影视| 国产毛片片精品天天看视频| 五月天久久综合| 青草视频免费在线观看| 99这里只有精品6| 无码内射中文字幕岛国片| 国产乱子伦视频三区| 欧美另类精品一区二区三区| 视频一本大道香蕉久在线播放| 55夜色66夜色国产精品视频| 亚洲69视频| 国产美女精品一区二区| 91年精品国产福利线观看久久 | 手机在线免费毛片| 亚洲第一区在线| 色婷婷在线影院| 亚洲精品福利视频| 香蕉蕉亚亚洲aav综合| 亚洲国产成熟视频在线多多| 国产黄在线免费观看| 国产欧美精品专区一区二区| 欧美一级高清片欧美国产欧美| 久久精品亚洲中文字幕乱码| 特级aaaaaaaaa毛片免费视频| 呦女亚洲一区精品| 在线观看亚洲天堂| 亚洲美女高潮久久久久久久| 999国内精品视频免费| 日韩大片免费观看视频播放| 亚洲激情区| 乱码国产乱码精品精在线播放| 成人免费午间影院在线观看| 亚洲中久无码永久在线观看软件 | 婷婷激情五月网| 欧美翘臀一区二区三区| av在线5g无码天天| 伊人成人在线| 99视频只有精品| 日韩精品一区二区三区中文无码| 手机在线国产精品| 色屁屁一区二区三区视频国产| 国产va在线观看免费| 国产美女丝袜高潮| 亚洲欧美精品在线| 精品久久久久无码| 欧美伦理一区| 久久精品最新免费国产成人| 亚洲人成高清| 久久免费视频播放| 白浆视频在线观看| 亚洲视频免费在线| 久热re国产手机在线观看| 成年av福利永久免费观看| 99re这里只有国产中文精品国产精品 | 欧美精品1区| 亚洲欧美日韩综合二区三区| 99热国产这里只有精品无卡顿" | 欧美精品影院| 一级毛片中文字幕| 国产一区二区丝袜高跟鞋| 91午夜福利在线观看| 色香蕉网站| 丝袜国产一区| 极品av一区二区| 色哟哟精品无码网站在线播放视频| 日本不卡在线视频| 毛片大全免费观看| 欧美色视频在线| 久久国产精品娇妻素人| 91免费片| 99久久精品国产麻豆婷婷| 日韩高清一区 | 人人91人人澡人人妻人人爽| 97se综合| 国产精品理论片| 亚洲精品福利网站|