高東,肖遙,張貝克,許欣,吳重光
(1 北京化工大學信息科學與技術學院,北京100029;2 北京德普羅爾科技有限公司,北京100029)
危險與可操作性分析(HAZOP)于20 世紀70年代被提出,是一種以系統工程為基礎的危險分析方法。該方法采用表格式分析形式,具有專家分析的特性,主要適用于連續性生產系統的安全分析與評價,是一種啟發性的、實用性的定性分析方法。由于該方法具備“集體智慧”、“引導詞激發創新思維”以及“系統化與結構化審查”等特點,自誕生之日起,就被廣泛應用于國內外各個行業的安全評價、安全分析中[1-7]。HAZOP 分析一般按照國際標準IEC 61882展開,該標準詳細規定了HAZOP分析的基本定義、基本原理、分析步驟、流程等。
基于人工的分析方法存在工作量大、耗時長;嚴重依賴專家經驗;分析結果完備性難以保證;知識的繼承管理困難等問題,眾多學者開始對計算機輔助分析方法或計算機自動分析方法展開研究,通過計算機來輔助或替代人工進行HAZOP,以提高安全分析的效率,獲得更加準確的結果[8-15]。
無論是基于人工的分析方法還是基于計算機輔助或自動的分析方法,在分析結果的表達存儲上均存在各自的缺點。
(1)基于人工的分析方法通過專家會議的方式進行,分析結果以表格的形式保存,不同專家、不同項目做出的分析結果表達形式缺乏統一標準,在不同項目、團隊以及生產的設計、施工、生產、維護等不同階段進行信息的傳遞、復用、共享時會造成巨大的不便,耗費大量的人力物力成本。
(2)基于計算機輔助或自動的分析方法,雖然采用了計算機軟件來進行分析與結果存儲,分析結果同樣缺乏統一的表達形式,同時方法不具備知識自動識別能力。因此不同軟件之間難以實現信息復用、共享;同時同一軟件在不同項目、團隊以及生產的設計、施工、生產、維護等不同階段難于識別、復用。因此,針對安全分析相關信息標準化的研究成為一個重要的研究課題。
本體(ontology)是哲學上的一個概念。在哲學的范疇來說,知識本體是客觀存在的一個系統的介紹或說明。它描述了系統的基本概念和系統間的相互關系,由于具有共享和再利用知識庫的功能,知識本體被應用于很多方面,比如信息組織、信息研究等。知識本體一般分為通用知識本體與領域知識本體[16-18]。作為領域知識本體之一,國際標準ISO15926 是過程工廠包括石油與天然氣生產設施生命周期數據集成的標準,基于知識本體構建,用于計算機知識存儲與構造知識庫的標準[19]。以此標準為基礎,一些學者進行了安全分析信息標準化的研 究。 Lee[20]將FMEA (failure mode and effect analysis)與知識本體相結合,并構建了基于FMEA和知識本體的診斷模型,在故障模式與失效分析中進行了嘗試。Kuraoka 等[21]提出了一種基于本體論的HAZOP 分析信息表達方式,嘗試采用本體對HAZOP信息進行表達。針對HAZOP分析常見的因素尤其是設備進行了基于知識本體的標準化,給出了安全分析元素的標準化表達。之后在此基礎上,Batres 等[22]針對HAZOP 分析,提出了一種hazard scenario graph用于安全分析結果的表達,該方法以ISO15926 為基礎定義了安全分析中常見的元素,如行為、事件、原因、后果等,并提供了相應的環境工具。但該危險劇情圖建模過程較為復雜且需要人工將危險劇情一步一步建立到模型中,工作量很大、效率低,且嚴重依賴于建模人員的水平。
在前人研究的基礎上基于ISO15926 標準中關于標準化的表達,吳重光等[23]分析、抽提了HAZOP 分析方法的自身特點、規律,提出了一種新的過程安全分析信息標準化方法。該方法以HAZOP 分析中最為關鍵的危險事件傳播路徑作為標準化對象,針對危險事件傳播路徑給出了描述、表達方法,即劇情對象模型SOM(scenario object model)。采用劇情對象模型來描述石油化工過程中各個變量、設備、事件、原因、后果之間的影響關系。該模型基于知識本體實現,解決信息共享的問題。以劇情對象模型為基礎,吳重光等[24-25]開發了圖形化工具,實現了劇情對象模型的圖形化表達,便于建模、分析,并將該方法、工具應用到實際HAZOP分析的項目中。
上述關于HAZOP 分析信息標準化工作均基于傳統的HAZOP 分析流程進行,通過人工或者計算機輔助的方式進行離線的HAZOP 分析。為了充分利用HAZOP 分析信息以及實時獲得的數據,Gao等[26]提出一種在線安全分析方法,并基于知識本體實現了信息的標準化。
雖然HAZOP 知識本體的描述與其他領域知識本體描述的方式、原理類似,但HAZOP 信息的描述呈現以下特點。
(1)HAZOP 的對象是石油化工行業,其自身涵蓋了工廠整個生命周期中工程、采購、建設、操作等大量的數據類型與信息,非常復雜。
(2)HAZOP 知識本體需要針對HAZOP 自身的規范、標準流程建立,與傳統描述靜態關系的其他領域知識本體相比,HAZOP 的知識本體更強調類之間的邏輯影響關系,比如原因、后果之間的對應、事故的傳播路徑等。
在HAZOP 分析信息標準化方向,雖然已有不少研究成果,但目前的方法還存在以下問題。
(1)對HAZOP 分析中關鍵信息抽提、歸納還不完全,知識本體對HAZOP 信息的歸納表達仍然有待完備。
(2)HAZOP信息標準化的過程依賴手工建模,建模過程復雜、工作量大、效率低,而且模型的水平嚴重依賴建模人員的水平。
(3)所形成的計算機模型往往也只有特定的軟件才能識別、打開,嚴重影響HAZOP 分析信息的共享、復用。
為解決上述問題,提出基于知識本體的HAZOP信息標準化框架,實現了HAZOP分析信息表達的標準化以及自動化,達到了信息有效的共享與復用。本文首先介紹了當前HAZOP 分析及其標準化過程中存在的問題,其次介紹基于知識本體的HAZOP標準化信息模型,實現了HAZOP分析中所有關鍵信息、因素的標準化表達,然后介紹了基于此模型的信息標準化方法,實現針對人工HAZOP分析結果的自動識別與標準化,最后將該方法應用到某油品合成裝置的安全分析中,將傳統的HAZOP 分析結果自動轉化為標準化的分析信息模型,驗證了方法的有效性。
無論是基于人工的HAZOP 還是計算機輔助的HAZOP 方法,其本質都是基于“偏差”進行,也就是對偏離正常工藝設計條件的情況(包括設備失效、人為誤操作等)進行分析,尋找該偏差可能導致的事故、導致該偏差的原因、傳播路徑以及需要采取的措施等等。因此,HAZOP 信息就是由大量的偏差(事故)傳播路徑構成的。傳播路徑包括涉及的偏差、中間事件、原因、后果、現有安全措施、風險等級、建議措施等,構成了HAZOP 分析的全部元素。如圖1所示。
各個元素的主要定義如下。
偏差傳播路徑,構成HAZOP結果的基本單元,包含偏差、中間事件、原因、后果、現有防護措施、建議以及風險等級等。HAZOP 分析結果由一個或多個偏差傳播路徑組成。

圖1 基于偏差傳播路徑的HAZOP元素
偏差,與設定的工藝條件的偏離。偏差由工藝參數和引導詞構成。工藝參數,與過程有關的物理或化學特性,包括具體工藝變量如溫度、壓力、液位、流量等,以及抽象的過程如混合、反應、濃度、pH 等。引導詞,用于定性或定量設計工藝指標的簡單詞語,引導識別工藝過程的危險,常見的引導詞包括多、少、高、低、沒有等。
原因,產生偏差的原因包括設備故障、人為誤操作、設備失效等。
后果,偏差傳播最后導致的后果包括爆炸、火災、設備損壞、人員傷亡等。
中間事件,偏差產生后,傳播路徑中從原因到后果之間的事件。例如誤操作關閉反應器的冷卻水閥門為原因,反應器爆炸為后果的話,那么,反應器溫度升高、反應器壓力升高都是中間事件。
防護措施,當前系統中存在的設備或系統,用于防止或減輕偏差的傳播、不利后果的發展發生。
建議,針對偏差傳播導致的不利后果以及已有的防護措施,還需要加入的設備或采取的措施,如加裝控制系統、加裝檢測儀表等。
風險等級,由偏差導致不利后果的頻率與嚴重度確認的風險等級,通常為1~5 級。5 級最為嚴重,用于描述當前偏差傳播路徑引起后果的頻率與嚴重度。也有采用L、M、H三級,H為最嚴重。
上述基于偏差(事故)傳播路徑的HAZOP 元素基本涵蓋了傳統HAZOP 分析中常見的元素。將上述元素按照知識本體的概念進行歸類,歸類按照以下原則進行。
(1)類是知識本體的基本概念,將HAZOP 中概念性元素包括傳播路徑、偏差、建議措施等采用類的方式來描述。
(2)對于簡單元素,如風險等級、路徑編號等,直接作為類的屬性。
(3)對于可以進一步抽象的元素,進一步抽提共性,形成父類、子類的關系。如HAZOP的原因、后果以及中間事件都以事件類作為父類,因為它們都可以采用單體+活動的形式來描述。
最后得到基于知識本體的HAZOP 標準化信息模型。如圖2所示。

圖2 基于知識本體的HAZOP標準化信息模型
該模型由偏差傳播路徑類組成,偏差傳播路徑類又包含偏差類、事件類、措施建議類以及風險等級、路徑編號等屬性組成。
偏差傳播路徑類,代表HAZOP 中偏差傳播路徑的概念。
偏差類,代表HAZOP 中偏差的概念,包含工藝變量類與引導詞類。工藝變量類主要包括:溫度、壓力、液位、物位、流量、pH、電壓、電流、黏度、頻率、速度、反應等。引導詞類代表了HAZOP 中常見的引導詞,包括沒有(否)、多(大、高)、少(小、低)、多余(以及)、部分(局部)、相反(反向)以及其他(異常)等。
事件類,代表了偏差傳播中發生的“事件”。具體又分為3 種事件:原因事件類、后果事件類、中間事件類。原因事件類代表了HAZOP中的原因,后果事件類代表了HAZOP 中的后果,中間事件類代表了傳播路徑中從原因到后果之間的事件。無論是原因事件、后果事件還是中間事件,都可以采用單體+活動來描述。單體為本體概念中的某個實體、事物,活動為本體概念中的某個行為、動作。單體+活動可以用來描述事件。以“反應器爆炸”此后果事件為例,反應器為單體,爆炸為活動;又以“精餾塔液位升高”此中間事件為例,精餾塔液位為單體,升高為活動。即所有的事件都可以采用單體+活動來表述。
措施建議類,代表了HAZOP 中針對每條傳播路徑的現有的防護措施以及針對偏差傳播的建議。包括安全措施類與建議類。安全措施類包括控制系統、緊急停車系統、報警等。建議類由活動+單體組成。以“增加液位控制系統”建議為例,增加為活動,液位控制系統為單體。即所有的建議類都可以采用活動+單體來表述。
風險等級,為偏差傳播路徑類的屬性,描述風險等級。采用三級制:L、M、H。L 對應5 級風險中的1級、2級;M對應5級風險中的3級;H對應5級風險中的4級、5級。
路徑編號,為偏差傳播路徑類的屬性,描述該路徑的編號。
需要實現標準化的HAZOP 信息分為兩類:一類是新開展的HAZOP 分析的信息,此類信息可以在進行分析時,就采用支持上述標準化模型的軟件進行信息的表達與存儲;另一類為大量已經完成的HAZOP 分析報告,針對此類報告,需要對分析結果進行自動識別、分類,形成標準化的信息。其中,已經完成的HAZOP 分析報告數量龐大,報告的形式雖有標準格式但具體內容、書寫風格各異,大量的信息無法復用、共享,是實現安全分析信息標準化的難點。
針對此問題,以基于知識本體的HAZOP 標準化信息模型為基礎,提出HAZOP信息標準化方法,算法整體流程如圖3所示。
HAZOP 分析中,將待分析工藝按照工藝單元等劃分成不同的節點,對每個節點中的變量選擇引導詞形成偏差,分析原因、后果、中間事件、安全措施、建議,確定風險等級等,形成一條條HAZOP 分析記錄即偏差傳播路徑。因此,對分析結果進行標準化也按照不同的節點中的不同記錄依次處理。對每一條記錄的標準化主要包括以下幾個步驟。
(1)提取識別記錄中的工藝參數。讀取記錄中的工藝參數,將其按照HAZOP 標準化信息模型中工藝參數類型進行分類。

圖3 HAZOP信息標準化方法
(2)提取識別記錄中的引導詞。讀取記錄中引導詞,將其按照HAZOP 標準化信息模型中引導詞類型進行分類。
(3)提取識別記錄中的原因。讀取記錄中的原因,并將其識別為一條或者多條HAZOP 標準化信息模型的原因類的結構,即單體+活動的模式。
(4)提取識別記錄中的后果。讀取記錄中的后果,并將其識別為一條或者多條HAZOP 標準化信息模型的后果類的結構,即單體+活動的模式。
(5)提取識別記錄中的中間事件。讀取記錄中的中間事件,并將其識別為一條或者多條HAZOP標準化信息模型的中間事件類的結構,即單體+活動的模式。
(6)提取識別記錄中的安全措施。讀取記錄中的安全措施,并將其識別為一條或者多條HAZOP標準化信息模型的安全措施類的結構。
(7)提取識別記錄中的建議。讀取記錄中的建議,并將其識別為一條或者多條HAZOP 標準化信息模型的建議類的結構,即活動+單體的模式。
(8)提取識別記錄中的風險等級。讀取識別記錄中的風險等級。
(9)將上述信息形成一條完整的標準化偏差傳播路徑。
在各個步驟知識提取與識別過程,均采用BiLSTM 神經網絡進行訓練、標注、識別。長短期記憶網絡(long short-term memory,LSTM)是一種循環神經網絡,是為了解決一般的RNN(循環神經網絡)存在的長期依賴問題而專門設計出來的;BiLSTM 分為前向LSTM 和后向LSTM,將訓練數據轉化為字向量形式,字向量的大小可以根據需要訓練成固定大小。本文將訓練數據利用Word2Vec 模型訓練成了100維,然后將每個字的向量輸入到前向神經網絡和后向神經網絡,使得前向神經網絡包含了句子正方向每個詞與詞之間的關系,后向神經網絡包含了句子反方向上每個詞與詞之間的關系,然后將訓練的結果進行拼接,最后利用Softmax 函數,對數據進行歸一化,求出每個詞對應標簽的概率,從而得到想要的標注結果,達到實體識別的目的[27]。
本文的數據提取以實體+活動為例,具體流程如圖4所示。

圖4 數據標注識別流程
首先將訓練數據分類,分為實體標注數據與句子分類標注數據,然后將其分別在神經網絡模型中進行訓練,得到實體識別的神經網絡模型與分類神經網絡模型。最后將實際數據輸入進行識別。用于實體識別的數據需要將數據標注成BIOE 形式,B表示實體的頭部,I 表示實體的中間部分,E 表示實體的尾部,O表示非實體數據。如:費/B托/I/反/I應/I器/E超/O溫/O,/O泄/O漏/O,/O遇/O點/O火/O 源/O 引/O 發/O 火/O 災/O 爆/O 炸/O,/O 人/O 員/O中/O 毒/O 傷/O 亡/O。對于實體的活動識別,需要整理活動的類型,如超壓、超溫爆炸等,將每一條數據進行按活動類型標注。如:費托反應器超溫,泄漏,遇點火源引發火災爆炸標注為超溫爆炸;然后構建神經網絡模型進行訓練,從而達到實體+活動識別的目的。
以“費托反應器超溫,遇點火源引發火災爆炸”該結果為例,通過標注兩種數據(費托反應器、超溫爆炸)訓練了神經網絡模型后,實體識別網絡可以將句子中的實體識別出來,再經過分類網絡能將句子的活動類型識別,從而達到實體識別與類型識別的目的,即上述例子識別結果為:費托反應器超溫爆炸。
以某HAZOP 分析中一條記錄為例,如表1所示。
該記錄描述了某汽提塔塔底溫度升高時,可能的原因、后果、保護措施、建議措施、風險等級等。對此條記錄進行標準化處理,得到如圖5所示。

圖5 一條標準化記錄
基于上述方法,開發了基于知識本體與與語義識別的HAZOP分析系統。系統的界面如圖6所示。
該系統的主要特點包括以下兩部分。

表1 某汽提塔單元HAZOP分析記錄

圖6 基于知識本體與語義識別的HAZOP分析系統
(1)對傳統HAZOP 分析結果進行語義分析與識別,將分析記錄轉換為基于知識本體的標準形式進行存儲,實現了HAZOP 分析結果的自動化、標準化,便于后續的復用與共享。
(2)以存儲的歷史標準化信息為基礎,抽提、識別歷史信息,對HAZOP 分析提供智能輔助。即對進行的HAZOP 進行決策支持,按照相關度、可能性等提供可能的偏差原因、后果、建議等,充分利用專家知識,提高HAZOP分析的效率。
以某廠油品合成裝置的HAZOP 分析為例,該裝置進行了基于人工的HAZOP 分析,分析報告涵蓋了油品合成裝置中的費托合成單元、催化劑還原單元、蠟過濾單元、尾氣脫碳單元、精脫硫單元、合成水處理單元、液體中間原料罐區單元、低溫油洗單元及除氧水及凝液精制站單元等共9 個單元。采用基于知識本體與語義識別的HAZOP 分析系統對報告對9 個單元102 個節點834 個分析記錄進行了語義分析與識別,將其轉換為基于知識本體的標準形式進行存儲。
以節點83為例,該節點HAZOP分析結果如表2所示。
此節點的標準化結果如圖7所示。
如圖中所示,系統將該節點的5條記錄進行了識別,形成了標準化的表達。
此外,該系統將存儲的歷史標準化信息為基礎,抽提、識別歷史信息,對HAZOP 分析提供智能輔助。即對進行的HAZOP 進行決策支持,按照相關度、可能性等提供可能的偏差原因、后果、傳播路徑等等。進行HAZOP 分析時,根據輸入的變量與引導詞,系統根據歷史數據提示所有可能的原因、后果以及建議等,充分利用專家知識,提高HAZOP分析的效率。

表2 HAZOP分析結果

圖7 HAZOP分析標準化結果
針對傳統基于人工的HAZOP 分析結果以及計算機輔助的HAZOP 分析均存在的分析結果缺乏統一的表達形式,難于共享、復用等問題,提出了基于知識本體的HAZOP信息標準化框架。
該框架包含HAZOP 的標準化信息模型與HAZOP 信息標準化方法。HAZOP 標準化信息模型基于知識本體與IEC 61882構建,給出了各個元素以及各個元素之間關系的定義,實現了HAZOP 信息的標準化表達。在此模型基礎上,提出了HAZOP 信息標準化方法,采用識別、分類算法對已有HAZOP 分析結果進行自動識別、分析,實現了HAZOP 分析結果的標準化、自動化。以該框架為基礎設計開發了基于知識本體和語義識別的HAZOP 分析系統,并將該系統應用到某油品合成裝置的HAZOP 分析中。結果表明該框架可以有效地自動實現分析結果的標準化,便于分析知識的表達、共享與復用。