陳 寧助理研究員 王 堯助理研究員
(北京市勞動保護科學研究所 安全與應急管理研究室,北京 100054)
安全風險通常指不確定性對目標的負面影響,包括危險發生的可能性及引發的人員傷亡、財產損失、生態環境破壞和社會危害的嚴重性的組合。危險源是指可能單獨或共同引發風險的內在要素。企業安全生產管理的核心就是識別并管控危險源以及安全風險。基于危險源的特性和事故的演化過程,各類安全風險并存情況普遍存在,各類風險的并發特征及其相互關系對事故后果會產生較大影響,故在風險綜合管控中考慮風險的并存性有著重要意義。
在企業安全生產風險評估方面,韓建勇提出企業安全生產風險評價是對生產系統內的設備、系統或者相關生產儀器的安全可靠性進行評估,查看生產狀況是否符合相關技術標準,危險源是否在規定范圍內分布、是否滿足分布標準,以及對發生事故風險概率進行測算。張桂英研究化工生產企業安全風險和隱患的排查管理;謝鵬等提出基于云理論和區間層次分析法的涉爆粉塵企業安全風險評估模型;閆建華探討中煤集團礦建施工項目的安全風險管控現狀及存在問題。目前,企業安全風險研究大多針對風險評估的意義或某類企業具體風險的評估模型和防控措施,很少涉及企業安全風險的并存分析。
關聯規則研究最初來源于超市貨架擺放,后在公共安全領域也有較為廣泛的應用,如顧小林等從食品生產加工檢測數據中挖掘影響食品安全問題的因素,建立報警關聯規則;孟凡榮等分析煤礦事故危險源,運用關聯規則評價巷道瓦斯危險源的風險程度;張洋等將關聯規則用于食品供應鏈風險預警系統中,發現食品供應鏈中的風險;張明媛等利用關聯分析挖掘施工隱患數據集,發現建筑施工現場內外環境中危險源之間的關聯關系,從而對施工現場進行有效的安全管理;宗萬里等研究食品安全抽檢數據的不合格項目之間的關聯規則,用于食品安全監管。
對于企業安全風險來說,同一個危險源可能潛在多種風險類型,這種關聯關系稱為并存關系,相應的規則稱為風險并存規則。本文以某地區企業安全風險數據為研究對象,運用關聯規則分析企業安全風險的并存關系,挖掘風險并存規則,為企業應急準備和風險管控提供新思路。
關聯分析是指對2個或更多事物之間可能存在關聯關系的分析。廣義上說,這種關系可以是并發關系、因果關系、時序關系等。關聯規則最初用來研究顧客交易(事務)數據庫中經常被同時購買的貨品。如果某些商品同時被購買的次數超過用戶設定閾值,就可以認為這些商品之間存在著關聯關系。這種關聯關系反映顧客的購買行為模式,可以應用于商品貨架設計、貨品安排、顧客分類、市場促銷等。
I
是全體數據項的集合,D
為全體事務集,每個事務T
有唯一的標識號。項集是由數據項構成的非空集合。對項集A
?I
,稱T
包含A
當且僅當A
?T
。項集包含的元素個數稱為項集的長度,長度為k
的項集稱為k
階項集。關聯規則是描述數據庫中數據項集之間存在潛在關系的規則,形式為A
?B
,其中A
?I
,B
?I
,且A
∩B
=?。A
稱為規則頭,B
稱為規則尾。項集之間的關聯表示它們出現在同一交易中的可能性較高。常用的量化標準包括支持度、置信度、提升度等度量,用來定義關聯規則在統計上的意義。項集A
在事務集合D
中的支持數是D
中包含A
的事務數量。A
在D
中的支持度Pr(A
)就是A
的支持數與D
的總事務量之比。從統計學角度,A
的支持度等于A
在D
中出現的概率。支持閾值表示項集在統計意義上的最低重要性。給定一個支持閾值,如果項集A
的支持數不小于支持閾值,則A
稱為頻繁項集。規則A
?B
的支持度定義為式(1),表示A
,B
同時出現的可能性。Pr(A
∪B
)(1)
規則A
?B
的置信度定義為式(2),表示D
中包含A
的事務同時也包含B
的可能性,也就是在A
出現的條件下B
也出現的概率。置信閾值表示規則應該滿足的最低置信度。Pr(A
∪B
)/ Pr(A
)(2)
規則A
?B
的提升度定義為式(3),表示有針對性的推銷(根據某些規則)與盲目推銷的比率,這個值越高越好。如果提升度大于1,說明A
、B
正相關,也就是一個出現蘊含另一個也出現;提升度小于1,說明A
、B
負相關,也就是一個出現可能導致另一個不出現;提升度等于1,說明A
、B
獨立。Pr(A
∪B
)/Pr(A
)Pr(B
)(3)
支持度是對關聯規則重要性的衡量,置信度是對關聯規則準確度的衡量。支持度說明這條規則在所有事務中的代表性,支持度越大,關聯規則越重要。相反,如果支持度很低,則說明該關聯規則實用的機會很小。提升度描述A
對B
影響力的大小。提升度越大,說明B
受A
的影響越大。一般來說,關聯規則的提升度都應該大于1,因為只有規則A
?B
的置信度大于B
的支持度,才說明A
的出現對B
的出現有促進作用,也就是它們之間存在某種程度的正相關性。迄今為止,關聯規則挖掘算法有很多種,其中Apriori是一種經典的關聯規則挖掘算法,也是本文所采用的算法。在企業安全風險關聯分析研究中,數據項為企業的安全風險類型。依據《企業職工傷亡事故分類標準》(GB 6441-2008),企業事故災難主要有20類,見表1。事故類別可視為風險類別,即企業可能發生何種類型事故等同于該企業存在何種類型風險。本文所指的安全風險類型即為表1中的各類事故風險類型。一個危險源潛在的風險類型為一條事務,所有的事務構成事務集。企業風險并存關系可以看作一種關聯關系,即一個危險源可能同時存在多種風險。企業安全風險并存分析就是在企業安全風險數據集中挖掘一個危險源可能同時潛在的風險類型,從而發現企業安全風險并存規則。

表1 企業職工傷亡事故分類Tab.1 Classification of casualty accidents of enterprise employees
本案例數據集包含5萬多條危險源信息,其中每條信息描述一個危險源可能引發的風險類型。填報危險源信息的企業遍及?;⒐I、建筑、水電氣熱、商務、文化、旅游、體育、供排水、餐飲等各行業領域。由于該地區不存在煤礦領域企業,故僅涉及15類風險,即火災、觸電、車輛傷害、高處墜落、鍋爐爆炸、機械傷害、起重傷害、容器爆炸、坍塌、物體打擊、淹溺、中毒和窒息、灼燙、其它爆炸、其它傷害風險。圖1給出每個危險源(橫坐標對應每個危險源序號)潛在的風險類型數(縱坐標表示危險源潛在的風險類型個數),其中56.5%的危險源同時存在2種或2種以上的風險。從風險雷達圖(如圖2)可知,火災出現頻次最高,其次是觸電、中毒和窒息,而其他風險出現的頻次都比較低。

圖1 危險源的風險類型數Fig.1 Number of risks of each hazard resource

圖2 企業安全風險雷達圖Fig.2 Radar chart of enterprise safety risks
在關聯分析之前,首先把原始數據轉換為二值型數據表,其中每種風險對應一個字段(數據項),如果取值為1,則表示該危險源存在這類風險,反之為0。圖3給出各類風險的取值分布,在全部數據中,火災出現的頻次達到42 580,觸電出現的次數為28 010,中毒和窒息出現了14 604次。由此可見,火災、觸電、中毒和窒息是企業所面臨的主要安全風險類型。

圖3 企業安全風險分布Fig.3 Distribution of enterprise safety risks
D
的每條記錄T
對應一個危險源的潛在風險類型。所有的15類風險類型構成數據項集I
。給定支持閾值和置信閾值,企業安全風險并存規則挖掘的目的是從D
中挖掘滿足閾值的并發風險規則。設置支持閾值為0.1,置信閾值為0.6,計算得到8個頻繁項集(如圖4),其中包括4個1階項集:{火災},{觸電},{中毒和窒息},{其它傷害};3個2階項集:{火災,觸電},{火災,中毒和窒息},{觸電,中毒和窒息};1個3階項集:{火災,觸電,中毒和窒息}。由此可知,火災、觸電、中毒和窒息3類風險之間存在明顯的共存關系,其中火災和觸電是最經常同時存在的風險隱患,支持度達到0.391。當一個危險源存在火災或者觸電風險時,也有可能存在中毒和窒息的風險。這是由于觸電經常引發火災,而據統計火災中吸入一氧化碳等有毒煙氣中毒死亡人數占總死亡人數一半以上,因此這3類風險之間存在明顯的關聯關系。表2給出風險類型之間的關聯規則,包括規則頭、規則尾、支持度、置信度、提升度,按照置信度從高到低排序。當存在觸電或者中毒和窒息風險時,存在火災風險的可能性較高(置信度分別為0.82和0.95);而如果觸電、中毒和窒息2種風險同時存在時,則火災的風險相應提高(置信度增加到0.99,提升度增加到1.37)。當存在中毒和窒息風險時,觸電風險也可能同時存在(置信度為0.68),而當火災、中毒和窒息2種風險都存在時,觸電風險的置信度提高到0.71,提升度也增加到1.49。這3種風險之間的關聯關系可以用一個有向圖(如圖5)來描述,圖5中每個結點表示一個頻繁項集,其大小與支持度成正比,結點之間的邊表示2個頻繁項集之間的關聯關系,邊的寬度與置信度成正比。

圖4 頻繁項集及其支持度Fig.4 Frequent item sets with support

表2 企業安全風險并存規則Tab.2 Coexistence rules of enterprise safety risks

圖5 企業安全風險并存規則圖Fig.5 Coexistence rules chart of enterprise safety risks
由于火災是目前最大的風險隱患,下面著重討論火災的并存風險。首先以火災作為規則頭,計算當存在火災風險時,同時存在其他14種風險的可能性。然后以火災為規則尾,計算當存在其他某種風險時,同時也存在火災風險的可能性。圖6給出與火災相關的風險并存規則的支持度和置信度。當一個危險源存在火災風險時,也可能有觸電、中毒和窒息、其它傷害、其它爆炸等風險。相反,當存在中毒和窒息、觸電、爆炸風險時,也可能有火災風險。需要注意的是,雖然爆炸(包括容器爆炸、鍋爐爆炸、其它爆炸)在數據集中的支持度很低(現實中發生的概率較低),但一旦存在爆炸風險時,同時存在火災風險的可能性較高,也就是置信度較高。


圖6 與火災有關的風險并存規則Fig.6 Risk coexistence rules related to fire
風險的并存性在企業安全風險管理中普遍存在,在制定應急處置時應綜合考慮,更好地預防事故發生。本文以某地區企業安全風險數據為分析對象,利用關聯分析方法研究15種主要安全風險類型的并存問題,并用支持度、置信度和提升度等指標來衡量并存性的強度。研究發現火災、觸電、中毒和窒息3類主要風險之間存在明顯的共存關系。
本文的研究結果可以為企業安全風險綜合管理提供建議。首先,企業要充分考慮有可能并存的風險或事故,配備應急物資和裝備,并選取適宜的存放地點。其次,企業在開展突發事件綜合應急演練科目設計時應綜合考慮各種有可能并存的事故或事件,在演練策劃過程中,要考慮企業應急組織機構設置、信息報送、應急處置、應急保障等環節是否符合多種事故或事件同時發生的情況,演練結束后要根據演練的結果修訂綜合預案。在企業安全風險并發規則挖掘中,支持閾值和置信閾值起著至關重要的作用。為提高本方法的可操作性,在后續研究中將討論閾值的設置問題。