金一南,孫艷麗
(沈陽建筑大學,沈陽 110168)
隨著城市建設的高速發展,建筑工程需求量急劇增多。但建筑行業施工具有生產流動性大、生產周期長、露天及高空作業多等特點,且在建筑工程施工過程中參與人員繁雜,施工現場情況復雜多變,受工作人員素質參差不齊及認知局限性的影響,工程潛在風險難以全面預知。據統計,2021年,遼寧省建筑工程生產安全事故共計82起,死亡94人[1]。2022年,其事故共計71起,死亡80人[2]。當前,建筑工程安全生產形勢依舊嚴峻,分析建筑工程安全生產過程中的事故致因,探索其規律,對制定有效的風險管理措施、減少建筑工程安全事故具有現實意義。
學界針對工程事故致因的研究已取得一定成果。劉國愈等運用海因里希事故致因理論,從因果發生角度闡明事故致因及致因與傷害間的關系[3]。傅貴等提出事故致因“2-4”模型,通過建立HFACS與24Model不安全動作因素的對應關系,以實際事故為例論述對應關系的應用過程[4]。李華等基于STAMP系統事故理論模型,從建筑工程安全控制結構入手逐層定性分析事故致因[5]。Chen Ning利用關聯規則分析我國建筑施工安全事故的原因,揭示了影響施工現場安全的因素及施工事故的后果[6]。KIM、TERESA運用層次分析法,對坍塌事故致因進行量化分析,發現建筑工程施工過程中風險因素評估不到位、監督檢查疏忽引起操作失誤是導致事故發生的關鍵因素[7-8]。姚明亮,王丹等從人的不安全行為角度出發,分別建立管理安全及人因安全干預機理模型與網絡傳播模型,探討工程事故中人的不安全行為致因的傳播路徑及干預機制[9-10]。上述針對工程事故的定性分析與統計分析對工程事故預警及風險管理有一定的應用價值,但其中事故致因識別工作量大且易受主觀因素影響,缺少大量真實數據的支撐,得出的結論具有一定的局限性。近年來,學者開始使用大數據文本挖掘方法研究工程事故,旨在從事故調查報告結果入手分析事故致因,從而進行工程風險識別與管理。張偉等以事故致因理論為基礎建立結構化的施工安全事故致因系統模型并驗證其有效性[11]。田水承等針對建筑施工坍塌事故,通過R語言進行文本挖掘,明確事故的核心致因、邊緣致因及事故致因間的關系[12]。李莉等基于Python及Pajek平臺,采用Apriori算法分析了化工事故致因關聯[13]。馮子陽等運用行為安全“2-4”模型,分析了建筑運維階段事故報告,確定了不同影響因素間的關系[14]。
從大量文本數據中提取有效重要信息與潛在規律,最大限度發揮歷史數據的實用價值,實現對事故調查報告的深層次分析,是建筑工程風險識別與管理領域的迫切需求。本研究采用文本挖掘法對2013—2022年遼寧省建筑工程事故調查報告進行深入分析,揭示事故致因的分布規律及內部關聯,為建筑工程風險識別管理提供新思路,旨在提高建設工程項目的風險管理水平,提出科學有效的風險規避措施。以中華人民共和國住房和城鄉建設部、遼寧省應急管理廳及地方各級相關官方網站為數據來源,收集生產安全事故報告信息,共得到遼寧省建筑工程生產安全事故報告180份,報告由“工程概況”“事故發生經過及救援過程”“人員傷亡和經濟損失”“事故發生的原因和事故性質”“對有關責任單位和責任人的處理建議”及“防范措施和整改建議”等內容組成。
文本挖掘是從大量文本數據中提取事先未知的、可理解的、最終可用知識的過程。利用文本挖掘技術從非結構化的文本數據中獲取有用信息是一種常見的技術手段,目前該技術已運用于風險識別領域。如陳芳等運用文本挖掘法,挖掘大量空置危險接近事件報告,設計基于全局詞的向量模型與關鍵詞共現網絡,分析各事故致因主題詞及關鍵詞間的潛在關系,提供精準防控空中危險接近事件的數據支持[15]。文本挖掘的具體工作流程見圖1。

圖1 文本挖掘工作流程Fig.1 Text mining workflow
1)文本挖掘工具的選取。進行事故文本挖掘需要選取相應的挖掘工具。采用ROST CM6內容挖掘系統、UCINET社會網絡分析系統作為文本挖掘的技術工具。
2)文本數據收集。選取2013—2022年遼寧省建筑工程事故報告作為文本挖掘語料。為減少無效工作,只提取事故報告中有價值部分,剔除與研究無關的內容如“工程概況”“單位介紹”等,按條編號,將文本數據保存為“.txt”格式。
3)數據預處理。用ROST CM6軟件中的批量文件處理器將篩選后的文本數據合并,使用Ultra-replace(超級批量文本替換)依據詞條標準化信息將表中所有源詞條替換為標準詞條,利用“分詞命令”生成相應的分詞文件,完成挖掘研究的數據預處理。
4)信息可視化與特征挖掘。統計事故類型,運用ROST CM6軟件對文本數據進行事故致因詞頻提取,構建事故致因語義網絡,進行矩陣分析與中心性分析,統計事故發生地點,將事故分析指標可視化。
為減少無效工作,僅將事故調查報告中的“事故類型”“事故直接原因”“事故間接原因”“事發地點”作為文本挖掘語料庫,使用ROST CM6內容挖掘系統軟件中的批量文本處理器合并180份事故調查報告。
中文表述中,不同詞語可表達相同的含義,如事故致因“安全生產意識薄弱”在不同事故調查報告中有“缺乏自我保護意識”“不具備安全生產知識”“安全意識放松”“缺乏個人安全防護意識”等不同表述,故從180份事故調查報告中隨機抽取60份,分析統計同一事故致因的不同表述方式,建立詞條標準化信息對照表,形成同義詞詞庫。使用Ultra-replace對多個意思相同的源詞條進行歸類代替,部分標準化詞條見表1。

表1 詞條標準化對照表Tab.1 Contrast of term standardization
為確保分詞結果的精確性及研究的準確性,在ROST CM6軟件自定義詞表的基礎上建立“專業詞詞庫”及“停用詞詞庫”,加入建筑工程領域相關專業詞匯,刪除無研究意義的詞匯。在軟件執行分詞命令后,對“文件名_分詞后.txt”進行人工調整。
針對2013—2022年遼寧省建筑工程不同類型事故數據進行統計分類,高空墜落類型事故在180份事故調查報告中占60.56%,是發生建筑工程事故的主要原因,其次是坍塌事故(9.44%)與物體打擊事故(7.78%)。故在建筑工程安全生產過程中,應重點對高空墜落、坍塌以及物體打擊事故進行針對性預防,詳見圖2。

圖2 建筑工程事故類型分布(件)Fig.2 Distribution of accident types
為探究不同事故致因的影響程度,使用ROST CM6軟件中的頻數統計功能分析經過預處理的文本數據,輸出建筑工程事故致因詞頻,取頻數排序前30的事故致因等級進行編碼:頻率>30%的事故致因定義為Ⅰ級致因,30%>頻率>10%的事故致因定義為Ⅱ級致因,頻率≤10%的事故致因定義為Ⅲ級致因。詳見表2。

表2 建筑工程事故致因詞頻統計Tab.2 Word frequency statistics caused by construction accidents
利用ROST CM6軟件語義網絡分析工具將事故致因進行可視化處理,網絡節點與節點的連線表現各特征的分布與特征間的關系,線條越粗表示共同出現的頻率越高,成因特征間的聯系越緊密。方塊表示節點的中心度,方塊越大中心度越大,該節點在該網絡中的地位越重要。語義網絡圖可直觀表明事故的發生是多種因素互相作用的結果,為深入挖掘建筑工程事故致因,還需進一步對數據進行中心性分析,詳見圖3。

圖3 事故致因語義網絡圖Fig.3 Semantic network diagram of accident causes
為探究建筑工程事故各致因間的作用關系,使用ROST CM6軟件進行共現矩陣分析,如同一組致因在一份事故報告中出現多次,計為共現一次,一組事故致因的共現值越大,二者的關聯性就越大。統計180份事故報告中不同事故致因的共現次數,最終得到共現矩陣,詳見表3。

表3 建筑工程事故致因共現矩陣(部分)Tab.3 Co-occurrence matrix of construction accidents(part)
中心性是衡量某一致因在整個數據集中重要程度的指標,反映某一致因與其他致因間的關聯情況,致因的中心度越大,表明其在整個事故致因集中的重要度越高。使用UCINET軟件對建筑工程事故致因進行中心性分析,結果詳見表4。

表4 建筑工程事故致因的中心性Tab.4 Centrality of the causes of construction accidents
事故致因A1、A2的中心度占比均在0.1以上,表明其位于事故致因網絡的核心位置,與其他事故致因的關聯性最大,屬于Ⅰ級事故致因。從安全事故發生的內在機制來看,有兩方面因素,即物的不安全狀態與人的不安全行為[16]。事故致因A1、A2同屬于人的不安全行為,結合海因里希的事故因果連鎖理論[3],人的安全思想對人的安全行為與物的安全狀態有著至關重要的影響,因此要減少建筑工程事故的發生,根源上要從人的安全思想入手,提升建筑工程相關工作人員的安全意識,對一線作業人員進行切實、深入的安全教育,使安全思想深入人心,在根源上杜絕安全事故的發生。
統計180份事故調查報告中的事故發生地點,繪制事故隱患地點對比詞云圖。詞云自中心向外部輻射分布,關鍵詞位置越靠近中心、字體越大代表其出現的頻率越高,意味著該地點存在的安全隱患越多。“建筑外墻”“屋頂”“腳手架”“基坑工地”等安全隱患地點的詞組字體較大,為詞云中的核心詞匯,即是建筑工程事故最易發生的核心地點,應在建筑工程施工風險管理中高度重視,重點防范。詳見圖4。

圖4 事故隱患地點對比詞云圖Fig.4 Comparison word cloud map of accident hazard locations
1)對180份事故調查報告進行事故類型統計分析發現,高空墜落、坍塌、物體打擊是建筑工程安全生產中最易發生的事故,在建筑安全生產管理中應引起關注,制定相關預防措施。
2)基于詞頻分析,從180份事故調查報告中提取30個高頻事故致因,根據其出現的頻率進行等級劃分,發現安全意識薄弱、未配戴安全設施是建筑工程事故的I級致因。
3)對事故致因進行共現矩陣分析及中心性分析發現,施工人員安全意識薄弱、未佩戴安全裝置、工人無證上崗、未配安全管理人員、安全教育不到位處于事故致因關聯網絡的核心位置,說明此類因素易導致建筑工程事故發生,應制定針對性風險管理措施,有效預防事故的發生。
4)對事故地點進行可視化呈現,建筑外墻、屋頂、腳手架、基坑工地等處于詞云核心,說明以上地點易發生建筑安全事故,在建筑工程安全生產風險管理中應重點對以上隱患地點進行風險防控。