雷紫淇 王凡帆 於尚霏 申靜雯
(中國礦業(yè)大學(北京) 北京 100083)
電梯是人民群眾生產(chǎn)生活中的重要運輸工具,應(yīng)用范圍廣,使用頻率高。國家市場監(jiān)督管理總局發(fā)布的《2022 年全國特種設(shè)備安全狀況的通告》顯示,截至2022 年底,全國共發(fā)生特種設(shè)備事故和相關(guān)事故108 起,其中電梯事故22 起,占全年特種設(shè)備安全事故總數(shù)的20.37%,死亡17 人[1]。此外,根據(jù)國家市場監(jiān)督管理總局特種設(shè)備安全監(jiān)察局發(fā)布的全國特種設(shè)備安全狀況通報,近10 年全國電梯每年的增長率都在10%以上,2022 年的全國特種設(shè)備數(shù)量是2013 年的2.1 倍。巨大的保有量導致電梯事故時有發(fā)生,且具有一定的突發(fā)性、偶然性和隨機性,因此結(jié)合法律法規(guī)和電梯安全事故案例,進行總結(jié)分析,通過對事故原因和事故特征的提取,構(gòu)建致因預測模型,在事故發(fā)生后,能夠通過事故特征及時得到較為準確的事故發(fā)生直接原因、間接原因等相關(guān)信息,提高事故后的解決效率,是十分必要的。
隨著實際安全管理問題和現(xiàn)處社會經(jīng)濟大環(huán)境復雜性不斷被人們所認識,關(guān)于科學的研究方法論體系也在不斷拓展。為預防和減少事故的發(fā)生,專家在多個領(lǐng)域?qū)κ鹿拾l(fā)生的各種影響因素進行了研究,構(gòu)建不同的事故致因模型,提出不同的事故致因理論,并借用Python 語言、C 語言、R 語言等對導致事故發(fā)生的各個因素之間的關(guān)聯(lián)進行了研究。將事故特征和事故致因間關(guān)聯(lián)關(guān)系也運用在化工、建筑、道路交通等領(lǐng)域,但該項研究在電梯安全領(lǐng)域運用較少。
海外的學者已進行過有關(guān)電梯安全事故的探討,并且以此研究的產(chǎn)出分別從人力、設(shè)備、資料、法律以及環(huán)境等多角度提供了優(yōu)化做法及建議。例如,國外Zarikas V 和Loupis M 通過分析希臘電梯安全事故,得出了與電梯安裝、服務(wù)和運行相關(guān)的各種統(tǒng)計推斷,結(jié)果顯示有65%的事故發(fā)生在電梯安裝和維護作業(yè)人員身上,并指出安全管理制度沒有落實好是電梯事故發(fā)生的主要原因[2]。國內(nèi)張武橋[3]用數(shù)理統(tǒng)計分析的方法,基于電梯運營安全事故樣本數(shù)據(jù),通過事故發(fā)生的地點、形態(tài)、環(huán)節(jié)、原因等,歸納總結(jié)電梯運營事故發(fā)生的潛在規(guī)律和根本原因,最后從主成分角度和安全理論維度分析了電梯運營安全的影響因素。藍麒[4]從電梯安全脆弱性角度對電梯安全協(xié)同治理進行了深入分析,構(gòu)建了電梯安全協(xié)同治理體系框架。
然而,造成電梯事故的原因方面,多數(shù)研究者主要參照電梯安全管理實踐知識和統(tǒng)計分析來進行探討。在國內(nèi),李玨等人[5]通過找出導致電梯事故的關(guān)鍵人為因素,并對其關(guān)聯(lián)性進行分析,使用人因分析與分類系統(tǒng)(HFACS)模型對電梯事故進行分類統(tǒng)計與研究。并利用卡方檢驗以及概率比分析HFACS 上層與下層人因之間的關(guān)聯(lián)性,最終提出針對預防電梯事故的實施方案。但目前關(guān)于電梯安全事故的研究主要側(cè)重于構(gòu)建電梯安全風險評價指標體系,或者是對于單個因素、單個事故表征的研究,將電梯安全事故表征與事故致因因素結(jié)合起來綜合分析,并建立高質(zhì)量致因預測模型的研究并不是很全面。
為獲得較為準確全面的語料庫,基于Python 語言,用爬蟲技術(shù)對電梯安全相關(guān)法律法規(guī)和電梯事故案例進行爬取。獲得《中華人民共和國特種設(shè)備安全法》《特種設(shè)備安全監(jiān)督檢查辦法》《特種設(shè)備事故報告和調(diào)查處理規(guī)定》《特種設(shè)備安全監(jiān)察條例》等相關(guān)法律法規(guī)以及近10 年來我國部分電梯安全事故案例。
分析所獲語料,發(fā)現(xiàn)有重復值、缺失值、異常數(shù)據(jù)等不利因素存在,為保證爬取所獲文本的質(zhì)量以及后續(xù)模型建造的質(zhì)量和準確性,借助Python 語言,再對其進行數(shù)據(jù)的預處理,包括清洗數(shù)據(jù)、分詞、過濾停用詞等,見圖1。

圖1 數(shù)據(jù)預處理
針對預處理后的語料,提取電梯安全事故報告中的“直接原因”“間接原因”“事故特征”“事故發(fā)生前設(shè)備狀態(tài)”和“事故分類”等相關(guān)因素并總結(jié),見圖2。

圖2 特征提取
將提取總結(jié)后的相關(guān)因素數(shù)據(jù)化處理,并將電梯安全事故的直接原因和間接原因整理為人的因素、管理因素、設(shè)備因素和環(huán)境因素4 個方面[6,7],數(shù)據(jù)化處理結(jié)果見表1。

表1 電梯安全事故樣本數(shù)據(jù)的數(shù)據(jù)化處理
網(wǎng)格搜索算法是通過遍歷研究中所給定的數(shù)據(jù)參數(shù)組合,來完善所建模型。如果在遍歷過程中超參數(shù)的選擇不恰當,就會出現(xiàn)欠擬合或者過擬合的現(xiàn)象,導致最終預測結(jié)果不準確。網(wǎng)格搜索算法將在規(guī)定的參數(shù)范圍內(nèi),按照步長依次調(diào)整規(guī)范參數(shù),在一次次調(diào)整參數(shù)的過程中訓練學習器,最后在所有參數(shù)中找到檢驗集上精度最高的參數(shù),為機器的深度學習提供幫助[8]。
使用網(wǎng)格搜索參數(shù)尋優(yōu)尋找隨機森林全局最優(yōu)參數(shù)組合,首先將數(shù)據(jù)集隨機劃分為k個驗證集,在k個子集中選取k-1 個子集作為訓練集,1 個子集作為測試集;利用k-1 個訓練子集訓練模型,并使用網(wǎng)格搜索設(shè)置需要調(diào)整的參數(shù)大致范圍及步長,計算每個參數(shù)下模型的評估能力;利用交叉驗證重復上述過程k次,計算k次模型評估能力的平均值,并獲取模型性能最優(yōu)情況下的參數(shù)取值。
經(jīng)網(wǎng)格搜索計算,最終得出參數(shù)的最優(yōu)組合,見表2。其中,max_depth 為樹的最大深度,min_samples_leaf 表示一個節(jié)點在分支后的每個子節(jié)點的樣本數(shù)量的最小值,random_state 為隨機種子數(shù),用以復現(xiàn)模型,min_samples_split 是節(jié)點可分裂的最小值,n_estimators 為CART 樹個數(shù)[9]。

表2 網(wǎng)格搜索獲取隨機森林最佳參數(shù)
電梯事故往往會損害生命財產(chǎn)安全,因此在模型準確率方面具有較高的要求,而在該網(wǎng)格搜索得到的參數(shù)建模下,隨機森林模型的預測準確率可達0.972,將使該預測模型擁有較高的準確率,滿足實際應(yīng)用的需求。
隨機森林是一種機器學習算法,在眾多算法中,它使用頻率最高的就是集成學習。它的基本思想是將多個分類器組合在一起,從而使整體更完備和周密,達到一個預測效果更好的集成分類器。更具體一點,該算法會將決策樹作為一個基本單元,大量的決策樹一起勾勒了一個龐大的隨機森林,如圖3 所示。

圖3 隨機森林
形成隨機森林首先要構(gòu)建單棵決策樹,這棵決策樹會包括兩個部分:樣本和特征。而樹的構(gòu)建會包含特征選擇、樹的生成以及剪枝3 個部分,在一個訓練集合中含有N個樣本,有放回并且隨機地選擇n(n≤N)個樣本,隨后用這些選擇好的樣本來訓練一棵決策樹,且作為決策樹根處的節(jié)點。同時,假設(shè)訓練集的特征個數(shù)是K,每次選擇k個構(gòu)建決策樹。
需要指出的是,樹的生成是一個遞歸的過程。一般而言,隨著不斷的劃分,決策樹的分支節(jié)點所包含的樣本最終會慢慢歸集到同一個屬性,使得節(jié)點的“純度”越來越高。
驗證隨機森林模型需要通過合適的評價指標,其中擬合優(yōu)度R2可以檢驗?zāi)P蛯颖緮?shù)據(jù)的擬合程度,取值在0 到1 之間,擬合優(yōu)度越高,代表模型的可解釋程度越高。均方根誤差RMSE可以反映樣本的離散程度, 取值為大于0 的整數(shù),取值越低說明精度越高,但其大小受預測數(shù)值的大小影響。擬合優(yōu)度R2和均方根誤差RMSE的計算公式如下[10]。
式中:
n——總樣本數(shù);
i——小于n的變量;
Yi——真實值;
在MATLAB 中,利用網(wǎng)格搜索所得隨機森林最優(yōu)參數(shù),用隨機森林模型來構(gòu)建電梯事故致因預測模型。如圖4 所示,當決策樹設(shè)為100 時,誤差范圍基本保持在[0.015,0.02]區(qū)間內(nèi),錯誤基本穩(wěn)定。

圖4 誤差曲線圖
模型根據(jù)80%的訓練集和20%的測試集對真實值和預測值的結(jié)果進行對比,如圖5、圖6 所示。

圖5 訓練集預測結(jié)果對比

圖6 測試集預測結(jié)果對比
從圖7 中可以看出,“直接原因”項對“事故特征”項的影響最大,其次是“間接原因”項和“事故發(fā)生前設(shè)備狀態(tài)”項。

圖7 特征重要性柱狀圖
利用指標計算公式,驗證基于隨機森林算法的電梯安全事故致因預測模型的擬合優(yōu)度R2、均方根誤差RMSE。對于預測模型的評價指標見表3[10]。

表3 模型評價指標
2021 年8 月16 日,新疆維吾爾自治區(qū)烏魯木齊市某區(qū)發(fā)生1 起電梯墜落事故,造成1 人死亡,經(jīng)濟損失150 萬元。經(jīng)調(diào)查分析,引發(fā)事故的直接原因是死者安全意識淡薄、違反安裝技術(shù)規(guī)程,間接原因是施工現(xiàn)場安全管理落實不到位[11]。將該事故報告中的事故特征數(shù)據(jù)化處理后輸入電梯安全事故致因預測模型中,見表4、表5。

表4 墜落事故直接原因預測概率

表5 墜落事故間接原因預測概率
由表4 可知,基于隨機森林算法的電梯安全事故直接原因預測模型中共有176 棵決策樹,其中預測概率最高的2 項是違規(guī)作業(yè)(P3)和結(jié)構(gòu)或零部件損壞(M2)。由表5 可知,基于隨機森林算法的電梯安全事故間接原因預測模型中共有171 棵決策樹,其中預測概率最高的2 項是安全管理不到位(A1)和維修保養(yǎng)不到位(P4)。
綜上根據(jù)相對多數(shù)投票法,模型對該案例事故的直接原因和間接原因的預測結(jié)果與實際調(diào)查結(jié)果基本一致,且從人為因素、管理因素、設(shè)備因素等多個角度進行合理預測,驗證了所獲模型的有效性。
2022 年8 月18 日,北京市豐臺區(qū)某街道發(fā)生1起電梯擠壓事故,造成1 人死亡。經(jīng)過調(diào)查分析,引發(fā)此次事故的直接原因是維保人員在完成電梯維修作業(yè)后,違反安全操作規(guī)章進入電梯底坑,導致其受到右側(cè)井道壁與轎廂側(cè)壁的持續(xù)擠壓,造成死亡。間接原因是相關(guān)公司對管理區(qū)域內(nèi)電梯監(jiān)督不到位以及電梯有限公司對員工的作業(yè)沒有行之有效的監(jiān)管措施[12]。將該事故報告中的事故特征數(shù)據(jù)化處理后輸入電梯安全事故致因預測模型中,見表6、表7。

表6 擠壓事故直接原因預測概率

表7 擠壓事故間接原因預測概率
由表6 可知,基于隨機森林算法的電梯安全事故直接原因預測模型中共有175 棵決策樹,其中預測概率最高的3 項是違規(guī)作業(yè)(P3)、維修保養(yǎng)不到位(P4)和無證上崗(A3)。由表7 可知,基于隨機森林算法的電梯安全事故間接原因預測模型中共有175 棵決策樹,其中預測概率最高的2 項是安全管理不到位(A1)和維修保養(yǎng)不到位(P4)。
綜上根據(jù)相對多數(shù)投票法,模型對該案例事故的直接原因和間接原因的預測結(jié)果與實際調(diào)查結(jié)果基本一致,再次驗證所獲模型的有效性。
電梯安全事故的發(fā)生不是僅受某個單因素的影響,而是多個因素共同造成的。在日常電梯的使用過程中存在諸多安全因素,且這些因素并非完全獨立,各因素間有錯綜復雜的關(guān)聯(lián)關(guān)系,無法直觀從眾多事故報告中找出關(guān)聯(lián)規(guī)則。基于上述原因,本文利用Python語言,對所需文本進行爬取和預處理,分析整理電梯安全事故影響因素。再使用網(wǎng)格搜索獲得隨機森林最佳參數(shù),接著用隨機森林算法構(gòu)建基于機器學習的電梯安全事故致因分析模型,獲得預測較為準確的致因分析模型,最后通過2 個實例對模型進行準確性和實用性檢驗。所建模型能夠幫助事故后的快速歸因,提高事故解決效率。
1)規(guī)范電梯的設(shè)計、建造和安裝。為確保電梯運行安全,在電梯最初設(shè)計時,就要將工作人員和使用人員的安全放在第一位。同時,確保在電梯基礎(chǔ)零件的建造上,謹慎選擇零件材料,提高電梯的自身質(zhì)量,將非人為因素對電梯安全事故的影響降到最低。
2)完善相關(guān)人員的培訓制度。在眾多的事故報告中可見,從電梯安裝、維修保養(yǎng)到事故后的救援,都存在由于部分相關(guān)人員專業(yè)性不足導致不可預估的后果。為此,必須保證各生產(chǎn)安裝電梯人員和區(qū)域電梯救援管理人員的專業(yè)性,以及電梯工作人員在工作時的專注性和嚴謹性。提高相關(guān)人員的專業(yè)性,不僅會減少工作人員的危險系數(shù),同時也會降低電梯發(fā)生事故的概率以及增加事故后救援的成功率。
3)重視日常安全檢查和定期保養(yǎng)。電梯作為日常生活中使用頻率高的運輸工具,大多電梯都處于持續(xù)運行的狀態(tài)下,同時還有人為因素的影響,電梯零件極易損耗,進而增加電梯發(fā)生安全事故的概率。這就需要電梯檢查保養(yǎng)工作人員定期逐一排查電梯的安全隱患,按照規(guī)章制度進行電梯后續(xù)的維修保養(yǎng)工作。
4)注重宣傳電梯安全以及自救知識。電梯在現(xiàn)代化的生產(chǎn)生活中必不可少,但仍有相當比例的人不了解電梯的急救知識,導致在電梯發(fā)生事故時,不能做出正確反應(yīng)。這就需要社會增強電梯安全以及電梯自救知識宣傳力度,讓公眾掌握理論知識,才能在發(fā)生電梯事故時,盡可能減輕電梯事故對自身的傷害。
5)及時完善安全規(guī)章制度。在科技的快速發(fā)展下,規(guī)章制度也要與時俱進。管理部門應(yīng)該根據(jù)實際情況,定期淘汰或修改無效的規(guī)章制度,及時建立適合的安全管理體系。