999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進的Apriori算法的鐵路事故風險源關聯分析方法

2023-10-26 08:30:01王寧昌錫銘楊欣吳建軍
山東科學 2023年5期

王寧 昌錫銘 楊欣 吳建軍

摘要:為了預防鐵路事故的發生,需要對造成鐵路事故的風險源因素進行探索和分析,揭示鐵路事故的發生規律。提出利用改進的Apriori算法,對鐵路事故與風險源進行數據挖掘分析。考慮鐵路事故傷亡的嚴重程度,提出新的支持度、置信度指標計算方法,對鐵路事故因素進行加權量化。同時添加時間約束,探索不同時間的鐵路事故風險源關聯規則。利用英國鐵路事故數據,挖掘鐵路事故與風險源之間的關聯規則,針對實際案例制定切實有效的預防措施。結果表明,利用改進的Apriori算法能夠得到更多的鐵路事故與風險源之間的關聯規則,對于預防鐵路事故的發生具有重要的作用。

關鍵詞:風險源;鐵路事故;關聯規則;Apriori算法;數據挖掘分析

中圖分類號:U298.5?? 文獻標志碼:A?? 文章編號:1002-4026(2023)05-0067-08

Association analysis method for railway accident hazards based on the improved Apriori algorithm

WANG Ning,CHANG Ximing*,YANG Xin,WU Jianjun

(State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing 100044)

Abstract∶The causes of railway accidents are difficult to determine as several hazards can lead to accidents. To prevent the occurrence of railway accidents, the hazards responsible for railway accidents should be analyzed, and the occurrence rules of previous railway accidents should be revealed. In this study,data mining analysis on railway accidents and hazards was conducted using the improved Apriori algorithm.Considering the severity of accident casualties, a new calculation method for support and confidence indicators was proposed to weigh and quantify railway accident factors.Furthermore, time constraints were added to explore association rules of hazards with corresponding railway accidents at different times. Using the actual UK railway accident data, the association rules between railway accidents and hazards were discovered, and effective preventive measures were formulated for actual cases. Results show that the improved Apriori algorithm can explore more association rules between railway accidents and hazards, which can play an important role in preventing railway accidents.

Key words∶hazards;railway accidents;association rule;Apriori algorithm; data mining analysis

隨著鐵路運營里程和鐵路運輸量的增加,與鐵路有關的事故屢屢發生。例如,2011 年7月23日,D301次列車與D3115次列車追尾事故,造成40人死亡、172人受傷;2020年3月30日,T179次列車撞上塌方體,導致空調發電車起火,部分車廂脫軌傾覆事故,導致128人傷亡;2021年6月4日,K596次列車與作業人員相撞,造成9人死亡[1]。鐵路運輸安全風險時刻在威脅著鐵路運輸的健康發展和人員的生命安全,造成事故發生的風險源因素十分復雜。因此,有必要對鐵路事故中的風險源因素進行分析,挖掘風險源與事故之間隱含的關聯關系,以便認識鐵路事故發生的規律,進一步保障鐵路運輸安全。

目前廣泛使用的關聯規則算法為Apriori關聯規則算法,是典型的數據挖掘算法。利用關聯規則算法對各領域的分析研究已相對成熟。在醫學數據挖掘領域,張萌等[2]使用Apriori算法對病人的就診資料進行了挖掘,得到了病人的病癥和疾病之間的關聯規則。降惠等[3]利用Apriori關聯規則算法探討了長治市手足口病與氣象因素的關聯關系。陳治等[4]利用Apriori關聯規則算法對宮頸癌樣本數據集進行了分析,得到了不同因素對宮頸癌的影響情況。劉媛等[5]利用了關聯規則和網絡藥理學方法對治療消化性潰瘍的用藥規律進行了探索,對其作用機制有了更深一步的了解和認識。在工業智能化生產領域,何林等[6]利用k均值聚類算法(k-means)和改進的Apriori關聯規則算法對工業大數據進行挖掘分析,得到了有利于企業生產調整智能化的關聯規則并最大化利用了資源。在海洋災害預警數據挖掘方面,程巖等[7]采用改進的Apriori模型形成了海洋預警決策的支持庫,預測風暴潮水發生的可能性并預警海洋災害。zaydln等[8]使用貝葉斯網絡和關聯規則挖掘方法分析了全長12 m及以上的土耳其漁船未報告的職業事故數據。Lan等[9]使用關聯規則技術確定了與全損海事事故的發生和嚴重程度相關的模式,了解了全損事故的特點,制定針對性的預防措施。

在交通領域,劉文雅等[10]建立了考慮故障關聯的改進的Apriori算法,得到的關聯規則有助于地鐵故障的影響分析。許未等[11]應用傳統的Apriori算法,構建了鐵路事故致因網絡,探索了鐵路事故致因因素的內在聯系,這些研究在使用Apriori算法進行數據挖掘的過程中未將事故后果的嚴重程度進行考慮。因此在鐵路事故預防領域相對應的研究仍存在不足之處。與鐵路事故發生有關的風險源數據往往是大量的,利用改進的Apriori算法挖掘風險源因素與事故因素之間的關聯關系,可以獲得事故中的有用信息。本文提出了考慮事故危害加權的關聯規則指標進行鐵路事故風險源和事故的關聯性分析,并在時間上進行約束,以期挖掘更多隱含鐵路事故的關聯規則,為鐵路安全管理提供更加智能化與精細化的管理建議,預防鐵路事故的發生。

1 事故風險源關聯分析方法

1.1 傳統的關聯規則

當前各學者對于結構化的數據多有研究,提出卷積神經網絡的二分類結構化非平衡數據分類算法、敏感屬性識別與分級算法等[12-13],探討結構化數據的有效信息。但是對于非結構化數據,如鐵路事故數據報告的研究并未深入。而Apriori算法作為經典的頻繁項集挖掘算法,可以針對非結構化數據進行挖掘,從數量龐大的非結構化鐵路事故數據中挖掘出頻繁出現的風險源與事故的集合,并將挖掘到的隱含鐵路事故的信息進行直觀呈現。根據挖掘到的規則,可以關注到不同風險源與事故之間的關聯關系,針對風險源關聯規則進行防控,從而對鐵路系統進行有效的安全管理。

在鐵路事故數據集合中,將鐵路事故的類型與造成鐵路事故發生的事故風險源記作一個事務集合H,H={H1,H2,H3,…,Hn},H中包含n個項,即所有風險源與鐵路事故的數量總和。M、N均表示為非空項集,M?H,N?H。如果M中包含k個項,則M為k項集。記不同事務之間的關聯規則為M?N,即表示項集M和項集N間的關聯關系,此時M∩N=??。

在關聯規則挖掘中,常用支持度、置信度兩個指標來對關聯規則進行挖掘與衡量,分別對這兩個指標進行定義。

(1)支持度指標

關聯規則M?N的支持度表示的是M、N項集同時出現的概率,如式(1)所示:

式中,number(M,N)代表項集M、N同時出現的事務數量;number(A)代表事務數據庫中所有事務的數量。

(2)置信度指標

關聯規則M?N的置信度表示的是一個項集M出現以后,另一個項集N出現的概率,如式(2)所示:

式中,number(M)代表項集M出現的事務數量。

1.2 基于改進Apriori算法的關聯規則

傳統的關聯規則在進行數據挖掘時,將事務中的項均視為同等重要。然而在鐵路事故當中,不同的事故與風險源所造成的危害是不同的,利用傳統的關聯規則將風險源與事故數據一起進行數據挖掘是不嚴謹的。因此本研究提出了改進的支持度、置信度指標,采用加權的關聯規則對鐵路交通事故數據進行分析。對鐵路事故進行加權,鐵路事故加權指標的設定通過造成的鐵路事故后果來進行設定。鐵路事故后果通過事故造成的人員傷亡嚴重程度來衡量,傷亡嚴重程度通過表1所示的死亡和加權傷害來量化。

改進的支持度指標Imp-Sup(M?N)見式(3):

改進的支持度指標表示M、N項集同時出現的概率。當項集M或項集N中出現鐵路事故信息時對其進行加權計算,未出現鐵路事故信息時保持原指標結果。式中,ω(M)為M項集的加權,ω(M,N)為ω(M)與ω(N)中權值較大者,B表示鐵路事故數據。

置信度指標Imp-Conf(M?N)見式(4):

改進的置信度指標表示項集M出現之后,另一個項集N出現的概率。當項集M或項集N中出現鐵路事故信息時對其進行加權計算,未出現鐵路事故信息時保持原指標結果。

傳統的Apriori算法是挖掘數據關聯規則的經典算法,其思路是對數據進行逐一層次的迭代,不斷產生更高維度的頻繁項集和強關聯規則。本文在Apriori算法的基礎上添加時間約束,從時間角度對關聯規則進行劃分,并利用改進的提升度和置信度指標來篩選的強關聯規則,步驟如下:

步驟1 設定最小支持度、最小置信度指標的值,所設定的指標是后續產生頻繁項集與強關聯規則的基礎。

步驟2 對整個鐵路事故風險源數據的集合進行掃描。第一次掃描產生候選1項集,記W1。根據時間約束,將W1劃分為日間和夜間數據集分別為Wd1和Wn1,根據步驟1設定的最小支持度指標的值,由候選1項集Wd1和Wn1生成頻繁1項集Vd1和Vn1。

步驟3 由候選1項集Wd1和Wn1直接生成候選2項集Wd2和Wn2,再根據步驟1設定的最小支持度指標的值,生成頻繁2項集Vd2和Vn2。

步驟4 不斷重復步驟3,依次產生候選k項集和頻繁k項集,直至無法產生新的候選k+1項集Wdk+1和Wnk+1時,得到了所探索數據集的全部頻繁項集。

步驟5 根據步驟1設定的最小支持度、置信度指標,得到不同時間下,數據集合中風險源與鐵路事故之間的強關聯規則。

圖1為改進的關聯規則算法流程圖。

2 鐵路事故數據挖掘

本研究通過英國政府網站https://www.gov.uk/raib-reports獲取了2011—2020年共計10年的英國鐵路事故數據報告176份,從每份事故報告中提取發生的事故類型和風險源。在研究中所用到的事故數據并未包括地鐵事故和有軌電車事故。值得注意的是,在對事故類型進行統計時,存在一份事故報告中記錄發生多種類型事故的情況,如在編號為R072011的事故報告中,記錄表明先發生了失控事故再發生了脫軌事故,將這兩種類型的事故都進行了統計。收集到發生的事故類型分別為碰撞、脫軌、失控、墜落、超速、拖拽、觸電、未遂事故共計8種類型。各事故類型的分布情況如圖2所示。

統計風險源為人員、設備、環境、管理4種類型,共計89種風險源。將風險源進行編號,89種風險源分別編號為H01~H89。其中H01~H34的風險源為人員類型風險源,H35~H55的風險源為設備類型風險源,H56~H70的風險源為環境類型風險源,H71~H89的風險源為管理類型風險源。由于篇幅限制,這里僅選取部分人員、設備、環境和管理類型風險源進行列舉如表2所示。詳細的各類風險源及描述詳見OSID科學數據與內容附表。

鐵路事故的后果通過在事故中造成的人員傷亡的嚴重程度來衡量,傷亡嚴重程度通過表1所示的死亡和加權傷害(fatalities and weighted injuries, FWI)來量化。通過計算,得到每種事故的危害,以此確定鐵路事故的加權。表3為編號H90~H97的事故類型及危害后果量化值。

3 案例分析

根據上述實際鐵路事故數據,采用改進的關聯規則算法挖掘風險源之間、風險源與鐵路事故之間的關聯關系。鐵路事故的發生頻率較低,所造成的事故損失是巨大的,設定不同的最小支持度和最小置信度的指標組合進行實驗,得到不同的關聯規則數量,如圖3所示??梢钥闯觯倪M后的關聯規則在相同的最小支持度和最小置信度指標組合下,所得到的強關聯規則數量更多,獲取的有利于鐵路事故防控的信息也更加充分。

在本文中,設定不同的指標組合,其得到包含鐵路事故信息的關聯規則均占比增加,如圖4所示。其中,設定在日間的最小支持度為0.05,最小置信度為0.1,得到70條強關聯規則。相較于未進行加權計算的關聯規則,所獲得強關聯規則中包含鐵路事故的關聯規則占比由85.7%提升到了97.1%。設定在夜間的最小支持度為0.06,最小置信度為0.8,得到87條強關聯規則。相較于未進行加權計算的關聯規則,所獲得強關聯規則中包含鐵路事故的關聯規則占比由81.8%提升到了97.7%。在這兩個時間段獲取的包含更多鐵路事故信息的關聯規則占比均提高,得到的包含鐵路事故與風險源之間關聯關系的規則也更多,有利于進一步探索風險源與鐵路事故之間的關聯關系,有利于后續進行鐵路事故的預防和控制。

在不同時間得到的部分強關聯規則如表4所示。針對此類結果,可以提出具體的預防措施如下:(1)在日間往往由于人員的誤判以及一些人員不遵守交通規則的行為導致碰撞事故的發生,需要進一步加強對行人、乘客、騎行者等人的規范和引導。(2)在夜間,失控事故的發生往往伴隨著碰撞事故的發生,因此在發生失控事故時,需要注意對事故進行及時干預,防止碰撞事故的進一步發生。(3)在夜間,車輛、機械設備等操作員的違規操作或操作錯誤往往會使車輛或者設備不安全運行,從而導致碰撞事故的發生。因此需要重點加強鐵路作業車輛、設備等人員的管理培訓,預防事故的發生。(4)夜間列車司機也容易產生過大的壓力或者作業疲勞分心,從而導致碰撞事故的發生,針對這一情況需要進一步合理安排司機作業時間,并在司機上崗前確認其身體狀況,從而保障鐵路列車的安全運行。

4 結語

本研究所提出的改進的Apriori算法根據不同的鐵路事故造成的危害不同,在進行支持度與置信度指標計算時,考慮了事故的權重,挖掘到了包含更多鐵路事故信息的關聯規則。同時添加時間約束,包含鐵路事故與風險源的強關聯規則數量在不同時間維度下均有所提高。最后針對典型強關聯規則提出具體的預防措施,有利于鐵路的安全管理。

本文仍存在一些不足,需要在今后的工作中進一步研究和改進??梢钥紤]使用更加豐富且具有一致性的數據,便于關聯規則的探索研究。也可以將風險源的重要性程度進行考慮,在進行支持度和置信度指標的計算過程中對風險源的重要性程度進行科學合理的加權量化分析,以便進一步探討探討風險源之間關聯關系,為鐵路安全管理提供更加切實有效的預防措施。

參考文獻:

[1]國家鐵路局.“6.4”蘭新線K596次旅客列車與作業人員相撞鐵路交通事故調查處理情況公告[EB/OL]. [2022-08-10]. http://www.nra.gov.cn/zzjg/jgj/lzgl/gglz/202107/t20210729_337941.shtml

[2]張萌, 梁正, 祝思清. 基于關聯規則的數據挖掘在醫療診斷中的應用[J]. 山東科學, 2008, 21(1): 80-82.

[3]降惠, 尹振保, 武麗娟, 等. Apriori算法在手足口病與氣象因素關系分析中的應用[J]. 智能計算機與應用, 2021, 11(7): 124-128. DOI: 10.3969/j.issn.2095-2163.2021.07.023.

[4]陳治, 吳娟娟. 基于關聯規則的醫療數據挖掘研究[J]. 統計與決策, 2020, 36(6): 174-177. DOI: 10.13546/j.cnki.tjyjc.2020.06.040.

[5]劉媛, 孫輝, 許苑南, 等. 基于數據挖掘及網絡藥理學探討中藥治療消化性潰瘍的用藥規律及作用機制[J]. 山東科學, 2022, 35(5): 37-45. DOI: 10.3976/j.issn.1002-4026.2022.05.005.

[6]何林, 劉宇紅, 張榮芬. 基于關聯規則對工業鈾測量數據挖掘分析研究[J]. 計算機技術與發展, 2022, 32(5): 147-152. DOI: 10.3969/j.issn.1673-629X.2022.05.025.

[7]程巖, 任國興, 杜立彬. 基于Apriori模型的海洋災害預警數據挖掘技術[J]. 山東科學, 2009, 22(2): 57-60.

[8]ZAYDIN E, FISKIN R, UGDD)]URLU , et al. A hybrid model for marine accident analysis based on Bayesian Network (BN) and Association Rule Mining (ARM) [J]. Ocean Engineering, 2022, 247:110705. DOI: 10.1016/j.oceaneng.2022.110705.

[9]LAN H, MA X, MA L, et al. Pattern investigation of total loss maritime accidents based on association rule mining[J]. Reliability Engineering & SystemSafety, 2023, 229:108893. DOI: 10.1016/j.ress.2022.108893. [ZK)]

[10][ZK(#]劉文雅, 徐永能. 基于改進Apriori算法的地鐵故障關聯規則挖掘[J]. 兵器裝備工程學報, 2021, 42(12):210-215. DOI: 10.11809/bqzbgcxb2021.12.033.

[11]許未, 何世偉, 劉朝輝,等. 基于關聯規則的鐵路事故致因網絡構建與分析[J]. 鐵道運輸與經濟, 2020, 42(11): 72-79. DOI: 10.16668/j.cnki.issn.1003-1421.2020.11.13.

[12]徐紅, 矯桂娥, 張文俊, 等. 基于卷積神經網絡的結構化非平衡數據分類算法[J]. 計算機工程, 2023, 49(2): 81-89. DOI: 10.19678/j.issn.1000-3428.0063871.

[13]何文竹, 彭長根, 王毛妮, 等. 面向結構化數據集的敏感屬性識別與分級算法[J]. 計算機應用研究, 2020, 37(10): 3077-3082. DOI: 10.19734/j.issn.1001-3695.2019.05.0187.

主站蜘蛛池模板: 自拍偷拍欧美| 国产欧美视频综合二区| 日韩福利视频导航| 国产三级毛片| 手机精品视频在线观看免费| 午夜视频在线观看免费网站| 久久香蕉国产线看观看式| 精品综合久久久久久97| 国产电话自拍伊人| 精品人妻一区二区三区蜜桃AⅤ | 日韩欧美国产中文| 国产精品黄色片| 无码高潮喷水在线观看| 久久黄色毛片| 大陆精大陆国产国语精品1024| 国产精品福利在线观看无码卡| 激情综合网址| 狠狠干欧美| 国产性猛交XXXX免费看| 激情综合网激情综合| 日本精品视频| 国产一级片网址| 综合亚洲网| 成人一级免费视频| 激情成人综合网| 精品视频第一页| 日韩黄色精品| 国产日本一区二区三区| 黄色网页在线观看| 亚洲人成网7777777国产| 亚洲中文字幕国产av| 精品国产免费第一区二区三区日韩| 福利小视频在线播放| 亚洲高清无在码在线无弹窗| 在线中文字幕日韩| 国产中文一区a级毛片视频| 91视频青青草| 黄色一及毛片| 国产美女精品一区二区| 国产欧美自拍视频| 国产精品极品美女自在线网站| 国产视频a| 国产精品露脸视频| 亚洲美女AV免费一区| 乱人伦视频中文字幕在线| yy6080理论大片一级久久| 在线看片中文字幕| 国产91视频免费观看| 激情视频综合网| 久久久久88色偷偷| 91久草视频| 国产极品美女在线观看| 色网在线视频| 97超爽成人免费视频在线播放| 国产在线一区视频| 在线国产毛片| 国产粉嫩粉嫩的18在线播放91| 狠狠色噜噜狠狠狠狠色综合久 | 美女黄网十八禁免费看| 99热这里只有成人精品国产| 国产精品久久精品| 国产真实乱了在线播放| 国产精品一线天| 欧美天堂久久| 久久久久久久久亚洲精品| 人妻精品全国免费视频| 亚洲成人www| 无码日韩精品91超碰| 成人福利在线视频| 伊人91视频| 天堂成人在线| 亚洲日本www| 免费激情网址| 国产真实二区一区在线亚洲| 国产亚洲男人的天堂在线观看| 免费看美女自慰的网站| 亚洲国产av无码综合原创国产| 欧美伦理一区| 重口调教一区二区视频| 欧美色综合网站| 国产国产人成免费视频77777 | 日本在线欧美在线|