999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機的交通事故影響因素分析

2022-03-26 10:33:44魏凌峰姜文龍
山東交通科技 2022年1期
關鍵詞:利用特征模型

魏凌峰,姜文龍

(中國人民公安大學 交通管理學院,北京 100038)

引言

根據中國統計年鑒2020 年[1],2016—2019 年發生的機動車交通事故統計數據見表1。

表1 2016—2019 年事故統計

根據表1 中數據發現,2016—2019 年交通事故發生數在2017 年有所下降,2018 年開始有較大增長,與電動自行車的快速發展和機動車保有量的大幅上升有關。此外,死亡人數整體相對較為穩定且有小幅增減,受傷人數增長較多。非機動車的事故數從2016 年的17 747 起增加至2019 年的29 049 起,增幅約63.7%,表明電動自行車的事故也在不斷增多。事故的不斷增多會帶來傷亡和經濟損失,為減少我國交通事故的發生,采取相應措施進行針對性地預測與預防是十分必要的。

國內專家學者早已對交通事故的影響因素進行分析,李世民等[2]對北京市某交叉口進行了為期 4 a的數據研究,通過累計logistic 回歸模型進行分析;鄧曉慶等[3]利用BP 神經網絡對道路交通量和道路線形進行研究,且獲得較好的預測結果;姚琦和王林山[4]利用GA 和LM 的結合算法對BP 神經網絡進行優化,從而對交通事故模型進行預測;張廣泰等[5]利用多層次灰色與GA-BP 神經網絡模型對烏魯木齊事故多發黑點路段進行預測,驗證其模型的可行性。

1 特征選擇

1.1 隨機森林模型

隨機森林模型其根源為決策樹模型,它是一種集成學習的組合分類算法。集成學習其核心在于把多個分類性能較弱的分類器組合起來,經過演變得出一個具有較高分類性能的分類器。而隨機森林算法可以并行同時生成,這也為特征指標的選擇提供了依據。

隨機森林算法主要利用自主抽樣法,流程為從原始數據中有放回的抽取多個樣本,隨后利用分類性能較弱的分類器(決策樹)對先前抽取的樣本進行訓練,再將這些并行演算的決策樹全部組合到一起,通過投票得出最終的結果即最后的分類。見圖1。

圖1 隨機森林流程

利用隨機森林的重要性評分功能,其原理是利用基尼系數(Gini),在隨機森林的每一棵樹的生成時,都是按照基尼系數在分裂前后的減少情況為分裂的依據,對某個節點進行分類。因此,在隨機森林中可以按照特征N 進行分裂,隨后通過其基尼系數的減少的總量對特征N 進行分析判斷,確定其重要性。針對一般決策樹的基尼系數:

式中:K—共有K 類;Pk—樣本屬于第K 類的概率。

基尼系數越大,則不確定性就越大;基尼系數越小,不確定性越小,數據分割越徹底,越干凈。

使用隨機森林選取特征重要性具有較多優點,如在數據集上表現良好,在當前很多數據集上,相對其他算法具有較大優勢,兩個隨機性的引入使得隨機森林對于數據的缺失值、異常值等具有較低的敏感性;訓練速度快,可以對多個變量的重要性進行排序;實現簡單等。但也有一定缺點,如在某些缺失大量數據或存在較多異常值樣本集上,RF 模型容易陷入過擬合;取值劃分比較多的特征容易對RF決策產生更大的影響,從而影響擬合模型效果。

1.2 數據處理

針對交通事故原始數據集進行一個篩選,將不符合本次分析內容的特征進行刪除,最后留下16 個特征指標,利用事故類型作為因變量共分為三類:財產損失(輕度)、傷人(中度)、死亡(重度)。針對16 個特征屬性747 條數據利用Matlab 進行數據預處理,再經過數據篩選、補全缺失值等處理過程后得到完整的數據集。隨后利用隨機森林RF 對數據集的特征重要性進行計算,同時進行歸一化,其結果由高到底見表2。

表2 特征重要性占比

下一步對數據集進行RF 預測,利用原數據集與指標選取后的數據集進行準確度對比,找出準確度最高的數據指標集合。在此之前需要進行驗證來測試算法準確性,以防止過擬合的現象,在Matlab 中可以利用交叉驗證法與留出法進行驗證。采取十折交叉驗證法,其原理為將數據集分成10 份,依次將其中9 份作為訓練數據,1 份作為測試數據進行試驗。每次試驗都會得出相應的正確率(或差錯率)。將10 次的結果取算術平均值,將平均值作為該算法的大致精度,同時10 次交叉驗證并不只做一次,往往是多次進行。10 次交叉驗證,將10 次的結果再次求其算術平均數,這樣可以減少誤差提高算法準確性的精度。經過計算得出RF 模型準確率見表3。

表3 RF 模型準確率

結果發現在刪除最后兩個的特征時,模型的準確率只有很小幅度地提升,在刪除第三個特征值的時候模型準確率有了較大地提高,若繼續刪除的話也只有小幅度地提升。為保證數據分析的多樣性,最終確定使用12 個特征值:事故類型(SGLX)、事故形態(SGXT)、車輛間事故(CLJSG)、直接財產損失(MONEY)、天氣(TQ)、事故認定原因(人員操作)(SGRDYY)、能見度(NJD)、照明條件(Light)、道路類型(DLLX)、路口路段類型(LKLULX)、道路物理隔離(DLWLGL)、路側防護設施(LCFHSS)、道路安全屬性(LDAQSX)。

2 SVM 模型評價分析

2.1 模型選擇

確定數據特征后利用Matlab 進行模型分析,為確保最大準確率,在分析前利用Matlab 對所有的模型進行訓練,得出最優模型,其模型結果見表4。

表4 模型準確度

通過模型訓練可知,準確度最高的為支持向量機(SVM)模型,因此本文擬采用SVM 對交通事故的嚴重程度影響因素進行分析。

2.2 模型介紹

高斯核函數[6]首先將原來的數據點映射成一種新的特征向量,然后得到新的特征向量點乘的結果。對高斯核函數來說,本質就是將每一個樣本點映射到一個無窮維的特征空間,這就表明高斯核函數對于樣本數據的變形是非常復雜的,但是經過變形,再去點乘,可以得到十分簡單明了的結果,表明了核函數的高效。

高斯函數公式:

因此,可以利用高斯核SVM 對本次交通事故影響因素進行分析。

2.3 模型評價指標

SVM 模型主要采取混淆矩陣、F1 分數、ROC 曲線以及AUC 值進行評價。其中混淆矩陣的計算指標見表5。

表5 指標介紹

通過計算表5 中相應指標結果,可推算出評價模型效果的指標:真正類率TPR、假真類率FPR、真負類率TNR=1-FPR、準確率ACC、精確率Precision、召回率Recall 以及調和平均值F1。

將計算的指標繪制ROC 曲線,ROC 曲線是由FPR 和TPR 的點連成。橫軸是FPR,縱軸是TPR。而AUC 即為ROC 曲線下方的面積,AUC 主要用于衡量二分類問題中機器學習算法性能或者泛化能力。

2.4 模型結果分析[6]

利用Matlab 實現高斯核函數SVM,獲得相應的評價指標結果。

(1)混淆矩陣。混淆矩陣可見圖2,通過混淆矩陣可知原本是傷人事故的預測準確率最高,只有三個被誤分類未死亡事故,雖然財產損失誤分類的個數也只有三個,但由于其本身數量較少,其錯誤率達11.1%。同時也可以得出真正類率TPR 與真負類率TNR 等。

圖2 混淆矩陣

(2)ROC 曲線。ROC 曲線上r 任意一點都反映著對同一信號刺激的感受性。通過ROC 曲線可以計算出AUC 值,其計算方法通過Matlab 軟件實現。

為了驗證其最優性,選取另外兩種模型決策樹與樸素貝葉斯神經網絡進行ROC 曲線、AUC 值的對比分析,結果見圖3。

圖3 ROC 曲線

由圖3 分析可知,高斯核函數SVM 能較好地預測交通事故嚴重程度,故將數據集采用隨機抽取的方式抽取測試集進行預測,抽取樣本為所有樣本的20%即150 條數據,預測結果見表6。為證明其最優性,采取SVM、決策樹與樸素貝葉斯神經網絡進行對比預測。

表6 模型預測準確度

通過對比發現,對于交通事故嚴重程度的預測,高斯核函數SVM 具有較好的預測準確性,其準確率達95.72%。使用樸素貝葉斯神經網絡[7]對事故嚴重程度進行預測[8]準確率只有63.72%,準確率較低。

3 結語

通過隨機森林對事故數據的特征指標進行重要性計算可知,對于事故發生最重要的特征因素為人員操作不當[9],主要存在三個方面:非機動車不按規定行駛、行人不按規定行駛和機動車不按規定行駛。因此,為減少道路交通事故的發生,需要對這三類人員進行交通安全教育。

基于交通事故數據分析,驗證高斯核函數具有95%的較高預測準確性,為未來事故預測提供一定的參考,同時為交通安全的改善提供方向。不足之處為數據量相對較少,只考慮了部分城市道路,涉及范圍較少,可能存在一定的偶然性,在今后的研究中將繼續逐步解決這些問題。

猜你喜歡
利用特征模型
一半模型
利用min{a,b}的積分表示解決一類絕對值不等式
中等數學(2022年2期)2022-06-05 07:10:50
重要模型『一線三等角』
利用一半進行移多補少
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
利用數的分解來思考
Roommate is necessary when far away from home
抓住特征巧觀察
主站蜘蛛池模板: 国产成人艳妇AA视频在线| 98超碰在线观看| 伊在人亚洲香蕉精品播放| 在线观看亚洲成人| 欧美在线视频不卡| 国产一区免费在线观看| 污网站免费在线观看| v天堂中文在线| 又黄又湿又爽的视频| 亚洲中文字幕久久无码精品A| 国产v精品成人免费视频71pao| 国产在线自在拍91精品黑人| 国产精品va| 亚洲一区免费看| 国产99热| 日韩欧美综合在线制服| 男女精品视频| 国产特级毛片| 亚洲综合网在线观看| 一级香蕉视频在线观看| 奇米精品一区二区三区在线观看| 国产综合网站| 美女国产在线| 91原创视频在线| 露脸国产精品自产在线播| 色偷偷av男人的天堂不卡| 9久久伊人精品综合| 制服丝袜国产精品| 人人爱天天做夜夜爽| 在线免费a视频| jizz在线免费播放| 日韩免费中文字幕| 国产成人91精品| 国产激情第一页| 国产微拍一区| 91精品aⅴ无码中文字字幕蜜桃| 国产亚洲精久久久久久久91| 精品国产一区91在线| 国产成人成人一区二区| 99精品国产高清一区二区| 中文字幕人妻av一区二区| 丝袜久久剧情精品国产| 国产网站免费| 國產尤物AV尤物在線觀看| 亚洲日本中文字幕天堂网| 国产欧美日韩另类精彩视频| 国产成人综合网| jizz在线观看| 天天干天天色综合网| 色视频国产| 特级做a爰片毛片免费69| 成人国产免费| 999精品在线视频| 国模粉嫩小泬视频在线观看| 青草午夜精品视频在线观看| 国产高清不卡视频| 亚洲区一区| 激情国产精品一区| 在线a网站| 久久久久久尹人网香蕉| 亚洲AV人人澡人人双人| 激情无码视频在线看| 欧美 亚洲 日韩 国产| 欧美成人一级| 久久一色本道亚洲| 久久精品人人做人人综合试看| 国产91透明丝袜美腿在线| 成人福利视频网| 久久精品免费看一| 欧美激情视频二区| 久一在线视频| 91久久偷偷做嫩草影院| 色综合热无码热国产| 一级片免费网站| 91视频99| 亚洲香蕉久久| 永久免费av网站可以直接看的 | 中文字幕在线免费看| 亚洲Aⅴ无码专区在线观看q| 又爽又大又黄a级毛片在线视频 | 精品综合久久久久久97| 91在线丝袜|