黃妙華,王思楚
(1.武漢理工大學現代汽車零部件技術湖北省重點實驗室,湖北 武漢 430070;2.汽車零部件技術湖北省協同創新中心,湖北 武漢 430070;3.武漢理工大學汽車工程學院,湖北 武漢 430070)
隨著計算機技術的發展,智能汽車自動駕駛技術成為近年汽車廠家研究的重點。由于交通事故給人們造成了許多生命和財產損失,安全問題是無人駕駛技術發展的要點之一。為了評價自動駕駛系統的功能,各國政府和汽車企業正在加緊研究和開發智能汽車場地測試方法[1]。歐盟和我國的汽車檢測機構都發布過關于汽車自動緊急制動系統的車輛追尾和行人碰撞測試條例,我國智能網聯汽車產業創新聯盟也于2018年發布了智能網聯汽車自動駕駛功能測試規程[2]。目前大多數測試條例和規程對測試道路的要求為平坦、干燥的瀝青或混凝土路面,對自然環境的要求為無降雨、降雪、冰雹等惡劣天氣,但包含路面狀況、天氣在內的道路條件和自然環境條件已經成為影響汽車安全的重要因素。文獻[3]分析了希臘59316起事故進行分析,發現良好的天氣條件和夜間事故會增加事故的嚴重性。
文獻[4]研究了道路條件對車輛事故嚴重性的影響,發現在當道路條件不清、結冰和下雪天氣條件下,車禍的嚴重性顯著增加。現階段大多數測試標準僅考慮車輛與行人的速度與位置,缺乏對測試場景環境的針對性規定,缺乏對容易引起事故的交通條件和環境因素的考慮。要考慮測試標準中的交通條件和環境因素的常用方法是從真實事故數據中發現規律。文獻[5]收集了國內六個城市車與兩輪車相撞的事故數據,設計了考慮到照明情況、道路特征、汽車運動狀態和視野的自動緊急制動系統兩輪車測試場景;文獻[1]考慮到了照明條件、道路特征、汽車運動狀態和視野的,通過聚類方法建立了危險場景庫;文獻[6]針對與行人相關的交通事故,建立了考慮到光線條件、行人身高、行人狀態、視野和天氣的自動緊急制動系統測試場景。目前國內外研究主要集中在自動緊急制動系統,缺少對完整自動駕駛功能的測試場景研究,并且測試場景的設計較為簡單,缺少對路面條件,天氣條件以及各種位于道路中間的障礙物的考慮。
這里利用汽車事故數據,分析交通環境和自然環境中與交通事故嚴重性關系密切的因素,并提取其中典型條件,結合我國現有的汽車自動駕駛功能測試規程,建立考慮到環境對車輛事故嚴重性影響的汽車自動駕駛功能測試場景,為智能網聯汽車自動駕駛功能的檢測提供參考。
這里所使用得數據為英國交通部所記錄并公開的2017年英國交通事故情況、涉及的車輛類型和相應傷亡情況的詳細數據。數據只包含了發生在公共道路上的人身傷害事故,事故發生后由警方進行記錄并匯總。數據不包括沒有人員傷亡或發生在私人道路和私人停車場的事故。
該數據數據項較多,事故現場交通條件和自然環境的記錄較為詳細和完整,對我國汽車主動安全系統測試場景的設計具有參考借鑒意義。從中選取一部分與交通條件和自然環境有關的數據,包含項目名稱,如表1所示。

表1 事故記錄項目Tab.1 Accident Recording Items
記錄中的事故共129982起,其中轎車事故共97654起。轎車事故中致命的事故為1084起,占事故總數的1.11%,嚴重的事故為15253 起,占比15.62%,輕微的事故為81317 起,占比83.27%。
3.1.1 Apriori算法介紹
Apriori是常見的用于挖掘數據關聯規則的算法,用于找出數據值中頻繁出現的數據集合,從這些找出的數據集合中我們能直觀地獲取有用的信息[7]。該算法中涉及到頻繁項集,支持度(support),置信度(confidence),提升度(lift)4個概念。
(1)頻繁項集:指經常同時出現的數據項的集合,包含K個項的頻繁項集合就稱為頻繁K項集。
(2)支持度:指事件發生的概率,公式如下:

式中:P(XY)—XY同時發生的概率;count(X,Y)—X和Y同時出現的次數;count(All)—所有事件的總數。
(3)置信度:指在滿足一個事件發生的前提下另一個事件發生的概率,公式如下:

(4)提升度:指在發生一件事的條件下,同時發生另一件事的概率,與另一件事發生的概率之比。當提升仍度大于1的時候,兩件事的關聯規則是正相關,當提升度小于1時,兩件事的關聯規則為負相關,公式如下:

Apriori算法的步驟如下[8]:
(1)掃描數據庫,對每個數據項進行計數,得出1候選項集,這時K=1。
(2)由定義的最小支持度從K候選項集中篩選得出頻繁K項集。
(3)由K頻繁項集進行連接,得出K+1 候選項集,掃描數據庫,根據設定的最小支持度由K+1 候選項集進行剪枝得出頻繁K+1項集。
(4)重復(2)(3)步驟直到K+1頻繁項集為空時算法結束。
3.1.2 Apriori算法的改進
使用Apriori算法提取轎車交通事故的關聯規則存在不足之處。在實際行車中,大部分時間的天氣都是晴天,路面大部分時間處于干燥狀態,所以在這類常見條件下發生的事故數量也較多,由“晴天無大風”、“路面干燥”等項組合成的頻繁項集支持度也就較大,表示這類常見條件的項也就較容易被關聯算法提取,從而在頻繁項集中反復出現,而另一些表示較不頻繁條件的項則難以在頻繁項集中出現。因此僅使用Apriori算法進行關聯規則挖掘容易得出錯誤的結論,例如由關聯規則挖掘容易得到白色汽車更容易發生事故的結論[9],與以往的科學研究結論[10]相反。
現階段針對這一問題的研究較少,文獻[11]提出采用獨立性檢驗的方法,分析項之間的獨立性從而判斷事務之間是否存在關聯,然后去除不存在關聯的事務從而一定程度上排除了這種誤導性的關聯規則。但是該方法沒有解決常見條件的項在關聯規則中反復出現這一問題。
針對上述問題提出改進的Apriori算法。由于事故的嚴重性被分為三個程度:致命的、嚴重的以及輕微的,針對車輛事故場景提出對嚴重交通事故發生的提升度這一指標。關聯規則對致命和嚴重交通事故發生的提升度即在該關聯規則在事務集中出現的前提下,嚴重或致命的事故出現的概率與沒有這個前提下嚴重或致命事故出現的概率的比值。將事故的嚴重程度這一屬性加入到事務集的事務中,對事故數據進行頻繁項集的挖掘,在結果中選取包含事故嚴重程度為致命或嚴重的頻繁項集。然后計算除表示嚴重程度以外的其它項組成的項集對該嚴重程度的交通事故發生的提升度。然后按以下規則對具有包含關系的頻繁項集進行比較,去掉對致命和嚴重交通事故影響較小的項。設{a,b}項集對嚴重程度為致命和嚴重的事故的提升度為lift1而{a,b,c}項集對嚴重程度為致命和嚴重的事故的提升度為lift2,若{a,b}?{a,b,c}且lift1大于lift2,則視c為與嚴重程度關系不大的項,將{a,b,c}關聯規則從頻繁項集中刪去,只保留{a,b}關聯規則。該方法能對關聯規則進行篩除,去掉對致命和嚴重交通事故影響較小的項。改進后算法的主要步驟如下:
(1)選取合適的支持度,使用Apriori 算法產生頻繁項集。
(2)計算頻繁項集中每一項對嚴重交通事故發生的提升度,選取合適的提升度閾值,去除提升度在閾值以下的關聯規則。
(3)對具有包含關系的頻繁項集進行比較,去掉對致命和嚴重交通事故影響較小的項。
(4)輸出最后得出的頻繁項集。
容易引起不同類型車輛事故的因素不相同,因此典型事故場景也需要根據不同車型來分別構建,這里只對轎車事故數據進行研究。首先從中篩選出轎車的事故數據,然后將篩選后的車輛事故分為三類,第一類為車與車相撞的事故,第二類為車與其它物體相撞的事故,第三類為車僅與行人相撞的事故。
這三類事故的發生原因和影響因素各不相同,因此需要分開三類分別分析。對每一類事故分別使用改進后的Apriori算法進行關聯規則挖掘。
經過調試,分別取支持度為0.001,0.01,0.003,使用Apriori算法對頻繁項集進行挖掘。經過挖掘后的第一類事故關聯規則,如表2所示。第二類事故關聯規則,如表3所示。第三類事故關聯規則,如表4所示。

表2 第一類事故部分關聯規則Tab.2 Part of Association Rules for Class I Accidents

表3 第二類事故部分關聯規則Tab.3 Part of Association Rules for Class II Accidents

表4 第三類事故部分關聯規則Tab.4 Part of Association Rules for Class III Accidents
有相關規程將智能汽車安全測試分為14項[2],其中與道路條件有關的有11項,包括交通信號燈識別及響應、前方車輛行駛狀態識別及響應、障礙物識別及響應、行人和非機動車識別及避讓、跟車行駛、靠路邊停車、超車、并道、交叉路口通行、環形路口通行。測試場景中的場景一般包括道路環境要素、其他交通參與者、車輛駕駛任務等因素[12]。構建測試場景時,在原規程標準上將測試項目與關聯規則結合。
在表2~表4中,出現了許多較少見的元素,說明挖掘關聯規則時兼顧到了常見的項和較不常見但對事故影響較大的項。從中可以看出:(1)不好的光線條件對車輛事故嚴重程度的影響較大,在容易發生車與車碰撞的測試時需要考慮無燈的夜晚,而在容易發生車行人碰撞的測試時應考慮有燈的夜晚;(2)車在路面潮濕的條件下進行超車容易發生追尾類型的嚴重交通事故,車在沒有指揮的路口轉彎容易發生側面碰撞的事故,且與惡劣天氣關系不大,而變道或超車時發生的車輛相撞的嚴重事故在雨天更容易發生,因此與追尾事故相關的測試需要設置路面潮濕的場景,而超車和變道的測試需要設置下雨天氣以及路面潮濕的場景;(3)沒有路燈的夜晚、下雨的天氣和潮濕的地面是發生車輛與路面其他物體碰撞的主要原因,且它們之間關聯較大,常在關聯規則中一同出現,因此在障礙物識別響應測試時需要考慮這些因素;(4)容易與車輛相撞的物體包括樹,路邊的石頭,柵欄等,車輛撞到樹較容易發生嚴重的交通事故,并且主要發生在遠離路口的路段,在障礙物識別響應測試時需要設置常見的行道樹作為障礙物;(5)導致人與車輛相撞的嚴重事故的主要原因是行人在非人行橫道處穿過馬路,且從遠離駕駛員的道路一側穿到靠近駕駛員的道路一側,以及在夜晚有燈的光線條件,人與車輛相撞的嚴重事故與惡劣天氣和潮濕路面的關系不大,因此與行人有關的測試場景需要考慮夜晚有燈的光線條件,而為降低成本不需要設置有雨天氣和潮濕路面的場景條件。
結合測試項目與以上分析,構建測試場景,如表5所示。

表5 智能汽車安全測試場景Tab.5 Intelligent Vehicle Safety Test Scenario

表5 智能汽車安全測試場景(續表)Tab.5 Intelligent Vehicle Safety Test Scenario
其中部分測試場景示意圖,如圖1所示。


圖1 部分智能汽車安全測試場景示意圖Fig.1 Intelligent Vehicle Safety Test Scenario
這里對交通事故數據進行統計學分析、篩選、分類,將事故分為車與車相撞的事故,車與其它物體相撞的事故,車僅與行人相撞的事故利用改進Apriori算法進行關聯規則的提取,在提取過程中不僅考慮了常見事件,還考慮了不常見但對交通事故有較大影響的事件,提出了以嚴重事故發生為目標的提升度來提取關聯規則。最后根據提取出的關聯規則結合已有的標準建立了新的智能汽車安全測試場景,對于開發和完善我國智能汽車的場景測試方法具有重要意義。在未來的研究中可考慮更詳細的交通條件和環境因素,并針對不同類型車輛的事故分別分析,完善測試場景的構建,為智能汽車設計和測試提供參考。