黃李波 徐嘉
(同濟大學 上海市 201804)
近年來自動駕駛成為汽車安全研究領域的熱點。毫米波雷達傳感器是自動駕駛的核心部件之一,相比于其他感知傳感器,其在惡劣光線和雨霧天氣條件下,仍有較強的魯棒性,基于毫米波雷達的人車識別技術可以提高自動駕駛系統[1]的性能。傳統汽車毫米波雷達無法測量高度信息而且點云稀疏,因此難以對行人、自行車等靜止物體進行分類,而成像毫米波雷達增加了高度的信息,并且可以輸出高密度的3 維立體點云,從而更加容易的實現目標分類。
本文使用的基于成像毫米波雷達的分類算法概述如圖1 所示。本節介紹該算法的兩個主要模塊:特征提取和目標分類器。
從成像毫米波雷達輸出的點云原始數據信息中提取出與目標特征相關的信息,包括目標點的縱向距離x、橫向距離y、高度z、徑向距離r、速度v 和信噪比SNR。由這些目標點組成雷達點云,根據點云的空間分布、速度和電磁散射特征[2],提取出16 個點云特征。這16 個特征的名稱及描述如表1 所示。本節將詳細分析和解釋每個特征。
1.1.1 目標點云的空間分布特征
將成像毫米波雷達輸出的3 維立體目標點云,投影到x-y 平面,使用一個最小矩形邊框將其包起來。最小矩形邊框的長寬如圖2 所示。將矩形的寬W 定義為第一個特征a1,將矩形的長L 定義為第二個特征a2,矩形的面積S 定義為第三個特征a3,矩形面積S 計算公式如下:

將矩形框沿著z 軸拉伸,形成一個立方體,將目標點云包住。該立方體以雷達3 維點云在z 軸坐標上的最小值為下底,最大值為上底。立方體的體積V 被定義為第四個特征a4,立方體的體積V計算公式如下:

不同的目標由于表面材質、體積、形狀的不同,同一個目標距離雷達遠近,同一個目標在靜態和動態下,雷達探測到的目標點云數量都不同。將雷達點云數量N 定義為第五個特征a5。目標距離雷達近一些,采集到的目標點云數量會相對多一些。將目標距離雷達的徑向距離r 定義為第六個特征a6。由于不同目標的高度以及形狀不同,將目標點云的平均高度作為第七個特征a7。與行人相比,汽車表面材質不同,雷達點云分布稀疏。將雷達目標點云密度D 定義為第八個特征a8,雷達目標點云密度D 計算公式如下:

目標點云x 軸坐標值的標準差XSD被定義為第九個特征a9。類似地YSD被定義為第十個特征a10、ZSD被定義為第十一個特征a11。XSD、YSD和ZSD計算公式如下:


1.1.2 目標點云的速度特征

由手臂和腿的擺動產生的速度分量使行人的點云速度分布在一個很寬的范圍內[3]。相比之下,車輛點云的速度分布相對較窄,因為車輛的運動可以看作剛體的平移。將點云的速度范圍vL定義為第十三個特征a13。點云的速度范圍vL計算公式如下:

目標點云速度的標準差vSD被定義為第十四個特征a14。vSD的計算公式如下:


圖1:分類算法概述

圖2:外接矩形框示意圖

圖3:隨機森林的集成模型示意圖

表1:16 個點云特征

表2:常用核函數

表3:成像毫米波雷達系統配置參數

表4:不同分類器的識別率

表5:沒有高度信息的識別率

圖4:實驗用的成像毫米波雷達

圖5:采集靜態目標的場景

圖6:采集動態目標的場景
1.1.3 目標點云的電磁散射特征
雷達目標的反射強度和目標的形狀、尺寸、結構及材料有關。隨著雷達目標的RCS 隨著目標尺寸的增大而增大,自行車、行人和有人自行車的RCS 波動小于汽車[4]。 因此把目標點云的平均信噪比SNRmean定義為第十五個特征a15。同時,將目標點云信噪比的方差SNRSD定義為第十六個特征a16。SNRmean和SNRSD的計算公式如下:

根據雷達目標點云的形狀、速度以及目標反射強度特征,提取出了16 維特征向量。基于這16 維特征向量,對以下幾種分類算法進行了研究。
1.2.1 決策樹分類算法

圖7:五類目標識別率的混淆矩陣

圖8:特征重要性排序
決策樹是一種用于分類任務的模型。一棵決策樹由根結點、內部結點以及葉結點組成。根結點和內部結點代表問題,每個問題對應一個二分類器。所做的雷達人車分類包括5 類目標,是多分類問題。決策樹的每個結點是個二分類學習器,解決多分類問題就需要對問題進行拆分,將多分類問題拆分成多個二分類問題[4]。
1.2.2 隨機森林分類算法
集成學習是通過合并多個學習器,從而得到更加強大模型的方法。集成學習得到的模型,在泛化性能上優于單一學習器。隨機森林是一種經典的集成模型。隨機森林是包含多棵決策樹的模型,其中的每棵決策樹相互獨立。隨機森林的分類結果由單個決策樹的輸出結果投票決定,將個別數輸出的類別的眾數作為最終分類結果[5]。隨機森林的集成模型示意圖如圖3 所示。
1.2.3 核SVM 分類算法
SVM 的基本模型是一個二分類模型,通過一個最大化間隔的劃分超平面,實現兩類目標的分類。劃分超平面的數學描述:

分類樣本通常不是線性可分的,我們使用核技巧進行非線性分類。對于SVM,常用的核函數如表2 所示。
利用網格搜索和交叉驗證的方法,自動化的選擇分類器模型的優化參數。
考慮到數據集樣本量有限,采用K 折交叉驗證的方法,對3 種分類器模型的性能進行評價,確定出最優參數。收集的數據集被隨機均勻地分成K 個不同的分區。K-1 個分區用于訓練,剩下1 個分區依次用于測試。通過這種方式,將操作K 個分類循環。以K 種分類結果的平均準確率作為分類精度的估計。
使用網格搜索的方法,不同參數可以取若干個間隔,在計算時可以窮舉參數空間的網格交叉點。因此可以確定網格的全局最優參數,從而防止手動調參的重大誤差[6]。
本文采用的是德州儀器公司生產的成像毫米波雷達開發套件,該開發套件采用四片級聯的AWR2243 芯片,如圖4(a)所示。單個AWR2243 芯片配置了3 個發射天線和4 個接收天線,四級聯的成像毫米波雷達系統配置了12 個發射天線和16 個接收天線。相比于單芯片系統,四級聯的雷達系統可實現較高的信噪比和角分辨率。四級聯成像毫米波雷達系統配置參數如表3 所示。雷達安裝在小車上,距離地面高度90 厘米,如圖4(b)所示。分別在靜態和動態下采集了5 類目標的數據,5 類目標包括行人、自行車、摩托車、小轎車以及大巴車。根據采集的數據,制作了3 個數據集:靜態、動態以及混合數據集。
使用成像毫米波雷達開發套件在空曠的場地,分別采集了5 類目標在靜止狀態下的數據,場景如圖5 所示。采集靜止的人、靜止的自行車以及靜止的摩托車的數據時,雷達距離目標在1 米到20米的范圍內,以1 米為間隔,分別采用正面、45 度傾斜、側面以及背面朝向雷達。采集靜止的小轎車、靜止的大巴的數據時,雷達距離目標在1 米到40 米的范圍內,以5 米為間隔,分別采用正面、45 度傾斜、側面以及背面朝向雷達。5 類目標,在靜態下,分別采集了2000 幀的數據。
如圖6 所示,在空曠的場地上,采集運動的行人、自行車、摩托車、小轎車和大巴。其中行人、自行車和摩托車在距離雷達0 到20 米的范圍內,以5 米為間隔采集數據;而小轎車和大巴在距離雷達0 到40 米的范圍內,以5 米為間隔采集數據。采集數據時,目標的運動狀態分為橫穿、接近、遠離、和以固定徑向距離環繞的方式,以及較快和較慢的速度。5 類目標,在運動狀態下,分別采集了2000 幀的數據。
將靜態數據集合動態數據集混合,形成混合數據集。5 類目標,分別有4000 幀的數據。
本文使用平均識別率來評價分類結果。分別使用機器學習的決策樹模型、隨機森林模型以及SVM 模型,完成對行人、自行車、摩托車、小轎車和大巴車,這5 類目標的分類。
基于提出的16 維特征向量,比較了不同機器學習分類器模型的分類效果。在確定三種機器學習的分類模型的最優參數時,使用了網格搜索的方法,其中SVM 模型使用了核技巧,效果最好的是高斯核。將5 類人車目標的識別率的平均值作為分類結果,不同分類器的識別率如表4 所示。隨機森林和SVM 分類器模型,對靜態、動態以及混合數據集的分類識別率都在95%以上,其中隨機森林模型對靜態數據集識別率較高,超過97%,SVM 模型對動態和混合數據集的分類識別率較高。三類分類器中,決策樹的綜合識別率最低。
由于傳統汽車毫米波雷達沒有高度信息,將成像毫米波雷達點云數據集中的高度信息去掉,形成二維雷達數據點。使用SVM 模型,分別使用二維數據點和三維數據點云進行人和車的多分類。本文提出的16 維特征中的a4、a7、a8和a11和點云的高度信息有關,去掉這4 個特征。基于剩下的12 維特征,我們分別使用三種機器學習的分類模型進行分類。沒有高度信息的分類識別率如表5 所示,分類的結果普遍低于表4 中的結果。
對行人、自行車、摩托車、小轎車和大巴車進行了分類。為了比較這5 類目標的分類難易程度,使用混淆矩陣的方法輸出決策樹模型的分類結果,如圖7 所示。其中大巴車的識別率最高,自行車和摩托車的識別率相對低一些,這兩類目標相似度較高,容易相互誤識別,因此識別率相對低一些。
使用隨機森林模型,比較了提出的16 個特征的重要性。對于靜態、動態和混合的目標,最重要的特征是a3,即點云在XY 平面投影得到的矩形框的面積。重要性排名前三的特征還有a4和a10,其中a4表示點云外接立方體的體積,a10表示目標點云Y 軸坐標值的標準差。重要性排名前三的特征都屬于目標點云的形狀特征。如圖8 所示。
本文使用了成像毫米波雷達傳感器,從成像毫米波雷達三維點云的形狀、速度以及信號強度中提取了16 維特征向量,采用機器學習的決策樹、隨機森林以及核SVM 模型,實現了人車的多類分類。三種分類器模型中,隨機森林以及SVM 模型,對三種數據集的分類識別率都達到了95%以上,其中隨機森林模型對靜態目標分類效果最好,高斯核SVM 模型對動態目標和混合目標分類效果較好。相比于傳統汽車雷達的二維數據點,成像毫米波雷達三維立體點云的人車分類識別率更高。五類人車目標中,大型車輛最容易識別,自行車和摩托車的識別率最低。由隨機森林模型可知,提出的16維特征中,對于靜態、動態和混合的目標,最重要的特征是a3,即點云在XY 平面投影得到的矩形框的面積。重要性排名前三的特征還有a4和a10,其中a4表示點云外接立方體的體積,a10表示目標點云Y 軸坐標值的標準差。重要性排名前三的特征都屬于目標點云的形狀特征。