蔣慶剛,譚克奇
(河南理工大學鶴壁工程技術學院,河南 鶴壁 458030)
智能車輛導航中各項信息處理技術的發展,促使汽車控制領域步入了新一級的科技時代,例如新興的車輛自主駕駛技術,其自主駕駛的重點是對導航路徑進行高效準確的識別。相比于主流的慣性導航、衛星導航與天文導航,仿生的偏振光導航類似于一種自主導航,既不存在偏差累積,也不會輕易受到干擾,而且偏振光導航已經實現了實時定位功能。
在導航路徑識別方面,現已有眾多研究人員對其展開討論。文獻[1]提出一種基于SVM與圖匹配相結合的車載激光點云道路標線識別方法,以標線為基礎對目標進行點云分割,構建由延展度、最小外包矩形面積與不變矩等組成的形狀特征矢量,再通過SVM對道路標線實施粗略分類并架構圖結構,采用圖匹配的策略對粗略的分類結果進行優化,從而實現路徑標識線的準確識別,該方法除了可以精確識別多種類標線目標,還對形狀類似的標線辨別存在較強的穩健性,但是存在識別結果偏差大的問題。文獻[2]提出一種農業機器人視覺導航路徑識別方法,該方法通過光照無關量剔除光照干擾,并采用混合閾值方法對圖像進行分割,實現對導航路徑的識別。實驗結果表明,該方法識別精準度較高。但是會由于樣本種類不均衡導致識別效果與實時性均有所下降。
為解決上述問題,將偏振光仿生技術與圖像處理技術進行結合,得出一種基于偏振光實時定位的標識線導航路徑圖像識別方法。通過對偏振光相關信息的獲取,得到相應的地理坐標,達成偏振光實時定位,采用圖像處理技術預處理路徑圖像,通過抽行掃描法抽取得到路徑標識線特征點,并以此為依據利用線性回歸方程架構標識線的表達式,基于特征點的質量判定,選取精準性較高的特征點結合數學形態學來識別路徑圖像中的標識線。實驗結果表明,所提方法可以有效去除圖像存在的噪聲點,并且識別效果較好。
從理論上說,通過兩點不平行偏振光的偏振向量能夠推算得到太陽的方向向量,在某一時間的太陽高度角[3,4]與方位角是對應于當地地理坐標的,因此,采用兩個或兩個以上偏振光的偏振方向向量、時間信息、太陽方向向量判別方式與地磁信息[5],就能夠求得當地的地理坐標,使偏振光實時定位性能得到實現。圖1為偏振光方向向量和太陽方向向量示意圖。

圖1 偏振光方向向量和太陽方向向量示意圖
圖1中,4個被觀察點分別用W1、W2、W3與W4表示,其偏振方向向量分別用P1、P2、P3與P4表示,觀察點、太陽和天頂點分別表示為O、S和Z。太陽高度角、方位角分別表示為hs和As,其中As為太陽方向向量位于水平坐標系中的投影與正北方向所構成的夾角。按照天空內偏振光的分散形式,得出偏振e方向向量pe與平面WlOS為垂直關系,其中l=1,2,3,4,因此,隨機選取兩個呈不平行關系的偏振e方向向量pe(e=1,2,3,4)與偏振f方向向量pf進行向量積,便可求得太陽方向向量Sb0,其計算公式如下
Sb0=(Sbx,Sby,Sbz)hs=K(Pe×Pf)hs
(e,f=1,2,3,4;e≠f)
(1)
式中,太陽方向向量位于載體坐標系中X、Y、Z軸的坐標值用Sbx、Sby、Sbz表示,關于整數K值選為1還是-1,則要依據太陽方向向量判定方式進行確定。圖2為載體坐標系示意圖。

圖2 載體坐標系示意圖
根據圖2載體坐標系中的太陽方向向量得出

(2)
式中,δ、φ和ω分別表示太陽赤緯、地理緯度與太陽時角。其中,太陽時角用下列公式進行表示
ω=η+15(tUT1+E)-180°
(3)
式中,η、tUT1及E分別表示為地理經度、格林尼治時間與時差。
格林尼治時間[6]與世界統一時間(tUTC)之間存在小于0.9s的誤差,因為將其單位換算成小時后數值極小,所以對計算產生的影響微乎其微,可以忽略不計。因此,將格林尼治時間替換成世界統一時間,代入上式后得到
ω=η+15(tUTC+E)-180°
(4)
圖2中的As用下式表示
As=A′s+H+D
(5)
式中,地磁北極和電子羅盤體軸所構成的夾角表示為H,被觀察點的磁偏角表示為D,其能夠通過地理的經緯度獲得,表達式如下
D=f(φ,η)
(6)
為了降低圖像分析、識別難度,則要對原始圖像執行預處理,突出顯示原始圖像中的有用信息,并消除噪聲。圖像降噪是采用中值濾波技術[7,8]實現的,該技術是一種基于部分平均的平滑技術,可以有效抑制脈沖干擾和椒鹽噪聲,而且對線性濾波器引起的圖像細節模糊存在一定程度的優化性,令圖像邊緣得到有效的保護。
中值濾波界定:如果有一組序列x1,x2,x3,…,xn,將其按大小順序排列成xi1≤xi2≤xi3≤…≤xin,那么得到如下中值表達式
M=median(x1,x2,x3,…,xn)

(7)
通過一個3×3的網格,對二維網格中的數據實現一維排序,根據上式得到中值M,將網格中心的原始灰度替換成中值M。
圖像分割的重中之重就是關于閾值的確定,而想要更好地適應外部環境的變化,應選用全局自動閾值分割法[9]運用于路徑圖像分割。關于路徑圖像的閾值分割,簡單來說,是在一個閾值處將圖像的直方圖分成目標范圍與背景范圍兩個部分。Otsu方法的核心理念就是令兩部分的類內方差為極小值,而類間方差為極大值[10]。
如果將路徑圖像的直方圖灰度變化區間設定為[m1,m2],直方圖被整數K值分割成C1與C2,且K∈(m1,m2),那么得到直方圖變化區間[m1,K]與[K,m2]。圖像中的像素總和、灰度值設定為i的像素個數和每個像素的發生概率分別用N、ni和Pi表示,而C1、C2的發生概率和均值則分別用ω1、ω2和μ1、μ2表示,得出下列公式

(8)

(9)
依據兩部分與整體路徑圖像的關系可以得出
μ=ω1μ1+ω2μ2
(10)


(11)

(12)

(13)
式(12)、(13)中,Pi(j)代表產生Cj部分灰度值為i的像素概率,其中j=1,2。從上列各式可以看出類內方差和類間方差都是整數K值的函數,若在[m1,m2]中選擇的整數K值,滿足類間方差極大且類內方差極小,則該整數K值是最優閾值,并通過創建的判定函數J來對其進行驗證

(14)
從式(14)可以發現,取判定函數J的極大值時,對應整數K值便是所需閾值。該閾值分割法并不影響先驗概率,因此,其可以最大程度地分割路徑圖像內的背景和目標。
高速上的道路存在諸多的特殊性,在設計與構建階段都要遵循嚴格的行業準則,例如其極限轉彎半徑設定是650m,所以在車前方距視平面40m內的車道分界線均能夠以直線處理。原始路徑圖像經過預處理,對圖像坐標系中標識線的像素方位和分散寬度進行確定,從而獲得標識線的中心像素方位,再通過最小平方法擬合標識線的中心像素,對圖像坐標系中標識線的位置參數做進一步的確定,如圖3所示。

圖3 標識線識別原理示意圖
分析圖3可知,將圖像底邊的中心點設為坐標原點O,橫向正方向為x軸,縱向正方向為y軸,也是車輛的對稱線。利用左右側分開處理的策略對標識線進行識別,下式分別為設定的左右側標識線中心線直線方程
y=a1x+b1
(15)
y=a2x+b2
(16)
因為路徑圖像經預處理后變成了二值圖像,其背景像素值是0,標識線圖像像素值則是1,因此,通過在選擇的掃描范圍中抽行掃描圖像,便能夠得到一組標識線中點坐標。根據圖3,將提取的行縱坐標設置成yi,那么位于該行的標識線圖像起點、終點的橫坐標用xi1、xi2表示,若xi=(xi1+xi2)/2,那么該行的標識線圖像中點坐標是(xi,yi)。因此,從路徑圖像中提取并掃描n行后,就可獲得一組標識線中點坐標(xi,yi),其中i=0,1,…,n。
將照相機采集到的路徑圖像尺寸設置成320×240,提取特征點的數量n設置成5,以確保識別結果的實時性與準確性。掃描的各行像素是沿y軸從下到上,且每隔24個像素便進行一次抽取而獲得的,各行的掃描方向為沿x軸正方向從左到右完成[11]。若第i行掃描的像素首次發生像素值突變,則此時該點的坐標是(xi1,yi),然后繼續掃描;若再次發生像素值突變,則此時該點的坐標是(xi2,yi),此行掃描終止。若提取特征點數量n<5,掃描繼續;若n>5,掃描終止。
利用最小平方法來直線擬合所獲取的中心線5個特征點坐標,便可解得參數a1、b1,同理識別右側標識線。
依據標識線識別原理,對標識線導航路徑圖像進行識別。由于路徑場景中包含大量的引導線與各類標志物,如四向道路、三向道路、彎道、拐角、丁字路口、掉頭標識以及轉彎標識等[12],在充分考慮各類標識物的基礎上,實現對標識線導航路徑圖像的識別。具體的識別步驟如下:
1)對圖像中路徑的邊緣點進行識別,在識別過程中,在圖像處理區域中,依次對所有像素進行二值化處理,從而得到路徑左、右邊緣點,在此過程中,要注意保護路徑邊緣細節。
2)在識別一幀導航路徑圖像時,采用中值濾波算法設定一個閾值,根據該閾值判斷該像素是否為噪聲點。如果是噪聲點,需要對其進行中值濾波處理;如果不是噪聲點,將圖像的像素直接輸出即可。
3)運用最優閾值法得到導航路徑圖像的最佳閾值。
4)雖然經過中值濾波技術處理后的圖像中的噪聲得到了大量減少,但是為了進一步提升圖像識別質量,采用數學形態學中的開運算方法對圖像進行進一步去噪,從而得到準確的標識線導航路徑圖像識別結果。
為了給車輛導航提供有效的數據支持,確保標識線得到穩定、實時的辨識,實驗選取一輛微型客車,在其前擋風玻璃的中心位置安裝導航,對所提方法與文獻[1]方法、文獻[2]方法進行測試和對比驗證。
獲得不同車速相同路徑行駛情況下,采用三種方法識別的標識線偏差對比結果,如表1所示。

表1 識別偏差對比數據
通過表1可以看出,三種方法偏差值隨著車速的提升而增加,其中,所提方法的識別偏差值最小,在不同路況情況下,相比于弧線標識線,直線的標識線識別效果更加理想,且偏差值與車速之間的正比例關系不變。無論是路徑情況還是行駛速度方面,所提方法均優于文獻方法,具備優秀的識別性能與良好的穩定性。
將大型超市作為導航搜索的目標點,采用所提方法、文獻[1]方法、文獻[2]方法在設定固定出發點行駛向距離出發點最近的大型超市,在必經路線某個路口設置交通事故點,觀察三種方法的導航路徑判斷對比結果,如圖4所示。

圖4 導航路徑識別效果對比
分析圖4可知,采用所提方法、文獻[1]方法和文獻[2]方法行駛的實際路徑分別為5km、10km、7km,其中所提方法的行駛路徑最短,當三種導航的必經路口上發生事故時,文獻[1]方法在路口發生事故時,返回出發點重新選擇最近目標點,耗時最長,路徑最長。文獻[2]方法在所經路口發生事故時,選擇返回城市主干道,判斷其它大型超市作為新的目標點,造成其行程較長,耗時較長。所提方法在所經路口發生交通事故時,在事故點附近迅速判斷最近的備選道路及最近的目標點,穿過居民區小路,最終達到目標點,耗時較短且路程最短,與原計劃最短路程相差不多。由此可知,所提方法路徑識別規劃的實時性最好。
為了進一步驗證所提方法的有效性,以是否能夠識別出標識線導航路徑圖像中的標識物為標準,對比不同方法的圖像識別效果,圖5為待識別圖像。

圖5 待識別圖像
分析圖5可知,為了檢驗所提方法的識別能力,在待識別圖像中設置了四向道路、三向道路、拐角、彎道以及指示箭頭與禁止停車等引導線與各類標識物,采用不同方法對該圖像進行識別,識別結果如表2所示。

表2 標識物識別結果
分析表2中數據可知,采用所提方法能夠有效識別出圖像中的各類標識物,僅對部分標識物在識別中存在缺失現象,如拐角標識和禁止停車標識。而采用文獻[1]方法和文獻[2]方法對圖像中的標識物進行識別時,遺漏的標識物較多,說明所提方法的識別效果較好,具有明顯的優勢性。這是由于所提方法采用最優閾值法獲取導航路徑圖像的最佳閾值,并結合數學形態學中的開運算方法對圖像進行進一步去噪,從而得到了更加準確的標識物識別結果。
由于在復雜或有危險因素的路況中實時、精準地識別標識線存在一定的難度。為解決此類問題,提出一種基于偏振光實時定位的標識線導航路徑圖像識別方法。利用偏振光的相關信息求得對應的地理坐標,完成偏振光實時定位,通過中值濾波對路徑圖像完成預處理,根據分割區域與整體路徑圖像的關系,采用Otsu方法選取一個滿足類內方差極小、類間方差極大的最優閾值,利用抽行掃描法對標識線的中心像素方位進行獲取,再結合最小平方法的擬合方程式和數學形態學有效地對標識線完成理想識別。經過實驗驗證,所提方法具有較好的圖像識別效果,可以更好地為視覺導航提供理論支持。