□ 黃 旭 □ 張世義 □ 李 軍
重慶交通大學 機電與車輛工程學院 重慶 400074
圖像識別來源于模板匹配,從人類自身的視覺識別中演變而來。人類自身視覺識別的思路為,將眼前的物體和腦海中的印象進行對比,完成對眼前物體的定義。圖像識別也是如此,對原圖像提取特征,和需要的目標特征進行對比,從而達到識別的效果。圖像識別在現代科技中扮演著至關重要的角色,許多領域,如無人駕駛、人臉識別、導彈跟蹤等,都離不開圖像識別。隨著時代的進步、科技的發展,圖像識別技術不斷完善,發展到今天主要有統計識別、模糊集識別、神經網絡識別、模板匹配識別、結構識別、支持向量機識別等方法。此外,在某些特殊情況下,還有利用輔助靶標的識別方法。基本上所有圖像識別技術都離不開圖像預處理、圖像分割、特征提取、特征匹配識別等步驟。其中,圖像分割指為了節約計算資源,將圖像根據某些參數分成不同的區域,進而剔除無效區域。基于閾值、區域、邊緣的分割方法,以及超像素分割方法,都是如今常見的圖像分割方法。
圖像分割在圖像識別中起至關重要的作用,選擇合理的分割方法,可以大大縮短圖像識別的時間,節省計算資源。如在自動駕駛車輛領域,通過圖像分割可以快速識別出車道線、指示牌、交通信號燈等重要交通信息。可見,圖像分割非常重要。
基于閾值的圖像分割法是一種常見的圖像分割方法,主要思想為,不同的目標具有不同的特征,如顏色、灰度、輪廓等,利用特征間的細微差別,選取閾值劃分為目標物與背景。閾值分割能夠快速地實現圖像分割,常用于目標與背景相差較大的情況,對于復雜環境識別難度較大。
劉睿等[1]基于灰度值最大類間差算法對圖像進行二值化處理,利用不斷變化的閾值使不同分類之間的灰度值差異較大,能夠更加準確地進行圖像識別。
李成等[2]在進行目標識別時采用紅外成像技術獲得初始圖像。考慮到紅外圖像的缺點,通過復合去噪和對比度增強等手段進行處理,用于保障后續操作的連續性。考慮到紅外圖像的灰度變化明顯,采用閾值分割法來進行分割。選取高亮區的比例、灰度標準的偏差值、長寬比、復雜度、緊湊度等參數作為特征向量,結合模糊綜合評判法完成圖像目標的識別。
Troya-galvis等[3-4]提出采用多閾值相結合的方法進行單一目標分類分割的框架,由多個框架共同運作,達到精確分割的目的。
閾值分割能夠較為快速地完成圖像的分割,但是需要目標和周圍環境具有明顯的灰度值差異,因此往往需要進行對比度增強等處理。由于對復雜圖像難以進行準確的分割,因此人們常用閾值分割進行初步分割,在此基礎上再運用邊緣檢測分割、區域增長分割等方法,可以節約計算資源。
基于區域的圖像分割法分為區域生長和分裂合并兩種類型。對于區域生長類型,先選取一個像素,然后不斷合并具有相似特征的像素,從而達到圖像分割的目的。對于分裂合并類型,將整個圖像作為出發點,逐漸排除或合并相似的像素,最終完成圖像的分割。和傳統閾值分割方法相比,區域分割在像素的相似性和空間的鄰接性上更有優勢,可以明顯減小噪聲的干擾,具有更強的魯棒性。
李文靜等[5]在進行室內識別時,考慮室內場景的復雜性,結合歐氏聚類算法高效率分割的特點和區域生長對復雜環境適用度高的優點,利用區域生長將物體分割出來,應用歐氏聚類算法對歸屬物品分割,與標志庫進行對比,最終完成物體的識別。
王丹丹等[6]針對早期的蘋果體型小,不易識別的問題,提出了區域分割和全卷積網絡相結合的識別方法,首先通過深層次神經網絡提取蘋果的典型特征,然后進行區域識別定位,從而克服復雜背景、果實重疊等干擾因素,提高識別的準確率。
金旭輝[7]對交通指示牌進行識別,在色調、飽和度、亮度顏色空間中,結合顏色分層技術和簡單閾值處理,利用區域分割快速找到對應顏色的指示牌區域,通過數學形態學手段對區域形狀進行完善,提高識別準確性。
基于邊緣的圖像分割法利用不同區域中像素灰度值不同,以及區域邊界像素灰度值變化比較大的特點,檢測到邊界點,并將各個邊界點連接起來,從而完成區域分割。Roberts、Sobel、PreWitt、坎尼等都是常見的邊緣檢測方法。
Wang等[8]對圖像進行二值化處理,根據目標灰度值和環境灰度值相差較大的特點,采用小波多尺度邊緣檢測法提取車輛的邊緣信息,從而進行分割,并結合矩不變量的特征和改進反向傳播神經網絡完成對車輛的識別。
陳強等[9]在興趣區域中考慮鋼軌附近的灰度值分布在數值較小的區域,采用對數變換圖像增強的處理方法使需要的數值區間被拉大,壓縮無用的數值區間,提高識別度,并利用坎尼算子和概率霍夫變換提取軌道線。
王紅雨等[10]為減小光線條件差和噪聲污染的影響,將模糊理論和局部二值模式算子相結合,得到改進的邊緣提取算法,以此提高圖像的邊緣連續性和識別的速度。但是,由于這種方法產生的邊緣粒子較粗,因此難以進行精準識別。
Wang等[11]在對手勢識別時,采用雙邊濾波對圖像進行處理,利用優化彩色視頻信號顏色空間的橢圓模型提取手部膚色,加入Sobel算子完成對手勢的分割,以此達到對手勢的精確圖像識別。
超像素圖像分割法指將圖像中具有相似特征的局部連續像素聚合在一起的方法。和傳統方法相比,超像素分割有利于圖像局部特征的提取,減小了處理對象的規模,便于計算。
王璨等[12]為了提高農作物與雜草識別的準確性,在超像素分割的基礎上,提出了基于卷積神經網絡提取多尺度分層特征的識別方法。應用這一方法,首先建立神經網絡模型提取分層特征,通過特征對圖像進行識別;然后進行超像素分割,將每個超像素內全部像素的平均類別作為像素的類別;最后將相同的像素類別合并,實現圖像的分割,從而達到快速識別。
曹正文等[13]采用基于線性譜聚類的超像素分割對電子計算機斷層掃描圖像進行分割,根據同一個超像素具有相似性的特征,對圖像進行降維處理,得到視覺概要圖,有利于圖像中胰腺器官的分割。
楊飛等[14]通過無監督分割均值漂移對圖像進行分割,得到多個尺度的超像素分割,每個超像素代表一個尺寸,并在此基礎上建立道路分割模型。試驗表明,這一模型具有良好的道路檢測性能。
劉艷等[15]為解決傳統視差圖的毛刺現象,將二進制與超像素分割相結合,使視差優化時的邊緣保持平滑。
對于自動駕駛汽車,往往需要快速分割出感興趣的區域,縮減后續操作空間,節約計算資源,達到快速識別的目的。對于道路交通指示牌的分割識別,目前的技術主要是通過目標顏色生成相應的灰度圖像,然后進行迅速分割,結合目標形狀鎖定區域進行識別。目前技術仍受形狀相似或顏色相似干擾,在未來的發展中需要提高。
Agarwal等[16]在對交通信號燈進行識別時,為防止被發光二極管燈等光元素干擾,圍繞三種不同顏色的信號燈分別生成二值圖像,并利用邊緣檢測法提取輪廓,從而完成對交通信號燈的識別,流程如圖1所示。

圖1 交通信號燈識別流程
Tedjojuwono等[17]為了快速對車牌進行識別,采用一種互聯圖像分割,首先對原圖像進行對比度增強和降噪等預處理,然后采用坎尼算子提取車牌輪廓,從而使圖像分為幾個不同的區域,最后對幾個不同區域的輪廓進行比較,得到車牌區域。
宋文杰等[18]對圖像進行預處理增強對比度,根據標志特征,結合色相、飽和度、明度和色彩空間進行色彩分割,快速提取目標輪廓,并應用中值濾波消除噪點,利用膨脹腐蝕原理完善目標輪廓,從而達到分割的效果。
Zaklouta等[19]根據標志顏色,采用對應色彩增強的方法處理圖像,利用全局閾值法對圖像快速分割,鎖定標志位置,結合梯度直方圖與支持向量機檢測器檢測三角和圓形符號,以此達到實時識別交通標志的目的。
Khan等[20]在亮度-顏色分量空間色度層上提取顏色特征,利用K均值聚類算法分割出感興趣區域,根據數據庫對形狀進行匹配識別,找出指示牌并對其進行識別分析。
筆者主要介紹了四種不同的圖像分割方法,每種分割方法都有優劣。基于閾值的圖像分割法能夠快速分割圖像,但對于復雜圖像難以進行有效分割。基于邊緣的圖像分割法容易產生虛假的邊緣或者孤立的線段。基于區域的圖像分割法會對無目標物的空白區域進行分割,浪費計算資源。超像素圖像分割法難以在計算速度和計算精度之間達到很好的平衡。圖像分割技術發展至今,一般同時采取多種分割方法,如利用閾值分割和邊緣分割速度快的特點,先確定大致區域,再進行區域分割,以此縮短計算時間,提高效率。如今圖像分割技術已經基本成熟,今后將會圍繞分割速度進行研究。