楊樹旺
(中鐵第一勘察設計院集團有限公司,陜西西安 710043)
伴隨計算機及信息技術的發展,以全自動駕駛車輛為代表的新技術為城市軌道交通注入新的活力。為提高全自動駕駛車輛檢修作業的信息化水平,完善車輛檢修基地的信息化建設,將全自動駕駛車輛基地自動駕駛區綜合管控系統所產生的監測數據與對應車輛進行綁定,即可形成特定車輛的專屬“病例”檔案,便于檢修管理決策以及車輛性能改進。而要實現上述目標,就必須完成車輛編號的自動識別。
車輛編號自動識別技術的實現主要經歷了射頻技術與電子標簽結合、圖像識別技術等階段,但由于涉及車輛結構改造以及易受異物影響等原因,使用效果均不理想。隨著大數據技術的發展,深度學習技術逐漸在車號識別研究領域有所應用。胡路路、張亮等采用目標檢測算法、文字檢測網絡(Connectionist Text Proposal Network,CTPN)模型實現了車輛編號的識別,準確率超過95%。但該種方法模型迭代次數極高,需要大量的樣本數據提高識別準確率。
本文基于深度學習、目標檢測、機器視覺和光學字符識別(Optical Character Recognition,OCR)等技術,研發新型車號識別系統。該系統利用車輛標志與編號相對位置固定的特點,大幅減少模型訓練所需的樣本數量。
深度學習是機器學習的分支,是一種以人工神經網絡為架構,對資料進行表征學習的算法。本系統使用的深度學習技術框架為Darknet。Darknet深度學習框架支持中央處理器(Central Processing Unit,CPU)和圖形處理器(Graphics Processing Unit,GPU)計算,且支持開源計算機視覺庫(Open Source Computer Vision Library,OpenCV)和共享內存并行編程(Open Multi-Processing,OpenMP),同時Darknet框架具有結構清晰,源代碼查看、修改方便的優點。
目標檢測是計算機視覺及影像處理中的術語,指的是讓計算機去分析1張圖片或者1段視頻流中的物體,并標記出來。本系統使用YOLO目標檢測算法,其算法示意圖如圖1所示。YOLO算法將輸入圖像縮放成統一大小的尺寸,利用整張圖片作為輸入進行特征的提取,將最后的特征圖劃分為S×S個網格,每個網格可以看成是1個候選框,每個候選框包含了4維位置坐標信息和1維目標類別置信度,然后分別對每個網格進行目標分類和邊框回歸,實現目標搜索。
機器視覺是配備有感測視覺儀器(如自動對焦相機或傳感器)的檢測機器,可用于檢測產品缺陷、判斷并選擇特定物體,或用于測量尺寸等,大量應用于工廠自動化檢測及機器人產業中。
OCR是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。本系統使用開源算法Tesseract。支持Tesseract 的Leptonica組件有著優越的圖像分析性能,保證文字識別的精度。除此之外,Tesseract還具有多平臺的可移植性,擁有龐大的Unicode字符識別庫。OCR 檢測與文本識別主要包含圖像預處理、版面分析、圖像切分、特征提取與模型訓練、識別后處理等,其流程如圖2所示。
基于上述技術,本文研發的基于深度學習目標檢測的車號識別系統主要由高速攝像頭、光電反射車感器、邊緣計算機及信息傳輸模塊組成,工作流程如圖3所示。
(1)在列檢庫司機登車平臺端部,采用可調節吊桿機構吊裝車號識別攝像機,使其能夠在車輛經過時在同一畫面中拍攝到車輛的標志(LOGO)和車號,車號識別攝像機安裝位置如圖4所示。在該股道車輛入庫位置部署1臺邊緣計算機和1個光電反射車感器,地鐵車輛經過時觸發車感器,邊緣計算機通過車感器檢測到車輛到來,觸發攝像頭錄制短視頻。
(2)邊緣計算機內置檢測程序,使用深度學習目標檢測技術逐幀檢測視頻是否拍到車輛LOGO,如果沒有檢測到則判定為車感器誤觸發;如果檢測到車輛LOGO,則通過檢測程序計算得到LOGO在圖像上的位置和像素尺寸大小。
(3)根據車頭正面LOGO與車號之間的相對位置和大小比例關系(預置在檢測程序中),基于機器視覺技術計算出車號在圖像上的位置和大小,找到車號位置,圖像裁減后使用OCR算法進行文本識別,得到車號數據。由于攝像頭不可能安裝在車頭正前方,車號圖像會有變形,裁減車號位置的圖像后,可通過透視變換矯正圖像,以改善圖像變形對識別結果的影響。
(4)邊緣計算機按照通信協議要求將車號數據、車感器被觸發的時間以及邊緣計算機編號通過網絡發送給上級服務器。上級服務器據此形成特定車輛的位置記錄。
地鐵車輛的車頭部分標識了車輛編號及車輛LOGO,如圖5所示。不同車輛的車號不同,但LOGO的位置及形狀固定不變。系統在策略上的與眾不同之處在于,不直接識別車號,而是先識別出LOGO,根據LOGO與車號之間的位置關系,找到車號所在區域,然后再識別車號。由于LOGO是固定不變的目標,相比車號的識別準確度會更高,深度學習時所需要的樣本更少,訓練速度更快。
依托南寧地鐵那洪車輛基地的建設,實施全自動駕駛車輛基地作業綜合管控系統。其中停車列檢庫的車號識別系統安裝完畢后,在現場進行為期2個月的調試測試,數據統計結果如圖6所示。
由圖6可知,測試前期識別成功率曲線波動較大,成功識別車號數量較少;隨著調試過程的推進,識別成功率逐漸上升,并趨于穩定,但仍有個別數據波動產生。通過故障分析顯示,個別股道未能成功識別車號的原因均為車感器未被觸發、攝像機未拍攝錄像等硬件設備原因,除此之外,在硬件設備正常運轉、攝像機正常工作的其余股道,車號識別系統均正確識別出所在股道的車輛車號。在調試后期,系統的識別準確率也趨于穩定。
當前國內城市軌道交通發展迅速,本文從全自動駕駛車輛基地自動駕駛區綜合管控系統的實際需求出發,綜合深度學習、目標檢測、機器視覺以及光學字符識別技術,利用地鐵車輛車號與車輛標志相對位置不變的特點,開發了地鐵車輛的車號識別系統。經過現場安裝測試,證明其能夠成功識別車輛編號,準確率及可靠性均達到使用要求,可為解決傳統地鐵車輛檢修基地車號識別問題提供有效的解決方法,為持續推進車輛基地運用檢修管理信息化提供有力保障。