黃揚帆,邰國欽,馮 俊
(重慶大學 通信工程學院,重慶 400044)
數字圖像處理是電子信息工程及通信工程等相關專業(yè)的核心課程[1],并在工業(yè)工程上得到了廣泛的應用。在教學實踐的基礎上,為提高學生對圖像處理的理解能力和動手能力,開發(fā)了一種基于視頻感知的導航儀實驗設計。目前,已經研制出很多基于不同平臺的導盲設計[2-4],如嵌入式、單片機、超聲波、光電定位等,實現形式也是多種多樣,有的是觸摸型的導盲棒,有的是感知型的視頻轉換系統(tǒng)。為了達到更加方便快捷的目的,本文利用數字圖像處理技術[5],探索一款基于視頻感知的導盲系統(tǒng)設計。
系統(tǒng)設計框圖主要由3個部分組成:攝像頭、圖像處理器系統(tǒng)、外接語音裝置。攝像頭部分主要是攝取使用者前方道路視頻的,是一切信息的來源和基礎。PC機內先由采集卡一幀一幀地從視頻中獲得圖像[6],然后通過數字圖像處理的相關程序[7-9]實現辨別哪些部分是可能障礙物。分析完圖像信息后,如果有障礙物,就發(fā)出指令執(zhí)行語音提示,如果沒有障礙物,直接進行下一幀分析,同時保留此幀信息,以待與下一幀作比較,獲得更多的信息。
借助數字攝像頭對前方的圖像采集后,經過數據采集傳輸至處理器,進行圖像處理,待識別出前方預判范圍內的障礙后,轉化為語音,同時進行報警,并且提示障礙的大概距離及豎直高度。可用音量調節(jié)旋紐調節(jié)報警聲音量的大小,同時從處理器接出耳機,供使用者使用。圖1為本項目設計的系統(tǒng)結構框圖。

圖1 系統(tǒng)結構框圖
攝像頭采用常規(guī)CCD攝像頭,傳感器芯片為SONY CCD 1/3“,AV視頻輸出接口,便于與視頻采集卡的AV輸入端直接連接。
本系統(tǒng)采用的是天敏SDK2500型的采集卡。該采集卡采用的是Philips 7130芯片。相比于同類產品,Philips 7130芯片是一顆9bit ADC,使得采集的圖像無論是質量還是顏色的飽和度方面均有足夠的保障。該采集卡同時還具有二次開發(fā)功能,便于對其進行自定義功能開發(fā)。
在使用本系統(tǒng)時,當使用者使用本導盲裝置系統(tǒng)時,攝像頭捕捉到行進路面上的情景圖片后,將數據經過視頻采集卡傳遞到處理器中,處理器經過圖像處理[10-11]識別出每一幀圖片中的物體是否含有障礙物的信息,進而按照數字圖像處理的知識分辨[12-14]出是否有障礙物,如果有障礙物,就通過系統(tǒng)軟件程序指令,調出聲音系統(tǒng),指示使用者垮過障礙物。圖2是本系統(tǒng)的基本工作流程。
系統(tǒng)主要可以分為3部分:圖像采集、圖像處理、控制操作。圖3為控制流程圖。
(1)圖像采集。由攝像頭與采集卡部分組成,主要功能是為處理器提供投影幕布的圖像,為后續(xù)圖像處理提供數據源,為系統(tǒng)的輸入部分。
(2)圖像處理。由Intel處理器執(zhí)行,是本系統(tǒng)的核心。通過對捕捉過來的幕布圖像進行處理,確定出有障礙物圖片中障礙物的位置,處理結果直接影響下一步執(zhí)行指令的準確度。
(3)生成語音控制指令。由Intel處理器執(zhí)行,是本系統(tǒng)的后續(xù)關鍵部分。事先編輯好的系統(tǒng)軟件程序對圖像處理后的信息進行核對,例如當視頻的某些幀中出現的類似障礙物的信息,進入系統(tǒng)判斷如何避開,通過語音提示使用者的行進情況。

圖2 系統(tǒng)流程圖

圖3 控制流程圖
視頻圖像的采集由硬件部分的“天敏SDK 2500視頻采集卡”完成,攝像頭采集的模擬信號經過A/D轉換形成視頻數據流,然后通過PCI總線送至上位機。由于國內的廣播電視信號傳輸均采用PAL制,即在傳輸端把RGB三基色信號轉成YUV格式(Y為亮度信號,U、V分別為紅、藍色差信號)后傳輸。
為還原圖像,程序應首先進行YUV到RGB的轉換。CCD攝像頭顯示的圖像范圍一般和投影儀幕布不符,故在下一步處理之前需要確定圖像的范圍。PAL制信號的幀頻為25Hz,每張圖片的有效像素點為720×576,又采用4︰2︰2格式的YUV信號,每個像素需要用3×8=24bit(即3個字節(jié))編碼表示,故每張圖片平均都超過了1MB,每秒須處理25MB以上的數據內容。這樣大的數據量既占用系統(tǒng)資源,又對最后的處理結果沒有必要,因此使得設置抓拍的頻率成為必要。另外選擇圖像格式、設置處理時延等也被集成在了功能子模塊“自定義抓拍”中。具體流程如圖4所示。

圖4 圖像采集流程圖
圖像處理根據圖像記錄方式的不同分為模擬圖像和數字圖像。本設計完全是用數字(即計算機存儲的數據)來記錄圖像亮度信息,故屬于數字圖像。本設計采用的圖像格式即為BMP文件。
在圖像進行數字化處理之后,發(fā)現有可疑障礙物出現,就馬上判定生效有障礙物,并開始與上一張進行比較,從而得知可疑障礙物的遠近,然后通過SendMessage(WM_ICONERASEBKGND,(WPARAM)dc.GetSafe-Hdc(),0)這個指令,調用系統(tǒng)語音程序,發(fā)出命令示警語音,提示使用者可疑障礙物的距離,使得使用者順利通過。
通過多次的系統(tǒng)調試實驗,設計出了一款能簡單辨別障礙物的導盲系統(tǒng)。主要是通過數字圖像處理,對攝像頭收集來的使用者當前環(huán)境內的視頻照片進行分析,得出可疑障礙物的信息,然后根據含有可疑障礙物信息的每一幀圖片之間的差異,分析計算,提示使用者如何避開障礙物。圖5即是實驗設計的結果。
當障礙物的信息在圖片中出現的時候,系統(tǒng)將記下圖片中障礙物的位置和大小比例,同時啟動語音程序,提示使用者前方有障礙物,注意繞道前行。然后繼續(xù)收集下一幀圖片的信息。

圖5 出現障礙物圖片和對應二值化圖
二值化后,同一地方的明暗明顯不同,這就說明閾值的高低使得灰度大小不同的地方成為可疑障礙物的幾率不同,用這個方法就可以解決白天不同時段,甚至是夜晚因為光亮的強弱不同而帶來的不便。可以使用自動閾值灰度,然后自動二值化后,根據當時不同的光照強度確定當時所需的閾值。
相關改進就是在閾值設定的程序處,修改為自動閾值設定的程序。該自動設定閾值的程序是以環(huán)境的光照強度為標準設定的,在不同光照強度的情況下,系統(tǒng)自動調節(jié)閾值。這樣就可以在不同光照強度時,很準確地判斷障礙物和正常路線不同的灰度值,從而就能準確地判斷出障礙物的情況。
本系統(tǒng)通過數字攝像頭對前方的圖像獲取視頻后,經過數據采集卡采集圖片傳輸至處理器進行圖像處理,待識別出前方預判范圍內的障礙物后,轉化為語音信號,同時進行報警,并且提示障礙物的大概距離及豎直高度。從掌上電腦接出耳機,可用音量調節(jié)旋紐調節(jié)報警聲音量的大小,供使用者使用。實驗結果表明,該導航儀對障礙物距離和豎直高度的測量比較準確,具有測量精度高、體積小、使用方便的特點。該實驗可用在數字圖像處理等相關課程上,能極大地提高學生的動手能力和對圖像處理的理解能力。
(
)
[1]岡薩雷斯.數字圖像處理 [M].2版.北京:電子工業(yè)出版社,2007.
[2]Mu Kezhi,Shi Yikai.Applying research of threshold methods in pupil detetion[J].Beijing Biomedical Engineering,2005,24(6):443-445.
[3]Kiyoaki Tokunou,Youshinobu Ebisawa.Automated thresholding for real-time image processing in video-based eye-gaze detection[J].Proc of 20thAnn Int Conf of IEEE Eng In Med and Bio Soc,1998,20(2):748-751.
[4]Hutchinson T E,White Jr K P,Reichert K C,et al.Human-computer interaction using eye-gaze input[J].IEEE Trans.Syst Man Clyburn,1989,19(11/12):1527-1533.
[5]何斌.Visual C++數字圖像處理[M].北京:人民郵電出版社,2001.
[6]張桂勇,陳芳瓊.API for Windows 2000/XP 詳解[M].北京:清華大學出版社,2003.
[7]譚浩強.C語言設計[M].北京:清華大學出版社,2006.
[8]孫鑫,余安萍.VC++深入詳解[M].北京:電子工業(yè)出版社,2006.
[9]謝丹鳳,趙丹培.Visual C++ 數字圖像處理[M].北京:電子工業(yè)出版社,2008.
[10]韓文靜,李晶,孫農亮.基于HPF和Hough變換的人眼精確定位[J].計算機工程與應用,2008,44(10):64-66.
[11]張宏林.Visual C++數字圖像識別技術及工程實踐[M].北京:人民郵電出版社,2003.
[12]邵潔.虹膜內外邊緣定位算法[J].上海電力學院學報,2008,24(1):54-56.
[13]徐春青,張健.虹膜圖像定位方法的研究[J].遼寧工學院學報,2007,26(6):368-371.
[14]鄧智明.虹膜快速定位及虹膜圖像質量評估算法研究[D].西安:西安電子科技大學,2007.