胡新宇,左 韜,2,張勁波,伍一維
(1.武漢科技大學(xué) 信息科學(xué)與工程學(xué)院,湖北 武漢 430081;2.武漢科技大學(xué) 冶金自動(dòng)化與檢測(cè)技術(shù)教育部工程研究中心,湖北 武漢 430081)
移動(dòng)機(jī)器人與周?chē)h(huán)境進(jìn)行智能交互,在環(huán)境中執(zhí)行類(lèi)似于人的任務(wù),是近些年的研究熱點(diǎn)[1]。同時(shí)定位與地圖構(gòu)建(SLAM,simultaneous localization and mapping)是移動(dòng)機(jī)器人最基本的問(wèn)題,要求機(jī)器人能在未知環(huán)境中探索、建模并構(gòu)建有效、可用的全局地圖,是該領(lǐng)域研究的前沿方向[2]。將深度學(xué)習(xí)融合到視覺(jué)SLAM技術(shù)中,構(gòu)建含有環(huán)境語(yǔ)義信息的三維稠密點(diǎn)云地圖,這對(duì)移動(dòng)機(jī)器人理解環(huán)境中的語(yǔ)義信息,順利執(zhí)行高級(jí)復(fù)雜的任務(wù)具有舉足輕重的作用。
視覺(jué)SLAM是通過(guò)視覺(jué)傳感器,在沒(méi)有環(huán)境先驗(yàn)信息的情況下,在運(yùn)動(dòng)過(guò)程中估計(jì)自身運(yùn)動(dòng)狀態(tài)并構(gòu)建環(huán)境地圖[3]。目前,主流的視覺(jué)SLAM算法可分為兩種[4]:一種是基于特征的方法,該算法是通過(guò)提取每個(gè)圖像中的特征,再進(jìn)行匹配,從而恢復(fù)相機(jī)的姿態(tài)。如:KinectFusion[5]使用RGBD 相機(jī),通過(guò)ICP算法恢復(fù)相機(jī)的姿態(tài),并通過(guò)CUDA 進(jìn)行加速,來(lái)構(gòu)建環(huán)境的稠密點(diǎn)云地圖;RGBD_SLAM[6]是通過(guò)跟蹤ORB 特征,利用G2O算法優(yōu)化相機(jī)位姿來(lái)構(gòu)建稠密地圖;ORB-SLAM[7]是目前為止在該領(lǐng)域最優(yōu)秀的SLAM系統(tǒng)框架,不僅支持單目、雙目以及深度相機(jī),還包含回環(huán)檢測(cè)、重定位、自動(dòng)初始化,可以穩(wěn)健、快速地構(gòu)建環(huán)境的稀疏點(diǎn)云地圖。另一種是直接法,根據(jù)圖像的強(qiáng)度值來(lái)估計(jì)相機(jī)位姿,常見(jiàn)的基于直接法的算法框架有:DSO_SLAM[8]、LSD_SLAM[9]、SVO_SLAM[10]等。
在計(jì)算機(jī)視覺(jué)領(lǐng)域,深度學(xué)習(xí)的出現(xiàn)推動(dòng)了目標(biāo)檢測(cè)的發(fā)展。……