熊志麗 劉華軍
(南京理工大學計算機科學與工程學院 南京 210094)
同時定位與地圖構建(Simultaneous Localization and Mapping,SLAM)問題一直備受機器人和自動駕駛領域的關注,在經典的視覺SLAM 框架中,視覺里程計(Visual Odometry,VO)扮演著前端的作用,即在讀取傳感器傳來的信息后,通過相鄰兩幀的圖像信息估計出圖像之間的相對運動,運動主要包括旋轉和平移兩個層面。VO的概念最早應用領域為火星探索[1]。傳統的VO 工作流程主要包括:相機校準、對輸入的圖像進行特征的提取和篩選、相鄰幀的特征匹配、異常值剔除、運動估計和比例估計、局部優化、最后輸出位姿。可見傳統VO系統的運行過程比較復雜,分為很多模塊,每個模塊都有各自的算法,將不同模塊耦合在一起也是工作重點。
傳統方法按照是否提取特征可以分為特征點法和直接法。特征點法主要運用在場景紋理豐富、特征明顯的情況下。特征點由關鍵點和描述子組成,在提取關鍵點后再通過計算描述子對關鍵點進行篩選。提取關鍵點是指獲得像素點的位置,而描述子是一個向量,能夠根據人工設計的方法對該關鍵點周圍的像素信息進行描述,減少甚至消除相機視角的變化對圖像尺度和方向的影響,更好地進行幀間匹配。有的特征點還包含朝向、大小等信息。SIFT[2]、SURF[3]、BRIEF[4]是描述子常見的算法。
直接法主要用光流來描述運動信息。光流分為計算所有像素的稠密光流以及計算部分像素的稀疏光流。稀疏光流的代表有Lucas-Kanade(LK)光流[5],可用于SLAM 的特征點位置跟蹤。……