999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合空洞卷積神經網絡的語義SLAM研究

2020-12-07 06:14:15潘琢金,戴旭文魏鑫磊王傳云
現代電子技術 2020年22期
關鍵詞:語義深度信息

潘琢金, 戴旭文 魏鑫磊 王傳云

摘? 要: 為了解決傳統視覺SLAM算法受動態環境因素影響較大、對設備的算力要求高的問題,該文提出一種融合ORB?SLAM2、語義標簽以及全局性稠密光流法的視覺SLAM算法。該方法采用空洞卷積神經網絡的語義分割模塊為雙目圖像添加語義標簽,識別物體類別。再結合相鄰幀間位置信息對圖像的動態點進行剔除。最后使用Octo?map優化定位與建圖,實現動態環境下地圖的建立與實時更新。實驗結果證明,該文提出的算法在動態環境下的特征點提取速度和質量相較傳統視覺SLAM算法有一定提高。

關鍵詞: 語義SLAM; 空洞卷積神經網絡; 語義標簽; 動態點剔除; 地圖構建; 結果分析

中圖分類號: TN911.73?34; TP301.6? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)22?0152?05

Abstract: A visual SLAM algorithm fusing ORB?SLAM2, semantic label and global dense optical flow method is proposed to solve the problem that the traditional visual SLAM algorithm is greatly affected by dynamic environment factors and requires high computing power of equipment. In this method, the semantic segmentation module of dilated convolution neural network is used to add semantic tags to binocular images, so as to identify object categories. The dynamic points of the image are eliminated by combining the position information between adjacent frames. The octo?map is used to optimize location and map construction to realize the map establishment and real?time update under the dynamic environment. The experimental results show that, in combination with the traditional SLAM algorithm, the speed and quality of feature point extraction in dynamic environment are improved.

Keywords: semantic SLAM; dilated convolutional neural network; semantic tag; dynamic points elimination; map construction; result analysis

0? 引? 言

移動設備在未知的環境中運動時,通常需要采用紅外光、雷達等傳感器獲取周邊環境的位置信息[1],估算自身的位置及姿態信息。然而,傳統的地圖構建方式完全依賴周邊環境的幾何特征,并不能充分地理解周邊環境。這導致設備上的處理器需要對比圖像上所有特征點的位移情況,消耗大量算力,限制了其對復雜任務的處理能力。因此,將獲取的圖像信息從像素級別上升到物體級別,已成為移動設備在現實場景下執行復雜任務的必要手段。

為了解決以上問題,本文研究一種融合語義信息的SLAM算法。語義與SLAM看似獨立,實則相輔相成。一方面,語義信息能夠減少傳統SLAM對圖像特征的依賴,尤其在動態環境下,移動的物體會導致定位精度下降、誤差累積、跟蹤失敗等問題。融入語義信息后,SLAM系統能夠在物體層面判斷動態物體的精確位置,提高建圖和定位的精度;另一方面,借助SLAM技術,充分利用幾何信息計算出的物體位置與輪廓信息也有助于提高語義分割的精度。

本文使用的SLAM系統基于ORB?SLAM2[2]算法,該算法是基于關鍵幀的稀疏SLAM算法中性能較好的算法框架。系統首先使用MYNT?EYE雙目攝像頭實時獲取圖像,再利用ORB?SLAM2算法實現相機的位姿估計并篩選關鍵幀,同時,結合語義分割算法對獲得的二維圖像進行語義分割,最后使用光流法結合語義信息實現對動態點的剔除。

本文提出的語義SLAM在ROS系統下通過5個線程實現,分別為跟蹤、本地建圖、回環檢測、語義分割和Octo?map建圖線程。線程之間采用ROS基于話題和服務的通信機制,將雙目矯正圖像作為輸入,分別提供給本地建圖線程和語義分割線程。其中,語義分割線程采用的神經網絡基于ENet[3]網絡結構,將深度信息作為門控信號,從而控制卷積核的大小,提高了目標檢測的準確度;跟蹤線程在負責跟蹤并計算每一幀位姿的同時,通過獲取相鄰幀間的位姿變化忽略相機自身運動,實時檢測關鍵幀中的動態對象,并將其動態點剔除;本地建圖線程通過地圖點匹配構建地圖,將圖像關鍵幀按時間順序檢測,可有效縮小漏檢、誤檢對整體建圖的影響;Octo?map[4]建圖線程使用稠密八叉樹地圖算法,采用log?odds方法計算出葉子節點的占據概率,將八叉樹按照占據概率進行渲染,更新并繪制出點云圖像。系統運行流程如圖1所示。

1? 基于空洞卷積的語義分割算法

1.1? 語義分割線程

經典ORB?SLAM2算法使用特征像素點匹配來獲取相鄰幀間物體的位置變化,然而匹配得到的像素點并沒有實際意義且這種匹配方式過于依賴特征。若環境內有較大噪聲,則匹配精度將無法保證。因此,若能將獲取到的圖像特征融入語義標簽,將會降低特征點匹配消耗的算力并提高建圖速度。

本文提出的SLAM系統中融入了語義分割線程,用于加載網絡模型及權重信息、輸入原始圖像并輸出分割結果。具體來看,首先線程將待分割的圖像進行預處理,調整其通道數及像素值并輸入到神經網絡中;其次,運行神經網絡進行推理,得到不同類別語義標簽的概率,在圖像中劃分并輸出語義分割結果。

1.2? 語義分割算法

用于SLAM系統的語義分割算法要求網絡同時具有較高的分割精度及較快的處理速率,但在傳統的語義分割算法中,這兩者不可兼得。若希望獲得較好的分割精度,則需要提取到豐富的圖像特征,相對應地增加網絡參量,擴大卷積核并保持較大的感受野,以學習到更有區分性的特征。若希望獲得較快的運行速度,則需要降低網絡的參量,減小卷積核的大小。綜合考慮分割精度和速度,本文提出的算法選擇了ENet作為基礎算法,并在此基礎上進行改進。

ENet算法由較大的Encoder和較小的Decoder組成,Encoder主要進行信息處理和過濾,而Decoder主要是對Encoder的輸出做上采樣,對細節做細微調整。同時,由于ENet模型未引入bias值,減少了一部分的內核調用和存儲操作,分割速度在相似性能的分割算法中也處于領先位置。

Paszke A等提出在語義分割網絡中,最初的網絡層不應該直接分類,而應該作為很好的特征提取器并為網絡后續部分的輸入進行預處理,這樣能夠大大減少輸入的尺寸,使冗余的視覺信息得到有效的壓縮,能夠降低計算資源的消耗[3]。本文提出的算法借鑒了這一思想,在data層后設計一個數據處理模塊,降低圖像中的冗余信息。

1.3? 基于深度信息的多尺度卷積門控

二維圖像中物體的大小與距攝像機的距離成反比,圖像的深度信息有利于不同尺度物體的分割。Kong S等認為,在語義分割網絡中融合深度信息能夠提高物體尤其是遠處物體的語義分割精度[5]。本文使用雙目視覺模塊通過雙目立體匹配得到視差圖,并利用視差和深度的關系,得到當前圖像的深度。

由于圖像中遠處的物體較大,近處的物體較小。因此,不同深度的圖像應使用不同大小的卷積核進行卷積。然而,增大卷積核尺寸會使參數成倍增長,導致網絡效率變低。本文使用空洞卷積對圖像特征進行提取,在保證參數個數不變的同時,增大了卷積核的感受野,并保持輸出的特征映射大小保持不變,使其在附近獲取更多的上下文信息。感受野與空洞步長的關系如圖2所示。

為了提升語義分割模塊的精確度,本文使用深度信息作為門控信號自適應地學習圖像特征。

1) 本文將深度信息根據距離遠近分為5個等級,并生成一張包含深度等級信息的掩模圖像;

2) 采用不同空洞步長的卷積核,對圖像進行卷積,得到5張相同尺寸的圖像;

3) 使用深度信息作為門控信號,按照深度掩模圖像中每個像素點的深度信息,將5張圖像進行疊加,得到其適應深度信息的圖像,繼續后續卷積操作。

2? 動態點刪除

傳統SLAM算法的假設環境是靜態或低動態的,但在實際應用環境中,無論是地圖中的物體還是無人設備本身,都處在無規則的運動當中。因此動態物體檢測的準確性將會影響建圖的實際效果,如果發生漏檢、誤檢情況,將會導致兩個相鄰關鍵幀的特征點匹配存在差異,破壞SLAM系統的穩定性。因此,從二維圖像中識別出動態對象,并在構建語義地圖之前丟棄它們是必要的。

語義分割模塊負責預測物體類別,并在圖像相應像素點位置標記類別標簽,在跟蹤線程遍歷二維圖像后,標記出疑似動態物體在二維圖像上的位置信息。然而,語義分割網絡可識別的種類有限,且精確度在不同的訓練集上略有差異,動態物體檢測不能過分依賴于語義分割檢測出的動態物體。為解決這一問題,本文使用三幀差分法和光流法檢測動態物體的運行軌跡,并結合語義分割模塊得到的動態對象特征點信息,實現對動態對象的有效判斷與處理。

2.1? 三幀差分法

三幀差分法[6]是通過相鄰三幀圖像利用運動目標的位置差異做差分運算,并對結果做閾值化處理得到運動目標區域的方法。選取圖像序列連續的3幀圖像,分別為[fk-1(x,y)],[fk(x,y)], [fk+1(x,y)] ,相鄰2幀圖像的差值為:

2.2? LK光流法

本文提出的SLAM系統早期采用LK光流法。Yu C等提出的LK光流法首先在跟蹤線程提取ORB特征點,粗略地檢查特征點的移動情況,并保存潛在異常值,再通過語義分割線程對關鍵幀做語義分割,使用異常值拒絕方法,結合語義分割和移動一致性檢查方法過濾掉動態對象,將位于移動物體上的ORB特征點潛在的異常值剔除[7]。

然而,LK光流法在追蹤運動速度較快的小目標時,出現了跟蹤丟失的情況,尤其是面對遠處的車輛時,丟失效果較為嚴重。造成這種現象的原因是圖像經過多次下采樣,會使小目標丟失特征,且只是對某些特征點進行光流計算,有一定的局限性,無法達到運動檢測要求。

2.3? 全局稠密性光流法

考慮到全局性稠密光流法能夠較好地提取出運動物體的軌跡,且定位動態物體較為準確。本文提出的SLAM系統結合了基于梯度的全局性稠密光流算法,通過圖像金字塔匹配方法,計算圖像上所有點的光流,并將其與已設定的光流動靜點閾值作比較,若大于閾值,則判斷其移動,并將圖像掩模置0,用于后續動態點處理。

為消除相機本身的移動對建圖的影響,該算法通過單應矩陣表示相鄰關鍵幀之間的相關性,以獲取上一幀與當前幀間的對應關系及運動信息。單應矩陣能夠將射影平面上的點映射到另一射影平面上,設[p1x1,y1],[p2x2,y2]為相鄰2幀上的圖像點匹配的點對,其單應矩陣為H,則有[p2=Hp1],即:

3? Octo?map建圖

由于點云地圖規模很大,需要大量的存儲空間,且在位姿出現誤差時,會導致地圖出現明顯的重疊。Sengupta S等將Octo?map地圖嵌入到分層魯棒性的馬爾可夫隨機場,為帶有語義標簽的地圖提供體素[8]。通過以上操作,Octo?map地圖能夠壓縮點云信息,并以八叉樹的形式存儲并更新地圖。

八叉樹是一種用于表述三維空間并具有8個子節點的樹狀數據結構,每個子節點代表其被占據的概率[9]。隨著不同關鍵幀的變化,每個子節點的概率也會發生改變,已知在[t=1,2,…,T]時刻,每個子節點的觀測值為[z1:T],則第n個葉子節點的概率公式為:

基于八叉樹結構存儲的Octo?map地圖具有占用空間小、更新地圖方便,且分辨率可調的特點,尤其適合無人機等邊緣計算設備搭載的視覺SLAM系統。

本文提出的SLAM系統將視覺模塊獲取的矯正圖像作為輸入,篩選出關鍵幀信息,并將其輸入到語義分割線程處理,將八叉樹的每個體素都關聯特定顏色,每種顏色代表一種語義標簽,把相機坐標系下的點云信息轉換成世界坐標系下的點云坐標,生成融合了語義標簽與點云信息的語義地圖。

4? 實驗結果與分析

本文實驗平臺硬件配置為NVIDIA TITAN RTX型號的GPU,測試系統為Ubuntu 16.04。SLAM部分采用CityScapes數據集(leftimg 8 bit和rightimg 8 bit組合形成雙目)及小覓雙目視覺模塊進行建圖測試。語義分割網絡采用CityScapes數據集進行對比驗證。

4.1? 語義分割模塊驗證

本文設計的SLAM系統將雙目視覺模塊立體匹配得到的視差圖作為輸入,獲取深度信息。語義分割線程選擇其中關鍵幀中的深度信息,控制空洞卷積中空洞的大小,自適應地調整神經網絡卷積過程中的感受野,提升特征提取效果??紤]到本文提出的語義SLAM系統的實際運用場景為街景,因此采用 CityScapes數據集進行效果驗證。作為目前街景領域最權威的數據集之一,以場景復雜多變、分割難度大著稱,能夠較好地體現算法在實際應用環境下的性能。圖3為傳統ENet網絡與本文提出的網絡在CityScapes數據集上的分割效果對比,自上而下依次為輸入圖像、本文算法的效果、傳統ENet分割效果。由圖3可以看出,相比原ENet網絡近處分割較為精細,遠處的物體分割粗略,融合深度信息的改進方法使其分割效果更關注遠處物體。表1為SegNet網絡、ENet網絡以及本文方法在CityScapes數據集下運行的準確率,本文方法在深度信息的引入下,相較于原有的ENet算法,分割效果提升1%。

4.2? 動態物體剔除模塊驗證

本文提出的語義SLAM系統通過結合全局性稠密光流法對動態物體位置進行判斷,提高了動態物體位置的檢測精度,并能夠精確有效地消除動態噪聲,從而構建了相對穩定的語義地圖,提高了系統的魯棒性。

4.3? Octo?map建圖模塊驗證

在ROS系統下,整體運行系統,使用Octo?map模塊建立結合語義后的SLAM地圖,等待地圖建立后,利用Rviz可視化工具顯示地圖,建圖效果如圖5所示。

5? 結? 語

本文的主要工作是在傳統雙目ORB?SLAM2算法的基礎上,融合基于卷積神經網絡的語義分割[10]算法,對移動設備所處的環境構建語義地圖。與其他語義地圖構建方法相比,本文提出的算法引入圖像深度信息作為多尺度空洞卷積網絡的門控信號,對分割算法進行改進,得到了更適合移植到嵌入式設備上的語義分割方法。實驗結果證明,該網絡在街景環境下能夠獲得較好的分割效果。此外,在SLAM算法中加入了全局性稠密光流法,將動態環境中動態點剔除,減少了動態物體對相機姿態估計的影響,并實現了構建地圖的優化,提高了動態場景下系統建圖的魯棒性。

參考文獻

[1] 潘思宇.基于背負式多激光系統的室內二維與三維構圖[D].廈門:廈門大學,2016.

[2] MUR?ARTAL R, TARDOS J D. ORB?SLAM2: An open?source SLAM system for monocular, stereo, and RGB?D cameras [J]. IEEE transactions on robotics, 2017, 33(5): 1255?1262.

[3] PASZKE A, CHAURASIA A, KIM S, et al. Enet: a deep neural network architecture for real?time semantic segmentation [J]. Computer vision and pattern recognition, 2016(2): 174.

[4] HORNUNG A, WURM K M, BENNEWITZ M, et al. OctoMap: an efficient probabilistic 3D mapping framework based on octrees [J]. Autonomous robots, 2013, 34(3): 189?206.

[5] KONG S, FOWLKES C C. Recurrent scene parsing with perspective understanding in the loop [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE, 2018: 956?965.

[6] 袁國武,陳志強,龔健,等.一種結合光流法與三幀差分法的運動目標檢測算法[J].小型微型計算機系統,2013,34(3):668?671.

[7] YU C, LIU Z, LIU X J, et al. DS?SLAM: A semantic visual SLAM towards dynamic environments [C]// 2018 IEEE/RSJ International Conference on Intelligent Robots and Systems. Madrid: IEEE, 2018: 1168?1174.

[8] SENGUPTA S, STURGESS P. Semantic octree: unifying recognition, reconstruction and representation via an octree constrained higher order MRF [C]// 2015 IEEE International Conference on Robotics and Automation. Seattle: IEEE, 2015: 1874?1879.

[9] MAIER D, HORNUNG A, BENNEWITZ M. Real?time navigation in 3D environments based on depth camera data [C]// 2012 12th IEEE?RAS International Conference on Humanoid Robots. Osaka: IEEE, 2012: 692?697.

[10] 白云漢.基于SLAM 算法和深度神經網絡的語義地圖構建研究[J].計算機應用與軟件,2018,35(1):183?190.

猜你喜歡
語義深度信息
深度理解一元一次方程
語言與語義
深度觀察
深度觀察
深度觀察
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
主站蜘蛛池模板: 国产精品嫩草影院av| 国产在线无码一区二区三区| 欧美日韩第三页| 国产欧美日韩资源在线观看| 国产精品手机在线播放| 国产xx在线观看| 麻豆精品视频在线原创| 538精品在线观看| 欧美va亚洲va香蕉在线| 中文字幕波多野不卡一区| 国产性精品| 亚洲制服丝袜第一页| 精品视频免费在线| 97视频在线精品国自产拍| 亚洲男女在线| 日韩天堂网| 欧美精品高清| 国产精品深爱在线| 亚洲精品va| 亚洲综合婷婷激情| 国产成人高清在线精品| 18禁影院亚洲专区| 乱码国产乱码精品精在线播放| 国产在线第二页| 亚洲欧洲日本在线| 欧美成人一级| 国产精品污视频| 91成人试看福利体验区| 91探花在线观看国产最新| 无码在线激情片| 永久免费无码成人网站| 国产精品亚洲日韩AⅤ在线观看| 成人一级黄色毛片| 久热精品免费| 欧美成人综合视频| 国产男女免费完整版视频| 亚洲视频四区| 国产成人无码AV在线播放动漫 | 人人91人人澡人人妻人人爽| 亚洲一区无码在线| 欧美天堂久久| 无码精品福利一区二区三区| 中文字幕自拍偷拍| 精品少妇人妻av无码久久| 国产免费高清无需播放器| 成人中文在线| 国产激情国语对白普通话| 黄色片中文字幕| 亚洲国产AV无码综合原创| 伊人久综合| 国产高清在线丝袜精品一区| 国产美女主播一级成人毛片| 亚洲综合久久一本伊一区| 国内丰满少妇猛烈精品播| 欧美日韩在线观看一区二区三区| 精品久久综合1区2区3区激情| AV不卡国产在线观看| 久久影院一区二区h| 欧美 亚洲 日韩 国产| 欧美成人午夜视频| 波多野结衣一区二区三区四区| 国产资源免费观看| 99精品福利视频| 精品视频在线观看你懂的一区| 91亚洲影院| 91偷拍一区| 国产正在播放| 成人精品免费视频| 久久精品亚洲热综合一区二区| 波多野结衣在线se| 久久香蕉国产线| 一本久道久久综合多人| 在线国产综合一区二区三区| 欧美成a人片在线观看| 国产在线98福利播放视频免费| 中文字幕 91| 国产另类视频| 国产视频入口| 午夜毛片免费观看视频 | 伊人婷婷色香五月综合缴缴情| a级毛片免费播放| 色悠久久综合|