999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于路徑規劃特點的語義目標導航方法

2024-04-09 01:42:24高宇霍靜李文斌伍靜來煜坤高陽
智能系統學報 2024年1期
關鍵詞:語義規劃

高宇,霍靜,李文斌,伍靜,來煜坤,高陽

(1.南京大學 計算機軟件新技術全國重點實驗室, 江蘇 南京 210023; 2.卡迪夫大學 計算機科學與信息學院, 英國 威爾士卡迪夫 CF10 3XQ)

語義目標導航任務[1]要求一個裝有紅綠藍-深度(RGB-depth,RGBD)相機的機器人(智能體)在未知地圖環境中自主探索以找到特定類別的物體,其對安防、智能巡檢具有重要意義。智能體為完成語義目標導航任務所需要的能力可概括為場景建圖、去哪里和如何去3類。場景建圖是指針對傳感器觀測數據的記憶和整合能力,除顯式構建地圖外也有使用循環神經網絡[2]等方法;去哪里是指分析目標類別物體最有可能出現位置的能力,以實現高效率探索;如何去是指路徑規劃和軌跡跟蹤能力,以找到快速抵達目標位置的可行控制動作序列。去哪里是語義目標導航區別于其他導航任務的鮮明特點。

解決語義目標導航任務需要搭建涉及眾多組件的復雜系統,每個組件的設定都會對最終性能產生很大影響,導致對現有方法的對比分析和對改進之處的探索極為困難。為此,本文創建了一個解決語義目標導航任務的標準框架,并針對測試中發現的深度不精準、語義分割效果差、探索效率低、路徑規劃沒有考慮任務特點等問題提出了新的解決方案從而進一步提升了性能。具體來說:1)針對探索效率低問題,在探索模塊中引入了基于路徑規劃特點的覆蓋最大化算法;2)針對深度不精準和語義分割效果差問題,在語義建圖模塊中引入了深度圖邊緣處理與地圖糾錯機制;3)針對路徑規劃沒有考慮語義目標導航任務特點的問題,引入了替代點機制和障礙物概率地圖。

使用提出的框架在一個逼真的交互式3D室內語義數據集(habitat-matterport 3D semantics dataset,HM3DSem)[3-4]下進行了實驗。實驗結果顯示,本文提出的3個改進明顯提高了語義目標導航任務的性能指標。本文所提框架成功應用到了四足機器人上,從而驗證了該框架對現實世界具有泛化性。

1 語義目標導航相關工作

1.1 語義SLAM

同時定位與地圖構建(simultaneous localization and mapping ,SLAM)算法根據傳感器數據來源的不同可以分為激光SLAM[5-7]和視覺SLAM[8-11]。激光SLAM根據激光測距結果直接構造障礙物地圖,視覺SLAM則尋找圖片上的關鍵特征點并通過多個視角來確定相機位姿。SLAM解決方案一般都集中在尋找像素級別的特征點,即在單幅圖像中提取特征點然后在多幅圖像中對特征點進行匹配。這與人類通過判斷物體在眼睛中的移動來進行定位極為不同,因為人類定位針對整個物體而SLAM解決方案針對特征點。為此可以引申出使用語義信息來幫助尋找多幅圖像中的關聯或為SLAM的回環檢測等引入更多信息,語義信息為SLAM提供了更多判斷相機移動的條件從而更好地定位。語義信息的引入也使得SLAM不僅能夠構建點云地圖、障礙物地圖,而且可以構建一個有語義標簽的地圖,從而為下游任務提供了更廣闊的空間。

語義目標導航任務主要用到語義SLAM提供的帶有語義標簽的地圖。有了帶有語義信息的二維地圖或者三維地圖,智能體能夠更加結構化地去分析不同類別物體的分布關系,更好地去理解場景從而推理出目標類別物體在地圖中各個位置的出現概率。對目標類別物體出現位置的推理是語義目標導航任務的核心。但是現有方法沒有針對語義目標導航中存在的深度不精準和語義分割效果差問題進行優化,這導致連續多幀的語義建圖出現較大誤差而無法完成語義導航任務。本文為此引入了深度圖邊緣處理及語義點云地圖和二維地圖糾錯機制。

1.2 經典導航方法

導航能力是無人車、無人機、無人船等眾多移動機器人所需要的基本能力之一。經典導航方法通常在SLAM構建的地圖上使用包括全局和局部路徑規劃在內的路徑規劃模塊產生路徑,然后使用控制算法對路徑規劃模塊生成的路徑進行跟蹤和實際行進。路徑規劃的經典算法有很多,如迪克斯特拉算法(Dijkstra algorithm)、A星搜索算法(A* search algorithm,A*)[12]、概率路線圖算法(probabilistic road maps,PRM)[13]、快速探索隨機樹算法(rapidly exploring random trees,RRT)[14]、人工勢場法(artificial potential fields,APF)[15]等。Dijkstra算法是基于圖結構的能夠保證最優解的路徑規劃算法,但處理大地圖時效率低下;AStar算法在Dijkstra算法的基礎上引入衡量任何一個位置到目標位置距離的啟發式函數從而使得探索方向具有一定的目的性;PRM算法對地圖進行稀疏采樣從而將柵格地圖轉換為由少量采樣點和可達邊組成的圖結構,然后在圖結構中再使用AStar等算法尋找路徑;RRT和PRM同是基于隨機采樣的規劃算法,基本思想是從一個點出發向外探索擴展;與前面幾種算法不同的是,APF更適用于動態環境和局部路徑規劃。但是現有算法都沒有針對語義目標導航任務特點進行改進從而導致路徑規劃模塊的失敗率較高,為此本文引入了替代點機制以提高路徑規劃算法對語義目標導航任務的魯棒性。

1.3 基于學習的導航方法

經典導航算法所使用的基于網格的地圖表示在精度和內存需求上具有天然的矛盾,在動態環境中實時重新規劃路徑也需要大量計算。此外,經典導航框架中從SLAM到路徑規劃,計算誤差會逐漸積累。為此,有研究將深度強化學習等引入導航中,從而得到了基于學習的導航方法[16]。大多數研究均使用深度Q網絡[17]、異步優勢演員評論家算法[18]、近端策略優化算法[19]、深度確定性策略梯度算法[20]等通用強化學習算法,但它們在狀態設計、獎勵函數設計、強化學習的使用方式等方面做了很多改進。狀態設計涵蓋了起點、目標點、障礙物位置等關鍵信息,與測試環境息息相關。若只考慮導航的核心任務(如避障和到達目標點),獎勵會非常稀疏從而導致強化學習難以訓練;所以多數研究引入了手工設計的中間獎勵函數,包括碰撞、與最近障礙物的距離變化、與目標點的距離變化、時間步懲罰等。如何在導航中使用強化學習是基于學習的方法的核心問題,本文將使用方式分為3種。第1種是在導航中直接使用深度強化學習[21],即將完整的導航過程描述為馬爾科夫過程,以傳感器的觀測數據作為狀態,直接學習到路徑或控制動作序列的映射;這種方法不再需要SLAM、全局地圖等,但在復雜環境中容易落入局部陷阱。第2種是與經典導航技術相結合[22],如先使用PRM對地圖進行稀疏化,再在局部使用深度強化學習進行路徑規劃。第3種是分層深度強化學習,即將路徑規劃劃分為靜態避障、動態避障、趨向目標點等不同層次上的子任務,這主要是考慮到環境復雜度與狀態空間巨大。但現有算法面對語義目標導航任務均存在探索效率低的問題,為此本文提出了基于路徑規劃特點的覆蓋范圍最大化算法。

2 基于路徑規劃特點的解決方案

2.1 語義目標導航任務定義

在語義目標導航任務中,智能體以隨機的位置和方向被初始化在一個未知地圖環境中,其目標是找到特定類別的物體,如床、廁所等。智能體需要依靠提供的RGBD相機、深度相機、位置信息(GPS)和羅盤等傳感器實現導航,也就是說視覺觀察包括第一人稱的RGB圖和深度圖。動作空間是離散的,由行進、左轉、右轉、停止共4個動作組成,行進意味著向前移動0.25 m,左轉和右轉的幅度為30°。當智能體認為它已經接近目標對象時,需要采取“停止”操作;如果智能體采取“停止”操作且停止時與目標物體的距離小于閾值1 m,則認為該回合是導航成功的??梢姵晒π枰瑫r滿足發出“停止”操作和與目標物體足夠近2個條件。

2.2 基于語義建圖的探索框架

本文構建了基于語義建圖的探索框架,將探索模塊、語義SLAM模塊、路徑規劃模塊等進行解耦合,為不同模塊下不同算法的性能對比及模塊之間的重要性對比提供了方便公平的對比框架。語義SLAM模塊使用GPS、羅盤、RGBD圖像等傳感器數據構建語義、障礙物等地圖;探索模塊根據構建好的地圖預測目標類別物體最有可能出現的位置從而得到長期目標;路徑規劃模塊依據障礙物地圖、智能體位置和長期目標規劃出一條可行路徑;軌跡跟蹤模塊依據路徑等輸出下一步智能體需要采取的動作。本文針對探索效率低問題,引入了基于路徑規劃特點的覆蓋范圍最大化算法;針對深度不精準和語義分割效果差問題,引入了深度圖邊緣處理及語義點云地圖和二維地圖糾錯機制;針對沒有考慮語義目標導航任務特點的問題,在路徑規劃模塊中引入了替代點機制和障礙物概率地圖。下面將詳細介紹各個模塊及對應改進。

2.3 基于路徑規劃特點的探索算法

探索模塊負責選取路徑規劃模塊的目標點,該目標點稱為長期目標。長期目標的選擇通常依據2點:1)到達長期目標所需經過區域多為未知以盡可能擴大探索面積;2)長期目標附近很可能存在目標類別物體以盡快完成任務。以往工作[23-26]中長期目標點的選擇通常使用強化學習來完成。以面向目標的語義探索算法(goal oriented semantic exploration,SemExp)[23]為例,其將障礙物地圖、語義地圖作為狀態輸入,將與目標類別距離變化和探索面積變化的加權和作為獎勵函數,將近端策略優化(proximal policy optimization,PPO)[19]作為策略網絡進行強化學習訓練。

本文通過實驗發現該方法存在探索效率低問題,結果如表1所示,數據集描述以及成功率、帶有路徑長度加權的成功率(success weighted by path length,SPL)等指標說明詳見第3.2節。使用SemExp論文公布的訓練好的網絡參數的成功率為25.8%,SPL為12.8%;隨機初始化的網絡參數成功率為25.3%,SPL為11.6%。二者指標接近,說明強化學習訓練對探索效率的提高幫助有限。將強化學習狀態輸入的語義地圖全部置零,成功率甚至達到了26.4%,SPL為12.2%。這更加突出了探索效率低的問題。

表1 SemExp不同設置在HM3DSem數據集下的指標對比Table 1 Comparison in different settings of SemExp under HM3DSem test dataset%

為此,本文提出了基于路徑規劃特點的覆蓋范圍最大化算法。該算法將長期目標設置在地圖的邊界處:

式中:psubgoal為長期目標,(x,y,θ)為當前智能體的位置和朝向,K為地圖尺寸。未探索區域被設置為無障礙物,路徑規劃會設計出一條涵蓋無障礙物和未探索區域的路線并在行進中不斷更新地圖。當前路徑在更新后地圖中不再可通行時,會重新規劃路線。

使用替代點的覆蓋范圍最大化算法:

輸入仿真器env,強制更新步數LMAX,局部規

劃器LPF,目標檢測OD;

1) lstep=0,haveseen=false,subgoal=(0, 0)

2) obs=env.reset()

3) While not env.done:

4) lstep+=1

5) If lstep>LMAX or LPF(subgoal)失敗:

6) 按2.3節公式計算subgoal

7) lstep=0

8) If not haveseen:

9) goal=OD(obs)

10) If goal is not None:

11) 按2.5節根據goal計算subgoal

12) haveseen=true

13) action=LPF(subgoal)

14) obs=env.step(action)

智能體不會再去訪問已經探索過且沒有其他支路的區域,因為這些區域不可能再涵蓋到達目標點的路線。也就是說,智能體進入死胡同后會自動改變朝向從而發現其他未探索區域。這避免了在某個房間反復探索或是在2點間反復來回等低探索效率行為。本文設計的探索模塊利用路徑重新規劃的特點使智能體覆蓋范圍最大化,從而提高了語義目標導航任務的探索效率。

2.4 邊緣處理與地圖糾錯

語義SLAM模塊負責地圖構建,包括點云地圖、障礙物地圖、已探索區域地圖和語義地圖,具體描述如表2所示。點云地圖通過對RGBD圖像使用主動神經SLAM(active neural SLAM,ANS)[27]方法得到。

表2 語義建圖模塊所建地圖含義描述Table 2 Description of maps created by semantic mapping module

語義地圖在語義目標導航任務中起著重要作用,語義地圖是探索模塊的主要輸入。語義地圖的質量直接決定了下游模塊的性能。以往語義目標導航研究所使用的語義地圖建立方法一般是先對RGB圖像進行語義分割得到分割圖,根據深度圖像得到三維點云,然后根據分割圖和深度圖像的對應關系為每一個點標注一個語義標簽,最后對得到的帶有語義信息的三維點云在垂直維度上進行求和得到二維語義地圖。使用每一幀的RGB圖像和深度圖像都能得到一幅二維語義地圖。不同時間下得到的二維語義地圖根據當時智能體的GPS和羅盤信息被拼接起來,這樣就構建出了供下游模塊使用的保存了全部所見幀信息的二維語義地圖。

深度不精準和語義分割效果差為上述語義地圖構建方法造成了嚴重問題。RGB圖像語義分割的些許差錯可能會導致該幀生成的二維語義地圖存在巨大錯誤,更嚴重的是二維語義地圖錯誤會隨著幀數增多而積累,最終導致拼接而成的二維語義地圖出現嚴重偏差甚至失效。

造成RGB圖像語義分割些許差錯會導致二維語義地圖產生巨大錯誤的根本來源是物體實例邊緣處深度值的不精準。一方面,語義分割容易在物體實例邊緣處的像素點上出錯,將部分屬于其他物體的像素點標注為該物體實例;另一方面,物體邊緣的深度值會發生跳變,在二維圖像中相鄰的2個點在實際的三維空間中可能相距很遠。

圖1給出了一組深度圖像、RGB圖像及對RGB圖像進行語義分割,其中語義分割算法實際使用的是掩膜區域卷積神經網絡(mask regionbased convolutional neural network,Mask R-CNN)[28]實例分割算法。深度圖像的像素值表示與相機的遠近,椅子和桌子后面的大片同像素區域超過了相機的最大測量距離;分割圖給出了椅子和桌子的語義信息。上段提到的物體實例邊緣處的2個不利方面均在該組圖中得到體現。以椅子腿為例,一方面,因為RGB圖像的噪聲和實例分割算法的性能限制,部分屬于地面、桌子等的像素點被劃分為椅子腿,這些像素點將進入椅子所對應的語義地圖層;另一方面,椅子與后方墻壁雖然在RGB圖像和深度圖像上像素點相鄰,但其在三維空間中實際距離相差很遠。這導致如果將部分墻壁像素點標注為椅子的語義信息,那么三維點云地圖中與椅子相離很遠的部分墻壁也將會被標注為椅子,而智能體到達該部分墻壁時會認為已找到椅子而采取停止動作。可見,在物體實例邊緣處對深度圖像和分割圖進行處理是非常必要且重要的,但以往語義目標導航研究沒有針對這一點進行優化。

圖1 一組深度圖像、RGB圖像與對應的部分分割圖Fig.1 Depth image, RGB image, and corresponding partial segmentation image

為此,本文針對上述問題提出了3種基于形態學的方法以改進語義SLAM模塊建圖的質量。這3種方法分別應用于語義SLAM模塊的3個步驟中,所以可以同時應用。

1)對語義分割得到的分割圖進行腐蝕。具體地,使用5×5的全1卷積核對分割圖進行卷積,分割圖上像素值表示語義概率,如果一個像素點為概率1的特定語義點且位于語義物體內部,則經過卷積操作后的該點數值為25。同時考慮語義點位置和概率,保留卷積后數值大于23.5的點作為最終分割圖中的特定語義區域,用公式表示為

式中:MSemNew表示處理后的分割圖,MSem表示原始分割圖,15表示5×5的全1矩陣,*表示卷積運算??梢娺@會縮小分割圖中語義物體的面積從而減少語義分割在物體邊緣處出錯的概率,但不會影響語義目標導航任務的性能,因為解決語義目標導航任務只需要知道有一個特定語義物體在該區域而無需知道物體的擺放細節。這也有助于去除語義分割模型輸出的異常孤立點。

2)對語義三維點云地圖進行濾波,去除那些距同類語義物體距離遠大于平均距離的語義點,從而確保去除掉由物體邊緣深度值跳變導致的部分線段狀點云,因為物體邊緣形成的錯誤點云與其主體點云的距離很大。具體地,使用K維樹(K-dimensional tree,KD Tree)來計算每個語義點周圍0.1 m范圍內相同語義點的數量,若數量大于5則保留該點,否則舍棄:

式中:MPcdNew表示處理后的點云,MPcd表示原始點云,dis是2點之間的距離函數,label是點對應的語義標簽函數,I是指示函數。

3)對拼接而成的語義二維地圖進行開運算。腐蝕操作類似于對分割圖的處理,會去除掉地圖中的孤立點,而膨脹操作恢復物體實例本來的尺寸并填充由于體素化而缺失的部分語義點。二維語義地圖開運算保證了供下游模塊使用的語義地圖質量以及與原地圖之間物體尺寸的匹配。

2.5 語義目標替代點

以往語義目標導航研究中使用的路徑規劃算法可分為2類:1)基于幾何的經典路徑規劃算法,如Sethian等[29]所使用的快速行進算法(fast marching method,FMM);2)基于學習的路徑規劃算法,如Wijmans等[30]所使用的去中心化分布式近端策略優化算法(decentralized distributed proximal policy optimization,DDPPO)。這些框架使用的均是標準路徑規劃算法,沒有將語義目標導航的任務特點考慮進去。為此,本文以語義目標導航的任務特點為驅動對路徑規劃模塊作了以下幾點設計。

語義目標導航任務的一個顯著特點是其長期目標(也即路徑規劃的終點)可能設置在障礙物上。這是合理的。如床在智能體所構建的障礙物地圖中屬于無法通過的障礙物,當語義目標類別設置為床時,標準的路徑規劃算法無法規劃出一條無障礙路徑,因為終點處于障礙物的包圍之中。以往語義目標導航框架沒有顯式地考慮這一問題,而是簡單地把所有目標語義點作為路徑規劃終點。這種方法能夠解決同一語義物體被作為障礙物的問題,但對于被其他障礙物所包圍的語義目標而言是無效的。如放置在桌子上的盆栽和嵌入墻壁的電視,二維障礙物地圖中盆栽被桌子圍繞,電視被墻壁圍繞,導致從機器人當前位置無法規劃出到任意一個語義目標點的路徑。為解決該問題,本文提出了將語義目標附近可通行點作為替代點的方法,即將位于語義目標點周圍且能夠從智能體當前位置規劃出一條路徑的點作為長期目標。該方法解決了語義目標被障礙物包圍而無法規劃路徑的問題。

求解替代點存在從最近替代點看不到目標物體的問題。以放置在桌子上的盆栽為例,按照尋找替代點的思路,替代點將被設置在桌子的4條邊上,若桌子靠墻,則有一條邊將被設置在墻的另一側即另一間房間(因為無法從障礙物地圖中判斷從另一間房間是否能夠看到盆栽)。這就導致長期目標有可能被設置在另一間房間而造成任務失敗。本文使用下述方法來尋找替代點以規避該問題:將發現語義目標物體時的智能體位置與隨機一個語義目標點進行連線,將連線上最靠近語義目標點的無障礙物點作為長期目標:

式中:subgoal表示語義目標替代點求解后的長期目標,curpos表示智能體發現語義目標時的位置,goal表示發現的語義目標點位置。智能體在發現語義目標物體時的位置肯定能夠看到語義目標,所以二者連線是智能體能夠完全觀察的區域,能為其后路徑規劃提供更多圖像,并且從當前位置到連線上點的可通行概率更大。

除了引入語義目標驅動的替代點機制,本文還將更適用于實際的障礙物地圖表示方法帶入了語義目標導航框架中。以往的語義目標導航研究使用非0即1的障礙物地圖表示方式,這種表示方式可能導致智能體在空曠處選擇貼近障礙物的路徑而這些路徑實際無法通行,也可能導致在狹窄處穿越密集障礙物時路徑規劃失靈。以往的語義目標導航研究也沒有考慮智能體的尺寸問題,只是把智能體作為一個質點。按照質點規劃出來的路徑往往難以通行。以往工作一般是構建所謂的碰撞傳感器[23,27,31-34]以記錄實際不可通行的區域來解決智能體尺寸問題,但該方法在現實中是不可行的。為此,本文將障礙物概率地圖引入到了語義目標導航任務中。本文使用9×9的全1矩陣作為卷積核對二維障礙物地圖進行卷積,卷積后地圖中每個大于0的像素點均當作障礙物像素點,從而得到障礙物概率地圖。這樣不僅將智能體尺寸引入到了障礙物地圖中,也顯式地表示了障礙物的密集程度。數值較大的區域表示位于障礙物中心無法通行,數值較小的區域由于深度圖像的誤差則有可能可以通行。這就給了路徑規劃模塊更大的選擇空間,同時也可以去除掉不符合實際的所謂“碰撞傳感器”。圖2給出了2種地圖表示形式的可視化效果。右圖表示概率地圖,每處障礙物的中心區域數值較大不可能通行,邊緣區域數值較小則有可能通行。智能體在無法找到全部數值為0的路徑時則會考慮數值較小的那些點。

圖2 障礙物地圖處理示例Fig.2 Example of obstacle map processing

最后,軌跡跟蹤模塊依據規劃出的路徑計算智能體下一步需要采取的動作。因為該任務中行進、左轉、右轉的幅度都是固定的,所以只需要將智能體轉向下一個路徑中間點并朝其前進即可。

3 實驗設計與結果分析

3.1 數據集與仿真器

本文使用HM3DSem (habitat-matterport 3D semantics dataset)數據集。HM3DSem是迄今為止最大的三維真實世界和室內空間數據集,具有密集的語義注釋。它包含142 646個對象實例注釋,216個3D空間及這些空間中的3 100個房間。場景使用142 646個原始對象名稱進行注釋并被映射到40個Matterport類別中。每個場景平均包含106個類別和661件物品。圖3給出了HM3DSem某個場景的預覽圖。

圖3 HM3DSem某個3D空間的預覽Fig.3 Preview image of one 3D space in HM3DSem

本文選用Habitat[35-36]作為仿真器。Habitat仿真器會加載HM3Dsem數據集及語義目標導航任務數據集(包括對智能體初始化位姿、語義目標類別等的定義),提供了數據集和用戶代碼的交互接口(如對傳感器數據的訪問、對智能體運動的控制、返回任務的執行結果等)。在本文的實驗環境中,智能體能夠獲得的信息有RGBD相機拍攝的第1人稱RGB圖像和深度圖像、跟蹤相機位置的里程計信息;智能體的動作空間為前進0.25 m、左轉30°、右轉30°、停止。

3.2 評價指標及基準算法

本文使用成功率(success rate,SR)、帶有路徑長度加權的成功率(success weighted by path length,SPL)、發出停止動作時與目標的距離(distance to goal,DTG)3個評價指標。指標定義為

式中:N表示回合數量,Si表示第i回合是否成功,li表示第i回合能夠完成任務的最短路徑長度,pi表示第i回合實際采取路徑的長度,di表示第i回合發出停止動作時智能體與語義目標的距離??梢?,SR和SPL越大越好,DTG越小越好。SPL綜合考慮了成功率和效率。按照Anderson等[1]的建議,本文將SPL作為主要指標,SR和DTG作為輔助指標。

為了評估模型效果,本文選取了前沿探索(frontier-based exploration,FrontierExp)[37]、DDPPO[30]、SemExp[23]、對人類經驗進行模仿學習的算法(HabitatWeb)[38]共4種基準模型作為對比。下面是對基準模型的簡要介紹。

FrontierExp選擇離自身位置最近且可通行的frontier(即未訪問區域和已訪問區域的交界)作為長期目標。

DDPPO不進行建圖,使用PPO直接學習傳感器數據到控制動作的策略。DDPPO在PPO基礎上實現了一種大規模強化學習訓練框架。本文使用DDPPO提供的模型參數進行測試,其使用64塊Tesla V100 GPU進行了3 d訓練,消耗了25億幀樣本??梢姡珼DPPO所需要的訓練樣本、訓練時間和硬件資源都是巨大的。

SemExp由語義建圖模塊、強化學習長期策略選擇和基于強化學習長期策略選擇和基于快速行進法(fast marching method,FMM)的局部路徑規劃算法組成。本文所提系統框架正是對SemExp各個模塊進行了解耦,依據測試中發現的問題進行了相應改進。

HabitatWeb收集了大量人類完成語義目標導航任務的示例并使用行為克隆對人類示例進行模仿學習。

3.3 與基準算法比較

圖4以實驗示意圖的形式給出了本文所提的系統框架。本文在HM3DSem測試數據集下進行測試。HM3DSem 測試集共有2 000個測試回合,每回合任務必須在500步內完成。語義目標類別有椅子、床、植物、馬桶、電視、沙發共6類。表3給出了本文所提框架與上述基準算法在HM3DSem 測試集下6個類別及平均的實驗結果。

圖4 語義目標導航系統框架Fig.4 Object goal navigation system framework diagram

表3 HM3DSem 測試數據集下語義目標導航結果Table 3 Object goal navigation results under HM3DSem test dataset

從表3可以看出,在使用SPL指標的測評中,本文所提框架取得了優于其他所有模型的效果(0.236),比其他最好的HabitatWeb(0.193)高出0.043,提高了22.3%。在椅子、植物、馬桶、電視、沙發這5個類上本文所提框架的SPL指標均最高,僅床類下HabitatWeb的SPL指標高于本文所提框架。這說明本文所提框架著實提高了語義目標導航任務的性能。在總體成功率方面,Habitat-Web(0.491)高于本文所提框架(0.441);本文框架在植物、馬桶、電視這3個類上成功率最高,HabitatWeb在椅子、床、沙發這3個類上成功率最高。高成功率低SPL說明HabitatWeb未能兼顧好成功率和效率,在提高成功率的同時極大地犧牲了效率。因為目標導航任務所涉及的場景復雜多變,人類示例很難窮盡所有情況,這導致HabitatWeb進行模仿學習時會遇到無法處理的狀態而在同一片區域反復游蕩,導致HabitatWeb完成任務的路徑長度極度增加。而本文框架提出了基于路徑規劃特點的覆蓋范圍最大化算法,避免了在同一片區域反復探索或是在2點間反復來回等低效率行為,使得智能體覆蓋范圍最大化,從而提高了語義目標導航任務的探索效率,使得本文所提框架成功率在低于HabitatWeb的同時SPL指標卻高于它。從以上分析可以看出,從兼顧成功率和效率的SPL指標來看,本文框架超過了以往的各個方法;從成功率來看,本文框架超過了Frontier-Exp、DDPPO、SemExp,略低于HabitatWeb。不過HabitatWeb需要大量的人類示例,耗費大量的時間和資金。本文框架無需昂貴的數據收集過程和巨大的訓練時間。

從表3還可以看到,幾乎所有方法在椅子、床、沙發、馬桶這4個類上的表現優于在植物、電視這2個類上的表現。如DDPPO在椅子類上SPL有0.198,而在植物類上SPL只有0.006;HabitatWeb在床類上SPL有0.255,而在電視類上只有0.078。本文分析認為造成這種巨大差異來源于不同類別的實例分割效果差異。為了驗證該想法,本文在HM3DSem測試數據集中隨機采樣了7萬張圖片(其中包含17.7萬個實例)并制作了實例分割數據集(如圖5所示),使用Mask R-CNN算法對其進行了測試,測試結果如表4所示。從表4中可以看出,植物和電視的邊界框平均精度指標(bounding box average precision,bbox AP)分別為12.10和7.94,遠低于其他物體類別。語義信息的不準確限制了植物和電視類的語義目標導航性能。另外,雖然本文框架在植物和電視類上的表現不如其他類別,但本文框架不同類別之間的差距低于其他算法。這說明本文框架對語義信息的容錯率更高,更適合應用到復雜的現實任務中去。

圖5 實例分割數據集可視化效果Fig.5 Visualization of instance segmentation dataset

表4 Mask R-CNN在HM3DSem各個物體類別下的實例分割表現Table 4 Instance segmentation performance of Mask RCNN in various object categories of HM3DSem

3.4 消融實驗

為了驗證本文3個模塊的有效性,本文進行了消融實驗,結果如表5所示。其中去除深度圖處理表示語義建圖模塊不再進行深度圖邊緣處理與語義點云地圖和二維地圖糾錯;去除最大化探索表示探索模塊不再使用覆蓋范圍最大化算法,更改成了基于Frontier的選擇方法;去除替代點機制表示路徑規劃模塊不再使用替代點機制和障礙物概率地圖。從表5可以看出,去掉深度圖處理、最大化探索、替代點機制后,SPL從0.236分別降為0.219、0.198、0.213,SR從0.441分別降為0.407、0.420、0.397。這說明本文所提3個改進都不同程度地提高了語義目標導航任務的性能。另外可以看出最大化探索對SPL指標的提升貢獻最大,再次證明了其較高的探索效率;深度圖處理和替代點機制對成功率的貢獻較大,說明其解決了部分噪音問題。

表5 消融實驗Table 5 Ablation experiment

3.5 現實世界實驗

本文所提框架成功應用到了絕影mini-lite四足機器人(如圖6所示)上去。該機器人使用了NVIDIA Xavier NX主機,裝備了16線激光雷達、Intel RealSense D435i相機等傳感器。現實實驗使用雷達進行定位,建圖要求與語義目標導航任務一致而未使用雷達。

圖6 現實實驗所用的四足機器人Fig.6 Quadruped robot used in real-world experiments

圖7給出了馬桶為語義目標類別的一個回合所錄制視頻的部分截圖。從左到右依次展示了機器人開始運動、繞開障礙物、探索臥室、發現臥室沒有目標物體后繼續向前探索、發現并靠近馬桶后停止。四足機器人實驗證明了本文框架對現實世界具有泛化性。

圖7 馬桶為語義目標類別的導航視頻截圖Fig.7 Screenshot of navigation video with toilet as semantic goal

4 結束語

語義目標導航任務研究對于將機器學習成果應用到實際機器人中有著重要意義。本文構建了一個包含語義SLAM模塊、探索模塊、路徑規劃模塊的系統框架。針對探索效率低的問題,在探索模塊中引入了基于路徑規劃特點的覆蓋范圍最大化算法;針對深度不精準問題,在語義SLAM模塊中引入了深度圖邊緣處理與地圖糾錯機制;針對路徑規劃沒有考慮語義目標導航任務特點的問題,在路徑規劃模塊中引入了替代點機制和障礙物概率地圖。本文在HM3DSem數據集下進行了實驗并應用到了實際四足機器人上。實驗結果表明本文所提的最大化探索提升了語義目標導航的探索效率,深度圖處理和替代點機制解決了部分噪音問題從而提升了成功率。本文所提3個改進明顯提高了語義目標導航任務的性能并對現實世界具有良好的泛化性。語義目標導航除了應用于室內場景,還能應用于隧道、洞穴、城市等室外場景下的巡檢、勘探、安防等任務。與室內場景中無需考慮機器人運動特性不同,在擁有復雜地形的室外場景中進行語義目標導航需要結合機器人特點。為此,下一步將研究機器人操作和語義目標導航的融合應用。

猜你喜歡
語義規劃
語言與語義
規劃引領把握未來
快遞業十三五規劃發布
商周刊(2017年5期)2017-08-22 03:35:26
多管齊下落實規劃
中國衛生(2016年2期)2016-11-12 13:22:16
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
迎接“十三五”規劃
認知范疇模糊與語義模糊
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
主站蜘蛛池模板: 亚洲制服中文字幕一区二区| 色偷偷男人的天堂亚洲av| 国模在线视频一区二区三区| 中国丰满人妻无码束缚啪啪| 亚洲男人天堂2020| 91欧美在线| 夜夜操天天摸| 沈阳少妇高潮在线| 91无码人妻精品一区| 久久国产精品娇妻素人| 色久综合在线| 五月天在线网站| 久久国产高潮流白浆免费观看| 久久国产精品电影| 性欧美在线| 91九色最新地址| 亚洲不卡网| 国产视频一区二区在线观看| 国产99视频在线| 天堂成人av| 大学生久久香蕉国产线观看 | 成年人国产网站| 国产欧美视频一区二区三区| 亚洲美女视频一区| 免费观看男人免费桶女人视频| 亚洲成aⅴ人在线观看| 成年午夜精品久久精品| 伊人久久久大香线蕉综合直播| 国产毛片不卡| 人禽伦免费交视频网页播放| 久久综合九九亚洲一区| 婷婷中文在线| 日韩在线网址| 男人天堂伊人网| 人妻91无码色偷偷色噜噜噜| 伊人精品视频免费在线| 色综合中文字幕| 91久久偷偷做嫩草影院免费看| 国产精品欧美亚洲韩国日本不卡| 2021无码专区人妻系列日韩| 久久精品91麻豆| 青青草综合网| 黄色网页在线观看| 国产精品久久久久久久久kt| 久久久久亚洲精品无码网站| 成人午夜久久| …亚洲 欧洲 另类 春色| 国产精品一老牛影视频| 日韩av高清无码一区二区三区| 免费中文字幕在在线不卡| 色成人综合| 四虎成人精品| 亚欧成人无码AV在线播放| 欧美自慰一级看片免费| 欧美啪啪视频免码| 成人精品在线观看| 毛片最新网址| 人妻无码中文字幕一区二区三区| 91精品国产自产在线老师啪l| 欧美日韩va| 国产激爽大片高清在线观看| 一区二区影院| 好吊妞欧美视频免费| 亚洲成网777777国产精品| 九九精品在线观看| 国产成人久久综合777777麻豆| 99资源在线| 国产视频自拍一区| 欧美中出一区二区| 热思思久久免费视频| 国产女人水多毛片18| 久久精品人妻中文系列| 久久精品女人天堂aaa| 成人a免费α片在线视频网站| 欧美怡红院视频一区二区三区| 国产一在线观看| 国产超碰在线观看| 蜜桃臀无码内射一区二区三区| 波多野结衣一二三| 成人亚洲视频| 无码网站免费观看| 欧美激情,国产精品|