




















摘 要:針對移動機器人在復雜室內環境下的局部路徑規劃算法會面臨躲避動態障礙物效率低、繞路及不能抵達目標點的問題,提出了一種解決室內路徑規劃的通道動態窗口算法。該方法選用基于密度的應用噪聲空間聚類算法(DBSCAN)先對障礙物分割,在相鄰障礙物之間建立通道,并將生成的通道離散化生成一系列的通道點。通過設計的通道點評價函數,選擇出最優通道點作為動態窗口法的臨時通道點,為動態窗口法提供正確的方向。采用通道動態窗口法對真實環境中的ROS機器人進行路徑規劃,結果表明,通道動態窗口法在路徑長度、運行時間和采樣次數的性能上均優于動態窗口法,表現出更強的適應性和魯棒性,避免了移動機器人躲避障礙物不及時和陷入局部位置的問題。該算法既能獨立執行局部路徑規劃任務,也能與 A* 算法相結合進行全局路徑規劃。
關鍵詞: 室內路徑規劃; 動態窗口法; 通道; 局部路徑規劃; 移動機器人
中圖分類號: TP242.6 文獻標志碼: A 文章編號: 1001-3695(2025)02-024-0501-06
doi: 10.19734/j.issn.1001-3695.2024.07.0235
Obstacle avoidance method based on channel dynamic window approach
Liu Chunling, Liu Jiaxin’, Guo Kaiwen
(College of Information Engineering, Dalian University, Dalian Liaoning 116622, China)
Abstract:Local path planning algorithms for mobile robots in complex indoor environments faced the problems of inefficient avoidance of dynamic obstacles, detouring and inability to reach the target point. This paper proposed a channel dynamic windowing algorithm to solve the indoor path planning. The method selected the density-based applied noise spatial clustering algorithm (DBSCAN) to segment the obstacles first, create channels between neighboring obstacles, and discretize the generated channels to produce a series of channel points. Through the designed channel point evaluation function, this algorithm selected the optimal channel points as the temporary channel points for the dynamic window me-thod to provide the correct direction for the dynamic window method. By applying the channel dynamic window method to perform path planning for ROS robots in real environments, the results show that the channel dynamic window method outperforms the dynamic window method in terms of the performance of path length, running time, and number of sampling times, exhibiting stronger adaptability and robustness, which effectively prevents the mobile robot from delaying obstacle avoidance and getting trapped in local positions. The algorithm can perform local path planning tasks independently, and can also be combined with the A* algorithm for global path planning.
Key words:indoor path planning; dynamic window method; channel; local path planning; mobile robot
0 引言
隨著人工智能的不斷發展,智能移動機器人在許多行業中都得到了廣泛應用,包括救災、軍事作戰等。除了特殊用途外,移動機器人在商業服務領域也得到了廣泛應用,如物流中心的物流機器人負責貨物運輸;餐館和酒店的機器人將物品送到指定位置。
移動機器人路徑規劃主要分為全局路徑規劃和局部路徑規劃算法。全局路徑規劃通過構建地圖和路徑規劃算法確定機器人的最優路徑,而局部路徑規劃則在機器人運動過程中通過實時避開障礙物來確保機器人的安全移動。全局路徑規劃與局部路徑規劃通常會結合使用,前者負責從宏觀上規劃出起點到終點的大致路線,后者則在執行過程中負責微調和實時適應環境變化。全局路徑規劃中常用的算法包括A*[1]、Dijkstra[2]、RRT(rapidly-exploring-random-tree)[3]、PRM(probabilistic-roadmaps)[4]、PSO(particle-swarm optimization)[5]、人工蜂群[6]。 局部路徑規劃常用的算法包括人工勢場法[7]、時間彈性帶[8]、動態窗口法(dynamic windows method)[9]、速度障礙法[10]、深度強化學習[11]。
在機器人局部路徑規劃中,動態窗口法規劃的路徑平滑,具有良好的避障能力,但算法容易陷入局部最優,無法獲得全局最優路徑,機器人遠離目標時無法選擇合適的速度指令[12]。文獻[13]基于全局最優路徑,提出了一種改進的DWA算法,用于移動機器人在動態環境下的路徑規劃。通過刪除冗余節點、優化初始方向、改進評估函數,增強移動機器人規避移動障礙物路徑的高效性。文獻[14] 對DWA進行了改進,根據障礙物的速度,動態改變障礙物的安全距離,以提高DWA的障礙物距離評價項目。在速度評估函數中引入了一個新的評估項,以優化DWA在速度空間中的搜索規則。文獻[15] 提出了一種改進哈里斯鷹算法(IHHO)與改進動態窗口算法(IDWA)的融合算法(IHHO-IDWA),通過增加子函數、提出自適應權重策略、設定初始航向角等改進策略來解決動態環境下移動機器人路徑規劃的動態窗口算法存在規劃路徑長和易陷入死鎖等問題。文獻[16]通過添加和減去線速度和角速度來提高避障性能。它們需要為每個環境調整與避障相關的策略和參數。當機器人遇到以前沒有考慮過的情況時,它可能無法有效地避開障礙物。文獻[17] 提出一種基于改進Q-learning算法和動態窗口法(DWA)的融合算法,通過提取改進Q-learning算法規劃路徑的節點,將其作為DWA算法的臨時目標,在前進過程中實時躲避環境中出現的動靜態障礙物。文獻[18]提出了一種改進的DWA方法,其使用深度神經網絡,用強化學習的方式訓練,使得模型自適應地調整目標函數的系數,達到提高效率的目標。
盡管以上文獻體現了動態窗口法在各種場景中的自適應、避障性能得到了極大的提高,但其在動態復雜環境中仍有不足:a)在某些情況下, 動態窗口法所得到的局部最優組合路徑可能不是全局最優路徑,這可能導致機器人繞遠或陷入困境;b)只考慮機器人周圍的短期目標和障礙物,這可能導致機器人陷入局部最優解,無法找到全局最優路徑。對于復雜環境中的長距離規劃問題,動態窗口法可能表現不佳。這些問題的存在,不僅影響了機器人的路徑規劃效率,還可能對其安全性和穩定性構成威脅。為了克服動態窗口法的這些局限性,提出了通道動態窗口法(channel dynamic window approach)。通過引入“通道”的概念,在機器人的運動空間中識別出可通過的臨時通道,再通過評價函數選擇最優的臨時通道點,從而有效降低路徑規劃的復雜度并且避免機器人陷入局部最優的情況。該方法與A*算法的結合彌補了局部規劃無法做到長距離規劃的問題,且通道機制解決了機器人繞遠或陷入局部位置的問題。
1 全局路徑規劃算法
1.1 A*算法
A*算法是一種啟發式搜索算法,常用于圖搜索和路徑規劃。它于 1968 年由Hart等人為解決在圖或網絡中尋找最短路徑的問題而提出。A*算法將Dijkstra算法的最短路徑搜索和啟發式搜索的優點相結合,能夠高效地找到從起點到終點的最短路徑。A*算法的基本思想是通過綜合考慮兩個關鍵的函數來實現路徑搜索,評價函數如式(1)所示。
f(n)=g(n)+h(n)(1)
其中:g(n)表示從起點到當前節點 n 的實際成本(路徑長度),也就是沿已知最短路徑移動累計的成本;h(n)反映了從當前節點n到目標節點的最短路徑估計代價。A*算法通過綜合考慮當前路徑的實際成本和對未來路徑的估算代價,形成了評價函數f(n)來評估節點n的優先級,以引導算法在搜索空間進行有效地決策。
1.2 A*算法規劃全局路徑
實現智能移動機器人高效導航需要綜合局部和全局路徑規劃。局部路徑規劃能夠滿足對動態環境做出實時改變,保證機器人在運動時的安全性與實時性;而全局性的路徑規劃則可以在較長的時期內進行有效的路徑預規劃,從而找到靜態環境下的最優路徑。所以該算法選擇了A*算法規劃全局路徑。
A*算法需要先驗地圖信息,所以使用cartography來建立全局地圖,然后使用A*算法得到一條如圖1所示的全局路徑。圖1 (a)為設置的仿真環境。圖1 (b)為cartography建立的相應地圖以及A*生成的路徑。生成的路徑規劃出了移動機器人的大致行進方向,為后期實現動態窗口法跟隨全局路徑做好了準備,彌補了動態窗口法的長距離路徑規劃問題。
2 通道動態窗口法
2.1 動態窗口法
動態窗口法作為一種常用于機器人路徑規劃和導航的算法,旨在幫助機器人在復雜和動態的環境中避開障礙物,同時盡可能快地到達目標點。該方法最初由Fox等人在1997年提出,適用于各種類型的機器人,包括移動機器人和自動駕駛車輛。動態窗口法使用了一個窗口的概念,這個窗口表示機器人在當前速度下可行駛的范圍。在每個時間步長,機器人會計算一組可能的速度和轉向控制命令,并通過評估這些控制命令來選擇最佳的移動策略。
動態窗口法主要分為兩個部分:第一部分按照移動機器人的姿態信息以時間間隔對速度空間進行采樣,在規定時間內產生軌跡集合; 第二部分根據評價函數對軌跡集合內的所有軌跡進行評價,選出評價最好的軌跡,最后將得到的最優軌跡通過轉換成速度指令,然后發送給移動機器人。
動態窗口法評價函數公式如下所示:
T(v,w)=αTtarget+(1.99-Dmin(Probot,Pobstacle)Rmax)βTspeed+γTobstacle(2)
其中:Dmin(Probot,Pobstacle)表示障礙物與機器人之間的最小距離;Rmax表示以障礙物為中心的最大速度控制半徑,當進入速度控制半徑時,會提高速度代價,選擇更安全的軌跡;Ttarget表示移動機器人與目標之間的距離代價;Tspeed表示移動機器人的速度代價,該值越小表示速度越快;Tobstacle表示移動機器人的障礙物距離代價,該函數對某一范圍內的障礙做出評價,軌跡越接近障礙物,代價值越高。
在圖1(a)的實驗場景中,進行了動態窗口法與全局路徑規劃的協同測試。得到了動態窗口法為移動機器人預測的一條如圖2(a) 所示的路徑,當到達圖2(b)的位置時,動態窗口法的預測軌跡長度逐漸縮短,最終導致移動機器人停留在原地,產生了陷入局部位置的問題。這是因為在速度空間中得到的軌跡長度比傳感器探測范圍小,預測軌跡不能對軌跡范圍外到探測范圍內的部分做出判斷,導致發現陷入局部位置時已錯過了最佳的規劃時機,如果增大速度空間,則會降低運算速度,提高計算復雜度。同時,由于傳感器精度導致的誤差,障礙物邊緣位置沒有完全被傳感器檢測到,在這種情況下,動態窗口法更容易陷入局部位置。
由以上分析可知,在全局路徑規劃中使用動態窗口法未取得預期的效果,此時未能成功規避障礙物,并導致機器人陷入局部位置。此外,在實現動態窗口法跟隨全局路徑之前,需要通過SLAM(simultaneous localization and mapping)獲取地圖信息。但由于傳感器精度、角度等因素,獲取的地圖信息可能與實際場景不符,會在整體規劃路徑上造成阻礙?,F實環境下臨時障礙物的出現是在所難免的,如果重新做整體規劃,效率會相對較低,無法滿足實時要求。當場景較大且起點和目標點之間障礙物較多時,使用動態窗口法可能會出現繞遠或陷入局部點的情況。
2.2 建立通道
算法采用DBSCAN(density-based spatial clustering of applications with noise)方法對檢測到的障礙物進行分割,求得需要分割的障礙之間的通道。DBSCAN是由Ester等人在1996年提出的一種廣泛應用的基于密度的聚類方法。這種方法可以根據數據點在空間中的密度對數據點進行分類,將其劃分為不同的聚類。與擅長處理呈球形障礙物的K-means聚類算法相比,DBSCAN的主要優勢在于其能夠識別出任意形狀的聚類,并且能夠高效地處理大量數據,如圖3(a)(b)所示。
通道的建立分為三個部分。首先,使用DBSCAN將障礙物聚類;然后鄰近的不同障礙物簇之間互相連接形成通道,用通道點評價函數計算每一個通道的代價值;最后過濾無效通道,在最優通道中尋找最優臨時目標點。通道的構成如圖3(c)(d)所示。
算法1 建立通道
輸入:激光傳感器數據。
輸出:目標點。
a)對激光數據使用DBSCAN聚類得到標簽數據。
b)由于激光數據的特性,所有障礙物在數據中的相鄰與環境中的相鄰保持一致,所以根據標簽數據快速得到障礙物端點位置。
c)相鄰障礙物建立通道,將通道線離散化,生成通道點。
d)依據車的寬距L篩選能通過的通道。
e)依據式(3),選擇最優通道點作為臨時目標點。
其中:pi表示第i個通道點;Vpi表示第i個通道點的代價值;D表示點之間的距離;probot表示移動機器人的位置;P(probot)表示距離移動機器人最近的全局路徑位置小于傳感器距離最大值的全局路徑點的集合;pobstacle表示障礙物位置的集合;S(P(probot),pobstacle)表示路徑點集合中與障礙物相交的個數;pintersect表示障礙物與軌跡的交點;ptarget表示目標位置;Spath表示全局路徑。
算法將通道作為臨時目標點,為動態窗口法提供正確的方向。如圖3(b)所示,粗線段為阻礙物,細線為阻礙物之間的通道。移動機器人想要越過障礙物,必須通過通道,所以選擇將通道作為臨時目標點。
2.3 通道動態窗口方法
為了解決動態窗口法在跟隨全局路徑時得到的局部最優軌跡組合不一定是全局最優軌跡組合,且在最佳軌跡組合的條件下動態窗口法會在局部位置受限的問題,通道動態窗口法通過將臨時目標點設計在通道上,使移動機器人在跟隨全局路徑的過程中成功越過障礙物,避免其陷入局部位置。同時,通道動態窗口法既能結合全局路徑規劃算法解決多區域長距離規劃問題,又能獨立完成局部區域的規劃任務。
在通道動態窗口法協同全局規劃算法時,首先要利用全局規劃算法規劃出一條全局路徑。接著,將描述障礙物的激光數據進行分割,生成一組通道。然后,將每個通道離散表示為通道點集合。針對不同情況,采用不同的評價函數對通道點進行評分,并從中選出最優通道點作為臨時目標點。最終,通過動態窗口法得到移動機器人的動作指令。
算法2 通道動態窗口法
輸入:移動機器人姿態、傳感器數據。
輸出:運動指令。
a)采集傳感器數據,將障礙物分割,建立通道。
b)通過式(2)得到通道點集的評價值。
c)找出評價值最大的通道點作為臨時目標點。
d)通過動態窗口法得到動作指令。
e)通過左右輪的差速控制移動。
f)如果沒有到達目標點,重復執行上述步驟。
圖4所示為通道動態窗口法與全局路徑規劃的協同測試,其中黃色路徑代表通道動態窗口法生成的移動路徑,紅色路徑則是由A*算法規劃出的全局最優路徑(見電子版)。在全局路徑已知的前提下,若全局路徑上出現了障礙物,那么通道動態窗口法會選擇與全局路徑緊密相鄰的通道來引導移動機器人,有效地防止了動態窗口法陷入局部最優解的問題。當全局路徑暢通無阻時,該方法會使機器人逐漸趨近于全局路徑。
3 仿真實驗
3.1 動態窗口法與通道動態窗口法比較
實驗所用配置為Intel i7-4000K處理器,16 GB運行內存和RTX2060顯卡。仿真平臺使用CoppeliaSim來模擬機器人運動、激光掃描、碰撞檢測等功能。通過測試通道動態窗口法和動態窗口法的性能表現,對兩者在靜態和動態環境中的適應性進行評估和比較。表1為動態窗口法設定的參數。在選擇角速度分辨率和線速度分辨率時,應權衡預測軌跡數和模型精度之間的權衡關系。較高的角速度分辨率和線速度分辨率可以生成更多的預測軌跡,從而提升模型的精確性。然而,分辨率的提高會帶來計算復雜度增加、實時性能下降的問題。因此,在優化動態窗口法時,必須綜合考慮參數配置對模型精度和計算效率的影響,并尋求最佳平衡點,以滿足實際應用需求。
將動態窗口法、通道動態窗口法以及文獻[19]提出的改進的動態窗口法進行性能對比。圖5顯示了不同算法在應對相同障礙物時表現出截然不同的反應策略。根據圖5(a)可以看出,動態窗口法傾向于選擇局部最優的軌跡,即更靠近障礙物的位置,因為該軌跡在末端更接近目標點,并且避免了與障礙物發生碰撞。圖5(b)則顯示了通道動態窗口法與改進的動態窗口法的軌跡。可以看出,通道動態窗口法通過提前規避障礙物,實現了更小的旋轉次數和更短的路徑來完成任務。通道動態窗口法通過為移動機器人提供明確的避障指示和引導其規避方向,使得機器人能夠以較低的旋轉代價完成任務。通過這種方式,通道動態窗口法可以更智能地規劃軌跡,防止與障礙物相撞,從而減少旋轉次數和路徑長度,提高了路徑規劃的整體效率。
根據表2的數據可以觀察到,通道動態窗口法在與動態窗口法、改進的動態窗口法的對比中表現出了顯著的優勢。具體而言,與動態窗口法相比,通道動態窗口法的路徑長度減少了約18.1%,運行時間縮短了56.7%,采樣次數減少了約35.1%。此外,與改進的DWA相比,兩者的運行軌跡雖然相似,但通道動態窗口法在各個性能方面均優于改進的動態窗口法,路徑長度減少了19.5%,運行時間縮短了26.1%,采樣次數減少了約31.4%。通道動態窗口法使得路徑規劃的效率得到了明顯提升,更為高效。
3.2 基于動態環境下的通道動態窗口法測試
為了進一步研究通道動態窗口法躲避動態障礙物的能力,圖6和7分別為動態窗口法和通道動態窗口法加入一個動態障礙物和兩個動態障礙物來驗證算法性能。通過對比,動態窗口法在躲避兩個動態障礙物時出現了繞路的問題,而通道動態窗口法較為成功地規避了動態障礙。
通過對兩種算法的路徑長度、運行時間和采樣次數進行對比,通道動態窗口法能夠實現更短的路徑距離,運行時間也相對較少,所需的采樣次數也相對較低。根據表3所示的數據結果表明,通道動態窗口法在動態環境下的避障性能具有更明顯的優勢。
3.3 基于TurtleBot3 Burger的實驗驗證
為進一步驗證本文算法的運行效果,搭建了如圖8所示的實驗地圖,將TurtleBot3 Burger作為實驗對象。TurtleBot3 Burger搭載了支持ROS系統和Ubuntu系統的樹莓派4B,使用LDS-02收集數據。
首先,LDS-02收集到的數據傳入虛擬機ROS系統,對所得數據清洗,去掉超出范圍和異常的值,并用范圍內均值代替清洗的數據。其次,分別使用動態窗口法和通道動態窗口法進行路徑規劃,控制指令均由ROS系統傳達。
動態窗口法與通道動態窗口法實驗結果分別如圖8、9所示,小車移動軌跡與仿真實驗結果相似,在面對橫截面較大的物體時,動態窗口法無法選擇出更優的路徑,通道動態窗口法能選擇出更優的路徑。
圖10為該算法與動態窗口法移動的軌跡。根據表4所示,提出算法的路徑長度比動態窗口法的路徑長度縮短了13.9%,采樣次數減少了29%,運行時間縮短了27.3%。由此可知,通道動態窗口法相比動態窗口法具有更高的效率和路徑規劃能力。
此外,為驗證移動機器人在陌生場景中的適應能力,以及測試自主控制操作下,移動機器人路徑規劃的效果,搭建了如圖11所示的實驗場景,左側的仿真圖像中紅色星形代表最終目標點,綠色星形代表臨時目標點(參見電子版)。
在自主操控中,數據的發布和算法的運行均在ROS機器人的本地運行,如圖11(a)所示;在啟動過程中,臨時目標點會指引機器人避開前方的障礙物,如圖11(b)所示;機器人越過第一個障礙物后,臨時目標點引導機器人通過障礙物之間的間隙,如圖11(c)所示;臨時目標點引導機器人通過第二個障礙物間隙,最終如圖11(d)所示。機器人被引導到最終目標點,因為機器人可直達最終目標點,所以不再設立臨時目標點。
圖12(a)和(b)分別顯示了機器人在實驗過程中角速度和線速度的變化情況。由圖可知,在機器人啟動階段,為了避開前方障礙物,角速度和線速度均顯著增加。然而,當機器人需要通過第一個間隙時,線速度開始降低,而角速度則用于控制機器人尋找合適方向以通過間隙。一旦方向確定,線速度迅速提高,而角速度降低,這表明機器人正在以最快速度直線行駛。當機器人需要通過第二個間隙時,線速度再次降低,角速度上升,這說明機器人正在對準臨時目標點。隨后,機器人以較快的速度通過,并最終到達目標位置。
自主控制的機器人移動軌跡如圖13所示,軌跡總長度為2.14 m,運行時間20 s,采樣次數41。機器人運行時間較長并且采樣次數較多,是因為需要通過較大的轉彎躲避當前較近的障礙物,之后又要通過變化角度通過間隙,但是機器人最終成功完成了路徑規劃任務,并且無碰撞發生。
4 結束語
針對移動機器人在室內多區域環境下,出現的陷入局部最優問題以及在規避動態障礙物的過程中,動態窗口算法會導致行駛距離增加等問題,提出了一種適用于室內移動機器人的通道動態窗口法。以動態窗口法為基礎,引入通道點概念,通過選擇臨時目標點來有效導航引導動態窗口法,提高動態窗口法的性能。利用臨時目標點,有助于機器人在復雜和動態環境中更加靈活地調整其運動軌跡,使算法更加穩定和可靠。通過模擬動態環境并使用真實的 ROS 機器人進行測試,證明了該算法的有效性。該算法不僅能在動態環境中順利進行路徑規劃,還能提高規劃效率,有效防止機器人陷入局部最優,保證了機器人在復雜動態環境中的導航效率和穩定性。
未來還需在長距離更復雜的測試環境中進行驗證,以及聚焦于算法的進一步優化,特別是提高多機器人的規避能力。此外,將引入參數自適應調節機制,提升模型的魯棒性和穩定性。
參考文獻:
[1]Wu Xiaolan, Zhang Qiyu, Bai Zhifeng, et al. A self-adaptive safe A* algorithm for AGV in large-scale storage environment [J]. Intelligent Service Robotics, 2024, 17(2): 221-235.
[2]Wang Jinghua, Xu Ziyu, Zheng Xiyu, et al. A fuzzy logic path planning algorithm based on geometric landmarks and kinetic constraints [J]. Information Technology and Control, 2022, 51(3): 499-514.
[3]Zhang Lieping, Shi Xiaoxu, Yi Yameng, et al. Mobile robot path planning algorithm based on RRT_connect [J]. Electronics, 2023, 12(11): 24-56.
[4]Li Weimin, Wang Lei, Zou Awei, et al. Path planning for UAV based on improved PRM [J]. Energies, 2022, 15(19): 7267-7267.
[5]Ma Zeyuan, Chen Jing. Adaptive path planning method for UAVs in complex environments [J]. International Journal of Applied Earth Observation and Geoinformation, 2022, 115: 103-133.
[6]魏博, 楊茸, 舒思豪, 等. 基于離子運動-人工蜂群算法的移動機器人路徑規劃 [J]. 計算機應用, 2021, 41(2): 379-383. (Wei Bo, Yang Rong, Shu Sihao, et al. Mobile robot path planning based on ion motion-artificial bee colony algorithm [J]. Journal of Computer Applications, 2021, 41(2): 379-383.)
[7]Su Qinghua, Ma Shaobo, Wang Liyong, et al. Artificial potential field guided JPS algorithm for fast optimal path planning in cluttered environments [J]. Journal of the Brazilian Society of Mechanical Sciences and Engineering, 2022, 44(12): 602.
[8]謝春麗, 劉斐灝. 改進時間彈性帶的動態避障軌跡規劃系統研究 [J]. 重慶交通大學學報: 自然科學版, 2023, 42(3): 143-150. (Xie Chunli, Liu Feihao. Research on dynamic obstacle avoidance trajectory planning system with improved time elastic band [J]. Journal of Chongqing Jiaotong University: Natural Science Edition, 2023, 42(3): 143-150.)
[9]Fox D, Burgard W, Thrun S. The dynamic window approach to collision avoidance [J]. IEEE Robotics amp; Automation Magazine, 1997, 4(1): 23-33.
[10]江南, 徐海芹, 邢浩翔. 基于TSACO及動態避障策略的無人機路徑規劃 [J]. 計算機應用研究, 2024, 41(10):3015-3020. (Jiang Nan, Xu Haiqin, Xing Haoxiang. UAV path planning based on TSACO and dynamic obstacle avoidance strategy [J]. Application Research of Computers, 2024, 41(10):3015-3020.)
[11]Liu Yanglong, Chen Zuguo, Li Yonggang, et al. Robot search path planning method based on prioritized deep reinforcement learning [J]. International Journal of Control, Automation and Systems, 2022, 20(8): 2669-2680.
[12]Hossain T, Habibullah H, Islam R, et al. Local path planning for autonomous mobile robots by integrating modified dynamic-window approach and improved follow the gap method [J]. Journal of Field Robotics, 2022, 39(4): 371-386.
[13]Song Baoyue, Tang Suming, Li Yao. A new path planning strategy integrating improved ACO and DWA algorithms for mobile robots in dynamic environments [J]. Mathematical Biosciences and Enginee-ring, 2024, 21(2): 2189-2211.
[14]Li Yue, Zhao Jianyou, Chen Zenghua, et al. A robot path planning method based on improved genetic algorithm and improved dynamic window approach [J]. Sustainability, 2023, 15(5): 4656-4656.
[15]黃志鋒, 劉媛華, 任志豪, 等. 融合改進哈里斯鷹和改進動態窗口的機器人動態路徑規劃 [J]. 計算機應用研究, 2024, 41(2): 450-458. (Huang Zhifeng, Liu Yuanhua, Ren Zhihao, et al. Research on mobile robot dynamic path planning based on improved Harris hawk algorithm and improved dynamic window algorithm [J]. Application Research of Computers, 2024, 41(2): 450-458.)
[16]Kim J, Yang G H. Improvement of dynamic window approach using reinforcement learning in dynamic environments [J]. International Journal of Control, Automation and Systems, 2022, 20(9): 2983-2992.
[17]王志偉, 鄒艷麗, 劉唐慧美, 等. 基于改進Q-learning算法和DWA的路徑規劃 [J]. 傳感器與微系統, 2023, 42(9): 148-152. (Wang Zhiwei, Zou Yanli, Liu Tanghuimei, et al. Path planning based on improved Q-learning algorithm and DWA [J]. Sensors and Microsystems, 2023, 42(9): 148-152.)
[18]Xu Wangzihao, Zhang Yuhao, Yu Leitao, et al. A local path planning algorithm based on improved dynamic window approach [J]. Journal of Intelligent amp; Fuzzy Systems, 2023, 45(3): 4917-4933.