(北京物資學院 北京 101149)
物聯網等技術的發展使人們的生活水平不斷提高,電子商務也在重塑著人們的購物方式,由此引起以物流為主導的各行各業不斷發展。在物流的智能倉儲環節,多機器人系統扮演著很重要的角色。與單個機器人相比,多機器人系統擁有效率高、速度快、魯棒性好以及傳遞信息準確等優點。
著名多機器人系統研究專家Lynne E。Parker從七個方面總結了多機器人系統領域的主要研究內容及亟待解決的問題[1]。其中最為嚴峻的且對企業發展影響較大的一個問題就是多機器人的任務分配問題,在多機器人進行協作探索時,特別是在未知環境下,任務分配問題是多機器人系統能效優化的一個極其重要的環節,該怎樣提高任務分配的效率是多機器人系統研究的關鍵問題[2]。
多機器人系統中的機器人調度過程如下[3]:當有一批訂單到來時,一般選擇已經存在的任務分配算法,對這一批訂單進行分配,各個機器人會被分配到一個或多個訂單任務,機器人根據被分到任務的具體信息,通過路徑規劃算法從當前位置移動到貨架位置;然后將貨架運輸到指定的工作臺進行相應處理,再從當前位置移動到下一個任務訂單所指向的貨架,依次循環直至完成所有被分到的任務。
其中多機器人任務分配的定義[4]為:已知存在一個多機器人系統,一個任務集合以及系統性能的評價指標,為每個子任務尋找一臺合適的機器人負責執行該子任務,且使得機器人系統執行完任務集合中的全部任務時所獲得的收益達到最大。即將任務按照一定的分配規則,分配給機器人去執行,目標是在保證所有任務完成的情況下,使總成本最小。
對于多機器人任務分配問題,國內外學者已經做了許多研究,下面對于任務分配現存研究方法做出闡述,分別敘述各個方法的優缺點。
深度強化學習[5-6](DRL,Deep Reinforcement Learning)是將深度學習方法與強化學習方法相結合,它集成了深度學習方法在感知問題上強大的特征提取能力,以及強化學習算法的行動決策能力,這些特點使其得以運用于現實場景中的大規模復雜問題。在使用深度強化學習方法解決任務分配問題時,機器人是具有自主決策能力的智能體(Agent),當一批訂單來臨時,由任務臺通過深度強化學習算法進行任務分配,將任務分配給空閑機器人,以實現整體效益最大化。
優點:在多機器人系統中該方法效率較高,精確度高,機器人學習時間較短。
缺點:對機器人性能要求較高,算法較為復雜。
群體智能方法[7]是指利用群體中各個體之間的相互協作和信息分享求解和優化問題。群體智能方法可以在沒有集中控制且缺少全局信息的情況下解決分布式問題,能夠適用于分布式動態任務分配問題。常見的群智能體智能算法有:蟻群算法、粒子群、魚群算法等。
優點:穩定性與可擴展性好,很好地動態適應性。
缺點:機器人之間的協調能力差,效率低,不適合復雜情況。
基于市場機制的任務分配方法[8]是在多機器人系統中,利用分布式的組織方式使得機器人之間保持共享信息,機器人通過投標來獲取執行任務的一種分配方法。這是一種具有良好魯棒性、靈活性的任務分配方法,適合動態不確定環境下求解任務分配問題。
優點:魯棒性與靈活性較好。
缺點:機器人需要彼此合作,資源耗費大,不能保證通訊中斷時的分配效果。
綜上,我們可以知道在現在智能倉儲系統發展迅速的情況下,在機器人越來越智能的情況下,深度強化學習方法是進行多機器人任務分配的首要選擇。
本文介紹了多機器人任務分配的基本概念與現存的幾種任務分配方法,包括深度強化學習方法、群智能方法、基于市場機制的方法,分別介紹了他們的概念以及優缺點,得到的結論是,在科技發展迅速的今天,使用深度強化學習方法來進行多機器人任務分配是一個較為合適的方法。