













摘要:【目的】提高傳統的單一類別煤矸分選機器人在面對形狀、尺寸差異較大的矸石時的適應性,分析異構機器人工作特性,實現異構機器人協同分選。【方法】基于深度Q值網絡(deep Q network,DQN)提出異構機器人協同分選模型;分析協同工作分選流程制定決策框架,根據強化學習所需,設計交互環境,構建智能體連續的狀態空間獎懲函數,長短期記憶網絡(long short term memory,LTSM)和全連接網絡相結合,構建DQN價值和目標網絡,實現強化學習模型在工作過程中的任務分配。【結果】協同分選模型與傳統順序分配模型相比,在不同含矸率工作負載下,可提高分選效益0.49%~17.74%;在樣本含矸率為21.61%,傳送帶速度為0.4~0.6 m/s的條件下,可提高分選效率2.41%~8.98%。【結論】異構機器人協同分選方法可以在不同的工作負載下獲得穩定的分揀效益,避免單一分配方案無法適應動態變化的矸石流缺陷。
關鍵詞:異構機器人;協同分選;強化學習;長短期記憶網絡;深度Q值網絡
中圖分類號:TP23;TH6;TB4文獻標志碼:A
引用格式:
張杰,夏蕊,李博,等.基于長短期記憶-深度Q值網絡的異構機器人煤矸協同分選方法[J].中國粉體技術,2024,30(3):28-38.
ZHANG J,XIA R,LI B,et al.Heterogeneous robot coal gangue collaborative sorting method based on long short term memory-deep Q network[J].China Powder Science and Technology,2024,30(3):28?38.
煤矸石是指煤炭采礦作業中產生的固體廢棄物,煤矸石分揀是指在煤炭開采、加工和使用過程中,將混雜在煤炭中的巖石、矸石等雜質分離出來的過程,對于提高煤炭質量、減少污染和提升能源利用效率具有重要意義[1-2]。傳統的煤矸石分揀多依賴人工或簡單的機械設備,但這些方法往往效率低下,成本高昂且勞動條件差。……