有史以來,第一次完成戶外5公里跑步的機器人誕生。近日,俄勒岡州立大學的研究人員讓一個兩足機器人Cassie完成了上述跑步。
憑借纖細的紅腿、鴕鳥的步伐和腹部的推力,它在53分鐘內跑完全程,沒有系安全帶,并且只充了一次電。
“這是機器人第一次學會走路和跑步,并成功地越過人類地形和正常地形”,俄亥俄州立大學機器人教授、Agility robotics創始人和CTO喬納森·赫斯特表示,“這是真實世界的環境,不是在跑步機上的實驗室那種東西。”
據悉,Cassie是一個兩腿機器人,由俄勒岡州立大學孵化出來的公司Agility Robotics制造,曾獲得美國國防部高級研究計劃局的100萬美元撥款。
研究團隊耗時16個月研發完畢,并于2017年首次推出Cassie,目前一臺售價大約7萬美元。
兩足機器人Cassie
2020年,該校剝離出Agility Robotics,不過該公司一直在推動雙足機器人的商業應用。據介紹,Cassie是通過深度強化學習算法學會了跑步能力,它還能在轉換位置或運動時保持平衡。
概括來說,該團隊將生物力學知識、機器人控制方法、以及機器學習工具相結合,最終塑造了Cassie。
同時,Cassie也是該公司的第一款產品,它穩定、精確的步伐參考了鳥類步態。和鴕鳥一樣,Cassie臀部有三個自由度,腳踝柔韌有力,但膝蓋只能單向彎曲。它的整個底盤非常輕,能以比較自然的方式去吸收沖擊,就像人類走路一樣。
不同于波士頓動力公司的四足機器人,對于四條腿站立的機器人,很難用外部物體把它撞倒。而Cassie是兩條腿,因此似乎更容易被撞倒。但該團隊表示,這種情況或將改變,因為新的深度學習技術可讓兩足機器人在移動過程中,開發出自我穩定的新方法。
盡管如此,這些方法也并非完美無缺。此次Cassie的運行時間包括大約6.5分鐘的故障排除時間,在5公里跑中跌倒了兩次,期間研究人員處理了電腦過熱和一個糟糕的轉彎,這導致Cassie的主機從腿上摔了下來。
但是,赫斯特仍然相信,兩足機器人將成為常態,并與人類融合在一起。其潛在應用場景主要在于災后搜救、物流包裹運送和家庭智能服務等。
兩足機器人Cassie在測試
對于此次成績,浙江之江實驗室PI研究員、前本田技研先端中心研究員、大阪大學博士&特聘研究員付春江表示,對能耗的追求其實在美國DRC機器人挑戰賽中就已初見端倪,相比傳統的剛體機器人比如ASIMO和ATLAS,斯坦福研究院的SRI的DURUS在更早之前、就已實現較長時間的行走。
而此次Cassie把雙足機器人的節能性推到了新高度。舉例來說,智能手機之所以成為日用品,就是起碼能保證一天一充電。其實,之前CassieE實現連續工作數小時,只不過那時它采用的控制方法需要限制步幅,即仍然停留在行走這種方式。
而此次的5公里,是在慢跑步態下實現的,確實更具沖擊力。不同于全地形和全身動作,行走的學習控制核心思路也沒有慢跑的復雜。而從俄勒岡州立大學ICRA2021的控制框圖可以看到,在承擔主要非線性、非連續動力學任務時,仍是讓降維模型的穩定周期運動來作為步態庫,去對控制策略網絡進行引導。
俄勒岡州立大學ICRA2021的控制框圖
付春江指出,相比之前純粹的強化學習,這可省去不少訓練量。當然,全步態學習包括跑步有著更復雜的無模型學習方法、回報設計、系統調參和軟硬件遷移,但主要還是依賴大規模仿真數據。
該團隊于2021年發表的一篇論文指出,周期回報組合設計是其關鍵。此外如下圖所示,該研究還用到了LSTM網絡和PPO訓練方法。
LSTM網絡和PPO訓練方法
付春江表示,Cassie此次實現5公里慢跑,是抗擾柔性硬件結構、調試數據、經驗的積累、以及強化學習的綜合積累結果。
目前該公司還研發了Digit機器人。據悉,Digit上身集成了傳感器和兩個4自由度臂,還有一個用于額外計算和自定義負載集成的托架。
研究團隊和Digit
它的實用性更強,只需少量額外編程即可執行簡單的任務。據介紹,Digit于2018年開始開發,并于2020年中期推向市場。Digit具有穩健的步行和跑步步態,具備爬樓梯、以及自主導航的感知能力。
目前,Digit已可用于搬運包裹。
Digit已可用于搬運包裹
即便遇到臺階,它仍可以搬著包裹上去。
赫斯特曾表示,該公司正在和福特公司合作,主要想解決最后一公里問題。Digit的獨特設計讓它可以被折疊,平時放在汽車后備箱即可隨車攜帶,一旦車輛到達目的地,就可讓Digit抓取包裹、并執行交付過程的最后一步。
遇到臺階,它仍可以搬著包裹上去
談及Agility Robotics和高校的合作模式,付春江表示,公司與高校合作的最大收益是試錯。他說,Agility Robotics創始人赫斯特在卡耐基梅隆大學(CMU)讀書時是硬件出身,期間設計了很多串并聯彈性元件、變阻抗機構。
赫斯特對剛柔混合結構十分執著,并相信通過硬件的實踐創新,可以倒逼控制的發展,但是當時CMU機器人學院院長克里斯·阿特金森不是很支持他。比較幸運的是,密歇根大學機器人研究所所長杰西·格里茲爾很看好赫斯持的工作。
由于當時混合零動力控制這條線在處理跑步時,需要加入彈性倒立擺模型作為零動力核心。在實現彈簧倒立擺的基礎上,彼時已在俄勒岡大學教書的赫斯特、及其學生安迪·阿巴特嘗試過很多構型,最終發現串并聯混合模型加玻璃纖維板,不僅能在一定工作空間上實現彈性倒立擺模型,還能在末端工作空間形成剛度橢圓抗地面干擾。
Agility Robotics公司的理念就是讓人形機器人走到人能去的任何地方
但柔性元件的加入對控制提出了新要求,因為無法找到證明穩定性的多項式形式的李雅普諾夫函數。所以Cassie被發到赫斯特的高校“朋友圈”,并嘗試了不同的方法。
比如前哈佛大學約翰·A·保爾森工程與應用科學學院的工程與計算機科學助理教授、現波士頓動力的Atlas團隊負責人斯科特·昆德斯馬就曾在Cassie身上嘗試強化學習的方式;密歇根大學的杰西·格里茲爾則使用了非線性控制的方式;加州理工學院機械和土木工程、以及控制和動力系統的教授亞倫·艾姆斯用的是魯棒優化控制的方式。
后來,斯科特·昆德斯馬跳槽到波士頓動力,強化學習的嘗試也被移交給加拿大不列顛哥倫比亞大學的計算機科學系教授米歇爾·范·德·帕內,并于2018年取得應用性突破。Agility Robotics確認效果后收回到自己公司,并開始大力投入此方向。
付春江補充稱,Agility Robotics公司的理念就是讓人形機器人走到人能去的任何地方。
同時,Agility Robotics也在積極擁抱資本,2018年該公司獲得800萬美元的資金,投資方分別是此前投資者Robotics Hub,以及新加入的Playground Global和索尼創新基金。2020年,該公司再次獲得2000萬美元的投資,這次的融資額度和投資人數都比上次更多。
而關于兩足機器人在國內的發展,付春江表示:“國內仿人雙足機器人經過長期積累和發展,已經達到或部分超過國際一流水平,比如北京理工大學的硬件性能,優必選公司的人機交互多樣性,浙江大學和南方科技大學的新型控制等。”
最近的科研范式開始轉向公司、高校、研究所大規模混合制趨勢,比如谷歌的AlphaFold2論文有34個不同領域行業的大牛作者,參與支撐的人數肯定也遠超這個數字。因此國內雙足機器人若想達到國際頂級水平,可能還需要有力部門組織深入合作,并召集海外學者貢獻創新力量。(摘自關《深科技》) (編輯/克珂)