在剛剛落幕的2025年度世界人工智能大會(下稱“WAIC”)上,具身智能機器人展廳人氣最火爆,滿地跑的機器狗、形態(tài)各異的機器人引來觀眾駐足。
據(jù)介紹,本屆WAIC上共有超150臺人形機器人同臺競技,是國內(nèi)人形機器人有史以來最大規(guī)模的一次集體展出。且不同于去年機器人多偏向于靜態(tài)陳列,今年展出的機器人都主打展示在真實場景里干活的能力。
智元機器人展臺面積達300平方米,也是本次參會具身智能企業(yè)中的最大展臺。該公司在展臺設立了工業(yè)物流、商業(yè)服務、家居、科研教育、文娛表演等五大商業(yè)場景,“指派”不同的機器人秀實力:作為主打交互服務的通用人形機器人遠征A2負責展臺講解,全程自主導覽無人工參與;精靈G1則化身展臺“全能助手”為觀眾遞物品、蓋紀念章;另一款機器人遠征A2-W在勤奮地進行拆垛搬運作業(yè),精準抓取不同規(guī)格的周轉(zhuǎn)箱。
銀河通用搭建了1∶1還原的真實商超場景,由銀河通用機器人Galbot進行全天候值守。
星動紀元模擬物流倉儲場景,展示機器人進行智能分揀、掃碼、服務等“真干活”的能力。
高盛研究預測,到2035年,全球人形機器人市場規(guī)模有望達到1540億美元。摩根士丹利在研報中稱,中國作為全球最大的機器人市場和制造中心,2024年機器人市場規(guī)模已達470億美元,占全球總量的40%,預計到2028年將增至1080億美元,年復合增長率達23%。
中信智庫7月27日在WAIC上發(fā)布《AI新紀元:砥礪開疆·智火燎原》AI+產(chǎn)業(yè)發(fā)展深度研究報告。報告指出,目前機器人大模型訓練方式已經(jīng)開始向端到端大模型+世界模型(物理規(guī)則建模)發(fā)展,同時模態(tài)能力也越來越豐富,但受制于機器人“大腦”泛化能力有限、數(shù)據(jù)集獲取難度高、結構設計待優(yōu)化、供應鏈成本居高不下等痛點,人形機器人短期內(nèi)仍難以實現(xiàn)大規(guī)模商用。
人形機器人被普遍認為是AI最有前景的落地方向之一,未來在工業(yè)、商業(yè)、家庭、外太空探索等領域具有廣闊應用場景,將人類從低級和高危行業(yè)中解放出來,提升人類生產(chǎn)力水平和工作效率。
需要指出的是,人形機器人只是具身智能的一種典型載體,但具身智能的范疇遠不止于人形機器人。具身智能核心在于“通過身體與環(huán)境的動態(tài)交互產(chǎn)生智能”,而“身體”的形態(tài)可以是多樣的,只要具備感知、行動能力并能與環(huán)境互動,都可成為具身智能的載體。
中信智庫在報告中指出,采用人形設計出于多種因素考量。
其一,更能適應環(huán)境。現(xiàn)實中許多場景,如樓梯、工具等均是根據(jù)人體工學設計的,機器人如果是人形就能夠在這些場景中直接應用。
其二,更好的任務通用性。人體具備較高靈活度,模仿人類的關節(jié)、感官系統(tǒng)可讓人形機器人更加靈活,可執(zhí)行多樣化任務。
其三,類人外觀降低人機交互的心理隔閡,與其他類型相比,未來人形機器人在情感溝通上面臨的壁壘更低。
其四,數(shù)據(jù)可得性更高。深度仿生意味著可以從人身動作中獲取大量的運動數(shù)據(jù),能夠明顯降低深度強化學習等訓練方法的難度和所需的訓練時間。
特斯拉人形機器人Optimus堅持仿人結構。Optimus機器人身高1.73米,在執(zhí)行器連接中使用模仿肌腱的彈簧設計,手部形態(tài)上模仿人類手掌,從而實現(xiàn)高靈敏度以抓取重物和輕薄物體。
根據(jù)特斯拉在今年1月公布的規(guī)劃,Optimus計劃在2025年量產(chǎn)數(shù)千臺,并在特斯拉工廠進行初步測試;2026年量產(chǎn)5萬-10萬臺,2027年再增加10倍。
今年初開始,車廠紛紛入局人形機器人成為一大趨勢。《財經(jīng)》根據(jù)官方公告不完全統(tǒng)計得出,當前國內(nèi)已有廣汽、上汽、比亞迪、小鵬、奇瑞、小米等15家車企,以及華為、地平線、禾賽科技等供應鏈企業(yè),相繼投入人形機器人賽道。在海外,特斯拉、寶馬、奔馳、本田、豐田、現(xiàn)代等6家車企也提出了自己的人形機器人思路。全球主流車企基本已入局人形機器人賽道。
在國內(nèi),人形機器人也成為今年資本市場熱度最高的領域之一。7月18日,中國證監(jiān)會官網(wǎng)信息顯示,宇樹科技開啟上市輔導,估值超120億元。宇樹科技成立于2016年,研究機器狗起家,2023年開始發(fā)布人形機器人產(chǎn)品,是國內(nèi)最受關注的人形機器人創(chuàng)業(yè)公司之一。人形機器人公司它石智航已經(jīng)開啟第三輪融資。今年3月,機器人公司維他動力宣布完成2億元融資,這家公司成立100天,已經(jīng)完成兩輪融資。
按照估值,目前中國人形機器人創(chuàng)業(yè)公司已經(jīng)形成了鮮明的梯隊,第一梯隊的公司有三家:宇樹科技、智元機器人和銀河通用,估值均超過70億元。第二梯隊的公司則包括它石智航、自變量機器人、逐際動力、千尋智能等十多家,估值在20億元-50億元之間。
盡管人形機器人行業(yè)熱度高漲,但仍然面臨著短期內(nèi)難以大規(guī)模商用的行業(yè)難題,中信智庫在報告中指出,阻力主要來自以下四個方面。
首先,機器人“大腦”,即具身智能機器人大模型泛化能力有限,導致當前應用場景受限。
具身智能大模型指通過海量多模態(tài)數(shù)據(jù)(視覺、語言、動作)預訓練,具備環(huán)境感知→任務理解→動作生成能力的通用智能體模型,逐步實現(xiàn)從“單一指令執(zhí)行”到“自主決策演進”的躍遷,其核心是讓機器人像人類一樣“看懂世界,聽懂指令,做出行動”,在工業(yè)、醫(yī)療、家庭服務等場景推動智能化升級。

中信智庫認為,機器人大模型大致可以參照自動駕駛的技術發(fā)展,也劃分為L1-L5階段。目前處于L4階段,該階段特點是實現(xiàn)真實交互反饋,代表模型為谷歌DeepMind于今年3月推出的Gemini Robotics,實現(xiàn)了視覺-語言-動作(VLA)三模態(tài)深度融合,具備極強的空間推理。
目前具身智能大模型快速迭代,但仍面臨數(shù)據(jù)集不夠、思考跟不上運動、缺乏生態(tài)等主要痛點,從效果上看,人形機器人在單一任務的泛化能力方面取得較好進展,但是多任務、跨任務的泛化能力仍然相對較弱,影響人形機器人落地應用場景表現(xiàn)。
數(shù)據(jù)是具身智能的“認知基石”,目前通用機器人大模型所需數(shù)據(jù)量極為龐大、且數(shù)據(jù)獲取難度高,導致短期內(nèi)通用機器人難以采集足夠數(shù)量的真機數(shù)據(jù)用于大模型訓練。
與語言大模型可以直接學習大量互聯(lián)網(wǎng)、書籍知識不同,僅靠觀看互聯(lián)網(wǎng)視頻或者人類動作視頻是很難快速提高機器人的運動和規(guī)劃能力。
物理AI仿真系統(tǒng)開發(fā)商松應科技首席執(zhí)行官聶凱旋告訴《財經(jīng)》,人形機器人則需要在真實物理環(huán)境中進行大量交互操作的數(shù)據(jù)來訓練其決策和行動能力,物理世界操作數(shù)據(jù)的短缺限制了人形機器人的發(fā)展。
機器人結構設計仍需優(yōu)化,零部件可靠性、電池續(xù)航等問題亟待解決。
2025年4月,北京舉辦人機共跑半程馬拉松。半馬挑戰(zhàn)機器人綜合性能,是對其關節(jié)結構設計、熱管理、電池續(xù)航、控制算法、通信干擾、軟硬件耦合等方面的綜合性考驗。
比賽途中多數(shù)機器人選手出現(xiàn)運動失衡、摔倒等現(xiàn)象,穩(wěn)定性較差;同時,不少機器人暴露出散熱問題,需不斷噴灑冷卻液進行降溫。這是因為,機器人的高功率電機、密集的電子元件在持續(xù)工作時會產(chǎn)生大量熱量,尤其是在高速持續(xù)運動或重載工況下,熱量積累速度很快。而由于人形機器人設計為仿人結構,其內(nèi)部空間緊湊,熱量難以快速散發(fā)。
人形機器人目前續(xù)航能力有限,大多數(shù)人形機器人續(xù)航能力集中在2小時-5小時,難以滿足家庭服務、工業(yè)協(xié)作等場景的持續(xù)作業(yè)需求,仍有待進一步提升。
目前,人形機器人的供應鏈成本較高,硬件價格仍需進一步下降。由于人形機器人量產(chǎn)產(chǎn)業(yè)規(guī)模有限,相關的零部件需求暫未完全釋放,而部分零部件如精密傳感器、行星滾柱絲杠等由于應用場景有限價格較為昂貴,未來產(chǎn)業(yè)規(guī)模進一步擴大也有賴于供應鏈環(huán)節(jié)的進一步降本。
(本刊記者劉以秦、研究員黃思韻、特約撰稿人顧翎羽對此文亦有貢獻)