人形機器人商用四大痛點

2025-08-07 00:00:00周源

財經(jīng) 2025年16期

在剛剛落幕的2025年度世界人工智能大會（下稱“WAIC”）上，具身智能機器人展廳人氣最火爆，滿地跑的機器狗、形態(tài)各異的機器人引來觀眾駐足。

據(jù)介紹，本屆WAIC上共有超150臺人形機器人同臺競技，是國內(nèi)人形機器人有史以來最大規(guī)模的一次集體展出。且不同于去年機器人多偏向于靜態(tài)陳列，今年展出的機器人都主打展示在真實場景里干活的能力。

智元機器人展臺面積達300平方米，也是本次參會具身智能企業(yè)中的最大展臺。該公司在展臺設立了工業(yè)物流、商業(yè)服務、家居、科研教育、文娛表演等五大商業(yè)場景，“指派”不同的機器人秀實力：作為主打交互服務的通用人形機器人遠征A2負責展臺講解，全程自主導覽無人工參與；精靈G1則化身展臺“全能助手”為觀眾遞物品、蓋紀念章；另一款機器人遠征A2-W在勤奮地進行拆垛搬運作業(yè)，精準抓取不同規(guī)格的周轉(zhuǎn)箱。

銀河通用搭建了1∶1還原的真實商超場景，由銀河通用機器人Galbot進行全天候值守。

星動紀元模擬物流倉儲場景，展示機器人進行智能分揀、掃碼、服務等“真干活”的能力。

高盛研究預測，到2035年，全球人形機器人市場規(guī)模有望達到1540億美元。摩根士丹利在研報中稱，中國作為全球最大的機器人市場和制造中心，2024年機器人市場規(guī)模已達470億美元，占全球總量的40%，預計到2028年將增至1080億美元，年復合增長率達23%。

中信智庫7月27日在WAIC上發(fā)布《AI新紀元：砥礪開疆·智火燎原》AI+產(chǎn)業(yè)發(fā)展深度研究報告。報告指出，目前機器人大模型訓練方式已經(jīng)開始向端到端大模型+世界模型（物理規(guī)則建模）發(fā)展，同時模態(tài)能力也越來越豐富，但受制于機器人“大腦”泛化能力有限、數(shù)據(jù)集獲取難度高、結構設計待優(yōu)化、供應鏈成本居高不下等痛點，人形機器人短期內(nèi)仍難以實現(xiàn)大規(guī)模商用。

為什么是人形機器人

人形機器人被普遍認為是AI最有前景的落地方向之一，未來在工業(yè)、商業(yè)、家庭、外太空探索等領域具有廣闊應用場景，將人類從低級和高危行業(yè)中解放出來，提升人類生產(chǎn)力水平和工作效率。

需要指出的是，人形機器人只是具身智能的一種典型載體，但具身智能的范疇遠不止于人形機器人。具身智能核心在于“通過身體與環(huán)境的動態(tài)交互產(chǎn)生智能”，而“身體”的形態(tài)可以是多樣的，只要具備感知、行動能力并能與環(huán)境互動，都可成為具身智能的載體。

中信智庫在報告中指出，采用人形設計出于多種因素考量。

其一，更能適應環(huán)境。現(xiàn)實中許多場景，如樓梯、工具等均是根據(jù)人體工學設計的，機器人如果是人形就能夠在這些場景中直接應用。

其二，更好的任務通用性。人體具備較高靈活度，模仿人類的關節(jié)、感官系統(tǒng)可讓人形機器人更加靈活，可執(zhí)行多樣化任務。

其三，類人外觀降低人機交互的心理隔閡，與其他類型相比，未來人形機器人在情感溝通上面臨的壁壘更低。

其四，數(shù)據(jù)可得性更高。深度仿生意味著可以從人身動作中獲取大量的運動數(shù)據(jù)，能夠明顯降低深度強化學習等訓練方法的難度和所需的訓練時間。

特斯拉人形機器人Optimus堅持仿人結構。Optimus機器人身高1.73米，在執(zhí)行器連接中使用模仿肌腱的彈簧設計，手部形態(tài)上模仿人類手掌，從而實現(xiàn)高靈敏度以抓取重物和輕薄物體。

根據(jù)特斯拉在今年1月公布的規(guī)劃，Optimus計劃在2025年量產(chǎn)數(shù)千臺，并在特斯拉工廠進行初步測試；2026年量產(chǎn)5萬-10萬臺，2027年再增加10倍。

今年初開始，車廠紛紛入局人形機器人成為一大趨勢。《財經(jīng)》根據(jù)官方公告不完全統(tǒng)計得出，當前國內(nèi)已有廣汽、上汽、比亞迪、小鵬、奇瑞、小米等15家車企，以及華為、地平線、禾賽科技等供應鏈企業(yè)，相繼投入人形機器人賽道。在海外，特斯拉、寶馬、奔馳、本田、豐田、現(xiàn)代等6家車企也提出了自己的人形機器人思路。全球主流車企基本已入局人形機器人賽道。

在國內(nèi)，人形機器人也成為今年資本市場熱度最高的領域之一。7月18日，中國證監(jiān)會官網(wǎng)信息顯示，宇樹科技開啟上市輔導，估值超120億元。宇樹科技成立于2016年，研究機器狗起家，2023年開始發(fā)布人形機器人產(chǎn)品，是國內(nèi)最受關注的人形機器人創(chuàng)業(yè)公司之一。人形機器人公司它石智航已經(jīng)開啟第三輪融資。今年3月，機器人公司維他動力宣布完成2億元融資，這家公司成立100天，已經(jīng)完成兩輪融資。

按照估值，目前中國人形機器人創(chuàng)業(yè)公司已經(jīng)形成了鮮明的梯隊，第一梯隊的公司有三家：宇樹科技、智元機器人和銀河通用，估值均超過70億元。第二梯隊的公司則包括它石智航、自變量機器人、逐際動力、千尋智能等十多家，估值在20億元-50億元之間。

商用難點

盡管人形機器人行業(yè)熱度高漲，但仍然面臨著短期內(nèi)難以大規(guī)模商用的行業(yè)難題，中信智庫在報告中指出，阻力主要來自以下四個方面。

首先，機器人“大腦”，即具身智能機器人大模型泛化能力有限，導致當前應用場景受限。

具身智能大模型指通過海量多模態(tài)數(shù)據(jù)（視覺、語言、動作）預訓練，具備環(huán)境感知→任務理解→動作生成能力的通用智能體模型，逐步實現(xiàn)從“單一指令執(zhí)行”到“自主決策演進”的躍遷，其核心是讓機器人像人類一樣“看懂世界，聽懂指令，做出行動”，在工業(yè)、醫(yī)療、家庭服務等場景推動智能化升級。

機器人大模型L1-L5的典型場景

中信智庫認為，機器人大模型大致可以參照自動駕駛的技術發(fā)展，也劃分為L1-L5階段。目前處于L4階段，該階段特點是實現(xiàn)真實交互反饋，代表模型為谷歌DeepMind于今年3月推出的Gemini Robotics，實現(xiàn)了視覺-語言-動作（VLA）三模態(tài)深度融合，具備極強的空間推理。

目前具身智能大模型快速迭代，但仍面臨數(shù)據(jù)集不夠、思考跟不上運動、缺乏生態(tài)等主要痛點，從效果上看，人形機器人在單一任務的泛化能力方面取得較好進展，但是多任務、跨任務的泛化能力仍然相對較弱，影響人形機器人落地應用場景表現(xiàn)。

數(shù)據(jù)是具身智能的“認知基石”，目前通用機器人大模型所需數(shù)據(jù)量極為龐大、且數(shù)據(jù)獲取難度高，導致短期內(nèi)通用機器人難以采集足夠數(shù)量的真機數(shù)據(jù)用于大模型訓練。

與語言大模型可以直接學習大量互聯(lián)網(wǎng)、書籍知識不同，僅靠觀看互聯(lián)網(wǎng)視頻或者人類動作視頻是很難快速提高機器人的運動和規(guī)劃能力。

物理AI仿真系統(tǒng)開發(fā)商松應科技首席執(zhí)行官聶凱旋告訴《財經(jīng)》，人形機器人則需要在真實物理環(huán)境中進行大量交互操作的數(shù)據(jù)來訓練其決策和行動能力，物理世界操作數(shù)據(jù)的短缺限制了人形機器人的發(fā)展。

機器人結構設計仍需優(yōu)化，零部件可靠性、電池續(xù)航等問題亟待解決。

2025年4月，北京舉辦人機共跑半程馬拉松。半馬挑戰(zhàn)機器人綜合性能，是對其關節(jié)結構設計、熱管理、電池續(xù)航、控制算法、通信干擾、軟硬件耦合等方面的綜合性考驗。

比賽途中多數(shù)機器人選手出現(xiàn)運動失衡、摔倒等現(xiàn)象，穩(wěn)定性較差；同時，不少機器人暴露出散熱問題，需不斷噴灑冷卻液進行降溫。這是因為，機器人的高功率電機、密集的電子元件在持續(xù)工作時會產(chǎn)生大量熱量，尤其是在高速持續(xù)運動或重載工況下，熱量積累速度很快。而由于人形機器人設計為仿人結構，其內(nèi)部空間緊湊，熱量難以快速散發(fā)。

人形機器人目前續(xù)航能力有限，大多數(shù)人形機器人續(xù)航能力集中在2小時-5小時，難以滿足家庭服務、工業(yè)協(xié)作等場景的持續(xù)作業(yè)需求，仍有待進一步提升。

目前，人形機器人的供應鏈成本較高，硬件價格仍需進一步下降。由于人形機器人量產(chǎn)產(chǎn)業(yè)規(guī)模有限，相關的零部件需求暫未完全釋放，而部分零部件如精密傳感器、行星滾柱絲杠等由于應用場景有限價格較為昂貴，未來產(chǎn)業(yè)規(guī)模進一步擴大也有賴于供應鏈環(huán)節(jié)的進一步降本。

（本刊記者劉以秦、研究員黃思韻、特約撰稿人顧翎羽對此文亦有貢獻）