
制造業作為經濟發展的核心驅動力,在美國、德國和歐盟等國家和地區受到高度重視。2019年德國公布《國家工業戰略2030》,2020年歐盟將“工業4.0”戰略升級為“工業5.0”,2020年的新冠疫情沖擊造成全球供應鏈出現嚴重中斷,全球產業鏈分工邏輯從效率優先向效率與安全并重轉變,進一步推動制造業本土化。
制造業在中國經濟崛起中也發揮了重要作用。為發揮產業鏈供應鏈安全問題和制造業在保障國家安全等方面的關鍵作用,國家“十四五”規劃就提出了“保持制造業比重基本穩定”的重要目標,二十大報告進一步指出“堅持把發展經濟的著力點放在實體經濟上,推進新型工業化,加快建設制造強國”。
傳統自動化技術賦能制造業。回顧近代人類文明迅速發展的歷程,就是科學技術不斷為制造業賦能、提高制造業自動化程度的歷史,新興的科學技術不斷應用于制造業中,以促進制造業的發展,進而推動經濟的快速增長。最重要的通用目的技術有四種,分別驅動了四次工業革命,它們是蒸汽機、電力、內燃機和數字技術。這些傳統自動化技術顯著提高了制造業生產效率,但面對高度復雜和動態變化的生產要求和生產環境仍然存在諸多局限。
具身智能(Embodied AI)為制造業企業工作流與產業格局帶來全新的發展契機。具身智能與基于傳統規則的人工智能不同,其通過與人類及物理環境的交互,實現感知與認知,從而在面對復雜環境和動態變化時,能及時自主決策并執行任務。具體而言,在生產線各環節中,“具身智能工人”與“具身智能設備” 不僅能進行高度復雜的生產作業,還能處理任務執行中各類信息進行迭代學習,優化自身行為。這使得具身智能具有高度生產靈活性,隨時響應,優化流程,實現增效降本,提高產品質量及市場匹配度。

具身智能將引起制造業生產函數、人機關系、制造范式、產業間關系的深度變革。具身智能制造本身與具身智能應用于傳統制造業,將以技術改變企業管理、組織架構及產業結構。本文旨在通過理論分析與實踐評估,初步探討具身智能重塑制造業企業工作流與產生格局的邏輯,為其深入發展提供戰略意見和理論支持。本文主要回答以下幾個核心問題:探討具身智能的核心技術及具身智能在制造業中的應用場景有哪些?如何用管理學理論解釋具身智能重塑制造業企業發展格局?具身智能如何重塑制造業企業工作流及變革制造業發展格局?具身智能發展有哪些難點與挑戰?加快具身智能發展應提出哪些對策建議?
具身智能是指能夠與環境(人類環境與物理環境)交互,通過交互感知、學習、分析,掌握一項新技能,且進一步生成新知識的一類人工智能。早在1950年圖靈便指出人工智能實現路徑或可有兩條,一是教會機器人下象棋(抽象計算),二是賦予機器感覺器官,教會其學習并聽懂語言。它們分別代表了兩類人工智能“學習”方式,前一種人工智能實現依靠“給予智能任務”,以“專家系統”與人工神經網絡為代表。第二種則為“賦予智能能力”,認為智能行為應在行為主體與環境的交互過程中產生,倡導智能應是是具身化和情境化的具身智能。
近期本體硬件、智能體感知與訓練方式等在智能傳感器、人形機器人、大模型算法、多模態技術、仿真及動態捕捉等各技術領域實現突破,使具身智能成為發展通用人工智能最具前景的技術路線。具身智能技術實現包含兩個部分(見圖1):一是在物理或者虛擬世界進行交互和任務執行的本體;二是置于本體之上的智能核心,即智能體,用于實現感知、理解、決策和控制等核心工作。具身智能實現需要集成本體對環境感知、與環境交互和執行操作的能力;以及智能體理解與分析、自主決策與控制精細動作、迭代學習的能力。本體硬件上,以各類傳感器為核心部件形成基礎交互系統,人形機器人提供機械身體實現基本運動控制,可作為具身智能其中一種行為載體(見圖2)。智能體中,預訓練大模型實現突破,成為機器從文本、圖像、視頻、音頻等多模態信息中學習的基礎。研究人員致力于結合大語言模型與多模態技術,為具身智能提供處理視覺信號、語音與自然語言信號的交互感知能力。比如具身視覺語言模型Google PaLM-E、NvidiaVIMA、Google Deepmind RT-X,算法處理通過大模型整體調度+小模型精調方式使機器實現具體任務。控制與執行訓練目前存在虛擬仿真與動態捕捉兩類方法,虛擬仿真類似于強化學習和無監督學習,通過在模擬器中不斷嘗試最終找到策略,目前該方法對訓練機器習得用小腦執行的“本能”任務非常有效,訓練情境有英偉達元宇宙仿真場景平臺Omniverse等。而對于現實世界復雜問題,目前采取動態捕捉+遙操作方法模仿人類的“控制”行為,實體環境中Tesla Optimus和騰訊 Robotics X等人形機器人均采用該種方式訓練(見圖3)。

具身智能是技術進步的產物,其可影響企業資源配置、組織管理與戰略制定,重塑制造業企業工作流。
隨著大數據、云計算、人工智能等技術發展,新興技術群——智能技術群逐漸形成。制造-服務融合成為新的生產組織形式,開放、協同、共享的創新生態系統得以構建,制造業企業的數字化轉型以及平臺企業的發展為其中最典型的表現形式。新興技術沖擊制造業企業管理模式,引發了學者對于“智能化管理”理論的思考。部分學者提出人工智能技術難以實現管理智能化,原因在于基于大數據訓練的深度學習技術并無自主糾偏能力,難以真正替代人類從事腦力勞動。這為具身智能變革現有制造業企業工作流的管理理論提供新的思路。
具身智能的引入可能會對現有的組織結構、工作流程與企業文化產生深遠的影響,其核心是全面自動化與人機協同。一是具身智能參與制造業企業管理的核心是交互式管理,其中包括人機交互與機器間交互。二是具身智能作為生產設備參與生產,生產與管理能夠自學習、自適應、自迭代,實現生產決策的因素窮盡與生產環節的持續優化。三是具身智能與人類協同的組織結構轉型,具身智能滲透進入人力資源管理、財務管理等管理決策中。組織架構轉變為,人類專注于具身智能技術研發與應用,具身智能則管理生產。
具身智能的不斷發展,其在制造業中的應用逐漸深入,帶來了對工作流的全面重塑。這種重塑不僅體現在生產效率的提升,還涉及生產函數的變革、人機關系的重構以及制造范式的轉型。
具身智能重塑生產函數
具身智能成為數據生產要素的“礦山”與“開礦工具”,將會改變生產要素中勞動力要素結構,重塑生產函數。

一是具身智能成為挖掘數據要素的 “開礦工具”和數據“礦山”。數據作為新型生產要素快速融入生產、分配、流通、消費和社會服務管理等各個環節,具有無限性、非排他性、邊際效益遞增性等特性。具身智能在交互中習得,有自挖掘、自遍歷、自學習、自生成、自迭代的特點,通過交互感知“開采”多模態信息數據,并不斷迭代學習生成新信息數據。比如,具身智能通過安裝在生產設備上的傳感器,能夠實時監測設備的運行狀態和生產線的操作情況,并通過自學習機制優化生產參數,在生產過程中實時獲取、處理和分析多模態數據。這種能力使得具身智能不僅生成新數據,成為數據“礦山”,而具身智能也能充當“開礦工具”,不斷挖掘出新的數據價值,突破“數據瓶頸”。比如西門子公司推出的的開放式物聯網(IoT)操作系統“MindSphere”支持各來源實時操作數據的分析。
二是具身智能替代人力勞動,變革生產要素中勞動力要素結構。具身智能通過捕捉與學習實現控制與執行,替代如加工組裝與搜索匹配等通過動作模仿和邏輯推理而完成的生產工作,改變勞動力生產要素結構。比如特斯拉“Optimus”機器人在生產線上能夠代替人工完成復雜的裝配任務,不僅提高了生產效率,還減少了因人工失誤而導致的次品率。部分工作崗位被具身智能系統替代。
具身智能變革人機關系
傳統制造業中,機器往往作為人類工人的輔助工具,主要承擔重復性和危險性的任務。具身智能的出現使得機器從“工具”轉變為“合作伙伴”,開啟了人機合作的新紀元。
一是具身智能實現人機交互智能化,交互習得并參與生產及決策。目前制造業生命周期多個環節中應用分析式人工智能作為生產管理輔助工具,比如Back2CAD CADGPT輔助研發設計與規劃;商湯AIDC、創新奇智AInno-15B工業大模型輔助生產制造;用友yongpt輔助經營管理;國光電器智能音箱Vifa ChatMini輔助產品服務優化等。亞馬遜倉庫機器人能夠實現通過語音與工人交流并根據指令調整貨品位置。
二是從輔助生產走向合作生產。人類設計、生產并管理具身智能,具身智能替代人類實現其他產品設計和制造,人機合作成為制造活動主體。具身智能融合云、AI與物理世界,具有理解力、交互力、規劃和決策能力及可調本體形態,不同形態智能本體設置于生產各環節,通過具身智能設備之間、具身智能設備與工作人員之間連接與交互,實現原料到產品、廠內設備和廠外設備、設備和人員,生產、銷售、配貨和售后全路徑貫通,具身智能自主安排生產計劃、優化制造流程、自檢生產設備、監督生產過程,并反饋信息不斷迭代,完成生產制造全流程。比如在現有的人機合作生產的寶馬汽車的裝配線上,已經實現制造過程中具身智能與人類工人的部分協作。工人主要負責復雜決策和靈活操作,而具身智能則tHm9PYay+pVCOghnp2LURg==負責重復性和高精度的任務。通過這種人機合作模式,寶馬顯著提高了生產效率,并縮短了新車型的生產周期。
具身智能變革制造范式
具身智能的應用推動了制造業從傳統的有限柔性生產向全面柔性生產的轉型,進而實現了定制化規模生產和產用融合的制造范式。
一是具身智能參與其他產品生產,實現全面柔性生產。傳統制造業中的柔性生產通常是有限的,即在一定范圍內允許生產線對產品規格進行調整。然而,具身智能的引入使得全面柔性生產成為可能。具身智能能夠實現生產端與用戶端無阻連接,其感知并發掘消費者需求并設計與提供相應產品,由用戶需求驅動產品開發和制造,實現工廠內外互聯的創成式設計(Generative Design),以需求指導生產,實現全面產用融合、供需協同與定制化規模生產。并且,具身智能通過實時感知市場需求的變化,并根據需求調整生產計劃和工藝流程。比如GE的“Predix”對生產各環節的實時監控,并通過數據分析預測潛在故障風險,提前布局維護。
二是負責生產具身智能的新型制造業部門能夠實現自我迭代。包括具身智能本體制造部門以及具身智能生產設備制造部門。比如具身智能本體制造部門中,有智能傳感器制造部門,其中涉及傳感器芯片、傳感器及其儀表的設計、生產及整機制造;也有具身智能機器人制造部門,涉及基礎電機、減速器、控制器到靈巧手等制造。交互感知基礎是各形態具身智能本體,具身智能本體生產集群涉及材料、機械工程、生物醫學等學科,其本身也可迭代學習并設計制造更適配的具身智能本體設備。比如西門子公司推出能夠實現產品、工廠、系統和機器的互聯的開放式物聯網(IoT)操作系統“MindSphere”。
具身智能的發展不僅影響了制造業企業內部的工作流,還對整個制造業的產業格局產生了深遠影響。其通過變革產業間關系、促進制造業與服務業的融合、重構全球供應鏈以及引領產業標準化,重塑制造業發展格局。
具身智能的未來是制造業與服務業全面融合
具身智能變革制造業與服務業關系。一是具身智能與制造業融合的未來是制造業與服務業全面融合。具身智能參與產品制造與服務提供,意味著工業經濟時代大規模生產下專業化分工的產業邊界逐漸模糊。制造業與服務業全面融合意味著以制造業部門占GDP比重作為衡量制造業發展水平的衡量標準失效。制造業仍發揮著引擎作用,制造業發展水平評價體系應向適配智能制造發展趨勢演進,比如以具身智能使用強度作為制造業發展水平衡量標準之一。二是具身智能發展過程中變革制造-服務相對關系。作為通用目的技術,具身智能全行業賦能,導致因服務業相對生產率增速緩慢,所引起服務業占比擴大、經濟增速減緩的“鮑莫爾成本病(Baumol’s disease)”得以克服。具身智能賦能服務業,使其生產率爆發式增長,并向勞動力節約型行業轉型。制造-服務相對價格變化會造成各行業相對規模變化,制造業與服務業全要素生產率增長率差值縮小,服務業相對價格上漲速度減緩,進一步使得服務業比重相對上升速度與制造業比重相對下降速度均減緩,保持制造業比重相對穩定。
具身智能重構全球產業鏈
一是強化全球產業鏈韌性。實時數據采集與分析、智能決策支持等功能,使得供應鏈管理更加高效和精準。具身智能的應用增強了全球供應鏈的彈性和敏捷性,使得企業能夠更快速地響應市場需求和突發事件。比如亞馬遜全球供應鏈網絡,實現了高度自動化和智能化的庫存管理。特斯拉優化了其供應鏈管理系統使其能迅速調整生產計劃,以應對新冠疫情期間物流中斷和零件短缺問題。
二是具身智能推動產業鏈垂直整合及區域協調。具身智能廣泛應用使得制造業企業內部、上下游企業之間、同類企業之間信息互通,制造企業能夠好地控制生產過程,根據供需調整生產計劃,縮短產品上市周期,響應市場需求,靈活處理庫存。對全球供應市場的信息處理使得制造業企業能夠高效管理區域化生產和供應鏈,形成區域智能制造集群,并構成全球化的產業生態體系。
三是具身智能推動產業標準化。產業標準化與具身智能的廣泛運用是互相推動的。標準化推動具身智能技術普及,使得國家和地區快速適應這一新興技術。而具身智能本身可自我學習,能夠助力應用該技術的相關部門的產業標準化。
隨著大模型泛化能力進一步提升,各種具身方法和智能體將不斷涌現。然而實現具身智能會面臨數據、算法、工程技術、場景、復雜軟硬件、算力、量產等諸多等待解決的問題和挑戰。
技術的演進與突破
目前的人工智能技術,已經在虛擬空間中實現生成式人工智能,具身智能與之不同之處在于:一是具有物理世界的執行力,二是具有可成長空間,三是具有對事物、行為的主觀能動性。經由具身智能走向通用人工智能的技術演進之路,核心是如何使人工智能“像人一樣”擁有本能及智慧。
然而目前仍存在以下多種技術問題。一是包括傳感器技術、芯片設計、人形機器人等在內的關鍵硬件技術仍無法實現具身智能的“感受”與 “感知”。具身智能的傳感器需要通過物理反應、化學反應,最后傳到智能體“大腦”,才能實現真正的“感受”,這是具身智能能夠開始“學習”的先決條件,也是獲取信息的重要來源。那么技術上如何實現傳感器把聽覺、視覺、觸覺等多模態的信息壓縮成一個個信息單元,傳輸到“大腦”中呢?機器本體設計,涉及基礎電機、減速器、控制器等關鍵零部件,目前仍未形成模塊化的生產流程,硬件和材料能否實現規模化生產,從而降低成本呢?芯片設計上,具身智能與動態環境交互,需要具備對實時大數據流處理、高并發、穩定性與能效的復雜需求,何種計算框架才能達到呢?
二是構建一個高效暢通、高度通用的軟件生態充滿挑戰。具身智能系統融合了環境感知、物理交互和任務執行等多方面的功能,涉及智能體到本體的相互連接、傳輸的各類組件,這意味著其任務必然是具身智能“軟件集”所驅動,而目前包含多模態感知、多任務適應、實時反應、自主學習迭代能力的軟件系統尚未形成。
三是需要結合合成數據及真實世界數據突破“數據瓶頸”。為使具身智能習得復雜知識、完成復雜任務,可以以互聯網數據訓練大模型、以仿真數據訓練精細動作、以標注數據習得具體任務。進一步地,從與真實世界的交互中,學習并迭代出新數據。而當前面臨數據采集困難、數據模擬成本高的問題。
應用場景的拓展與深化
一是新技術創新需要解決如何創造商業價值的問題。具身智能技術如何實現應用的落地、成果的轉化?如何把成本降低?如何確保收益的可持續性?如何解決在復雜不可控場景的“泛化”問題?
二是如何實現多種應用場景協同發力。目前布局具身智能研究及生產的有以特斯拉、比亞迪等為代表的車企,車企具有長期工業制造的經驗,集成了成本控制、生產供應鏈、后端銷售等商業能力;谷歌、亞馬遜、BAT等互聯網公司能以最快的速度觸達和感知市場需求;波士頓動力、Figure 01等機器人公司除了產品本體制造外之外,也擁有強大的數據智能能力。三類企業該如何互補合作,實現產投協同?
全球競爭與合作
具身智能作為能影響全人類發展的尖端技術,在全球技術研發的過程中往往會面臨競爭與合作的問題。一是我國發展具身智能面臨極其復雜的國際局勢。目前我國高端芯片采購使用受阻,算力競爭力發展受到一定抑制。美國升級對華芯片及芯片制造工具出口禁令,國產芯片產量大但存在未突破關鍵技術。通用大模型在理論研究、技術創新以及應用實踐方面,仍有較大進步空間,且存在研發、訓練、使用成本過高問題。二是面對如此復雜的國際環境,如何在競爭中取得產業標準化與技術規范的主導地位,以鞏固本國在具身智能領域的市場地位?
倫理與社會挑戰
具身智能技術進步與社會價值存在一定沖突。一是隱私與安全問題,具身智能在采集和處理個人數據時,會對隱私安全保護帶來挑戰;二是具身智能替代制造業中低技能勞動,存在大規模失業及社會不穩定的風險;三是技術倫理和責任分配問題,當具身智能可以交互、學習、思考、決策,無人監督時自主決策過程中的倫理問題也日漸凸顯,意味著可能存在錯誤決策的責任分配問題,責任分配也將成為重要的法律和倫理問題。
發展具身智能,需要在控制風險的基礎上尋求技術突破,因此提出以下加快具身智能發展對策建議。
以應用落地塑造技術演進方向
具身智能技術演進具有應用和技術雙輪驅動的特征,中國以完備工業體系與豐富應用落地場景為根基,從終端應用回溯激發技術創新,用業界應用落地需求塑造科技演進方向。美國擁有領先的人工智能芯片、算法、機器學習等核心技術,而中國優勢在于完備工業體系下豐富應用落地場景。因此,政策應引導行業應用先行,由應用端數據回環,來帶動具身智能技術突破、實用性增強及技術迭代。一是挖掘先進制造業中具身智能應用場景先行先試。挖掘裝備制造、儀器儀表、集成電路和生物醫藥等先進制造業生產中瓶頸問題和可智能化生產流程,優先探索工業大腦、機器人協助制造、機器視覺工業檢測、設備互聯管理等智能場景。二是以具身智能自學習實現應用領域拓展。制造業場景中部署具身智能集合高質量垂域數據,用于訓練工業大模型進而讓智能體自我進化。三是政府治理和民生領域需求拉動具身智能發展。使用具身智能輔助政府決策、政府治理及民生保障,助力決策前瞻化、科學化,社會治理精準化,公共服務高效化。使用具身智能輔助潛在風險研判和防范,維護人民利益和國家安全。同時以保障和改善民生需求拉動具身智能發展,創造智慧工作方式與生活方式。
以技術創新增強解決方案實現能力
具身智能實現大規模商用落地,需要多學科互補式技術創新,以平臺級通用解決方案加特定領域創新實現應用泛化。一是增強多學科互補的技術創新能力,為不同具身智能應用場景適配解決方案。材料、機械工程、數字產業、軟件工程、自然語言處理、物理學(仿真)、生物醫學等學科持續進行技術突破。二是技術創新需要平衡具身智能產業鏈中關鍵制造環節的可靠性、成本和通用能力,使技術演進方向滿足大規模商用落地需求。構建產學聯動科研團隊,搭建制造業企業與具身智能科研部門互聯平臺,以規模效益控制通用具身智能產品應用成本。引導制造業企業和具身智能研發團隊公開應用場景需求、技術創新成果和軟硬件供需情況,助力具身智能實現具體應用。比如鼓勵具有優秀運動能力和操作能力的平臺級通用具身機器人產品生產,在此基礎上,鼓勵具身機器人在特定領域不同任務的設計和應用,嘗試解決泛化和成功率問題。三是引導搭建具身智能科研實驗室。通過虛擬和現實結合的具身智能交互環境,幫助具身智能不斷進化實現技術演進。
以龍頭企業帶動具身智能生態構建
塑造頭部企業研發通用、中小企業研發應用、政企聯合建設基礎設施的協同市場格局,以具身智能標準化體系打通技術關鍵節點。一是搭建由頭部企業帶動、多產業部門聯合的標準化具身智能生態系統,有助于實現具身智能技術研發共創與技術創新涌現。具身智能產業發展具有規模效應,頭部企業穩定資本投入、完備商業化計劃、完善組織人才架構成為具身智能產業發展的關鍵。鼓勵大企業 “頭雁”先行,主導通用具身智能大模型以及多個領域垂直大模型研究,領跑行業技術迭代。通過標準化打通具身智能產業中芯片和硬件、基礎服務和算法框架、技術層以及應用層等各技術關鍵節點。二是鼓勵人工智能龍頭企業推出具身智能基礎設施產品與解決方案,支持人工智能企業與政府聯合建設具身智能基礎設施。加強集成算力、MaaS(模型即服務)、智能網絡連接設施和感知基礎設施等具身智能基礎設施建設。促使算力資源、數據服務和云服務向普惠化、廣泛化、標準化方向發展。結合軟件層面優化設計,使得支撐具身大模型訓練的算力資源在集群硬件層面得以提升,實現以云方式提供智能服務。推進泛在智能網絡連接設施與物聯數通新型感知基礎設施建設,實現人、機、物全面感知和泛在連接。

以法律監管和社會保障完善社會支持體系
完善算法與數據監管實現“價值對齊”,社會保障對沖具身智能就業沖擊。一是立法加強算法的安全治理,規范具身智能遵從人類價值。目前具身智能難以“自然習得”表征以及抽象信息,也缺乏理解并學習世界結構與運行規律等“常識”的能力。監管應促進創新和依法治理相結合,規避復雜算法和黑箱機制所引發的錯誤信息、算法歧視、隱私泄露、虛假信息泛濫等科技倫理問題。具身智能數據管理需要統籌好國家發展和安全問題。二是以社會保障對沖 “具身智能換人”問題。具身智能應用會替代部分勞動者崗位,政策應引導具身智能對重復性勞動、危險性工作的主動替代;其他諸如數據輸入和處理、客戶服務和支持、翻譯任務和報告撰寫以及內容生成等工作分梯次分階段替代,政府層面需加強社會保障制度,幫助居民再就業,做好兜底工作。三是處理好技術倫理與責任分配問題。