
近日,自稱“全球第一款通用AI Agent產品”的Manus一夜之間爆火。
其宣稱性能“吊打”OpenAI同款,邀請碼被炒至天價,甚至能賣到9萬、10萬元一個。
Manus火得突如其來,但不算莫名其妙。
火的原因有兩點:“一是多家造勢,風很大,但實測的人少,神秘感強,疊加“本土團隊”光環,又是一個后來居上的案例;二是大模型的好,大家都見識了,但一直停留在聊天上?,F在急需趁手的聚合式工具,把腦子里的想法變變現。
忽然,說曹操曹操就到,正中下懷。
聚合式工具也沒那么玄妙,相當于“高德打車”吧。
Manus是什么?行內叫智能體(Agent),通俗點可以叫“工具人”。這個工具人就是以大模型為“大腦”,自己“動手”使用工具來完成任務。Manus英文就是“手”的意思。
有代表性的工具人,當屬OpenAI的深度研究(Deep Research)和Anthropic的計算機應用(Computer Use)。以實測結果來看,Manus達不到宣傳片里的效果:幻覺較多,任務基本以失敗告終。
關鍵,是不是“工具人”,要看它是不是真的能自行決定怎么完成任務、挑什么工具,而不是靠編好的代碼。
Manus目前未有任何信息能證明自己是真正的智能體—沒有人為設計的工作流程。因此,只能說它在宣傳里呈現出“智能體”或通用人工智能(AGI)的樣子,并圍繞這一概念做文章。
而Manus也絕非一無是處。作為一款應用,界面簡潔友好;大腦(思考)、手(操作)、交付的層次非常清晰,組合起來也是相對合格的當代“牛馬”,還是能幫你提高一點生產力。
下文將舉例說明Manus如何完成工作任務、優勢和局限以及技術邏輯是什么。省流版:別花好幾萬買什么邀請碼,一個“毛坯房”不值得。
“工具人”絕不能純聊天,不干活兒,專業工具人都是一邊聊一邊干:左面對話框,右面操作臺。Manus和Claude的界面都是如此。
根據“我有一個朋友”的實測,給Manus由淺入深地提了幾個獨立的要求,比如寫小說,給蘋果股價建模,寫一個游戲等等,結果不太樂觀。
整個流程是這樣的:用戶在對話框里發布指令,Manus在操作臺一頓輸出,用戶可以清晰地看到Manus使用工具的過程,并接收它的操作結果。
收到指令后,Manus是這樣使用工具的:首先,建立一個總文件夾寫明“大目標”,再建立多個清單式的子文件夾,將任務分解,最后逐一完成子文件夾的“小目標”。完成小目標時,它可能在瀏覽器一通搜索,也可能寫一段代碼。
也就是說,Manus主要工具就三種,瀏覽器工具(Agent),計算機語言Python和一部分命令行。
其次,利用超文本標記語言HTML來輸出“結果”。
也就是說,Manus用網頁呈現所有的結果。
有人問,它不是做了10頁PPT給我了嗎?這也是Manus“聰明”的地方,其實它沒有PPT工具,為了你的PPT,它用前端工具寫了一大堆頁面,通過命令行把前端頁面打包成一個壓縮包,下載下來是一堆前端網站,每個前端網站就是一頁PPT—雖然甲方很過分,但乙方還是出色地完成了任務。
在具體測試Manus的過程中,有兩個問題明顯暴露。
一是瀏覽器工具的局限。
遇到反爬蟲網站或需要人機驗證的網站,它根本無法讀取數據。比如,你想要在多個購物網站比價一款手機,進不去的網站它只能作罷,最后給出的是在搜索頁標題里找出來的價格的比較??傊?,它給出的結果非常粗糙,根本達不到你想要的結果。
這也是瀏覽器工具的通病。OpenAI給出過統計數據,其瀏覽器Agent在數據集上只能完成58.1%的任務,而人類能完成78.2%,差距是巨大的。
但是,OpenAI的瀏覽器工具能力還是不差的,能幫人訂餐廳,買機票。而Manus的瀏覽器工具只能打開頁面,下滑,極少數時候點進某個網頁。因此,Manus應該沒有訓練自己的瀏覽器Agent,僅能做一些初步的簡單工作。
而且,Manus選擇工具也有局限。它有時非常豪爽地用Next.js寫代碼,這是一個全棧項目,前后端都能用的那種。但是Manus又沒有部署后端的能力,各種報錯之后陷入“深深的思索”。
二是幻覺嚴重。
比如給蘋果公司做財務估值,Manus這次沒有利用瀏覽器搜索,而是寫了一個Python腳本,在腳本里調用“雅虎金融”的接口來讀取公司相關數據。
然而,在實際過程中,它并沒有提供真實數據,而是撰寫了一堆模擬數據—也就是自己編的數據。反查它的操作流程,確實沒有調用過任何API,也沒有任何搜索過程,幻覺是比較嚴重的。
它最后給出的報告,當然也是完全不能用的。
在處理任務時,Manus普遍將大模型和Python腳本混在一起操作,上下文極長,更容易產生錯誤。用戶如果不留心或缺乏分辨能力,也更容易被“蒙騙”。
Manus AI創始人肖弘在接受采訪時,提到了理解智能體的核心:虛擬機。
其實,智能體應該是一個“DeepSeek”+“我”的東西。這里的“我”是執行角色。
在沒有智能體之前,我布置任務,大模型思考目標、分解步驟,“我”來執行并拿到結果。有了智能體之后,我布置任務,智能體直接給我結果。

就像我需要10頁PPT,DeepSeek給我寫好每一頁內容,“我”復制到PPT里。現在,我需要10頁PPT,智能體就給了我10頁PPT。
本來需要我使用電腦(做PPT),現在是大模型在使用我的電腦(做PPT)。
這就是智能體的本質。
如果用的是軟件搭出來的硬件系統,那么這個智能體就是大模型+虛擬機。
如果直接調用現實中的電腦,那么這個智能體就是大模型+計算機。一年前Claude就能拿用戶的電腦做網頁了。
這是因為現在大模型還較難真正接入物理世界,只能在“真假”計算機上下功夫。如果萬物互聯,“大模型+鍋碗瓢盆”可能直接把餐飲業干倒閉了,當然倒閉的肯定也不止一個行業了。這是后話。
智能體的背后,是“模型即產品”的思路。
正如OpenAI的深度研究,Anthropic的計算機應用,都不再套用自家的通用模型,而是根據應用場景,訓練全新的強化模型,這個強化模型本身就是一個好用的產品。反過來看Manus,當然是沒有自家的大模型,也缺乏專門訓練的相關工具,但是聚合的思路和表現形式很成功,也將大模型“純文本工作”—寫代碼、寫文字的優勢,通過網頁交付清晰地展示了出來。
在訓練模型的邏輯上,Manus可能也并沒有實現Claude人、大模型、環境三者即時反饋的簡潔模式,而依然遵循之前人、大模型、任務分解、工具使用、進程演化、目標達成等復雜結構。
在DeepSeek非常成功的今天,發展智能體是順應了形勢的需要、大眾的需求。各家AI公司都希望抓住這個機會來發力。搶占流量也是發力的一部分。
對于普通消費者而言,最重要的還是多觀察,多了解,別急著掏錢。人工智能不會毀滅你的生活,但是焦慮會。