
近日,埃隆·馬斯克旗下人工智能公司xAI正式發布新一代AI模型Grok3。馬斯克在直播中稱其為“聰明得可怕”,并宣布其能力比前代Grok2“高出一個數量級”,在多項基準測試中超越了OpenAI的GPT-4o和中國DeepSeek的R1模型。
Grok3的開發得益于xAI打造的“巨人”(Colossus)超級計算機,該系統搭載10萬塊英偉達H100GPU,提供2億GPU小時的訓練時長,算力達到Grok2的10倍。據了解,xAI采用三大創新訓練方法:
合成數據集——通過模擬場景生成多樣化數據,解決隱私問題;
自我糾正機制——模型可識別并修正自身錯誤;
強化學習——通過獎懲機制優化決策能力。
在AIME(美國數學邀請賽)和GPQA(一個極其困難的知識數據集,其中問題由生物學、物理學、化學等領域的博士水平的專家設計)等基準測試中,Grok3表現優異,其推理Beta版在復雜科學問題上的準確率顯著領先。
據了解,Grok3并非單一模型,而是一個系列,包括Grok3旗艦版、迷你版、快速版等。其中,旗艦版擅長金融、醫療、法律等專業領域,迷你版即輕量版,響應更快但精度略低;高速版則適合實時任務的快速響應。
功能創新方面,Grok3引入深度檢索(DeepSearch)功能,可快速檢索網絡和社交平臺內容,生成詳細研究報告。例如,在一次演示中,它整合了15條社交平臺X的帖子和32個網站信息來回答問題。此外,其“大頭腦”(BigBrain)模式通過延長思考時間提升回答深度,但目前僅限付費用戶使用。


據悉,Grok3已應用于客服、醫療診斷、金融風控等領域。例如,在醫療中可分析病歷和影像數據輔助診斷;在金融中能實時監測欺詐交易。
面對OpenAI的GPT-5和中國DeepSeek的競爭,馬斯克強調Grok3“優先追求真相”。不過,分析指出,DeepSeek等低成本高效模型正促使全球AI公司重新評估技術路線。
xAI計劃在未來幾個月開源Grok2,并推出Grok3的語音模式和API服務。隨著技術迭代,Grok3或將成為AI領域的重要競爭者,但其能否持續領先仍需觀察。