2025年開年,國內深度求索(DeepSeek)公司推出大語言模型DeepSeek R1引發全球轟動。這款開源模型在有限算力條件下,復現出OpenAI最先進的閉源o1模型的能力,讓社會各界感受到AI富有“靈性”的深度思考能力,這是邁向通用人工智能的重要一步。
從技術角度看,DeepSeek實現了算法創新驅動的效率革命。DeepSeek團隊在缺乏參考的情況下,成功復現媲美 OpenAI o1 模型的深度推理能力,而且應用程序接口(API)價格僅為后者的 1/30;此前DeepSeek V3 模型通過模型架構和基礎軟硬件的深度集成優化,實現與 GPT-4o 相當模型能力的同時,單次訓練成本僅為同水平模型的 1/10。這些均證明國內團隊已具備頂尖的算法創新能力,可以讓大模型的訓練和推理更加高效。
此外,開源生態與普惠AI成為中國技術突圍的戰略支點。如果說2023年Meta開源大模型LLaMA為全球開發者帶來ChatGPT水平的智能,那么DeepSeek R1則為大家帶來OpenAI o1水平的智能。DeepSeek不僅公開模型并制定寬松的使用協議,還發布詳盡的技術報告介紹實現方案,這種開源精神帶來的“普惠沖擊波”,打破了OpenAI嘗試通過閉源建立的技術壁壘。開源生態將成為算法創新的加速器,推動全球開發者共同探索高效化路徑。中國若能持續發揮開源優勢,有望在AI普惠化進程中占據先機。
但值得注意的是,盡管DeepSeek R1模型效果媲美世界最先進的OpenAI o1并在計算效率上擁有巨大優勢,但是OpenAI隨后發布了o3模型,顯著增強了在STEM(科學、技術、工程和數學)方面的高階推理能力,這說明我國在大模型技術方面總體仍處于追趕狀態。盡管中美 AI 差距不斷縮小,但需要警惕諸如“中國AI已超越美國”“DeepSeek羞辱OpenAI”等極端樂觀的說法?!?br>