DeepSeek是什么？

2025-06-16 00:00:00芭芭拉·帕茲

海外星云 2025年3期

2025年新年伊始，人工智能領域迎來了一位突破性的新“玩家”：由中國深度求索公司開發的人工智能助手——DeepSeek。得益于社交媒體的傳播，DeepSeek最近在網絡上引發了巨大轟動。

1月初，DeepSeek發布了其人工智能模型DeepSeek-R1，直接對標OpenAI的ChatGPTo1等領先模型。其獨特之處在于能以極低的成本開發高性能人工智能模型。

它擁有用戶友好的設計，能協助完成各種任務，包括回答問題、生成內容等，功能類似ChatGPT或谷歌的Gemini。但與通常提供免費版本卻對高性能人工智能引擎收費的美國人工智能巨頭不同，DeepSeek對普通用戶完全免費使用。

近日，它還快速推出了人工智能圖像生成器Janus-Pro，旨在挑戰美國的Dall-E3、StableDiffusion和Leonardo等模型。

那么DeepSeek有何不同？它是如何運作的？又為何獲得如此多的關注？

深度求索公司由對沖基金經理梁文峰于2023年創立，總部位于中國杭州，專注于開發開源大語言模型。由于是開源平臺，開發者可根據需求進行定制。這個在1月之前還鮮為人知的人工智能助手，其發布為人工智能創新注入了樂觀情緒，挑戰了依賴芯片、數據中心和能源巨額投資的美國科技巨頭的統治地位。

DeepSeek作為對話式人工智能大語言模型，能理解并回應自然語言輸入。你可以向它提問、請求項目協助、研究支持、起草郵件，還能通過深度思考（DeepThink）解決推理問題。

DeepSeek提供兩個大語言模型：DeepSeek-V3和DeepThink-R1。前者類似標準版ChatGPT，可快速響應、生成文本、改寫郵件和總結文檔；后者對標需要訂閱的OpenAIChatGPTo1模型，但兩者均免費開放。

用戶可通過網頁瀏覽器及手機應用訪問DeepSeek。截至2025年1月下旬，DeepSeek應用已成為美國等全球數十個國家蘋果和谷歌應用商店下載量最高的免費應用。

該平臺采用先進機器學習模型處理信息并生成響應，能勝任多樣化任務。與其他人工智能工具不同的是，DeepThink-R1模型會在給出詳細答復前，展示其完整的“思考過程”及解題耗時情況。

DeepSeek因性能比肩甚至超越頂級人工智能模型而登上新聞頭條。其R1模型在多項基準測試中優于OpenAI的o1-mini，人工智能基準測試和分析的獨立平臺ArtificialAnalysis研究顯示，其綜合質量超過谷歌、Meta和Anthropic的模型。

除了隨模型升級而動態變化的基準測試結果，其驚人的低成本更引發關注。據悉，DeepSeek-R1開發預算僅550萬美元，遠低于OpenAIGPT-4傳聞的1億美元。這種成本效益源于采用非最先進的英偉達H800芯片，以及優化資源卻不犧牲性能的創新訓練方法。

DeepSeek的爆火在股市引發劇烈震蕩。英偉達市值近日經歷暴跌、反彈、再暴跌的過山車行情。甲骨文、微軟、Alphabet（谷歌母公司）和荷蘭芯片設備商阿斯麥等科技巨頭也遭遇沖擊。

DeepSeek的快速崛起顛覆了全球人工智能市場，挑戰了“先進人工智能開發必須巨額投入”的傳統認知。硅谷著名風投家馬克·安德森將其比作人工智能領域的“斯普特尼克時刻”（指當一個組織意識到自己在關鍵領域落后于競爭對手時，所面臨的巨大挑戰和壓力以及由此產生的緊迫感和行動需求）。