DeepSeek,太火了。DeepSeek背后的人物——公司創始人、“85后”廣東小伙梁文鋒,自然也成為輿論關注焦點。有業內專家估算,中國AI企業DeepSeek的估值可能高達1500億美元,公司創始人梁文鋒的身家有望躋身全球富豪榜前列,甚至可能超越英偉達創始人黃仁勛。在接受媒體采訪時,梁文鋒曾表示,“我們不是有意成為一條鲇魚,只是不小心成了一條鲇魚”。
從湛江少年到震撼硅谷創新者
" 1月20日下午,中共中央政治局常委、國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(征求意見稿)》的意見建議。其中,梁文鋒的出席刷屏科技圈。
" 從一位普通的湛江少年,到震撼硅谷的AI創新者。梁文鋒的故事,是一段關于技術、勇氣和堅持的傳奇。梁文鋒,1985年出生于廣東湛江的一個普通家庭,父親是一名小學老師。自幼,他就是大家眼中的“學霸”,對數字與邏輯的敏感性遠超同齡人。
" 初中時,梁文鋒就喜歡拆裝電腦,并學完了高中的數學課程,甚至學到了大學的微積分。
" 2002年,17歲的梁文鋒以優異成績考入浙江大學電子信息工程專業,成為家族中第一個進入頂尖高校的孩子。當時的電子信息工程是浙江大學的王牌學科。
" 據上海艾麒信息創始人、董事長周朝恩回憶,讀研期間,梁文鋒以實習生身份加入艾麒,后經推薦直接擔任新技術部經理,給予月薪16000元,算是高薪特別聘請。周朝恩稱:“初見梁文鋒時,他戴著一副眼鏡,斯文有禮,身材清瘦,給人一種文靜內斂的印象。入職后,他便全身心投入到人工智能視頻與圖像技術的研究中,常常一整天都呆在辦公室里,專注地鉆研技術難題,甚至半天都不出來一次。”與梁文鋒深入接觸后,周朝恩發現,“他雖不善言辭,但在技術交流中卻能清晰地表達自己的觀點,展現出強大的邏輯思維能力。”
" 梁文鋒和“幻方”的故事始于2008年。那一年,全球金融危機爆發。畢業后的梁文鋒沒有像同齡人一樣進入大廠當碼農,而是一個人跑到成都,蝸居在出租屋里。幾番折騰下來,他決定下場作量化投資,梁文鋒敏銳地察覺到技術和數據或許能打開市場突破口。但這個決定并不容易,畢竟當時量化在國內還是個新事物,很多人并不相信量化可以賺錢。
" 于是,他拉上幾個同學,嘗試著用各種算法模型來預測股市走勢,沒日沒夜地寫代碼、調參數,經常熬夜到凌晨。每當遇到困難時,梁文鋒總會想起“量化投資之父”西蒙斯的一句話:“一定有辦法對價格建模。”股指期貨推出后,他們利用模型預測股指期貨的漲跌,進行高頻交易,交易很快就獲得了豐厚的回報。
" 2010年,滬深300股指期貨推出,量化投資迎來了春天。乘著這股東風,梁文鋒和他的團隊大賺一筆,自營資金超過5億元。2015年,30歲的梁文鋒與徐進正式創辦幻方量化。短短一年內,幻方量化成立了20只產品,迅速成為量化投資領域的佼佼者。
" 2015年12月1日,水木社區轉發了一則招聘啟事,講了一個創業故事:“2008年,L先生帶著8萬元本金,開始了自己獨立的量化交易之路。2015年,經歷過7年熊市牛市大輪回的L先生,以每年超過100%的復合收益率邁入了億元富豪的隊伍。‘幻方’取自于中國古代洛書《九宮圖》,是一種特殊的矩陣,是科學的結晶與吉祥的象征。L先生的理想是有朝一日能夠與世界級的量化交易泰斗——西蒙斯的文藝復興公司相媲美。”
" 隨后幾年,梁文鋒不斷擴大AI算法研究團隊,將人工智能技術深度融入量化策略。2021年8月,幻方量化的資金管理規模一度突破千億元,與九坤投資、明汯投資、靈均投資一起,被業界稱為量化私募領域的“四大天王”。這一年,梁文鋒在金牛獎頒獎典禮上發表演講,指出“量化投資的未來,是用技術讓市場更有效率”。
跨界AI:DeepSeek的橫空出世
" 2023年,38歲的梁文鋒在杭州投資創辦了深度求索(DeepSeek),這是一家專注于AI大模型研發的公司,目標是用低成本、高性能的技術,打破國際巨頭在人工智能領域的壟斷。而后來故事是,DeepSeek在未有任何頂流資本加持下,仍然堅強地活了下來。
" 2024年5月,DeepSeek-V2憑借出色的性能和性價比,引發了一場大模型價格戰,引發國內巨頭紛紛降價;真正爆發點,出現在2024年12月。
" 梁文鋒帶領團隊發布了新一代大模型DeepSeek-V3,并且還公開了由梁文鋒、羅福莉等人撰寫的53頁論文《DeepSeek-V3 Technical Report(技術報告)》。這款模型不僅在數學運算、代碼生成和中文問答等方面表現出色,更令人震驚的是,它的訓練成本僅為557.6萬美元,而OpenAI(開放模型)的GPT訓練成本高達7800萬美元。
" 更有網友調侃,“DeepSeek活成了真OpenAI,而OpenAI活成了close AI(封閉模型)”。在梁文鋒看來,中國要逐步成為創新貢獻者,而不是一直搭便車。早在上大學時,梁文鋒就篤定,AI一定會改變世界。畢業后,他在量化投資上賺了足夠多的錢,這使得他有足夠的資本聽從內心的聲音,去做自己喜歡的事情,而不是首先權衡利弊得失。
" 曾經有業內人士表示,梁文鋒是中國AI界非常罕見的人,他擁有恐怖的學習能力,兼具強大的解決方案和模型研究能力,又能調動資源。在內部員工看來,梁文鋒則完全不像老板,更像一個極客。時至今日,他仍然延續著低調作風,和公司其他研究員一樣,每天看論文、寫代碼,參與小組討論。
" 選人標準更是與主流格格不入。DeepSeek的成功并非偶然,他組建的一支本土年輕程序員團隊,不依賴海歸或高級技術專家。團隊成員大多是應屆畢業生或工作經驗不超過5年的年輕人,大多是獲得過數學競賽一等獎、拿過國際金牌的算法人才。梁文鋒認為,“創新需要擺脫慣性,經驗有時會成為包袱”。
" 在梁文鋒看來,如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那么重要,基礎能力、創造性、熱愛等更重要。
真正的差距在于原創性,不僅僅是時間
" 爆火之下,梁文鋒還需要回答更多的新問題。有媒體嘗試讓DeepSeek作為一名記者,對梁文鋒提一個問題,這是DeepSeek的回答:“DeepSeek宣稱其模型訓練成本僅為行業1/10,但有開發者指出,這可能是通過大幅縮減模型參數規模或依賴幻方早期囤積的廉價算力實現的,而非真正的技術突破。您是否承認這種‘成本優勢’本質是金融資源套利,而非算法創新?”
" 令人驚訝的是,這個由DeepSeek問出的問題,幾乎可以概括如今圍繞著DeepSeek的大部分爭議。正如ChatGPT橫空出世讓OpenAI成為當之無愧的AI頭部企業,英偉達的GPU憑借高性能成為算力基礎讓黃仁勛享盡高光,現在,DeepSeek的R1模型卻只能證明梁文鋒有能力作出一個和OpenAI最新模型相差無幾的模型。
" 當有媒體提問:“為什么DeepSeek 會讓硅谷許多人感到意外?”梁文鋒認為,在美國,每天都有各種創新出現,從這個角度看,我們的突破并不算特別。但他們驚訝的是,一家中國公司不僅僅是跟隨者,而是以創新者的身份加入了他們的競爭。
" 這與大多數中國企業習慣的模式完全不同。“中國AI不可能永遠處在跟隨的位置!”“真正的差距不是一年或兩年,而是原創與模仿之差。”這兩句從梁文鋒口中喊出的話,不僅事關AI產業,也是中國企業在跟隨、模仿了西方幾十年后,不得不面對的突破方向。
(摘自《新民周刊》吳雪)