DeepSeek發布了全世界第二個推理大模型,僅比OpenAI慢四個月,雙方大模型的性能相當,但性價比卻差出二三十倍,這是因為DeepSeek做了杰出的工程創新。但工程創新屬于漸進式創新,不是從0到1的顛覆式創新,有讀者對此表示失望,說至少也是從0.5到1吧?
其實不用失望,因為從0到1和從1到100同等重要,完全沒必要厚此薄彼。舉個例子,托馬斯·薩弗里(Thomas Savery)在詹姆斯·瓦特(James Watt)出生前38年就發明了蒸汽機,但是不好用,一直未能推廣。瓦特對蒸汽機做了重大改進,使蒸汽機得以普及,由此引發了工業革命。你說是薩弗里發明蒸汽機重要呢,還是瓦特改進蒸汽機重要呢?
這篇文章我們接著討論創新規律。一句話總結:好奇心+自由探索,這七個字就是DeepSeek的創新精髓。如果再加三個字,那就是:不差錢。
我先講講DeepSeek的創新力從何而來,再給大家介紹六種代表性的創新思想。
DeepSeek非常低調,對外界而言它是個謎一般的存在,我們能看到的關于它的信息,基本上都來自行業媒體《暗涌》對梁文峰的兩次專訪。
梁文峰1985年出生,2010年從浙江大學信息與通信工程專業碩士畢業。2016年,他成立了一家用人工智能炒股票的基金公司——幻方量化,賺了大錢。2022年11月,OpenAI發布ChatGPT,引發全球性的大模型浪潮。2023年4月,梁文峰宣布專門成立一家叫DeepSeek的公司做大模型,5月,他首次接受《暗涌》專訪。2024年5月,DeepSeek發布V2,震動業界,7月,他第二次接受《暗涌》專訪。
在這兩次專訪中,梁文峰講述了創新的原動力何來,創新型人才有什么特質,以及該怎么管理創新型組織。
他說:創新首先是一個信念問題。為什么硅谷那么有創新精神?首先是敢。過去30多年IT浪潮里,我們基本沒有參與到真正的技術創新里。大部分中國公司習慣follow(追隨),而不是創新。中國AI和美國真正的gap(差距)是原創和模仿。如果這個不改變,中國永遠只能是追隨者。
DeepSeek的使命就是“做研究、做探索”,推動技術前沿的發展,從根本上促進整個生態的成長。
創新不僅是商業驅動,它還需要好奇心和創造的野心。我們做創新,主要是好奇心驅動,對AI能力邊界的好奇。
梁文峰近日告訴新希望集團董事長劉永好,DeepSeek只有160個人。他們都是些什么樣的人呢?
梁文峰說:DeepSeek的招聘標準一直基于熱情和好奇心。我們的團隊成員背景各異,充滿個性和趣味性,他們對研究的渴望遠超對金錢的關注。
DeepSeek沒有什么“難以捉摸的天才”,只是來自頂尖高校的應屆生、博士生(甚至是四五年級的實習生),以及一些有幾年經驗的年輕人。
這160號充滿好奇心和創造欲的年輕人聚集在一起之后,又是怎么工作的呢?
梁文峰說:創新需要盡可能少的干預和管理,讓每個人有自由發揮的空間和試錯機會。創新往往都是自己產生的,不是刻意安排的,更不是教出來的。
DeepSeek完全是自下而上的。我們不預先設定角色,而是自然形成分工。每個人都帶著自己的經驗和想法,不需要被推動。當他們遇到挑戰時,會自發地拉上別人討論。不過,一旦某個想法被證明有潛力,我們就會從上層投入資源,推動它的發展。
DeepSeek的計算資源,團隊成員使用時沒有限制。如果有人有想法,他們可以隨時調用我們的訓練集群,無需審批。此外,由于我們沒有嚴格的層級架構或部門壁壘,只要彼此感興趣,團隊成員可以自由協作。
可以看到,DeepSeek是一家高度扁平化的、自組織的、靠員工內驅力往前走的公司。但如此自由寬松和開放式的管理,不會導致公司散架嗎?
梁文峰說:我們在招人時確保價值觀一致,然后通過企業文化來確保步調一致。我們并沒有一個成文的企業文化,因為所有成文東西,又會阻礙創新。更多時候,是管理者的以身示范,遇到一件事,你如何做決策,會成為一種準則。
在第二次專訪的最后,《暗涌》的記者問了一個非常好的問題:“好奇心驅動的瘋狂可以一直持續下去嗎?”
梁文鋒回答說:“不是所有人都能瘋狂一輩子,但大部分人,在他年輕的那些年,可以完全沒有功利目的,投入地去做一件事。”
我覺得這個回答體現了梁文峰的現實主義。極少有人能一輩子理想主義,但很多人年輕時都是理想主義者,一家公司只要能聚集一批才華橫溢的年輕人,在他們最理想主義的那些年,給他們充分發揮的舞臺,那就一定能創造奇跡。
當然,DeepSeek不差錢也是關鍵因素,但這是創新的必要條件而非充分條件,正因為如此,絕大多數顛覆式創新都是初創公司而非行業巨頭做出來的。
創新是一門學問,自約瑟夫·熊彼特(Joseph Schumpeter)以來,100多年間有過若干很好的創新理論,或者創新思想。我不知道梁文峰有沒有讀過這些東西,但他在DeepSeek的實踐,很多都與這些東西吻合。接下來,我給大家介紹六個相關的創新思想或創新理論。
Small teams could do amazing things, hiring the best people to surround you, to challenge you, they have skills that you don’t have and being confident with that。
小團隊能帶來驚喜。雇傭最好的人,他們有你沒有的技能,讓他們環繞在你周圍,讓他們挑戰你,而你要對他們充滿信心。
谷歌的人工智能團隊有6000人,OpenAI只有600人,DeepSeek才160人,但OpenAI超越了谷歌,DeepSeek有超越OpenAI的跡象。
1)Focus on Users not competition/聚焦用戶而非競爭
2)Fail quickly amp; learn quickly/快速失敗,快速學習
3)Share everything/分享一切
4)Data, not opinions/要數據,不要觀點
5)Let People pursue their dreams/讓員工追尋他們的夢想
谷歌還有個著名的“20%自由時間”制度:員工可以用五分之一的工作時間來探索任何自己感興趣的事情。無用之用,恰成大用,Gmail、Google News、Google AdSense等產品都是這20%自由時間探索出來的成果。
但谷歌的前CEO(首席執行官)埃里克·施密特(Eric Schmidt)去年夏天批評說:谷歌太自由太舒服了,導致公司在AI競賽中被OpenAI超越。施密特雖然后來為此道歉,但這個批評在私下引發廣泛共鳴。
錢穎一2006年-2018年擔任清華大學經管學院院長,之后擔任西湖大學校董會主席。他的這個創造力公式是我看到的對創造力規律的最好總結。
如前所述,好奇心是創造之源,想象力則是硬幣的另一方面。蘋果砸中牛頓的腦袋,激發了他對引力的好奇心,但沒有想象力,他就不會用引力來解釋天體運行。iPod大獲成功后喬布斯好奇為何不能拿它打電話,但沒有想象力,喬布斯就不會堅持去掉物理鍵盤,從而為多點觸控技術統治屏幕掃清障礙,這是iPhone誕生的關鍵一步。
對于創造力,知識也不可或缺。《西游記》是中國最具想象力的小說,它的營養至今滋養著游戲娛樂產業。但吳承恩雖能想象出上天入地的孫悟空,但造不出能把人帶上藍天的飛行器,因為他沒有相關知識——空氣動力學、飛行力學、材料科學……
錢穎一認為中國教育體系側重增長知識,但不鼓勵好奇心和想象力。因此人才適合在既有知識體系內的追趕型任務,不適合無人區的從0到1的創造力任務。我自己的觀察,很多孩子10歲以后就失去了好奇心,變成循規蹈矩的小大人,當然也丟掉了創造力。
可喜的是,從培養梁文峰的浙江大學身上,我們看到了打破教育慣性的希望,在激發創新、容忍失敗、鼓勵創業方面,浙江大學已經開始有斯坦福大學的模樣。
《硅谷百年史(1900-2015)》的兩位作者在結語中總結:
硅谷模式可以用三句話概括:質疑權威、不同凡響、改變世界。特立獨行的人是硅谷故事的主角,硅谷不可能出現在對特立獨行人士不甚友善的地方。
在硅谷,絕大多數飛躍性的技術進步都是由初出茅廬的年輕人創造的,他們有個共同點:離經叛道、敢想敢干,失敗了也沒關系,不敢嘗試才是恥辱。
在硅谷,工作趣味和個人理想壓倒了金錢和地位,于是就有了機會和創造性。
在硅谷,工程師的地位僅次于企業家,他們還經常是公司創辦人或董事會成員,但他們仍然穿著牛仔褲和T恤衫。在歐洲,比起市場營銷和銷售工作,技術工作要低人一等,歐洲把成千上萬工程師變成了庸庸碌碌的官員和西裝革履的銷售員。
這本書有兩位作者,阿倫·拉奧(Arun Rao)和皮埃羅·斯加魯菲(Piero Scaruffi),上述第四段話我相信是斯加魯菲寫的,他是意大利人,大學畢業后移民美國,曾為一家歐洲大公司工作十年。
實際上,《硅谷百年史》的結語令人悲傷。作者寫道:
硅谷原有的精神已所剩無幾,業余愛好者鉆研下一個大事件的機會渺茫,20世紀的特立獨行者已被訓練有素但缺乏想象力的書呆子所取代,公司和員工都變成了機會主義者,理想主義者越來越少。硅谷的壟斷日甚一日,巨無霸公司不僅想把自己的產品推給市場,還試圖把自己的世界觀強加于人。來硅谷的人越來越為了尋求穩定工作和良好福利,而不是挑戰現狀和改變世界。
這些話寫于2016年。
《創新者的窘境》(The Innovator’s Dilemma——Why new technologies cause great firms to fail),書名翻譯成《創新者的兩難》更合適。
這本書出版于1997年,作者克萊頓·克里斯坦森(Clayton Christensen)已于2020年1月去世。他身高2米,曾來北京參加《財經》雜志的活動,我有幸在現場聽過他的演講。
克里斯坦森在書中問道:為什么那么多管理良好、認真傾聽客戶意見、積極投資技術研發的大企業卻失敗了?并且這些失敗案例不僅存在于變化迅速的信息技術行業,也存在于變化不那么迅速的傳統行業——零售、鋼鐵、機械等。
他的答案是:大公司容易被新興企業顛覆,不是因為它們做錯了,而是因為它們做得太對了——它們過于關注當前客戶和利潤,忽視了新興市場的潛力。它們擅長漸進式創新,但面對顛覆式創新卻很笨拙。
他給出的對策是:設立獨立團隊或子公司探索新興市場,而非試圖讓主流業務部門主導顛覆式創新。
《創新者的兩難》對業界產生了深刻影響,顛覆式創新(Disruptive Innovation)、漸進式創新(Sustaining Innovation)這兩個概念已在業界膾炙人口。很多公司也都按書中的建議,成立了獨立的創新單元。但迄今為止,還沒有哪家公司能夠突破書中描述的創新兩難。比如今天我們討論的人工智能行業,主流公司都在大模型的方向上一路狂奔,他們不可能成為大模型的顛覆者,只可能被局外人所顛覆。
美國是當今世界第一科學技術強國,這很大程度上要歸功于羅斯福總統(Franklin D Roosevelt)的科技顧問范內瓦·布什(Vannevar Bush)。
1944年11月,二戰勝利在望,羅斯福致信布什,提出四個問題:
1)如何讓為戰爭開發的科學知識激發新事業,大幅改善國民福祉?
2)如何更好地讓科學戰勝疾病?
3)公共研究和私人研究的角色和關系,政府如何促進這兩種研究?
4)能否提出一個發現和發展美國青年科學人才的有效規劃?
羅斯福在信中說:“我們面前是各類思想的新前沿,如果我們以應對這場戰爭所用的同樣眼光、勇氣和干勁去開拓,我們就能創造更為充分更加豐富的就業機會和生活。”
1945年7月,羅斯福已去世三個月,布什向繼任總統杜魯門提交了上述問題的答案,這份報告后來被命名為《科學:無盡的前沿》。這是美國歷史上第一份國家層面的科學政策,它塑造了美國科學技術今天的面貌。布什在報告中提出了三個重要原則,歷屆美國總統均遵循這些原則,直到特朗普的第二個任期。
原則一:必須重視并支持基礎研究。
一個依靠別人來獲得基礎科學知識的國家,無論其機械技能如何,其工業進步都將步履緩慢,在世界貿易中的競爭力也會非常弱。我們不能再指望已被二戰蹂躪的歐洲作為基礎知識的來源,過去我們致力于應用國外發現的基礎知識,未來我們必須更加專注于自己發現基礎知識,因為未來的科學應用比以往任何時候都更依賴于基礎知識。
原則二:必須保障研究自由。
研究自由必須得到保障,廣泛的科學進步源于學者的思想自由及研究自由,他們理應在好奇心的驅使下探索未知,自主選擇研究方向。
原則三:必須同時重視社會科學和人文科學。
以犧牲社會科學、人文科學和其他對國民福祉至關重要的研究為代價來發展自然科學和醫學研究,這是愚蠢的想法。我們不能將整個國家最杰出的人才以極端的比例吸收到科學和技術中,因為這樣的規劃會損害整個國家,實際上也會損害科學,科學不能依靠自身單獨存在。
諾貝爾科學獎(物理學獎、化學獎、生理和醫學獎)自1901年起頒發。1901年-1945年,歐洲獲得80%以上的諾貝爾科學獎,僅德英法三國,獲獎比例就超過50%,這期間美國獲獎比例不到15%。在《科學:無盡的前沿》后,1946年-2024年,美國拿走了近半數諾貝爾科學獎。
(作者為《財經》執行主編;編輯:何剛)