
最近,沒有人不在討論人工智能(AI)。
剛開學,清華大學大模型與生成式AI課程的教室已經爆滿,最后一排后方的空地站滿了學生。不遠處的中關村科技城在夜晚燈火通明,全國54%的大模型企業聚集于此,等待有志者加入。而在金融街或CBD走進一家咖啡館或餐廳,總有人正在聊有關AI的投資機會。
1月20日,開源模型DeepSeek-R1在一夜之間家喻戶曉,加速了AI的全民市場教育。
但它所掀起的產業變量遠不止于此。“變量是全方位的,包括模型、算力、芯片、數據、應用,所以需要盡快調整工作重心,優化現有的產業政策。”北京市經信局數字產業處副處長張金瑞告訴《中國新聞周刊》。
“最近我們發現,國產芯片廠商開始被越來越多的企業選擇。盡管做不了模型訓練,但用于完成數據量不大、不復雜的推理任務都沒有問題。”他表示,這也將影響北京市未來的算力布局,算力的消耗方式需要從“粗放式”堆芯片轉變為“精細化”地使用算力。算力需求將長期看漲,今年預計會翻倍,但高品質、高質量、集群式的算力在北京仍然很稀缺。
張金瑞坦言,數據方面也面臨挑戰:DeepSeek帶來了使用高質量數據的趨勢,以前主力推動的大規模的行業數據匯集工作,下一步要如何調整?還有中小企業的部署潮。“突然之間,很多中小企業發現已經來到了‘必須擁抱AI’的路口。”話語間隙,就有同事來傳遞了一個行政執法機構的需求,對方想用DeepSeek但缺乏知識,希望能推薦老師過去授課。“我們經常一對一對接企業和機構的需求,以后可能要搭建交流平臺。”
北京有著最直觀的AI密度。據《北京人工智能產業白皮書(2024)》,北京市內約有2200家AI企業,2024年創造了3000億元的AI核心產業規模。尤其在海淀區,據公開信息,去年注冊AI企業已超1300家。

目前共有94款大模型在北京備案,占全國約四成。北京深度求索人工智能基礎技術研究有限公司的大模型DeepseekChat出現在去年5月15日的市委網信辦備案名單中,同一批還有來自小米、騰訊等公司的18個大模型。
在你追我趕的AI軍備競賽中,沒人能預測下一次DeepSeek式的創新成果會如何出現。擁有最密集人才、教育、企業、創投資源的北京,也要在新一輪的爆發中繼續迎接挑戰。
劉知遠卷入AI浪潮已經十余年:12年前在清華大學計算機科學與技術系博士后出站后留校任教至今,5年前開始推進中文大模型方向的研發,兩年半前聯合創立面壁智能,辦公地就在清華大學東南門附近。
同事形容他在海淀的工作節奏“密不透風”,這也是很多北京AI從業者的寫照。在五道口的一座大廈里,《中國新聞周刊》記者見到了劉知遠。言語之間,畫面好像回到了故事的起點——中國大模型的初啼,就發生在這里。
彼時,距離ChatGPT-3出現還有2年,距離DeepSeek的轟動還有7年,只有一群對技術創新敏感的人,決定一起做一些事。2018年11月,北京智源人工智能研究院(BAAI)成立,是依托清華、北大、中國科學院、百度、字節、小米等人工智能先進單位共建成立的非營利性新型研發機構。
一個月前,由谷歌語言小組冠名的一篇論文引起了全球AI領域的轟動。論文提出了知名的預訓練語言模型BERT,引發了NLP(自然語言處理)領域的變革。
微軟亞洲研究院創始人之一、金山前CEO張宏江擔任了智源研究院的首屆理事長。他曾提到,中國可能也需要一家新型的科研機構,獨立于高校、企業和政府,追求更系統的大目標。“國內大學里面研究者雖多,但坦率說都是一個個小單元,很難集中力量干大事。企業更多是聚焦自己目前的業務,很難在基礎前沿方向上做足夠堅定的探索。”
2019年4月,智源研究院正式啟動實施“智源學者計劃”,宣布將支持100位AI領域的優秀專家學者,研究院就在距離清華東南門不到三百米的地方。例如,在智能信息檢索與挖掘方向,中國人民大學教授文繼榮任首席科學家,清華大學教授唐杰等任智源學者;在NLP方向,清華大學教授孫茂松任首席科學家,副教授劉知遠等任智源青年科學家。
智源研究院前院長黃鐵軍曾闡述“智源模式”的人才機制,其特點包括鼓勵自由探索,堅持求真務實、不論資排輩,以“代表作”和“小同行評價”遴選人才等。“智源研究院建立了層層選拔千里馬的良性機制,把北京最頂尖的AI學者都聚在一起,天時地利人和,埋下了中國大模型創新的第一顆火種。”劉知遠感嘆。
里程碑事件發生在2020年6月:OpenAI發布GPT-3,稱使用了一萬張顯卡。Scaling Law(規模法則)顯現的同時,AI進入“大模型”時代。
“當時我們幾乎絕望了,2020年前發的很多模型在國際上都有引用和關注,但遠不能與GPT-3相比。我們以前最多只在一臺V100的8張卡上做實驗。如果不馬上跟進,差距就會越來越大。”劉知遠回憶道。
建立了人才機制的智源研究院迅速響應,在10月搭建“百人大模型計劃”,唐杰任項目總負責人。據雷鋒網報道,當時,研究院向時任北京市領導報告了計劃,市領導決定大力支持。自此,北京市全力推進中國大模型的研發。據上述報道,智源計劃用既有的科研經費購買300P算力,北京市決定從專項經費再撥款購買700P,總共達成1000P。
為項目起統一代號的時候,大家想到“五道口”的諧音,于是取名“悟道”。
計劃從四個方向展開,劉知遠負責研發其中的中文大模型。2020年8月左右,他向智源立項申請,很快獲批了10臺浪潮信息的V100,共80張卡支持訓練,成本在百萬元級別。“這很有魄力,扁平化的流程讓我們能加速追趕。一個月后機器就到位了,又花了二三十天,團隊訓練出了全球第一個中文開源大模型CPM,并在2020年底發布。”
2021年3月,多個方向的成果共同推進后,智源研究院正式發布了“悟道1.0”大模型。后來,模型訓練的規模越來越大,唐杰主導的“悟道2.0”成為中國第一個萬億大模型(參數規模達1.75萬億)。彼時,市場的聲音里有贊譽也有爭議,有人認為太過“燒錢”,未來發展規劃不清晰。頂住壓力的項目團隊,堅持完成了中國在大模型領域的拓荒。
“悟道”項目催生了中國和北京的第一批大模型創業團隊,智源研究院也被稱為AI界的“黃埔軍校”。2019年6月,唐杰及清華大學計算機系知識工程(KEG)實驗室同門張鵬帶領團隊實驗室孵化出智譜,從此將公司方向瞄向大模型;2022年8月,劉知遠牽頭創立面壁智能,團隊成員來自清華大學NLP實驗室;2023年3月,楊植麟二度創業,創立月之暗面并推出大模型產品Kimi。
出來創業后,劉知遠的心態發生了很大改變。“尤其感受到了市場需求的變化,技術創新從一件慢慢探索的事情,變成了一個使命必達的事情。這需要一個大團隊系統協作,我們要建一艘大船,齊頭并進。”
當創新的火種延續,越來越多的AI創業者從實驗室走出來。
2023年2月,背靠清華大學智能產業研究院(AIR)的清智孵化器裝修完成。北京有著超百家企業孵化器,但清智的高校背景,使它最為接近頂尖高校的科研成果。
走進中關村的搜狐網絡大廈,右側扶梯上樓,一個1100平方米的辦公空間映入眼簾,裝修風格像大學圖書館和大廠辦公區的融合。玻璃窗上繪有不同學科的標志性圖案、公式或模型,透過這層裝飾,能看到許多年輕人正在不同的會議室討論。
“我們想創造一個輕松、活潑和創新的環境。”清智資本及孵化器創始合伙人張煜告訴《中國新聞周刊》,這個辦公空間可以同時容納20—30個團隊,基本是占滿的狀態,目前這里有來自清華、北大、人大、港科大、南洋理工大學、斯坦福大學等高校背景和許多產業界的創業團隊。入駐這里后,初創團隊每月只需交100元日常管理費;小規模的算力也免費提供,用于訓練或推理。
近幾年,中關村誕生了不少新的創業神話,許多AI獨角獸也曾在這里留下足跡,例如百川智能、生數科技等。走在辦公區,安靜的氛圍里,緊張感和秩序感交織。每處工位和會議室都貼著初創企業的logo。不超過一年半,團隊壯大后就會搬離這里,也可能在未來某天一舉成名。
過去2年,張煜早上8點上班,晚上10點下班是常態。為了把更多空間留給創業團隊使用,他平時就坐在會議室辦公,桌上放一臺筆記本電腦。

清智資本也在這里辦公,在2022年4月正式注冊完成。作為牽頭人的張煜,曾在微軟公司工作超過15年,積累了研發管理和科技孵化器的經驗;所組建的技術評審和產業轉化的專家團隊,也大多有清華系和微軟系的雙重背景。清華大學的人工智能體系有三駕馬車,AIR負責產研結合,人工智能研究院、人工智能國際治理研究院則對應基礎研究和國際治理。
BP(商業計劃書)近乎潮水般地涌向郵箱,張煜表示,組織高校路演可能一次收到8—10個項目;除了AIR的授權項目,來自其他教授和專家推薦的項目也逐漸變多。“去年,保守估計,我們看了超1000份BP,直接聊的創業團隊約200個。”
AI領域是北京最火熱的創投賽道。據睿獸分析數據,2024年,北京在AI領域共發生投融資事件205起,金額達242.4億元。
其中不乏國資的身影。以面壁智能去年12月完成的一輪數億元融資為例,領投方之一有中關村科學城基金,跟投方之一有北京市人工智能產業投資基金。“在接觸的過程中,我們能感受到有非常相信長期主義、科技創新的團隊,是高度專業化的。”劉知遠說。
至于北京的市場化機構,據IT桔子數據,去年投資AI最多的是奇績創壇,共34次;其次是訊飛創投和Z基金;經緯創投、達晨財智等均有10次;大模型公司智譜則有9次。
張煜也在去年出手將近10次,種子輪和天使輪各一半。清智的篩選標準很明確:看重團隊的創新能力、科研基礎,也關注項目落地性,投后1—2年就必須有明確的落地場景和應用。
AI行業發展極快,團隊必須共同決策,出手非常謹慎。團隊會定期開技術委員會議和投決會,雙會通過的項目才能被投資。對于看重的項目,投資進度非常快,從立項到打款的投資周期平均為22天。其中,最快的一次天使投資只用了12天。
投資除了速度還要有耐心。一家創業團隊提出的想法是做具身智能的大腦,在投資團隊看來非常有價值。但當時的市場大多停留在小腦和本體的方向。“曾經一路覺得走不下去,非常艱難。去年下半年,團隊終于得到市場認可,拿到了2億元融資。”這離不開專家學者對科技含量的判斷力。“不過,AI領域很艱深,不是所有項目都能看得懂,我們也錯過了一些優質項目。”張煜坦言。
學院派出身的學生往往技術水平很高,但對產業現狀缺乏了解,張煜的團隊會幫助他們先找到小的應用場景。張煜表示,一定要給予創業者足夠的包容和鼓勵,這也是清華系的風格。“即便是不成熟的想法,也會和他討論各種可能性,而不是直接pass(放棄)。”
清智創投和孵化器有個不成文的原則:來自清華的項目不超過一半。“AI的創新生態絕對不能封閉,一定要在更廣闊的交流中尋找創新的機會。”張煜說。

在DeepSeek的開源影響下,AI應用將在今年加速鋪開,在北京尤其如此。
“開源吸引了大量開發者參與二次開發和垂直領域優化。”張金瑞說,許多有一定模型調優能力的應用企業向他們表示可以“拿來即用”。近期,18家芯片廠商和3大運營商,以及微信、WPS、百度等國民級應用均已接入DeepSeek,標志著大模型在應用端的快速規模化。
張煜預計,相對近兩年學院派創業的火熱,他估計產業派創業者也會顯著增加。
擁抱AI的浪潮開始了,大模型公司也感受到水溫的變化。“去年更多是接到咨詢,意向合作方沒下定決心‘是否要干’;今年我們聽到了更多‘肯定要干’或‘必須得干’,對方希望得到具體落地方案。”百川智能聯合創始人、總裁茹立云告訴《中國新聞周刊》,當前,許多地方的醫院或衛生健康委已經將AI的應用視作一號位工程,甚至要求在日報中更新AI的進展。
2023年4月,搜狗創始人王小川找到他的清華計算機系校友、搜狗前COO茹立云成立了百川智能。公司成立之初就選定醫療作為通用大模型的核心突破方向。
談成合作并不容易,人們對新技術的看法不一,用茹立云的話講,需要“雙方愿景一致,不謀而合”。去年8月,百川智能確認了首個重要醫療合作伙伴——國家兒童醫學中心北京兒童醫院。
北京兒童醫院擁有中國兒科界僅有的三位院士,高級職稱的醫護人員600余人,不僅醫療實力是國內“天花板”,也是最忙的兒童醫院。據2023年數據,其年均門診量約300萬人次,外地患兒比例達45%左右,10年前這一比重高達70%。
也正因此,院長倪鑫可能是最了解兒科醫療資源有多緊缺的人。王小川曾在接受媒體采訪時評價他“很有魄力”,當時就提出“要造100萬兒科醫生”。
這句話的意思是,中國兒科醫生數量當前僅有20.58萬人,希望基于大模型的AI醫生能補充相當于100萬人類醫生的勞動力。“我們判斷,訓練大模型最適合的就是來自專家的數據,而醫生是其中最稀缺、知識密度最高、數據最有價值的群體。”茹立云表示,北京在醫療方面的學科優勢,能和公司的技術積累互相促進。
AI醫生的終極形態是成熟的人形機器人加上AI版的醫生大腦,目前以小程序、端側App為主要形態。醫生或患者與之對話,得到關于病情的分析和處理建議。
2月13日,AI兒科醫生在北京兒童醫院正式“上崗”:多位來自不同科室的專家為一名顱底腫物伴隨抽動癥狀的患兒共同會診,討論病情與診治方案;同時,工程師將患兒的主要訴求和病歷資料輸入模型后,得出相應建議,兩者交叉比對,結果被認定高度吻合。
這背后是漫長的訓練和磨合過程。據了解,去年11月,百川的AI兒科醫生追平了互聯網問診平臺在線醫生76元的水平;今年1月,經北京兒童醫院的評測,達到主治水平,又經過多科室的頂級專家評測,才認為達到臨床應用條件。
茹立云表示,除了要跟隨大模型領域每天更新的論文與方法,融合與提高模型技術,還要通過大量實驗去驗證各個方法的實際效果,其中的細節工作并不遜于訓練通用大模型。
“這是一個交叉學科工程。醫療相關的數據處理是難點,例如強化慢思考的數據如何合成,一般的工程師也很難看懂,需要雙方共建。”他說。因此,百川智能招募了許多有醫學和工程雙重背景的人才。
豐厚的醫療資源,以及領跑創新的職責,似乎不允許北京跑慢一步。海淀區衛生健康委是首個同AI公司合作的地方衛生健康委,計劃在3月底實現海淀區居民AI全科醫生的覆蓋,提供初步判斷、分導診斷的服務。
這將為全國性的難題做先行試驗:全科或家庭醫生的社會普及度不高,服務能力和治病水平有限,大多數居民沒有分導診斷的意識,導致醫院資源分配不均。
在AI應用的各大賽道中,醫療是發展最快的領域之一,目前主要歸為AI影像/手術、AI醫療服務、AI輔助診斷、AI制藥四大方向。
孵化了1—2年的初創項目已經嶄露頭角。以張煜投過的項目為例,紫荊智康建立了AI醫院系統,虛擬醫生的診斷準確性已堪比人類的專家醫生;億航生物主要做外泌體技術的研發,與醫院合作完成阿爾茨海默病、帕金森病早期血液診斷等研究;華深智藥研究大分子制藥算法,以蛋白質3D結構預測算法,用于新藥研發場景。
去年7月,《北京市推動“人工智能+”行動計劃(2024—2025年)》印發實施,列出了包括醫療在內的5個重點領域和10個行業細分領域。“值得期待的是,未來能有企業拿到核心數據,做出應用級的水平和效果,大幅降低成本和提高效率。”張金瑞說。
以AI全科醫生為例,茹立云表示,評判效果的顯著性有許多要件,如簽約率達40%以上、居民滿意度明顯提升、社區醫生承接量提高等,最終促進有限高水平醫療資源的釋放。
劉知遠認為AI應用的爆發是階段性的。“今年可能是深度思考的爆發,好比原子彈爆炸的鏈式反應,未來還會有更大的爆發。”
自DeepSeek-R1發布,大模型競爭再度“白熱化”。其免費策略倒逼美國科技巨頭調整商業模式,重新考慮開源。例如,OpenAI已宣布GPT-4.5/5將陸續發布,免費版ChatGPT將在標準智能設置下無限制使用GPT-5對話。
國內的技術競賽也還在繼續。以月之暗面和DeepSeek的多次“撞車”為例,1月20日,兩家公司同日發布推理模型Kimi K1.5和DeepSeek-R1;2月18日,又同日發布有關注意力機制的論文,分別提出MoBA(混合塊注意力)和NSA(原生稀疏注意力)。
DeepSeek提前宣布,2月24日起的一周連續5天每天開源1個代碼庫。2月23日,月之暗面發布了自家的第一個開源模型。
競爭正不可阻擋地加劇,但其追求卻是一致的。劉知遠具體解釋,自AI學科開始成為一個賦能全人類的普惠技術那一刻起,就沿著兩條主旋律發展:
一是讓模型能力越來越強,不斷點亮新的技能點。兩年前是讓模型學會利用知識回答問題,現在是讓模型學會像人一樣深度思考,未來1—3年,可能是讓模型像人一樣自主學習、互相合作、具備非常強的創造力等。二是讓模型變得便宜,訓練和推理的成本都能變得更低,直到讓所有人都用得起。
“從這個意義上看,當模型的技能點還沒點完,就已經假設技術固定了下來,一定是錯誤的認知。”他強調。
這也是DeepSeek出現的重要意義。前兩年,大量的聲音開始反思中國為何遲遲沒有出現OpenAI在GPT-3時代的顛覆式成功,中國大模型的商業化是否存在問題。去年4月,字節跳動的豆包上線首周用戶量即破千萬,“大模型=大廠”的認知再度被強化。
行業普遍規律顯示,初創企業往往難以承受大模型訓練的高昂成本。2024年,北京市經信局曾通過算力券獎勵政策,幫助小米、智譜、零一萬物等60家企業降低算力租賃成本。總計補貼近6000萬元。

DeepSeek打破了這一固有認知。不過,其模式被認為“難以復制”,相比于其他AI明星企業,它在外界的曝光度不高,創始人梁文鋒的職業背景獨特,公司也沒有對外融資。
不過,從實驗室到創業公司,AI創業者們身上似乎都有著相似的精神,即對技術創新的極致追求。下一個DeepSeek式的創新成果,有可能降臨在其他玩家身上嗎?
受訪者普遍表示,下一個技術突破點完全值得期待,無論是創業企業還是大廠,都可能成為下一個破局者。“大模型的技術還沒有收斂,未來是百花齊放的。除了算力、數據等資源保障,人才密度是最核心的要素,這也是北京最大的優勢。”張金瑞說。
劉知遠判斷,無論2年前還是現在,整個AGI(通用人工智能)的馬拉松仍然還在前半段甚至1/4的階段。“要看誰持續的原始創新能力足夠強,源源不斷地尋找新路。”他也認為,盡管不一定如DeepSeek般引起全球轟動,但接下來一定會出現越來越多中國團隊通過科技創新達到的世界級成果。
北京的AI密度,更有可能為技術理想者們對AGI的信念提供更長遠的支撐。
“機器人與生命健康的結合,是我們所看到AGI時代的價值點。”茹立云說,盡管現在機器人的能力還沒到非常成熟的階段,但預計3—5年后就會有新的突破。梁文鋒也曾表示,當前階段是技術創新的爆發期,語言大模型是通往AGI的必經之路,堅信AGI會在這一代人中實現。
北京的一大批創業者們,圍繞AI正找回久違的“理想主義”。在面壁智能去年的年會上,劉知遠提到了“一直游到海水變藍”的故事:作家余華小時候家住在海邊,他好奇為什么課本說海水是藍色的,但家鄉的海水都是黃色的,于是開始往外游,直到海水變藍。
劉知遠認為這太像大家追求AGI的過程,“其實就是一種好奇心,一種信念感”。“我們現在所看到的AI的海水是黃色的、渾濁的,有各種各樣不同的聲音。我們要找到屬于自己的方向,一直游,當然過程中會有很多挑戰,也有很多美景。”
“我們要一直游到海水變藍的那一刻,直到AGI的出現。”他說。