百川智能：百舸爭流，勇立潮頭

2024-07-13 04:48:42沙敏

中關村 2024年6期

關鍵詞：智能模型

沙敏

王小川率領的百川智能，按部就班，有條不紊地，沿著他提出的“理想上慢一步，落地上快三步”目標在努力。

2024年3月，福布斯中國篩選出51家新晉獨角獸企業名單，成立僅一年的百川人工智能科技公司（以下簡稱“百川智能”）上榜。4月23日，在中關村啟迪科技大廈，記者來到百川智能，聽百川人講述著百川智能的創立、發展與未來。

技術極客，屢創奇跡

回首中國互聯網歷史，1994年被稱為Internet的元年。

清華大學的錢天白教授，協助中科院網絡信息中心，完成了中國國家頂級域名.CN服務器的設置，從此中國進入互聯網賽道。網易、搜狐、新浪相繼在納斯達克掛牌上市，成為當時中國三大門戶網站。中國互聯網江湖上，人才輩出，各領風騷；風云際會，屢創奇跡。如果說張朝陽是中國互聯網的教父，阿里的馬云，則以電子商務占據半壁江山；馬化騰創立騰訊后，1999年，騰訊開發的即時通信工具QQ軟件上線，成為國內運用次數最多的通信軟件。2011年微信應用軟件上線，如今在海內外，已擁有1000多億的用戶。

年少有為的王小川，是位技術極客，擅長的是技術創新。在當今計算機應用與技術創新飛速發展的時代，商業模式創新與計算機技術應用的創新，改變著百姓的生活。美團創辦者王興，創辦美團App，送餐變得快捷，外賣巨頭誕生；字節跳動的張一鳴，創辦今日頭條與抖音，成為國民級的運用。技術創新的背后，同樣也要有精湛業務背景的領導人，率領一支精干高效的團隊。

搜狗與清華有密不可分的歷史淵源，公司CEO王小川，更是清華大學計算機系的高材生，從清華本科畢業后，又讀完碩士、博士。

搜狗的CEO（首席執行官）、CMO（首席營銷官）、CTO（首席技術官）等高管均為清華校友。2003年開始研發搜狗搜索時，王小川最初的團隊，均來自清華大學奧賽集訓隊，12名兼職學生中，已誕生過技術領軍級人物。

搜狗的創始人王小川，當他還在清華大學讀大三時，就在ChinaRen做兼職，負責站內搜索。1999年，21歲的他率領團隊僅用兩個月，就高效研發出ChinaRen新聞發布系統，搜狗躍升為中國第四大網站。張朝陽邀請王小川加入搜狐，成為愛將，兩年后晉升副總裁。

2004年8月3日，他與團隊正式推出擁有獨立知識產權的搜索引擎搜狗，由于有馬云支持，促成了搜狗與分拆與獨立。搜狗創立了中國第一大輸入法和搜索引擎，擁有獨立的知識產權。

2015年，王小川獲得北京市榮模，北京市科學技術一等獎。2017年11月9日，搜狗在美國紐約交易所掛牌上市，成為中國赴美上市第一股，此時的搜狗市值已破50億。2019年，騰訊的馬化騰入股搜狗，雙方成為合作伙伴。

搜狗新的契機，發生在2021年。因為騰訊的商業版圖中缺少這塊業務，騰訊總裁馬化騰，以20億美元全資收購搜狗，搜狗CEO王小川宣布卸任，4月10日，他宣布成立百川智能。與搜狗總編輯孫彥新等人一起，投身大模型，立志為生命健康與醫學逐夢，創立中國版OpenAI。

百川智能的團隊認為，大模型將語言變成了數學模型，語言是數學模型、參數模型和權重模型。語言是思維與邏輯、知識與文化和交流的載體，當語言變成數學模型后，它代表的知識與經驗與思維與邏輯，都能夠用數學模型進行推演。王小川在學習大量醫學知識的基礎上，基于語言模型的思考，決定出來做大模型。初建的團隊，由搜狗的核心團隊組成，王小川以他任院長的清華計算機系天工智能研究院為人才研究庫，開啟了大模型生命健康與科學的創業之路。

百川匯海，開源雙贏

“2023年是大模型元年開始，人類從信息時代走向智能時代，走入新的快車道”。王小川在演講時的話語擲地有聲！

百川智能，就誕生在2023年充滿希望和機遇的春天。

4月10日，王小川宣布百川智能成立時，發表了演講：“生活在二十一世紀是如此幸運，波瀾壯闊的互聯網革命還沒有謝幕，通用人工智能時代又呼嘯而來。大模型不僅將重塑現有行業，更將創造前所未有的價值和機遇”。

王小川是一個有很深厚家國情懷的人，是完美的理想主義者。

當時國內的大量高校、企業和事業單位，使用的都是美國的大模型，給核心技術增量自控帶來了很大風險。中國應該有自己的開源模型！在他的率領下，公司員工守望相助，攻堅克難，高效率地完成任務。

4月底，算力迅速到位；6月15日，公司就發布第一款免費商用的大模型Baichuan7B并開源；第一款大模型一經推出，便受到業內矚目。7月11日，第二款Baichuan13B發布；8月8日，發布Baichuan53B閉源大語言模型，其寫作、文本創作能力達到行業最高水平。

9月6日，百川7B升級到2.0版本，發布Baichuan2-7B、Baichuan2-13B兩款免費可商用的開源模型，并且公開了Baichuan2-7B的技術報告，詳細介紹了Baichuan2-7B訓練的全過程。2.0版本系列模型在評估任務中，大幅領先全球范圍內最強的LLaMA2，引領開源社區走向中文開源大模型時代。Baichuan?2系列模型，在開源社區的下載量已經超過了700萬次。

中國科學院院士、清華大學人工智能研究院名譽院長張鈸，在主題演講中提到“目前我國已經推出很多從幾十億到幾百億不同規模的大模型，這些大模型主要集中在垂直領域的應用上，我很支持開源大模型助力學術研究”。他對百川智能推出的用于基礎研究的、開源大模型研究成果給予高度評價。

2024年1月29日，百川智能發布超千億參數的大語言模型Baichuan?3，根據中文大模型基準測評2024年4月報告，測評選取了國內外有代表性的32個大模型，通過SuperCLUE測評結果發現，

Baichuan?3表現不俗，拔得頭籌。在多個權威通用能力評測中，Baichuan?3均展現了出色能力，在中文任務上更是超越了GPT—4，是中文醫療任務表現最佳的大模型。

除此之外，百川智能助力知名高校的專項科研，為大模型研究項目提供資金扶持。2023年9月，百川智能與中國計算機學會（CCF）、北京英博數科科技有限公司一起，聯合創立了“CCF—百川—英博大模型基金”，支持國內外高校及科研院所的青年學者，為大模型開展學術研究，提供資金支持。該基金累計已收到985院校及新加坡知名大學的100余份申請，已經完成資助清華大學、北京大學、上海交通大學、復旦大學、中國人民大學、新加坡國立大學等高校的15個申請項目。

2024年3月17日，百川智能與北京大學共同簽署了“北大—百川通用人式智能聯合實驗室”共建協議，雙方攜手積極探索大模型的可解釋性、安全性、穩定性等層面的創新，解決企業在大模型對齊領域的技術需求，為大模型的基礎科學研究提供支持。

盡管百川智能成立僅一年，但保持著業內最快的模型更新速度，從以月度為單位，到以半月為單位，堅持開源與閉源結合，相繼推出11款大模型，涵蓋了開源、閉源、學術科研、國產算力等多個維度。公司未來會發布Baichuan?4，未來可期。

關愛健康，關愛生命

王小川率領的百川智能，按部就班，有條不紊地沿著他提出的“理想上慢一步，落地上快三步”目標在努力。王小川正朝著生命科學與醫療領域方向探索與前行。

在業內，醫療領域被稱為“大語言模型皇冠上的明珠”。為了摘取皇冠上的明珠，從國外到國內，人工智能醫學研究團隊不懈地努力，攀登這座科學的珠穆朗瑪峰。

在國外，2023年9月21日，谷歌蛋白質結構預測模型獲2023年拉斯克獎。拉斯克獎，是在醫學領域頂級獎項拉斯克獎，這一獎項也被譽為“諾貝爾獎的風向標”。將2023年基礎醫學研究獎，頒給了研究醫學大模型的兩位博士，因他們創造了一項能夠預測蛋白質三維結構的革命性技術——AlphaFold。頒獎辭中寫道：通過放飛想象力和才華，Hassadbis?Jumper和他們的團隊，完成了讓科學家困惑半個世紀的任務，開啟了研究和操縱蛋白質的新時代。

在國內，王小川提出：“理想上慢一步，落地上快三步”，最新發布的超千億參數的最新版本大模型Baichuan?3，表明百川智能的醫療知識水平有所突破。Baichuan3的醫療數據集Token數超千億，醫療能力逼近GPT—4。

對標世界先進的人工智能公司OpenAI，王小川頗有感觸。在談起與美國OpenAI交流時的體會時，他感嘆道：“他們現在正在設計一個把1000萬顆GPU連在一起去做模型的這樣一種技術，這樣一種想法像登月一樣。”王小川說落地快三步，是要實現應用上的盡快落地，與OpenAI不計成本的追求技術上的天花板相比，我們要做的事是發揮自己的優勢。

未來的百川智能有三個方向，一是AI顧問。大模型本身是造人，有知識有經驗的顧問；二是要做AI醫生。三是做太虛幻境。百川的產品在5月份起，將會逐步推向市場，大模型的超級底座和超級應用會接受用戶的檢驗。