沙敏
王小川率領的百川智能,按部就班,有條不紊地,沿著他提出的“理想上慢一步,落地上快三步”目標在努力。
2024年3月,福布斯中國篩選出51家新晉獨角獸企業名單,成立僅一年的百川人工智能科技公司(以下簡稱“百川智能”)上榜。4月23日,在中關村啟迪科技大廈,記者來到百川智能,聽百川人講述著百川智能的創立、發展與未來。
技術極客,屢創奇跡
回首中國互聯網歷史,1994年被稱為Internet的元年。
清華大學的錢天白教授,協助中科院網絡信息中心,完成了中國國家頂級域名.CN服務器的設置,從此中國進入互聯網賽道。網易、搜狐、新浪相繼在納斯達克掛牌上市,成為當時中國三大門戶網站。中國互聯網江湖上,人才輩出,各領風騷;風云際會,屢創奇跡。如果說張朝陽是中國互聯網的教父,阿里的馬云,則以電子商務占據半壁江山;馬化騰創立騰訊后,1999年,騰訊開發的即時通信工具QQ軟件上線,成為國內運用次數最多的通信軟件。2011年微信應用軟件上線,如今在海內外,已擁有1000多億的用戶。
年少有為的王小川,是位技術極客,擅長的是技術創新。在當今計算機應用與技術創新飛速發展的時代,商業模式創新與計算機技術應用的創新,改變著百姓的生活。美團創辦者王興,創辦美團App,送餐變得快捷,外賣巨頭誕生;字節跳動的張一鳴,創辦今日頭條與抖音,成為國民級的運用。技術創新的背后,同樣也要有精湛業務背景的領導人,率領一支精干高效的團隊。
搜狗與清華有密不可分的歷史淵源,公司CEO王小川,更是清華大學計算機系的高材生,從清華本科畢業后,又讀完碩士、博士。
搜狗的CEO(首席執行官)、CMO(首席營銷官)、CTO(首席技術官)等高管均為清華校友。2003年開始研發搜狗搜索時,王小川最初的團隊,均來自清華大學奧賽集訓隊,12名兼職學生中,已誕生過技術領軍級人物。
搜狗的創始人王小川,當他還在清華大學讀大三時,就在ChinaRen做兼職,負責站內搜索。1999年,21歲的他率領團隊僅用兩個月,就高效研發出ChinaRen新聞發布系統,搜狗躍升為中國第四大網站。張朝陽邀請王小川加入搜狐,成為愛將,兩年后晉升副總裁。
2004年8月3日,他與團隊正式推出擁有獨立知識產權的搜索引擎搜狗,由于有馬云支持,促成了搜狗與分拆與獨立。搜狗創立了中國第一大輸入法和搜索引擎,擁有獨立的知識產權。
2015年,王小川獲得北京市榮模,北京市科學技術一等獎。2017年11月9日,搜狗在美國紐約交易所掛牌上市,成為中國赴美上市第一股,此時的搜狗市值已破50億。2019年,騰訊的馬化騰入股搜狗,雙方成為合作伙伴。
搜狗新的契機,發生在2021年。因為騰訊的商業版圖中缺少這塊業務,騰訊總裁馬化騰,以20億美元全資收購搜狗,搜狗CEO王小川宣布卸任,4月10日,他宣布成立百川智能。與搜狗總編輯孫彥新等人一起,投身大模型,立志為生命健康與醫學逐夢,創立中國版OpenAI。
百川智能的團隊認為,大模型將語言變成了數學模型,語言是數學模型、參數模型和權重模型。語言是思維與邏輯、知識與文化和交流的載體,當語言變成數學模型后,它代表的知識與經驗與思維與邏輯,都能夠用數學模型進行推演。王小川在學習大量醫學知識的基礎上,基于語言模型的思考,決定出來做大模型。初建的團隊,由搜狗的核心團隊組成,王小川以他任院長的清華計算機系天工智能研究院為人才研究庫,開啟了大模型生命健康與科學的創業之路。
百川匯海,開源雙贏
“2023年是大模型元年開始,人類從信息時代走向智能時代,走入新的快車道”。王小川在演講時的話語擲地有聲!
百川智能,就誕生在2023年充滿希望和機遇的春天。
4月10日,王小川宣布百川智能成立時,發表了演講:“生活在二十一世紀是如此幸運,波瀾壯闊的互聯網革命還沒有謝幕,通用人工智能時代又呼嘯而來。大模型不僅將重塑現有行業,更將創造前所未有的價值和機遇”。
王小川是一個有很深厚家國情懷的人,是完美的理想主義者。
當時國內的大量高校、企業和事業單位,使用的都是美國的大模型,給核心技術增量自控帶來了很大風險。中國應該有自己的開源模型!在他的率領下,公司員工守望相助,攻堅克難,高效率地完成任務。
4月底,算力迅速到位;6月15日,公司就發布第一款免費商用的大模型Baichuan7B并開源;第一款大模型一經推出,便受到業內矚目。7月11日,第二款Baichuan13B發布;8月8日,發布Baichuan53B閉源大語言模型,其寫作、文本創作能力達到行業最高水平。
9月6日,百川7B升級到2.0版本,發布Baichuan2-7B、Baichuan2-13B兩款免費可商用的開源模型,并且公開了Baichuan2-7B的技術報告,詳細介紹了Baichuan2-7B訓練的全過程。2.0版本系列模型在評估任務中,大幅領先全球范圍內最強的LLaMA2,引領開源社區走向中文開源大模型時代。Baichuan?2系列模型,在開源社區的下載量已經超過了700萬次。
中國科學院院士、清華大學人工智能研究院名譽院長張鈸,在主題演講中提到“目前我國已經推出很多從幾十億到幾百億不同規模的大模型,這些大模型主要集中在垂直領域的應用上,我很支持開源大模型助力學術研究”。他對百川智能推出的用于基礎研究的、開源大模型研究成果給予高度評價。
2024年1月29日,百川智能發布超千億參數的大語言模型Baichuan?3,根據中文大模型基準測評2024年4月報告,測評選取了國內外有代表性的32個大模型,通過SuperCLUE測評結果發現,
Baichuan?3表現不俗,拔得頭籌。在多個權威通用能力評測中,Baichuan?3均展現了出色能力,在中文任務上更是超越了GPT—4,是中文醫療任務表現最佳的大模型。
除此之外,百川智能助力知名高校的專項科研,為大模型研究項目提供資金扶持。2023年9月,百川智能與中國計算機學會(CCF)、北京英博數科科技有限公司一起,聯合創立了“CCF—百川—英博大模型基金”,支持國內外高校及科研院所的青年學者,為大模型開展學術研究,提供資金支持。該基金累計已收到985院校及新加坡知名大學的100余份申請,已經完成資助清華大學、北京大學、上海交通大學、復旦大學、中國人民大學、新加坡國立大學等高校的15個申請項目。
2024年3月17日,百川智能與北京大學共同簽署了“北大—百川通用人式智能聯合實驗室”共建協議,雙方攜手積極探索大模型的可解釋性、安全性、穩定性等層面的創新,解決企業在大模型對齊領域的技術需求,為大模型的基礎科學研究提供支持。
盡管百川智能成立僅一年,但保持著業內最快的模型更新速度,從以月度為單位,到以半月為單位,堅持開源與閉源結合,相繼推出11款大模型,涵蓋了開源、閉源、學術科研、國產算力等多個維度。公司未來會發布Baichuan?4,未來可期。
關愛健康,關愛生命
王小川率領的百川智能,按部就班,有條不紊地沿著他提出的“理想上慢一步,落地上快三步”目標在努力。王小川正朝著生命科學與醫療領域方向探索與前行。
在業內,醫療領域被稱為“大語言模型皇冠上的明珠”。為了摘取皇冠上的明珠,從國外到國內,人工智能醫學研究團隊不懈地努力,攀登這座科學的珠穆朗瑪峰。
在國外,2023年9月21日,谷歌蛋白質結構預測模型獲2023年拉斯克獎。拉斯克獎,是在醫學領域頂級獎項拉斯克獎,這一獎項也被譽為“諾貝爾獎的風向標”。將2023年基礎醫學研究獎,頒給了研究醫學大模型的兩位博士,因他們創造了一項能夠預測蛋白質三維結構的革命性技術——AlphaFold。頒獎辭中寫道:通過放飛想象力和才華,Hassadbis?Jumper和他們的團隊,完成了讓科學家困惑半個世紀的任務,開啟了研究和操縱蛋白質的新時代。
在國內,王小川提出:“理想上慢一步,落地上快三步”,最新發布的超千億參數的最新版本大模型Baichuan?3,表明百川智能的醫療知識水平有所突破。Baichuan3的醫療數據集Token數超千億,醫療能力逼近GPT—4。
對標世界先進的人工智能公司OpenAI,王小川頗有感觸。在談起與美國OpenAI交流時的體會時,他感嘆道:“他們現在正在設計一個把1000萬顆GPU連在一起去做模型的這樣一種技術,這樣一種想法像登月一樣。”王小川說落地快三步,是要實現應用上的盡快落地,與OpenAI不計成本的追求技術上的天花板相比,我們要做的事是發揮自己的優勢。
未來的百川智能有三個方向,一是AI顧問。大模型本身是造人,有知識有經驗的顧問;二是要做AI醫生。三是做太虛幻境。百川的產品在5月份起,將會逐步推向市場,大模型的超級底座和超級應用會接受用戶的檢驗。