國產大模型哪家強

2023-08-10 13:51:48文|馬迪

今日中國·中文版 2023年8期

文| 馬迪

在ChatGPT 火爆的背景下，很多國家都主動或被動地加入了大模型的競賽。據報道，全球共有數百個大模型上線，那么中國在這個領域的發展如何呢？

相信大家已經被ChatGPT刷屏過好多次了—它以生成式AI為支撐，以強大的回答問題的能力驚艷了所有人，上線兩個月就狂吸1億用戶，成為有史以來用戶增長最快的APP。在這股熱潮中，很多國家都主動或被動地加入了大模型的競賽。據報道，全球共有數百個大模型上線，那么中國在這個領域的發展如何呢？

7月在上海舉辦的2023年WAIC（世界人工智能大會）展館里，30多個國產大語言模型集體亮相，展館里人頭攢動。大會還宣布了由上海人工智能實驗室與百度、阿里、科大訊飛、360、華為、中國移動的專家擔任中國首個大模型標準化專題組聯合組長。下面就讓我們來介紹這場競賽中的幾位首發隊員。

百度：文心大模型和文心一言

百度早在2010年就開始了人工智能的研發，迄今在AI上的投入超千億人民幣。ChatGPT的火爆讓百度有了“終于等到你”的興奮，也表現出了事事爭先的氣勢。3月率先發布“文心一言”，成為中文互聯網中第一個對標ChatGPT的存在。

從模型來看，文心一言是高度本土化的AI模型，更加匹配中文環境的使用習慣。文心一言的訓練數據來自百度旗下的問答、百科等知識圖譜，以及百度爬蟲抓取的萬億級的網頁數據。這些作為百度基本盤的業務，不僅能夠提供巨大的基礎數據，也讓文心一言天然在中文搜索上具有顯著優勢。

在首次發布會上，李彥宏使用視頻PPT展示文心一言的多個使用場景，引發了巨大爭議，讓很多網友對文心一言的真實能力一度產生懷疑。隨著產品逐漸向更多普通用戶開放，在實測中逐漸挽回了口碑。本次世界人工智能大會上，百度發布文心大模型3.5版本，模型效果提升50%、訓練速度提升兩倍、推理速度提升30倍。

阿里：通義大模型和通義千問

緊隨百度的步伐，今年4月7日阿里“通義千問”開放測試，成為中國第二個類ChatGPT產品，緊接著又在6月1日和7月7日分別上線了音視頻大模型“通義聽悟”和AI繪畫創作大模型“通義萬相”，實現了三個月連推三個不同產品的壯舉，進一步向多模態模型靠近。

通義千問的訓練數據來自阿里巴巴旗下的淘寶、支付寶、天貓等產業中抽取的大量中文對話和文本數據。阿里還宣布未來會將所有產品都接入通義千問，進行全面改造升級，包括天貓、淘寶、釘釘、天貓精靈、閑魚、盒馬等。

更具有想象力的是，阿里將通過開放通義千問，幫助所有企業結合自己的應用場景、知識體系、行業特殊需求，形成專屬的企業大模型。這意味著即使是中小企業，也能夠以較低的門檻打造自己的智能客服、智能導購、智能語音助手、自動駕駛助手。

其他科技大廠的大模型路徑

前文之所以單獨介紹了百度和阿里的類ChatGPT產品，一方面是它們更早面世，另一方面是因為它們是to C型產品，也就是面向所有普通用戶，每個人都有機會使用。但其他大廠顯然選擇了不同的道路—在他們看來，面向B端（機構用戶）、賦能千行百業才是大模型的重點。

這其中就包括了華為的“盤古”、騰訊的“混元”、字節跳動的“火山方舟”、京東的“言犀”等等。它們分別根植于不同的數據和技術土壤之上，彼此之間的差距會隨著時間和數據的變化而越發擴大。但它們面臨的難點是一致的：將大模型用在業務里，AI模型和客戶核心數據的結合必須更加緊密，深度私有化必不可少。換言之，這些廠商們也許需要幫助客戶從頭對核心數據進行標注、訓練，再進行模型訓練，時間和成本都將大大增加。

從3月如雨后春筍般冒頭至今，短短4個月的時間，中國大模型跑出了中國速度—技術層、配套設施層、應用層、政策監管、安全措施，各個環節都在同步發展，而不是等著底層技術成熟后才慢慢跟上。行業熱鬧之中，人們也看到了大模型技術路徑、產業落地、配套設施搭建、開發者生態都仍處于早期階段，你追我趕的過程才剛剛開始。