文| 馬 迪
在ChatGPT 火爆的背景下,很多國家都主動或被動地加入了大模型的競賽。據報道,全球共有數百個大模型上線,那么中國在這個領域的發展如何呢?

相信大家已經被ChatGPT刷屏過好多次了—它以生成式AI為支撐,以強大的回答問題的能力驚艷了所有人,上線兩個月就狂吸1億用戶,成為有史以來用戶增長最快的APP。在這股熱潮中,很多國家都主動或被動地加入了大模型的競賽。據報道,全球共有數百個大模型上線,那么中國在這個領域的發展如何呢?
7月在上海舉辦的2023年WAIC(世界人工智能大會)展館里,30多個國產大語言模型集體亮相,展館里人頭攢動。大會還宣布了由上海人工智能實驗室與百度、阿里、科大訊飛、360、華為、中國移動的專家擔任中國首個大模型標準化專題組聯合組長。下面就讓我們來介紹這場競賽中的幾位首發隊員。
百度早在2010年就開始了人工智能的研發,迄今在AI上的投入超千億人民幣。ChatGPT的火爆讓百度有了“終于等到你”的興奮,也表現出了事事爭先的氣勢。3月率先發布“文心一言”,成為中文互聯網中第一個對標ChatGPT的存在。
從模型來看,文心一言是高度本土化的AI模型,更加匹配中文環境的使用習慣。文心一言的訓練數據來自百度旗下的問答、百科等知識圖譜,以及百度爬蟲抓取的萬億級的網頁數據。這些作為百度基本盤的業務,不僅能夠提供巨大的基礎數據,也讓文心一言天然在中文搜索上具有顯著優勢。
在首次發布會上,李彥宏使用視頻PPT展示文心一言的多個使用場景,引發了巨大爭議,讓很多網友對文心一言的真實能力一度產生懷疑。隨著產品逐漸向更多普通用戶開放,在實測中逐漸挽回了口碑。本次世界人工智能大會上,百度發布文心大模型3.5版本,模型效果提升50%、訓練速度提升兩倍、推理速度提升30倍。
緊隨百度的步伐,今年4月7日阿里“通義千問”開放測試,成為中國第二個類ChatGPT產品,緊接著又在6月1日和7月7日分別上線了音視頻大模型“通義聽悟”和AI繪畫創作大模型“通義萬相”,實現了三個月連推三個不同產品的壯舉,進一步向多模態模型靠近。
通義千問的訓練數據來自阿里巴巴旗下的淘寶、支付寶、天貓等產業中抽取的大量中文對話和文本數據。阿里還宣布未來會將所有產品都接入通義千問,進行全面改造升級,包括天貓、淘寶、釘釘、天貓精靈、閑魚、盒馬等。
更具有想象力的是,阿里將通過開放通義千問,幫助所有企業結合自己的應用場景、知識體系、行業特殊需求,形成專屬的企業大模型。這意味著即使是中小企業,也能夠以較低的門檻打造自己的智能客服、智能導購、智能語音助手、自動駕駛助手。
前文之所以單獨介紹了百度和阿里的類ChatGPT產品,一方面是它們更早面世,另一方面是因為它們是to C型產品,也就是面向所有普通用戶,每個人都有機會使用。但其他大廠顯然選擇了不同的道路—在他們看來,面向B端(機構用戶)、賦能千行百業才是大模型的重點。
這其中就包括了華為的“盤古”、騰訊的“混元”、字節跳動的“火山方舟”、京東的“言犀”等等。它們分別根植于不同的數據和技術土壤之上,彼此之間的差距會隨著時間和數據的變化而越發擴大。但它們面臨的難點是一致的:將大模型用在業務里,AI模型和客戶核心數據的結合必須更加緊密,深度私有化必不可少。換言之,這些廠商們也許需要幫助客戶從頭對核心數據進行標注、訓練,再進行模型訓練,時間和成本都將大大增加。
從3月如雨后春筍般冒頭至今,短短4個月的時間,中國大模型跑出了中國速度—技術層、配套設施層、應用層、政策監管、安全措施,各個環節都在同步發展,而不是等著底層技術成熟后才慢慢跟上。行業熱鬧之中,人們也看到了大模型技術路徑、產業落地、配套設施搭建、開發者生態都仍處于早期階段,你追我趕的過程才剛剛開始。