江川

“生成式AI和大模型的智能涌現(xiàn),是全新的計算范式帶來的新機會。這意味著,AI技術(shù)已經(jīng)發(fā)展到一個臨界點,各行各業(yè)都不可避免地被改變?!薄顝┖?/p>
3月16日,在OpenAI發(fā)布GPT-4兩天后,百度召開新聞發(fā)布會。百度CEO李彥宏宣布正式推出大語言模型、生成式AI產(chǎn)品“文心一言”,并面向個人用戶和企業(yè)用戶邀約測試。截至3月17日早9點,排隊申請百度文心一言企業(yè)版API調(diào)用服務測試的企業(yè)用戶達7.38萬家。
平安證券表示,百度發(fā)布文心一言,吹響了國內(nèi)大模型應用的號角。伴隨著文心一言的催化,國內(nèi)AIGC產(chǎn)業(yè)鏈將迎來空前的市場機會。長江證券認為,百度文心一言掀起了新一輪AI產(chǎn)業(yè)鏈的浪潮,有望帶動底層基礎(chǔ)設施環(huán)節(jié)、底層數(shù)據(jù)資源環(huán)節(jié)、基礎(chǔ)模型環(huán)節(jié)、上層應用環(huán)節(jié)的發(fā)展。
對標ChatGPT
百度此次推出的文心一言,具備包括文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成在內(nèi)的多項通用能力,不僅做到了整體上的“人有我有”,還在某些局部做到了“人有我優(yōu)”。
先看文學創(chuàng)作能力。在發(fā)布會現(xiàn)場,李彥宏一連問了六個有關(guān)《三體》的問題,包括“《三體》作者是哪里人?”“可以總結(jié)一下《三體》的核心內(nèi)容嗎?”“如果要續(xù)寫的話,可以從哪些角度出發(fā)?”文心一言的回答總結(jié)了《三體》的第一部在講什么,第二部在講什么,第三部在講什么,續(xù)寫又是角色的塑造、情節(jié)設計、文化背景、哲學思考。李彥宏繼續(xù)追問“如何從哲學角度來進行續(xù)寫?生命的意義,人與宇宙的關(guān)系,道德和倫理,價值和信仰,科技和人文的關(guān)系”“電視劇《三體》的演員都有哪些?”文心一言都比較準確地列出了一系列參與的演員。這6輪對話,體現(xiàn)出文心一言各方面的能力,比如總結(jié)分析的能力、推理的能力。“事實性的東西對于一個搜索引擎來說不是那么難,但是對于一個生成式預訓練大模型來說,出錯的概率還是挺高的,這些問題都答對相當不容易,因為百度文心一言采用了知識增強和檢索增強。我們有5500億的事實知識在訓練數(shù)據(jù)里,所以可以保證事實性的問題回答比較準確。”
再看商業(yè)文案創(chuàng)作能力。李彥宏問:“如果要成立一個用大模型服務中小企業(yè)數(shù)字化升級的科技服務公司,應該給它起個什么名字?”文心一言回答:信智科技、數(shù)智云圖、云集科技、意向科技、魔方科技;問:“給我起一個公司的服務slogan,來表達共贏的概念”。答:“數(shù)智共贏智慧未來”;問:“幫我生成一篇公司成立的新聞稿,數(shù)智云圖,以共贏的服務理念,用大模型來服務中小企業(yè)的數(shù)字化升級,要求是600字左右”,文心一言也生成了相應的新聞稿。這里涉及相應的理解能力、表達能力、創(chuàng)意創(chuàng)作能力。這些能力都是沒有辦法教文心一言的。那么文心一言是怎么做到的?李彥宏解釋,其實還是要有好的技術(shù),要有大的數(shù)據(jù)?!叭藗冋f讀書破萬卷,文心一言可能讀了千億萬億的頁面,用了幾十億的搜索請求,用了很多的圖片,用了我們?nèi)恐R圖譜的5500億的事實,在不斷地訓練過程當中,逐步具備了一些比較通用的能力。大模型當參數(shù)達到千億量級,又有足夠多的訓練語料數(shù)據(jù)來進行訓練時,就會發(fā)生智能涌現(xiàn),就是沒有教過它的能力它也會?!?/p>
文心一言是要對標ChatGPT,甚至GPT-4,這個門檻無疑是很高的?;贕PT-3.5的ChatGPT在2022年11月30日橫空出世不久,新版本GPT-4又迅速發(fā)布。無論是速度還是呈現(xiàn)效果,都足以讓科技巨頭拉響警報。升級更新后的ChatGPT-4處理文字內(nèi)容的上限拓展到2.5萬個字符,是ChatGPT的8倍。
李彥宏坦言,在內(nèi)測的過程當中,文心一言的能力還算不上完美。但是為什么現(xiàn)在要發(fā)布?李彥宏給出的理由是有市場需求。百度的各個產(chǎn)品線,從搜索到智能云到自動駕駛到小度,都在等著要用這樣的技術(shù)。大語言模型產(chǎn)品一旦發(fā)布出來,它就會獲得真實的用戶反饋,而有了用戶反饋,它的迭代速度就會非??欤哪芰μ嵘蜁浅??。
值得肯定的是,在全球的大廠當中,百度是第一個發(fā)布大語言模型產(chǎn)品的。微軟是直接調(diào)用OpenAI,Google、Facebook、Meta、Amazon現(xiàn)在都沒有真正發(fā)布同類型、同級別的產(chǎn)品。
持續(xù)高投入
大語言模型、生成式AI產(chǎn)品意味著背后的大資金投入。無論是OpenAI還是百度,在這方面的投入都是數(shù)百億級別。OpenAI兩次共獲得微軟110億美金的投資。據(jù)國盛證券報告估算,GPT-3訓練一次的成本約為140萬美元,每一次訓練任務都耗資巨大。僅參照Chat?GPT來看,Chat?GPT其大模型GPT經(jīng)歷了三次迭代,參數(shù)量一度從1.17億增加到1750億,預訓練數(shù)據(jù)量從5GB增加到45TB,整體運行所需的投入達到百億。
在人工智能界,百度是中國大廠中投入最多的。2022年百度核心研發(fā)費用達到214.16億元,占百度核心收入比例達22.4%。其實百度在過去的十幾年當中,一直在AI的研發(fā)上堅持投入。
在人工智能剛開始被大家討論的時候,百度就已經(jīng)在該領(lǐng)域開始默默耕耘。2014年百度涉足智能駕駛領(lǐng)域,2015年上線世界首個大規(guī)模神經(jīng)網(wǎng)絡機器翻譯系統(tǒng),比Google早了一年多。2016年百度正式發(fā)布“百度大腦”并開源中國第一個深度學習框架飛槳。飛槳的出現(xiàn)打破了Google和Facebook的壟斷,現(xiàn)已躋身全球前二。
做AI講究“軟硬兼具”,百度“軟”有飛槳,“硬”有昆侖。2018年百度自主設計、2019年流片成功、2020年實現(xiàn)量產(chǎn)、2021年升級的百度昆侖AI芯片已經(jīng)得到大規(guī)模應用。此外,百度還研發(fā)出鴻鵠語音芯片,打破了卡脖子問題,使中國公司不再完全依靠外來輸入。從算力、算法到數(shù)據(jù),從高端芯片昆侖芯,到飛槳深度學習框架,再到文心大模型,百度在各個層面都早有關(guān)鍵自研技術(shù),給文心一言提供了強大的技術(shù)支持。
而百度的文心大模型和OpenAI的GPT模型類似,早在2019年就已推出,且經(jīng)過了多次的迭代,從剛開始單一的自然語言理解延伸到目前的多模態(tài),包括視覺、文檔、文圖、語音等多模態(tài)多功能,因此“文心一言”所基于的ERNIE系列模型也已經(jīng)具備較強泛化能力和性能。
在發(fā)布會現(xiàn)場,技術(shù)出身的李彥宏分享了IT領(lǐng)域最近發(fā)生的一些變化。過去,IT的技術(shù)棧分為3層,底層是芯片層,中間是操作系統(tǒng)層,上面是應用層或者軟件層。“在PC時代、移動互聯(lián)網(wǎng)時代都是這樣,但是當我們進入AI時代,IT技術(shù)棧從3層變?yōu)榱?層,即芯片層、框架層、模型層、應用層。芯片層過去以CPU為主,未來很可能會以GPU為主。文心一言處在模型層,AI時代的應用會基于這些大模型來進行開發(fā)?!?/p>
李彥宏談到,在全球范圍內(nèi),芯片、框架、模型、應用這4層都有領(lǐng)先產(chǎn)品的公司,百度是絕無僅有的那一個。百度的優(yōu)勢非常獨特,這個優(yōu)勢在未來文心的迭代速度上會有明顯的感受。事實上,從2月7日百度正式官宣文心一言要發(fā)布以來,僅僅一個多月的時間,已經(jīng)有650家企業(yè)宣布接入文心一言的生態(tài),這意味著很多企業(yè)其實已經(jīng)明白,這是一個大機會。
生成式AI,它是代表了一個新的技術(shù)范式,它會帶來市場需求的爆發(fā)性增長,商業(yè)價值的釋放會是前所未有的指數(shù)級。正如李彥宏所暢想的,在通用的基礎(chǔ)模型之上,在4層結(jié)構(gòu)上可以有能源大模型、交通大模型、媒體大模型,等等??梢宰龀蛇m合于千行百業(yè)的、服務各種各樣應用的模型。文心一言依托它超強的自然語言理解能力、表達能力以及推理能力,可以使得任何一個公司都能離自己的客戶更近,做出更好的客戶體驗,從而更好地建立競爭優(yōu)勢。
大模型帶來了AI產(chǎn)業(yè)的變革,也將是未來十年的主流趨勢,這已經(jīng)成為了業(yè)界共識。想要入場分羹的選手不少。自去年12月ChatGPT發(fā)布之后,無論是一級市場,還是國內(nèi)外的大廠,都在發(fā)力大模型,研發(fā)類ChatGPT產(chǎn)品。前美團聯(lián)合創(chuàng)始人王慧文、出門問問CEO李志飛、前搜狗CEO王小川、前京東高級副總裁周伯文等一批大佬,都在殺向大模型賽道。國內(nèi)大廠們更是如此。除了百度之外,阿里、騰訊、華為、字節(jié)、科大訊飛、商湯都沒有放棄大模型之戰(zhàn)。
對于百度而言,另一大優(yōu)勢是贏在了時間。正如李彥宏所說:“無論是什么樣的公司,都不可能在幾個月的時間里靠突擊做出來這樣的技術(shù)。文心一言是百度十幾年超大規(guī)模的研發(fā)投入,慢慢積累出來的?!?/p>