百度文心一言：讓智能涌現(xiàn)

2023-05-16 06:39:09江川

中關(guān)村 2023年4期

江川

“生成式AI和大模型的智能涌現(xiàn)，是全新的計算范式帶來的新機會。這意味著，AI技術(shù)已經(jīng)發(fā)展到一個臨界點，各行各業(yè)都不可避免地被改變?！薄顝┖?/p>

3月16日，在OpenAI發(fā)布GPT-4兩天后，百度召開新聞發(fā)布會。百度CEO李彥宏宣布正式推出大語言模型、生成式AI產(chǎn)品“文心一言”，并面向個人用戶和企業(yè)用戶邀約測試。截至3月17日早9點，排隊申請百度文心一言企業(yè)版API調(diào)用服務測試的企業(yè)用戶達7.38萬家。

平安證券表示，百度發(fā)布文心一言，吹響了國內(nèi)大模型應用的號角。伴隨著文心一言的催化，國內(nèi)AIGC產(chǎn)業(yè)鏈將迎來空前的市場機會。長江證券認為，百度文心一言掀起了新一輪AI產(chǎn)業(yè)鏈的浪潮，有望帶動底層基礎(chǔ)設施環(huán)節(jié)、底層數(shù)據(jù)資源環(huán)節(jié)、基礎(chǔ)模型環(huán)節(jié)、上層應用環(huán)節(jié)的發(fā)展。

對標ChatGPT

百度此次推出的文心一言，具備包括文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成在內(nèi)的多項通用能力，不僅做到了整體上的“人有我有”，還在某些局部做到了“人有我優(yōu)”。

先看文學創(chuàng)作能力。在發(fā)布會現(xiàn)場，李彥宏一連問了六個有關(guān)《三體》的問題，包括“《三體》作者是哪里人？”“可以總結(jié)一下《三體》的核心內(nèi)容嗎？”“如果要續(xù)寫的話，可以從哪些角度出發(fā)？”文心一言的回答總結(jié)了《三體》的第一部在講什么，第二部在講什么，第三部在講什么，續(xù)寫又是角色的塑造、情節(jié)設計、文化背景、哲學思考。李彥宏繼續(xù)追問“如何從哲學角度來進行續(xù)寫？生命的意義，人與宇宙的關(guān)系，道德和倫理，價值和信仰，科技和人文的關(guān)系”“電視劇《三體》的演員都有哪些？”文心一言都比較準確地列出了一系列參與的演員。這6輪對話，體現(xiàn)出文心一言各方面的能力，比如總結(jié)分析的能力、推理的能力。“事實性的東西對于一個搜索引擎來說不是那么難，但是對于一個生成式預訓練大模型來說，出錯的概率還是挺高的，這些問題都答對相當不容易，因為百度文心一言采用了知識增強和檢索增強。我們有5500億的事實知識在訓練數(shù)據(jù)里，所以可以保證事實性的問題回答比較準確。”

再看商業(yè)文案創(chuàng)作能力。李彥宏問：“如果要成立一個用大模型服務中小企業(yè)數(shù)字化升級的科技服務公司，應該給它起個什么名字？”文心一言回答：信智科技、數(shù)智云圖、云集科技、意向科技、魔方科技；問：“給我起一個公司的服務slogan，來表達共贏的概念”。答：“數(shù)智共贏智慧未來”；問：“幫我生成一篇公司成立的新聞稿，數(shù)智云圖，以共贏的服務理念，用大模型來服務中小企業(yè)的數(shù)字化升級，要求是600字左右”，文心一言也生成了相應的新聞稿。這里涉及相應的理解能力、表達能力、創(chuàng)意創(chuàng)作能力。這些能力都是沒有辦法教文心一言的。那么文心一言是怎么做到的？李彥宏解釋，其實還是要有好的技術(shù)，要有大的數(shù)據(jù)?！叭藗冋f讀書破萬卷，文心一言可能讀了千億萬億的頁面，用了幾十億的搜索請求，用了很多的圖片，用了我們?nèi)恐R圖譜的5500億的事實，在不斷地訓練過程當中，逐步具備了一些比較通用的能力。大模型當參數(shù)達到千億量級，又有足夠多的訓練語料數(shù)據(jù)來進行訓練時，就會發(fā)生智能涌現(xiàn)，就是沒有教過它的能力它也會?！?/p>

文心一言是要對標ChatGPT，甚至GPT-4，這個門檻無疑是很高的?；贕PT-3.5的ChatGPT在2022年11月30日橫空出世不久，新版本GPT-4又迅速發(fā)布。無論是速度還是呈現(xiàn)效果，都足以讓科技巨頭拉響警報。升級更新后的ChatGPT-4處理文字內(nèi)容的上限拓展到2.5萬個字符，是ChatGPT的8倍。

李彥宏坦言，在內(nèi)測的過程當中，文心一言的能力還算不上完美。但是為什么現(xiàn)在要發(fā)布？李彥宏給出的理由是有市場需求。百度的各個產(chǎn)品線，從搜索到智能云到自動駕駛到小度，都在等著要用這樣的技術(shù)。大語言模型產(chǎn)品一旦發(fā)布出來，它就會獲得真實的用戶反饋，而有了用戶反饋，它的迭代速度就會非?？欤哪芰μ嵘蜁浅？?。

值得肯定的是，在全球的大廠當中，百度是第一個發(fā)布大語言模型產(chǎn)品的。微軟是直接調(diào)用OpenAI，Google、Facebook、Meta、Amazon現(xiàn)在都沒有真正發(fā)布同類型、同級別的產(chǎn)品。

持續(xù)高投入

大語言模型、生成式AI產(chǎn)品意味著背后的大資金投入。無論是OpenAI還是百度，在這方面的投入都是數(shù)百億級別。OpenAI兩次共獲得微軟110億美金的投資。據(jù)國盛證券報告估算，GPT-3訓練一次的成本約為140萬美元，每一次訓練任務都耗資巨大。僅參照Chat?GPT來看，Chat?GPT其大模型GPT經(jīng)歷了三次迭代，參數(shù)量一度從1.17億增加到1750億，預訓練數(shù)據(jù)量從5GB增加到45TB，整體運行所需的投入達到百億。

在人工智能界，百度是中國大廠中投入最多的。2022年百度核心研發(fā)費用達到214.16億元，占百度核心收入比例達22.4%。其實百度在過去的十幾年當中，一直在AI的研發(fā)上堅持投入。

在人工智能剛開始被大家討論的時候，百度就已經(jīng)在該領(lǐng)域開始默默耕耘。2014年百度涉足智能駕駛領(lǐng)域，2015年上線世界首個大規(guī)模神經(jīng)網(wǎng)絡機器翻譯系統(tǒng)，比Google早了一年多。2016年百度正式發(fā)布“百度大腦”并開源中國第一個深度學習框架飛槳。飛槳的出現(xiàn)打破了Google和Facebook的壟斷，現(xiàn)已躋身全球前二。

做AI講究“軟硬兼具”，百度“軟”有飛槳，“硬”有昆侖。2018年百度自主設計、2019年流片成功、2020年實現(xiàn)量產(chǎn)、2021年升級的百度昆侖AI芯片已經(jīng)得到大規(guī)模應用。此外，百度還研發(fā)出鴻鵠語音芯片，打破了卡脖子問題，使中國公司不再完全依靠外來輸入。從算力、算法到數(shù)據(jù)，從高端芯片昆侖芯，到飛槳深度學習框架，再到文心大模型，百度在各個層面都早有關(guān)鍵自研技術(shù)，給文心一言提供了強大的技術(shù)支持。

而百度的文心大模型和OpenAI的GPT模型類似，早在2019年就已推出，且經(jīng)過了多次的迭代，從剛開始單一的自然語言理解延伸到目前的多模態(tài)，包括視覺、文檔、文圖、語音等多模態(tài)多功能，因此“文心一言”所基于的ERNIE系列模型也已經(jīng)具備較強泛化能力和性能。

在發(fā)布會現(xiàn)場，技術(shù)出身的李彥宏分享了IT領(lǐng)域最近發(fā)生的一些變化。過去，IT的技術(shù)棧分為3層，底層是芯片層，中間是操作系統(tǒng)層，上面是應用層或者軟件層。“在PC時代、移動互聯(lián)網(wǎng)時代都是這樣，但是當我們進入AI時代，IT技術(shù)棧從3層變?yōu)榱?層，即芯片層、框架層、模型層、應用層。芯片層過去以CPU為主，未來很可能會以GPU為主。文心一言處在模型層，AI時代的應用會基于這些大模型來進行開發(fā)?！?/p>

李彥宏談到，在全球范圍內(nèi)，芯片、框架、模型、應用這4層都有領(lǐng)先產(chǎn)品的公司，百度是絕無僅有的那一個。百度的優(yōu)勢非常獨特，這個優(yōu)勢在未來文心的迭代速度上會有明顯的感受。事實上，從2月7日百度正式官宣文心一言要發(fā)布以來，僅僅一個多月的時間，已經(jīng)有650家企業(yè)宣布接入文心一言的生態(tài)，這意味著很多企業(yè)其實已經(jīng)明白，這是一個大機會。

生成式AI，它是代表了一個新的技術(shù)范式，它會帶來市場需求的爆發(fā)性增長，商業(yè)價值的釋放會是前所未有的指數(shù)級。正如李彥宏所暢想的，在通用的基礎(chǔ)模型之上，在4層結(jié)構(gòu)上可以有能源大模型、交通大模型、媒體大模型，等等?？梢宰龀蛇m合于千行百業(yè)的、服務各種各樣應用的模型。文心一言依托它超強的自然語言理解能力、表達能力以及推理能力，可以使得任何一個公司都能離自己的客戶更近，做出更好的客戶體驗，從而更好地建立競爭優(yōu)勢。

大模型帶來了AI產(chǎn)業(yè)的變革，也將是未來十年的主流趨勢，這已經(jīng)成為了業(yè)界共識。想要入場分羹的選手不少。自去年12月ChatGPT發(fā)布之后，無論是一級市場，還是國內(nèi)外的大廠，都在發(fā)力大模型，研發(fā)類ChatGPT產(chǎn)品。前美團聯(lián)合創(chuàng)始人王慧文、出門問問CEO李志飛、前搜狗CEO王小川、前京東高級副總裁周伯文等一批大佬，都在殺向大模型賽道。國內(nèi)大廠們更是如此。除了百度之外，阿里、騰訊、華為、字節(jié)、科大訊飛、商湯都沒有放棄大模型之戰(zhàn)。

對于百度而言，另一大優(yōu)勢是贏在了時間。正如李彥宏所說：“無論是什么樣的公司，都不可能在幾個月的時間里靠突擊做出來這樣的技術(shù)。文心一言是百度十幾年超大規(guī)模的研發(fā)投入，慢慢積累出來的?！?/p>