999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大模型時代的芯片機(jī)遇

2024-08-02 00:00:00mackler
企業(yè)界 2024年10期

關(guān)于大模型,我們聽到的最多的就是Scaling。OpenAI通過多年對Scaling的堅(jiān)持和激進(jìn)投入,把模型一步步有效推進(jìn)到千億萬億規(guī)模,實(shí)際上證明了AGI這個非常非常難的問題可以通過Scaling這種路徑清晰也簡單地多的方式去不斷逼近。同時OpenAI也把Scale作為他們組織的核心價(jià)值觀之一來不斷逼近AGI。

今天不光模型尺寸在Scale,上下文長度也在劇烈地Scale。這種方法論雖然相比AGI這么宏大的目標(biāo)而言已經(jīng)足夠簡化了,但這背后是同等急劇上升的資源投入,單純的Scale并不是一個經(jīng)濟(jì)性的方案。

所以我們看到Sam Altman提到7萬億美元的瘋狂計(jì)劃,大家也經(jīng)常討論大模型商業(yè)落地的巨大成本。大模型的商業(yè)落地相比互聯(lián)網(wǎng)目前有一個非常巨大的區(qū)別,就是邊際成本仍然非常高。過去的互聯(lián)網(wǎng)業(yè)務(wù),增加一個用戶對互聯(lián)網(wǎng)廠商的基礎(chǔ)設(shè)施而言,增加的成本幾乎是可以忽略不記的。

但今天大模型每增加一個用戶,對基礎(chǔ)設(shè)施增加的成本是肉眼可見的增加的,目前一個月幾十美元的訂閱費(fèi)用都不足以抵消背后高昂的成本。而且今天的大模型要大規(guī)模商業(yè)化,在模型質(zhì)量、上下文長度等方面還有進(jìn)一步訴求,實(shí)際上還有可能需要進(jìn)一步增加這個邊際成本。

今天一個日活千萬的通用大模型需要一年超過100億的收入才能支撐其背后的數(shù)據(jù)中心成本,未來如果我們希望大模型產(chǎn)業(yè)真正像今天的互聯(lián)網(wǎng)產(chǎn)業(yè)一樣服務(wù)上億人,模型的質(zhì)量可能也需要進(jìn)一步上一個臺階,成本會成為很嚴(yán)重的問題

但對于芯片行業(yè)而言,只要適當(dāng)拉長時間尺度,這些都不會是問題。芯片行業(yè)是人類所有工業(yè)體系中Scaling技能點(diǎn)最強(qiáng)的。

過去大半個世紀(jì),半導(dǎo)體行業(yè)一直踐行的摩爾定律就是一個關(guān)于Scaling的經(jīng)濟(jì)性方案。其實(shí)NVidia的老黃評論Sam的7萬億美元計(jì)劃時也提到,芯片本身也會持續(xù)演進(jìn)來不斷降低大模型Scaling所需的資源。

7萬億會在幾年內(nèi)逐漸變成7千億、7百億,逐漸變成一個不是那么夸張的數(shù)字。今天很多人講大模型的上下文窗口就是新的內(nèi)存,今天看起來非常寶貴的幾K到幾M的大模型上下文窗口長度,我們精打細(xì)算把重要的信息,各種prompt填入到這有限的上下文窗口里,有點(diǎn)像上個世紀(jì)的各種經(jīng)典小游戲,用很多不可思議的方式在KB級別的內(nèi)存實(shí)現(xiàn)今天看起來已經(jīng)非常復(fù)雜的游戲。

但在不遠(yuǎn)的未來,芯片行業(yè)就可以把上下文窗口逐漸變得和今天的內(nèi)存一樣非常便宜,隨便一個hello world就直接吃掉MB級別的內(nèi)存,隨便一個應(yīng)用就GB級別的內(nèi)存占用。未來我們也一樣可以隨隨便便把一個領(lǐng)域的全部知識裝進(jìn)上下文里,讓大模型成為絕對意義上的領(lǐng)域?qū)<遥部梢宰尨竽P蛽碛羞h(yuǎn)超人類一輩子能接受的全部上下文,從而引發(fā)大模型走向新的質(zhì)變。

最近幾年其實(shí)說摩爾定律放緩的觀點(diǎn)很多,這也是實(shí)際情況,先進(jìn)工藝的研發(fā)投入資金也在指數(shù)級飆升,使得維持摩爾定律逐漸變得失去經(jīng)濟(jì)性。但芯片行業(yè)的Scaling不只是晶體管的微縮推動的,NVidia的GPU過去十年靠架構(gòu)繼續(xù)推動放緩的摩爾定律持續(xù)保持非常高的增速,算力成本降低了一千倍。

而今天大模型進(jìn)一步打開了更多芯片的演進(jìn)空間,今天大模型對芯片的需求從算力轉(zhuǎn)向了內(nèi)存和互聯(lián),內(nèi)存系統(tǒng)和互聯(lián)的Scale空間更大,除了半導(dǎo)體工藝的演進(jìn)外,封裝工藝的發(fā)展、硅光都對內(nèi)存和互聯(lián)的設(shè)計(jì)打開了巨大的空間。

大模型今天也早已經(jīng)全面走向分布式,今天不僅僅是單顆芯片的設(shè)計(jì),也進(jìn)一步擴(kuò)展到服務(wù)器、機(jī)柜、網(wǎng)絡(luò)層面,這些層面都有比原來有大得多的設(shè)計(jì)空間,未來芯片的增速不僅不會放緩,反而會比今天更快。

從大模型未來大規(guī)模商業(yè)化來看,大模型對芯片的主要需求實(shí)際上已經(jīng)轉(zhuǎn)向內(nèi)存和互聯(lián),因?yàn)槲覀冃枰銐蚨嗟母邘拑?nèi)存通過互聯(lián)系統(tǒng)連接起來形成一個巨大的高帶寬內(nèi)存來支撐大模型的服務(wù)。

今天我們經(jīng)常討論的售賣Token的價(jià)格,實(shí)際上Token和Token是不一樣的,一個7B模型的Token和千億萬億模型的Token肯定不等價(jià),一個4K上下文的Token和一個2M上下文的Token也不等價(jià)。Token的質(zhì)量實(shí)際上和模型規(guī)模以及上下文窗口都是強(qiáng)相關(guān)的。模型權(quán)重是模型在訓(xùn)練時候?qū)φ麄€數(shù)據(jù)集的壓縮和泛化,是對世界和常識的理解,而上下文對應(yīng)的KV-Cache是對上下文的理解。

而權(quán)重和KV-Cache其實(shí)也是大模型對內(nèi)存最主要的需求,這部分的訪存速度也決定了Token生成的速度。我們可以把Token的業(yè)務(wù)質(zhì)量和這個Token對應(yīng)的權(quán)重以及KV-Cache的總訪存量直接掛鉤。

高質(zhì)量的Token生成過程中需要更大的訪存量,低質(zhì)量的Token生成過程中需要的訪存量也相應(yīng)更小。而售賣Token對硬件系統(tǒng)而言實(shí)際上是售賣內(nèi)存系統(tǒng)的訪存帶寬。一個容量足夠大的內(nèi)存系統(tǒng)才能提供足夠高質(zhì)量的Token服務(wù),一個內(nèi)存帶寬性價(jià)比足夠高的系統(tǒng)才能帶來更好的服務(wù)成本。

物理世界中的內(nèi)存介質(zhì)選擇往往要帶寬就沒有容量、要容量就沒有帶寬。當(dāng)然這也沒辦法,如果存在一種內(nèi)存介質(zhì)容量和帶寬都比另一種都要低,也就被淘汰了,容量和帶寬總得占一個才會被篩選出來。所以今天繼要容量大又要帶寬性價(jià)比高,往往需要通過足夠有性價(jià)比的互聯(lián)系統(tǒng)將大量高帶寬內(nèi)存連到一起,這里面是存在非常大的設(shè)計(jì)空間的。

這也是中國AI芯片行業(yè)真正實(shí)現(xiàn)商業(yè)化的一次巨大機(jī)會,過去十年大家都是在卷算力,算力的競爭往往不只是峰值算力指標(biāo)的競爭,算力和編程模型、軟件都有很強(qiáng)的耦合性,算力指標(biāo)對先進(jìn)工藝也有很強(qiáng)的依賴性。這兩點(diǎn)實(shí)際上造成了過去十年大量AI芯片在產(chǎn)品定義和供應(yīng)鏈安全方面都遭遇了巨大的困難。

大模型今天把芯片產(chǎn)品的競爭力拉到了內(nèi)存和互聯(lián)維度,這些維度相比算力都標(biāo)準(zhǔn)化得多,對解決產(chǎn)品定義問題提供了新的可能性,標(biāo)準(zhǔn)化的維度更貼近指標(biāo)競爭,就像今天大家買網(wǎng)卡或者交換機(jī)時候只關(guān)注指標(biāo)而不關(guān)注是哪家的產(chǎn)品,這就是標(biāo)準(zhǔn)化競爭的好處。今天AI芯片可能介于網(wǎng)卡交換機(jī)這種純標(biāo)準(zhǔn)化的競爭和過去那種純算力這種非標(biāo)競爭之間,相比過去是存在更多空間來解決產(chǎn)品定義的問題。

內(nèi)存和互聯(lián)對先進(jìn)工藝的依賴度相比算力也更少,而且擴(kuò)大到機(jī)柜甚至集群層面,有更多競爭的可能性,今天在封裝、互聯(lián)層面有更多發(fā)揮空間,也降低了對先進(jìn)制程的依賴,在供應(yīng)鏈上也存在更多的選擇。

我們?nèi)绻串?dāng)下和未來兩三年,其實(shí)大模型的商業(yè)探索也是在成本和Token質(zhì)量上相互妥協(xié),也逐漸分化成了兩派。

一派是質(zhì)量優(yōu)先,用高端系統(tǒng)打造高質(zhì)量的通用大模型,尋找超級應(yīng)用來覆蓋高昂的成本。另一派是成本優(yōu)先,用足夠便宜的硬件上,提供基本夠用的Token質(zhì)量,尋找垂直場景的落地。

從芯片未來兩三年的短期Scaling來看,也會從兩個路徑來解決這兩派在成本和質(zhì)量上的糾結(jié)。一種是高端系統(tǒng)的成本的大幅度下降,顯著降低超級應(yīng)用需要承擔(dān)的成本,另一種是低端設(shè)備的規(guī)格大幅提升,顯著提升低成本設(shè)備下可以支持的Token質(zhì)量。

今天很多人講7B模型已經(jīng)夠用了,或者努力讓7B或者更小的模型變得夠用,其實(shí)也是一種無奈,如果能在同樣的成本下買到規(guī)格大得多的芯片,跑一個百億千億模型,支持超長上下文,商業(yè)化的空間會比今天大得多,就像曾經(jīng)的顯卡和游戲行業(yè)一樣,當(dāng)足夠便宜的顯卡已經(jīng)可以流程跑4k畫質(zhì)的時候,誰還會覺得1080p的畫質(zhì)也夠用了呢?

兩三年后,隨著芯片行業(yè)的發(fā)展,不會再有人需要小模型,大模型長文本的高質(zhì)量Token會變得足夠便宜。

往更長遠(yuǎn)看,大模型的成本模型對于商業(yè)形態(tài)都會產(chǎn)生巨大的變革。很多傳統(tǒng)互聯(lián)網(wǎng)業(yè)務(wù)具有巨大的固定成本,而邊際成本非常低,一個集中式的云往往就是最經(jīng)濟(jì)的商業(yè)形態(tài)。

今天大模型實(shí)際上把信息高度壓縮到一個足夠小的系統(tǒng)中,甚至是單個用戶在未來可能承受的。同時,今天大模型服務(wù)的邊際成本相比固定成本占比已經(jīng)非常高,短期內(nèi)仍然在云端更多是因?yàn)檫呺H成本對于用戶來講還是太高了,并且商業(yè)模式也還未大規(guī)模爆發(fā),用戶也不會愿意為一個尚未大規(guī)模商業(yè)化的需求承擔(dān)這部分邊際成本。

因此未來兩三年內(nèi)仍然是云端承擔(dān)大量的邊際成本來探索商業(yè)化的可能性,芯片行業(yè)幫助降低成本加速商業(yè)化。

但隨著大模型大規(guī)模商業(yè)化爆發(fā),這種成本模型實(shí)際上會造成巨大的浪費(fèi)。試想一下以后我們常用的幾十種不同的應(yīng)用都獨(dú)自提供大模型服務(wù),這些邊際成本對于所有廠商都是巨大的,而羊毛出在羊身上,最終還是會轉(zhuǎn)嫁到消費(fèi)者身上,就像今天需要付費(fèi)訂閱各種大模型廠商。

隨著芯片行業(yè)進(jìn)一步降低成本,大模型落到端側(cè)會變成總體更加經(jīng)濟(jì)的成本模型。就像今天的游戲市場,游戲畫質(zhì)的成本是游戲玩家自己買的顯卡來承擔(dān),游戲玩家也無需為想玩的不同游戲單獨(dú)為畫質(zhì)付費(fèi),游戲廠商也無需承擔(dān)這部分成本。

大模型也是類似的,未來芯片的Scaling讓用戶可以在端側(cè)低成本跑極高質(zhì)量的大模型,無需為不同的云端服務(wù)承擔(dān)獨(dú)立的大模型訂閱費(fèi)用,大模型的高度智能也能更容易打破不同應(yīng)用之間的壁壘,還能在端側(cè)更好地協(xié)同起來,實(shí)現(xiàn)更好的體驗(yàn)。當(dāng)然這和今天AI PC這一類在端側(cè)跑低成本的小模型還是有本質(zhì)區(qū)別的,還有待于芯片行業(yè)的迭代,讓大家能在比今天更低的成本下跑起來未來的旗艦?zāi)P汀?/p>

我們相信大模型能隨著芯片行業(yè)的Scaling逐漸低成本走進(jìn)千行百業(yè),也走進(jìn)大家的生活。我們也相信在大模型時代,AI芯片迎來了真正商業(yè)化的機(jī)會,可以把產(chǎn)品定義和供應(yīng)鏈的問題解決好,也在更多維度創(chuàng)造出更有競爭力的芯片產(chǎn)品。我們行云也希望在未來努力把這些都變成現(xiàn)實(shí)。

主站蜘蛛池模板: 欧美成人综合在线| 国产av无码日韩av无码网站| 亚洲三级电影在线播放| 国产老女人精品免费视频| 国产日本一区二区三区| 天堂成人在线视频| 思思热在线视频精品| 无码内射中文字幕岛国片| 欧美国产日韩在线观看| 手机在线看片不卡中文字幕| 婷婷综合缴情亚洲五月伊| 波多野结衣爽到高潮漏水大喷| 成年人久久黄色网站| 国产福利大秀91| 日韩精品少妇无码受不了| 亚洲一区黄色| 伊人久综合| 在线日韩日本国产亚洲| 91无码人妻精品一区二区蜜桃| 丁香亚洲综合五月天婷婷| 日韩中文精品亚洲第三区| 久久黄色小视频| 美女免费精品高清毛片在线视| 一区二区三区在线不卡免费| 日韩欧美国产精品| 日韩123欧美字幕| 成人日韩精品| 91色在线观看| 亚洲欧美成aⅴ人在线观看| 有专无码视频| 亚洲成a人片| 国产在线麻豆波多野结衣| 久久久久久尹人网香蕉| 高清国产在线| jizz国产在线| 国产欧美性爱网| 欧美精品在线看| 免费可以看的无遮挡av无码| 欧美日韩专区| 色综合网址| 人妻夜夜爽天天爽| 国产在线欧美| 亚洲综合色区在线播放2019| 亚洲天堂区| 欧美日韩国产高清一区二区三区| 久久99久久无码毛片一区二区| 怡春院欧美一区二区三区免费| 国产精品一线天| 亚洲成人www| 国产无码性爱一区二区三区| 国产精品专区第1页| 久996视频精品免费观看| 免费全部高H视频无码无遮掩| 成人一区在线| 55夜色66夜色国产精品视频| 亚洲毛片网站| 国产精品尹人在线观看| 久久香蕉国产线看观| 五月天福利视频| 91精品网站| 永久在线精品免费视频观看| 91福利在线观看视频| 一本大道香蕉中文日本不卡高清二区| 国产黄网站在线观看| 九九精品在线观看| 人妻免费无码不卡视频| 免费不卡视频| 91免费精品国偷自产在线在线| 中文字幕无码电影| 亚洲最大看欧美片网站地址| 欧美a级完整在线观看| 午夜天堂视频| 全裸无码专区| 亚洲中文制服丝袜欧美精品| 波多野结衣一区二区三区四区| 狠狠ⅴ日韩v欧美v天堂| 婷婷六月综合网| 亚洲国产天堂在线观看| 91在线国内在线播放老师| 国产传媒一区二区三区四区五区| 国产成人av大片在线播放| 久久免费看片|