999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大模型開啟革命的序幕

2023-12-28 07:13:12黃耀鵬
中國(guó)汽車界 2023年9期
關(guān)鍵詞:模型

文 / 黃耀鵬

今年的新能源汽車產(chǎn)業(yè),如果說有什么技術(shù)發(fā)展方向是業(yè)內(nèi)共識(shí)的話,除了高壓快充普及,就是大模型接入了。

7月31日,吉利預(yù)告了大模型技術(shù);8月8日,廣汽推出“廣汽AI大模型平臺(tái)”;本月,奇瑞將發(fā)布自己的AI大模型……在此之前,小鵬、理想、特斯拉都宣稱自己擁有“自動(dòng)化數(shù)據(jù)閉環(huán)系統(tǒng)”(大模型的一種應(yīng)用方向)。李想公開宣稱:“大模型的研發(fā)和訓(xùn)練,是智能電動(dòng)車企業(yè)的必要能力?!?/p>

而平臺(tái)級(jí)公司,百度、阿里、騰訊、360、華為都推出了自己的大模型。上半年結(jié)束的時(shí)候,國(guó)內(nèi)大模型已經(jīng)達(dá)到80個(gè)以上。中美兩國(guó)的大模型數(shù)量占據(jù)了全球80%。

面對(duì)大模型,車企有三種選擇:第一種是從基礎(chǔ)層開始,全盤由自己搭建;第二種是在平臺(tái)級(jí)企業(yè)搭建的基礎(chǔ)層上搭建應(yīng)用層;第三種是直接接入某個(gè)大模型。

目前,三種玩法都有一批企業(yè)參與。百度的文心一言(語言大模型),就有長(zhǎng)安、紅旗、嵐圖、長(zhǎng)城、吉利、東風(fēng)日產(chǎn)、零跑、集度等幾十家車企接入。

大模型有很多應(yīng)用方向,語言類的集中于智能座艙的優(yōu)化。而汽車必須首先滿足安全便捷地運(yùn)送乘客,自動(dòng)駕駛能力是剛需。因此,現(xiàn)在車企部署/接入的大模型,主要就是做自動(dòng)駕駛,或者其中的一些環(huán)節(jié)。

人工智能正在“涌現(xiàn)”

到底什么是“大模型”?

其實(shí)“模型”就是一段計(jì)算機(jī)程序,用來構(gòu)建一個(gè)虛擬的神經(jīng)網(wǎng)絡(luò)。和生物的神經(jīng)網(wǎng)絡(luò)類似,只有刺激到一定程度,神經(jīng)才會(huì)活躍。如果再強(qiáng)化刺激,就會(huì)輸出活動(dòng)。

這其實(shí)就是多段函數(shù)的表達(dá)。神經(jīng)網(wǎng)絡(luò)模擬任意連續(xù)函數(shù),也就成了可能。上世紀(jì)80年代之后,這些計(jì)算機(jī)概念就建立起來,并在自動(dòng)駕駛上應(yīng)用,但一直沒有大的突破。

汽車變身為行走的計(jì)算終端,其革命性形態(tài)已經(jīng)出現(xiàn)。現(xiàn)在就參與大模型構(gòu)建和應(yīng)用,就顯得比較重要了。

原因在于參數(shù)量。這是ChatGPT火起來的重要原因。OpenAI公司發(fā)現(xiàn),模型參數(shù)如果多到一定程度,系統(tǒng)智能(模型精度)就會(huì)極大提升,原理現(xiàn)在無法解釋,但已經(jīng)有了一個(gè)詞匯來形容——“涌現(xiàn)”。

多到什么程度呢?一般來說,至少要1億左右。當(dāng)然,因?yàn)樽匀徽Z言的信息密度高于圖像,所以ChatGPT-2的參數(shù)量達(dá)到15億個(gè),而ChatGPT-3則達(dá)到1750億個(gè),剛好和人類神經(jīng)元數(shù)量級(jí)別差不多。

不過,自動(dòng)駕駛方面的應(yīng)用,現(xiàn)在用不了那么多參數(shù)。因?yàn)椤坝楷F(xiàn)”現(xiàn)象尚未在計(jì)算機(jī)視覺領(lǐng)域出現(xiàn)。考慮到成本,車企們都未將大模型參數(shù)量做到ChatGPT-3那么夸張。但上億是沒跑的,否則就很難叫大模型,需要部署超算中心或者云端算力中心,來運(yùn)行如此之多的參數(shù)。

運(yùn)行參數(shù)用來做什么?對(duì)自動(dòng)駕駛系統(tǒng)進(jìn)行數(shù)據(jù)訓(xùn)練。那么大模型定義就呼之欲出了,就是擁有大量參數(shù)、運(yùn)行于大算力硬件平臺(tái)上,并能夠完成無監(jiān)督學(xué)習(xí)(自我訓(xùn)練)的計(jì)算機(jī)程序。

自動(dòng)標(biāo)注和預(yù)標(biāo)注

以前都是有監(jiān)督學(xué)習(xí)(人工訓(xùn)練),現(xiàn)在讓AI自我訓(xùn)練,就需要先完成數(shù)據(jù)閉環(huán)。這就是為什么幾家新勢(shì)力說自己擁有“自動(dòng)化數(shù)據(jù)標(biāo)注系統(tǒng)”的原因,其實(shí)就是大模型的一個(gè)功能。

而完整的數(shù)據(jù)閉環(huán)則囊括了數(shù)據(jù)采集、數(shù)據(jù)回流、數(shù)據(jù)處理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練、測(cè)試驗(yàn)證諸多環(huán)節(jié)。其中,“數(shù)據(jù)標(biāo)注”是AI自我訓(xùn)練的前提,也是AI訓(xùn)練的成本節(jié)點(diǎn)。

所謂標(biāo)注,就是給視頻或者圖像的關(guān)鍵信息點(diǎn)貼上標(biāo)簽,以便讓系統(tǒng)認(rèn)識(shí)并在實(shí)際操作中做針對(duì)性規(guī)劃。顯然,量產(chǎn)車采集的場(chǎng)景基本都是重復(fù)的,數(shù)據(jù)意義不大。專門采集車則比較貴(成本每天6000元-10000元)。

重點(diǎn)是,如何盡量多地搜集到“長(zhǎng)尾場(chǎng)景”,即不常遇見,但駕駛了很多次之后,每個(gè)人幾乎都會(huì)遇上的場(chǎng)景(占5%左右)。

在大模型上線前,都是人工標(biāo)注。1000幀的視頻數(shù)據(jù),人工標(biāo)注成本可能達(dá)到萬元。

而大模型目前最有價(jià)值的部分,莫過于自動(dòng)化數(shù)據(jù)標(biāo)注,可能會(huì)節(jié)約上億元(取決于替代多少人標(biāo)注數(shù)據(jù))。

特斯拉為了打造一套高效數(shù)據(jù)閉環(huán)系統(tǒng),自研了超算中心。超算的另一個(gè)作用,就是有了基底訓(xùn)練數(shù)據(jù)——超過20億公里,就不太依賴新的實(shí)際路采了。大模型會(huì)改變參數(shù),在電腦里面重建場(chǎng)景,自動(dòng)進(jìn)行長(zhǎng)尾場(chǎng)景的自我訓(xùn)練。比如采了白天的數(shù)據(jù),稍微改一下,就變成黑夜、雨天,或者有司機(jī)急打方向盤、急踩剎車造成的混亂等等,都可以模擬。

在超算上運(yùn)行的大模型,對(duì)長(zhǎng)尾場(chǎng)景自動(dòng)進(jìn)行“預(yù)標(biāo)注”。而后續(xù)還要進(jìn)行人工審核,譬如要把漏標(biāo)的框標(biāo)注出來、把標(biāo)注錯(cuò)誤的框刪掉、把框的大小統(tǒng)一等。如果大模型預(yù)標(biāo)注做得好,那么后續(xù)人工審核工作量就很小了,與采用人海戰(zhàn)術(shù)對(duì)每一個(gè)圖像要素進(jìn)行標(biāo)注,完全不可同日而語。

催化全新合作方式

數(shù)據(jù)閉環(huán)的工作現(xiàn)在已經(jīng)分割給外包供應(yīng)商、大模型平臺(tái)公司(也可以視為供應(yīng)商)和車企分別來做。

關(guān)鍵在于,數(shù)據(jù)閉環(huán)能否讓車企有效迭代自動(dòng)駕駛算法,并提升應(yīng)對(duì)偶發(fā)場(chǎng)景的能力(這幾乎是L4繞不過去的坎)。落實(shí)到使用層面,通過多方合作,基于新的標(biāo)注數(shù)據(jù),進(jìn)行新的訓(xùn)練,實(shí)現(xiàn)由數(shù)據(jù)閉環(huán)驅(qū)動(dòng)自動(dòng)駕駛軟件迭代,并通過OTA部署到終端。

很少有車企能夠徹頭徹尾地自己部署基礎(chǔ)大模型,自己搞定應(yīng)用層,自己設(shè)計(jì)預(yù)標(biāo)注并實(shí)現(xiàn)數(shù)據(jù)閉環(huán),再驅(qū)動(dòng)算法更新。這即是L4的進(jìn)化之路,它的技術(shù)復(fù)雜度要求車企與供應(yīng)商充分融合式合作,而非傳統(tǒng)的供應(yīng)商“交付”-主機(jī)廠應(yīng)用。

車企過于看重價(jià)值鏈全盤掌握,強(qiáng)調(diào)全棧自研,可能會(huì)耽誤迭代進(jìn)程。

如果設(shè)計(jì)一種規(guī)則,比如基礎(chǔ)層大模型由平臺(tái)級(jí)公司設(shè)計(jì),車企負(fù)責(zé)掌握標(biāo)注規(guī)則,并將后續(xù)人工審核交給另外的第三方,拿回標(biāo)注好的數(shù)據(jù)之后,自己進(jìn)行訓(xùn)練。通過任務(wù)拆解,讓自己處于自動(dòng)駕駛價(jià)值鏈的核心地位。避免在關(guān)鍵技術(shù)上受制于人,也不用被迫接受“全家桶”(即由某個(gè)供應(yīng)商提出軟硬一體的解決方案)。

車企對(duì)這種方式應(yīng)該駕輕就熟,現(xiàn)在球踢回供應(yīng)商這邊,要求后者也要主動(dòng)參與到車企的大模型設(shè)計(jì)和訓(xùn)練當(dāng)中,而不必執(zhí)著于“打包交付”。

目前,雖然上馬大模型的車企越來越多,但是已經(jīng)實(shí)現(xiàn)數(shù)據(jù)閉環(huán),并部署于量產(chǎn)車上的,幾乎沒有。大家都還在拼“誰先抵達(dá)下一個(gè)節(jié)點(diǎn)”。好消息是,L4看上去并非那么遙不可及了。

現(xiàn)在的問題是,一個(gè)主機(jī)廠面對(duì)好幾個(gè)自動(dòng)駕駛系統(tǒng)供應(yīng)商。各個(gè)供應(yīng)商提供的每一個(gè)模塊,代碼質(zhì)量不一,工具鏈可能也不相同。如何檢驗(yàn)不同供應(yīng)商的模塊是否存在沖突,目前的工程化還不夠成熟。

這就涉及到,新獲得的長(zhǎng)尾數(shù)據(jù),對(duì)決策(規(guī)劃)產(chǎn)生的影響到底是什么。有些新增數(shù)據(jù),上了模型訓(xùn)練之后,效果變好(有效應(yīng)對(duì)了該場(chǎng)景),但總體上效率下降。這樣的局部改善導(dǎo)致整體變差的情況,需要對(duì)全局價(jià)值進(jìn)行一番預(yù)評(píng)估。這是另外的話題了,不展開。

轉(zhuǎn)移模型到車端

不過有一點(diǎn)需要澄清,大模型部署于超算中心或者云端,但很難部署于車端。因?yàn)楹笳邲]有那么強(qiáng)的算力,而且車端的數(shù)據(jù)存儲(chǔ)空間也不勝任。大模型的訓(xùn)練也要在超算平臺(tái)上完成,訓(xùn)練得差不多了(改善可以無終點(diǎn)),就能上車,大模型就必須縮窄成中模型或者小模型。

數(shù)據(jù)需要壓縮,將知識(shí)體系(從感知輸入到規(guī)控輸出)轉(zhuǎn)移到輕量級(jí)的模型上,后者是車端算力和存儲(chǔ)可以承受的。

這其實(shí)就是“端到端”的算法。很多人都將“端到端”視為自動(dòng)駕駛算法的終極形態(tài)。所謂“端到端”,即只要有原始數(shù)據(jù)輸入(環(huán)境感知),就可以輸出結(jié)果(操作動(dòng)作),和ChatGPT類似,中間過程對(duì)觀察者來說是“黑盒子”。

雖說人類不需要理解決策過程,但人們總擔(dān)心自動(dòng)駕駛算法會(huì)輸出匪夷所思的決策。大量實(shí)踐結(jié)果沒問題,也不能打消顧慮。

不過這很像人類駕駛了。熟練司機(jī)從眼睛看見,到轉(zhuǎn)方向盤、踩剎車或油門,都是中樞神經(jīng)在工作,人類沒有覺得自己花時(shí)間思考了。這就是大腦的“預(yù)訓(xùn)練系統(tǒng)”在起作用。

轉(zhuǎn)移模型還有個(gè)好處,就是避免了云與車端通訊的時(shí)延問題。車端AI反應(yīng)都是毫秒級(jí),如果指望云端給出關(guān)鍵規(guī)劃,哪怕有邊緣計(jì)算加持,通訊也不能在任何時(shí)候?qū)崟r(shí)保障。

云端的作用,可以發(fā)揮大模型的參數(shù)容量?jī)?yōu)勢(shì),完成數(shù)據(jù)挖掘、自動(dòng)數(shù)據(jù)標(biāo)注等任務(wù)。在車端,可以部署分管不同子任務(wù)的多個(gè)小模型,合并成一個(gè)“中模型”,以節(jié)省車端計(jì)算環(huán)節(jié)的推理時(shí)間,增加安全性。不過車端模型的參數(shù)量,要比云端少一到兩個(gè)數(shù)量級(jí)。

為了提升ChatGpt的能力,OpenAI在8年間耗費(fèi)十億多美元的訓(xùn)練成本。車企大概率不會(huì)付出那么高的成本(不過特斯拉超算中心就花了10億美元)。如何用有限資金,搶占場(chǎng)景落地和商業(yè)化的速度(即訓(xùn)練迭代速度),而非一味追求模型之大、算力之強(qiáng)?

既然AI的應(yīng)用已經(jīng)走到了利用大模型實(shí)行空間(再現(xiàn)物理空間)計(jì)算這一步,那么L4就有可能實(shí)現(xiàn)。這是所有車企應(yīng)該具備的能力,無論它們采用什么方式達(dá)致這一目的。

汽車變身為行走的計(jì)算終端,汽車的革命性形態(tài),已經(jīng)出現(xiàn)在視野,不再遙遙無期?,F(xiàn)在就參與大模型構(gòu)建和應(yīng)用,而不是置身事外,就顯得比較重要了。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 免费国产不卡午夜福在线观看| 国内精品手机在线观看视频| 一级毛片在线播放免费| 日韩a级毛片| 99热亚洲精品6码| 亚洲综合九九| 91色综合综合热五月激情| 91免费精品国偷自产在线在线| 国产熟睡乱子伦视频网站| 色哟哟国产精品一区二区| 日韩欧美高清视频| 六月婷婷综合| 亚洲色图另类| 精品人妻AV区| 夜夜爽免费视频| 国产色伊人| 亚洲欧美日韩久久精品| 51国产偷自视频区视频手机观看| 午夜人性色福利无码视频在线观看| 国产一在线观看| 欧美五月婷婷| 欧美一级在线看| 久久这里只有精品8| 色噜噜综合网| 扒开粉嫩的小缝隙喷白浆视频| 国产手机在线观看| 午夜福利免费视频| 亚洲精品久综合蜜| 黄色免费在线网址| 国产精品男人的天堂| 国产拍在线| 丁香六月激情综合| 国产精品视频观看裸模| 久久黄色视频影| 高清码无在线看| 手机在线看片不卡中文字幕| 色视频国产| 国产尹人香蕉综合在线电影| 欧美激情第一欧美在线| 亚洲中文精品久久久久久不卡| 国内精品久久久久久久久久影视| 91福利在线观看视频| 欧美黄网在线| 在线看片中文字幕| 国产女人在线| 亚洲欧美一区二区三区图片| 五月天久久婷婷| 国产精品美女网站| 午夜天堂视频| 亚洲欧洲国产成人综合不卡| 亚洲成人在线免费| 欧美在线三级| 精品一区二区三区波多野结衣| 国产午夜精品一区二区三区软件| 992Tv视频国产精品| 亚洲成综合人影院在院播放| 亚洲日韩精品伊甸| 天天综合色天天综合网| 2021国产v亚洲v天堂无码| 熟女日韩精品2区| 国产性生交xxxxx免费| 午夜视频日本| 亚洲品质国产精品无码| 国产欧美日韩精品第二区| 妇女自拍偷自拍亚洲精品| 69视频国产| av午夜福利一片免费看| 亚洲欧美日韩色图| 91伊人国产| 日韩精品一区二区三区视频免费看| 日韩午夜福利在线观看| 2021国产乱人伦在线播放| 亚洲国产精品美女| 日韩人妻无码制服丝袜视频| 国产黄色视频综合| 亚洲第一香蕉视频| 再看日本中文字幕在线观看| 欧美成人a∨视频免费观看| 精品视频一区二区三区在线播| 欧美高清日韩| 91精品情国产情侣高潮对白蜜| 日韩在线第三页|