999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從ChatGPT到AGI:大國博弈的入場券、主戰場和主力軍

2023-12-29 00:00:00安筱鵬
新經濟導刊 2023年3期

摘 要:通用人工智能(AGI)正成為全球新一輪數字技術競爭的新賽道和制高點,必將對未來世界發展產生深遠影響。AI大模型的出現是一個劃時代的里程碑,以ChatGPT為代表的AI大模型實現了四個突破和跨越。大模型將會被各行各業廣泛應用,帶來生產力的巨大提升,并深刻改變我們的生活方式。以ChatGPT為代表的通用人工智能技術產業有五大特點:顛覆性、涌現性、工程化、通用性和密集型。面對美國的領先優勢,中國人工智能產業正處于奮起直追的關鍵時期,亟待找到一條人工智能高質量發展的新路,構建完整的AI技術生態和產業生態,培育算力和AI服務的統一大市場。我國AI大模型技術創新與產業化,面臨著統一大市場、高端芯片、數據資源和創新生態等多重挑戰。

關鍵詞:ChatGPT;AGI;技術跨越;產業特征;高質量發展

2022年11月30日,美國OpenAI公司發布人工智能聊天機器人程序ChatGPT,引起全球廣泛關注。ChatGPT是AI大模型創新從量變到質變長期積累的必然結果,是通用人工智能(AGI,Artificial General Intelligence)發展的重要里程碑。AGI正成為全球新一輪數字技術競爭的新賽道和制高點,必將對未來5年至10年全球技術創新、企業競爭、社會發展和國家博弈產生深遠影響。

一、AI大模型技術的四個跨越

AI大模型的出現是一個劃時代的里程碑,人類將進入到一個全新的智能化時代。觀察發展軌跡,以ChatGPT為代表的AI大模型實現了四個突破和跨越。

一是從弱(專用,Narrow)人工智能到強(通用,General)人工智能的跨越。事實上,人工智能特定領域能力早已超過人類,如1997年IBM沃森的智力競賽、2016年谷歌AlphaGo的圍棋競賽。GPT大模型實現了AI從單一專項能力超越人類到通用能力逼近人類的跨越,實現了從單模態到多模態的跨越,如從過去“文本到文本”“圖片到圖片”,擴展到“文字到圖片”“圖片到視頻”等跨模態的內容生成(如圖1所示)。

二是AI產品服務實現從2B到2C大規模普及的跨越。ChatGPT等AI大模型可用性大幅度提高,可服務于2C的出游計劃、網上購物、信息檢索等各個領域,將AI融入搜索引擎,嵌入Word、PowerPoint、Excel等Office辦公軟件,成為生產力提升新工具。ChatGPT成為互聯網歷史上用戶增長最快的應用,發布兩個月達到1億用戶。

三是模型訓練實現從手工作坊到規模化生產的跨越。Transformer使用無監督和自我監督的預訓練,減少了注釋訓練數據工作量,這是OpenAI技術團隊一直追求并不斷探索的方向。模型訓練實現上下游分工、流水線協同,改變了手工作坊式的訓練模式,形成“大模型+微調”的新范式。

四是互聯網數據組織形式實現從數據網頁(Web Page)到語義網絡(Semantic Web)的跨越。GPT成功將神經網絡算法落地為神經網絡大模型,讓神經網絡成為一種新的數據存儲模型,也讓信息檢索方式,從關鍵字檢索轉變成具備完整語義的自然語言人機交互檢索。對基于爬蟲、分詞、索引、特征工程等傳統搜索引擎而言,GPT是技術體系上的顛覆。

二、AI大模型產業的五大特征

就像工業革命一樣,大模型將會被各行各業廣泛應用,帶來生產力的巨大提升,并深刻改變我們的生活方式。以ChatGPT為代表的通用人工智能技術產業有五大特點:顛覆性、涌現性、工程化、通用性和密集型(如圖2所示)。

(一)顛覆性:AI大模型具有顛覆性技術的潛質

顛覆性技術是以意想不到的方式取代現有主流技術,并改變競爭格局和競爭規則的技術。從金屬冶煉、火藥制作,到移動互聯、智能交互、增材制造等,很多時候,顛覆性技術在發展初期都是被嘲笑的對象。ARM發展初期性能無法和X86相比,但其優勢是能耗低;第一代智能手機功能殘缺,沒有應用商店(APP Store),但它重新定義了智能。

不要嘲笑新技術的缺陷和不足,而要準確判斷新技術的長項和優勢的價值和潛力,就如互聯網和智能手機的出現。人們對“大模型”能力的預估,也許都是“低估”,AI大模型具有顛覆性技術的潛質。僅僅幾個月,全球這一領域就涌現出5萬多家創業公司,有些估值已經超過10億美元。不要問AGI能顛覆什么,而要問AGI不能顛覆什么。

人機交互突破。從鍵盤、鼠標、觸摸、XR到語音,每一次人機交互技術的突破,都將帶來一次產業重構。AI大模型可能會重塑“人機交互”方式,這種“升維競爭”會改變用戶使用搜索引擎、軟件工具、人機互動等方式,重構產業競爭格局。

知識創造突破。方舟投資(ARK Invest)發布報告預測,到 2030 年,AI 將輔助知識工作者(包括教師、律師、醫生、財務、程序員等白領職業)提升140%的工作效率,這將是繼人類歷史上的動力革命讓人類擺脫繁重的體力勞動之后,又一次偉大的技術革命。

軟件產業變革。GPT4的編碼能力,已相當于谷歌年薪18萬美元的L3工程師;CDSN調查顯示,GPT4相當于中國月薪3萬元的軟件開發人員。未來,50%的軟件代碼將會被AI接管。SaaS技術、產業、商業及生態模式將會重構,從“在線化”走向“智能化”新階段。

研發模式突破。AI大模型正成為加速科研進程的助推器,推動基因編輯、合成生物等技術進步,加速生物領域取得突破性成果。ChatGPT的出現,意味著知識創造的方式將發生改變,這將從最底層對科學研究形成影響。

白領崗位重塑。AI大模型顛覆了那種認為技術優先替代體力勞動者、AI無法具有人類創意的社會偏見,被機器智能首先取代的可能是“白領”而非通常認為的“藍領”。據預測,美國80%的員工工作內容至少10%會被改變,還有19%的員工工作內容至少有50%要被改變。

機器智能突破。AI將會從“線上”走到“線下”,從數字世界走到物理世界,將AI大模型裝到更多的物理設備和機器上,或許幾年后“GPT8”會融入波士頓動力機器人和特斯拉汽車。正如英偉達CEO黃仁勛所說,未來10年最大的機會在于AI與物理世界機器的融合。

AI大模型仍處于快速進化中,正如阿里巴巴郭敏對GPT3到GPT4的評價:它實現從“文本理解”到“圖像理解”、從“普通生”到“尖子生”、從“文科生”到“理科生”、從“本手”到“妙手”、從“對話理解”到“全文理解”、從“意圖理解”到“創意實現”的跨越。今天的AI大模型可能就像歷史上的火藥,正從放煙花時代走向槍炮時代,實現從冷兵器到熱兵器的跨越。今天,打敗你的不是AI,而是有AI加持的競爭對手。

(二)涌現性:模型參數超過臨界值,人工智能能力實現突變

本輪人工智能突破的基礎來自2017年谷歌提出的Transformer理論模型。在Transformer工程化的道路上,OpenAI和谷歌選擇了不同的技術路線,兩種路線的競爭相當于100年前交流電和直流電在剛發明電力時的競爭。實踐證明,OpenAI的工程化路線更有效,該技術路線的重大突破在于,模型參數超過某個臨界點之后,AI模型效果出現指數級增長,呈現“涌向效應”(如圖3所示)。

大模型的“涌現能力”。2022年,谷歌發表了研究AI大模型涌現問題的論文。基于MMLU(Multi-task language understanding)中數學、歷史、法律等測試集,對大模型進行測試,發現當大模型參數在百億量級時,模型性能出現指數級增長。如在思維鏈測試中,LaMAD大模型在參數達到680億時開始出現“涌現效應”,就像人到了18歲突然有了能力和心智上的突破。AI大模型效果提升與參數增長的“飛輪效應”,引發模型研發進入參數擴張的“軍備競賽”,模型參數從幾十億、幾百億、上千億擴展到上萬億。所有人都好奇:智能的極限在哪里?

“涌現”中的“泛化能力”。語言是人類智能的核心載體,“泛化能力”是大模型給人能帶來驚艷的重要標志。所謂“泛化能力”就是具備舉一反三的能力,有能力回答那些沒有經過專門訓練的問題。比爾·蓋茨說,ChatGPT不亞于互聯網的誕生, 他平生見識過兩次革命性的技術突破,一次是圖形用戶界面,一次是AI大模型。令他吃驚的是大模型的泛化能力,就像學習物理、化學后,盡管沒有學過生物,也能回答對AP生物考試中60道選擇題中的59道。

(三)工程化:AI大模型一半是工程、一半是理論

AI大模型是工程化的重大創新,其核心技術壁壘是數據、算法、算力等要素資源的精巧組合。正如OpenAI首席科學家IIya Sutskever所認為的,Transformer+GPT+互聯網無標注數據=AI大模型。成就來自OpenAI對通用人工智能(AGI)的極度信仰,對智能極限的極度追求,他們不只是一群科學家,更是一群動手能力極強的工程師。這種工程化挑戰,體現在三個方面。

一是對數據清洗質量有極致要求。數據預處理能力決定了數據質量,而數據質量決定了大模型的效果。數據前期處理能力是非常重要的工程能力,也是核心競爭力。OpenAI在GPT3訓練時語料清洗前為45TB,清洗后為570GB,數據顯示,專家們對數據清洗質量有著極致的追求。

二是數據“喂養”訓練過程中的Know How。模型訓練要解決類似模型災難性遺忘(catastrophic forgetting)等一系列重大技術難題,以及語料結構、邏輯和“投喂”順序的關鍵性訓練。

三是大規模高質量的算力構建。智能算力的培養,算力規模從千張到萬張GPU卡,如何保證算力不衰減,對算力的高帶寬、存算一體等均提出新要求,需要底層平臺+分布式框架+加速算法的高效集成,有些全球領先的算力公司花1年半也沒能搭建好。

(四)通用性:AI大模型是人類最大的通用目的技術(GPT)

技術具有不同的影響和價值,人類社會的技術可以分為兩類:專用目的技術(SPT, Special Purpose Technology)和通用目的技術(GPT, General Purpose Technology)。通用目的技術(GPT)是對人類經濟社會產生巨大、深遠而廣泛影響的革命性技術,如輪子、印刷、內燃機、電力、計算機、互聯網等。

AI大模型是人類社會最大的通用目的技術之一。AI大模型加速了智能時代的到來,所有產品都值得用大模型重新升級,未來將看到應用爆發、效率革命,AI將成為各行各業的新型生產力。究其原因,是這種技術具有通用目的技術(GPT)的四個特征。

一是可以廣泛地應用在各個領域(Variety of applications)。大模型商業化才剛剛開始,已廣泛融入教育、醫療、制造、軍事、辦公、律師、游戲、藝術等多個領域。更重要的是AI普及的速度:2023年1月,在達沃斯世界經濟論壇上,微軟CEO薩蒂亞說,“我一生中從未見過,美國西海岸的先進科技可以在幾個月內,以非常真實的方式出現在印度農村。對于知識型工作者來說,也許這一次完全等于工業革命。”

二是促進生產率提高、降低使用成本,具有不斷改造的空間。在工業時代,以蒸汽機、內燃機為代表的通用目的技術替代、賦能的是體力勞動者。AI大模型重構了人類知識檢索、創造、運用的基本方式,升級為支持、賦能腦力勞動者,是一種新的生產力。

三是與傳統技術之間有強力的互補性(Complementarity)。幾乎沒有一種技術能像AI大模型這樣,可以如此快速、便捷、無縫、大規模地與其它技術融合,與云計算、互聯網、軟件結合,服務于科研、農業、制造、生活等方方面面,并大規模推廣普及。

四是促進生產及組織管理方式變革。盡管現在AI對組織管理方式的變革還沒有大規模顯現,但這只是一個時間問題(如圖4所示)。

(五)密集型:AI大模型是技術、資本、人才密集型產業

只有大市場,才能形成技術資本密集型產業研發制造的“規模經濟”,從而攤銷前期的高投入成本,形成良性的商業閉環。全球航空工業是由空客、波音主導,A380研發需要十多年、250億美元;集成電路市場上只有臺積電和三星具有3納米的生產能力,3萬片3納米產線需要投資200億美元。面對產業研發和生產成本投入巨大的現實,只有全球的市場才能覆蓋投資成本,形成高投入的攤銷商業閉環,這是產業發展的規律。

AI大模型具有重投入、長周期、快迭代、高風險等特點。2012年以來,AI算力每三四個月增長一倍。GPT的訓練需要近萬張A100 GPU芯片+超過20萬核的CPU;ChatGPT每月運行成本為7500萬美元,訓練一次成本高達千萬美元,微軟投資OpenAI的100億美元,大多是以算力券形式提供。今天,這場高投入的競爭才剛剛開始,有機構估計,2023—2028年,AI算力增長將超過100萬倍。

大算力、大數據、大模型決定了AI大模型競爭是大國的游戲、巨人的戰場、工具的革命,是技術產業生態進化的力量,更是一種通用目的技術的新突破。

三、中國通用人工智能高質量發展之路:全球AI大模型競爭的入場券、主力軍、主戰場

美國不斷鞏固和強化其全球AI大模型產業革命的領導地位。中國人工智能產業正處于奮起直追的關鍵時期,亟待找到一條人工智能高質量發展的新路,核心是要建設集約化、在線化的算力基礎設施,發揮大型科技企業的算力、數據、人才等優勢,構建完整的AI技術生態和產業生態,培育算力和AI服務的統一大市場。

(一)入場券:“公共云+AI”的系統能力是AI大模型技術創新和產業化的入場券

大模型是一場“AI+云計算”的全方位競爭,超千億參數的大模型研發,并不僅僅是算法問題,而是囊括了底層龐大算力、網絡、大數據、機器學習等諸多領域的復雜系統性工程,需要有超大規模AI基礎設施的支撐。目前,AI與云計算相互依賴,技術創新和產業化與云計算緊密關聯,已經很難分開。算力成本、數據成本、商業閉環已成為制約AI發展的重大挑戰。云計算是AI大規模普及的最佳方式,特別是公共云選擇的在線化服務模式,能夠更好地支撐AI大模型實現大規模商業化。

模型即服務(MaaS)的崛起,是公共云+AI系統能力的重要體現。AI大模型所需的計算架構,在公共云已有的IaaS、PaaS、SaaS三個層面上,長出了MaaS層(Model as a Service),推動了云計算整體架構體系的演進升級。

IaaS層:異構芯片成為AI計算的關鍵資產,集成了GPU、TPU、NPU等不同架構的芯片,能夠更高效地支撐AI大模型進行各類復雜任務的訓練及應用。PaaS層:AI算法庫與工程框架是核心。AI算法庫是人工智能知識體系的“樹根”, AI工程框架顯著降低了模型開發的門檻。MaaS層:MaaS(模型即服務)作為AI大模型服務層應運而生,將演變成一種新型的AI基礎設施。SaaS層:應用效果“類人化”驅動場景創新。AI將以更“類人化”的應用效果,廣泛應用于聊天機器人、虛擬助手、文本生產、文本摘要、語音識別等多個領域(如圖5所示)。

智能化時代帶來算力的爆發,同時也提出了更高的要求。AI大模型的訓練和運營需要集約化、在線的算力基礎設施。集約化的算力基礎設施是基礎支撐,要求更高的計算并行性、更高的計算效率和更低的計算成本,并且要求適配各類專用計算芯片。在線化則對算力提出更高要求,從模型訓練和應用看,需要形成“用戶膨脹、使用反饋、模型進化”的“飛輪效應”,海量用戶在線使用和大規模API調用集成等都需要在線化的算力資源。

基于集約化、在線化的需求,云計算是智能化時代的創新引擎,也是AI發展的基石。因此,“公共云+AI”是發展AI大模型的最優解決方案,“云智一體”才能讓智能創新觸手可及,讓產業全面邁向智能。中美的這一輪競爭,核心是“大模型訓練能力+公共AI服務能力+公共計算能力”的競爭,最終比拼的是兩國間誰能用最低的成本、最高的效率、最專業化的技術、最大化地挖掘數據要素中的無限價值。

人們也許會問:中國為什么沒有ChatGPT?其實這個問題問錯了,正確的問題是:“中國為什么沒有Open AI?中國為什么沒有Snowflake(云原生數據庫公司)?中國為什么沒有Palantir(云原生大數據分析公司)?”

今天的ChatGPT只是美國創新生態中的一片樹葉,而我們要關注美國創新這棵樹是什么樣子——樹根是什么樣子,土壤是什么樣子,乃至整個森林生態是什么樣子。美國的云計算不僅是一個商業基礎設施,更是一個創新的基礎設施,沒有這樣的創新基礎設施,就不會有Snowflake、Open AI、Palantir這樣的公司。

(二)主力軍:擁有算力、模型、場景、人才等綜合優勢的大型科技公司,是AI大模型大國競爭的主力軍

ChatGPT是AI大模型工程化的重大創新,其核心的技術壁壘是數據、算法、算力等要素資源的精巧組合。AI大模型的基本特點是具有超大規模的參數量,對算力、數據、人才等均提出極高要求。

AI大模型需要大算力支持訓練。AI大模型的訓練離不開密集型的算力,而且不是簡單的GPU或CPU的堆積,而是需要將異構的算力有效高速地連接起來,并提供高吞吐、低延遲的網絡方案,這對大模型訓練至關重要。如之前所述,GPT3用了1萬張A100、14.8天,訓練一次的成本達到千萬美元級別,ChatGPT每月運行成本為7500萬美元。有機構估計,GPT4大約需要2萬—3萬張A100,訓練一個月左右。

AI大模型需要大數據“喂養”和強大的數據預處理能力。數據的預處理能力很大程度決定了數據的質量,從而影響模型的最終效果。在模型訓練之前,通常依賴專業數據團隊對數據集進行去重、清洗、分詞、詞的正則化或標準化等一系列預處理。

AI產業生態面臨重構,基礎模型從“百花齊放”到“幾枝獨秀”。AI大模型訓練及運營面臨成本高、數據獲取難、孵化周期長的挑戰,只有同時具備并能有機融合算力、數據、場景、人才和資本等優勢的科技公司,才會成為AI大模型工程化的主力軍。過去十年,全球AI大模型的研發主體,由科研機構牽頭運行的項目占比從60%下降到個位數。斯坦福發布報告顯示,2014年以前,重大AI理論模型大多來自學術界,而2022年,企業界生產了 32 個AI理論模型,學術界只生產了 3 個。

(三)主戰場:構建技術生態和可商業化閉環的產業生態,是AI大模型全球競爭的主戰場

AI大模型的競爭不僅是企業間的競爭,更是生態與生態間的競爭,是“整體戰”和“持久戰”,核心是生態戰——能夠形成技術與商業閉環。2016年3月AlphaGo擊敗冠軍李世乭,但人工智能一直沒有找到好的商業模式。過去10年,中國的人工智能產業也只在圖像識別領域找到了商業化方向。而這一輪AI大模型,將激發人們無限商業可能(如圖6所示)。

打通“模型創新、工程落地、產業商用”三環節,形成完整的技術與商業閉環能力,是AI大國博弈的主戰場。微軟的優勢不僅體現在與OpenAI合作模型訓練的先發優勢上,更體現在AI在2C、2B豐富多元的應用場景和商業閉環上。歐洲、日本等國家和地區或許也可以訓練出一個AI大模型,但由于缺乏云計算和互聯網企業等基礎能力,突破大規模商業化閉環面臨巨大的挑戰。

AI大模型訓練和運營分三個階段:一是理論大模型階段。核心是基礎架構、基礎算法的理論創新與突破, 如Transformer模型。二是工程大模型階段。核心是“大數據+大算力+長期主義”,通過模型對海量數據學習,實現AI大模型基礎能力的持續提升,如從GPT-1到GPT-3到GTP-4。這一階段是大模型和數據的“離線”階段,可以不依賴公共云和互聯網的在線能力。三是商業大模型階段。核心是實現“在線化”的商業閉環,關鍵是基于工程大模型底座,構建“通用服務大模型”(如ChatGPT)、“行業專屬大模型”(如基于ChatGPT或開源大模型訓練面向電力、創意、法律、醫療等行業的服務能力)和服務具體企業的“企業專屬大模型”(如精準服務某律師事務所或電力企業的專屬大模型)體系。AI大模型通過“API”等方式以及模型蒸餾等“瘦身”技術,將AI技術普惠化、低門檻化,在千行百業的2B市場和億萬2C市場中實現大規模商業化運營。如ChatGPT、New Bing、辦公場景中的Copilot等。

技術生態是AI大模型技術創新的重要載體。圍繞大模型、工程化應用等構建芯片、算法框架、數據治理、知識分享、行業應用等全棧式AI大模型技術體系,是AI大模型產業發展的重要基礎。

產業生態是構筑商業閉環和競爭壁壘的關鍵。數字時代是生態體系間的競爭,Wintel生態體系主導PC時代,ARM+Android生態體系主導移動互聯網時代,基于NVIDIA+Transformer的AI大模型生態正在形成。越早將大模型推向市場,越多吸納用戶的反饋來反哺大模型,越能實現“模型越強、應用越多,應用越多、模型越強”的“飛輪效應”。

讓算力更普惠、讓AI更普及是構建產業生態的重要一環。國內企業積極推動低代碼及Serverless發展,降低開發門檻讓算力更普及,面向企業提供更普惠的AI基礎設施和大模型能力。開發者可以在“魔搭”上下載各類開源AI模型,并直接調用算力、一站式AI大模型訓練及推理平臺。發布不到半年,“魔搭”社區總用戶量已超100萬,模型總下載量超1600萬次,成為國內規模最大的AI模型社區。

技術和商業閉環一旦形成,就會產生巨大的飛輪效應,構筑起較高的產業壁壘。大生態離不開大市場,歐洲錯失互聯網發展機遇的重要原因之一是缺乏單一統一大市場,市場規模決定了資本密集、技術密集、人才密集型的市場結構和競爭格局,也決定了企業的規模、成長性和競爭力。AI大模型具有重投入、長周期、快迭代、高風險等特點,其發展必須依賴大市場的規模經濟來支撐。

四、當前我國通用人工智能高質量發展面臨的主要挑戰

我國AI大模型技術創新與產業化,面臨著統一大市場、高端芯片、數據資源和創新生態等多重挑戰。

(一)低水平智算中心建設,消解了我國統一大市場優勢

ChatGPT激發了各地建設智算中心的沖動,全國多地市區縣政府規劃建設近百個私有化部署的智算中心,旨在以本地智算中心服務本地企業。這些低水平智算中心不提供公共云服務,主要服務本地產業和科研機構,無法向全國提供算力服務,客戶場景不豐富,市場空間有限,不支持開源模型,生態能力弱,無法支撐高質量AI大模型發展。分散的智算中心建設模式,造成了統一市場的割裂。

蜂擁而上的“大煉模型”,只是低水平的重復建設。只有依靠大型科技公司“煉大模型”,才能逐步彌補中美在模型層面的差距。全國各地“村村點火,處處冒煙”式建設的智算中心,將全國統一的人工智能算力市場和服務市場肢解為一個個孤立破碎的小市場,而我國大國大巿場優勢被消解,制約了AI企業的培育、生態的建立、人才的培養和商業的閉環。

(二)AI高端芯片出口管制,增加了算力成本、延長了追趕周期

高性能、低成本算力是AI大模型技術創新和產業化的關鍵資源。人工智能是美國政府打壓中國的重點領域。去年,美國已經對兩款高端GPU芯片——A100和H100實施對華出口管制,智算中心也面臨著“卡脖子”。

高端芯片出口管制,也降低了算力性能,增加了技術風險。H100的性能相當于中國可出口GPU芯片A800的8倍左右,同樣算力需要購買更多低性能的芯片,增加了服務器集群計算調度與建設難度,技術故障風險與運維、運營成本會大規模增加,性能差距也在10倍以上,性價比在3倍以上。

AI高端芯片出口管制進一步拉大了中美AI大模型產業的差距,需要基于云計算的大規模集群統一調度技術,推廣“一云多芯”的公共云服務,發揮大規模集群算力優勢與集約化成本優勢。

(三)數據的規模少、質量低和處理能力弱,降低了人工智能大模型的“智商”

大模型的“智商”取決于被訓練的數據量和知識密度。我國大模型數據主要存在以下幾個問題:一是互聯網中文數據較少,中文網站在世界前一百萬網站中只有1.3%;二是數據質量不高;三是數據處理能力弱。通用大模型預訓練語料庫詞條量高達3000億條,包含了互聯網網頁、GitHub代碼、電子圖書館、維基百科等,而能夠對大模型需要的海量數據進行清洗、加工、處理的企業鳳毛麟角。

(四)創新生態體系尚未形成,制約了創新型企業群體涌現

中美技術競爭,核心是創新生態體系的競爭。中國的挑戰在于,一是缺乏顛覆式技術創新的肥沃土壤。美國一直主導全球人工智能基礎模型架構的突破,2017年谷歌推出的Transformer架構,標志著美國在人工智能模型底層架構上的新突破,奠定了當前大模型主流算法架構基礎,全球也由此開啟了一輪超大規模人工智能模型訓練和應用競賽。二是創新基礎設施薄弱,云計算底座不厚實。三是支持新業態新技術的有效政策仍待完善。

OpenAI的啟示在于,成功=技術信仰與長期主義+風險投資創新+小公司創新與大公司商業化閉環。正如OpenAI首席科學家Ilya Sutskeve所展示的,成功來自于一個偏執狂的領軍者和一批擁有使命感的天才,他們擁有堅定的技術信仰、方向感和對AGI的戰略定力,不斷探尋正確的方法論,堅持將AI做成產品而不是技術的底層文化,秉持科學家+工程師的人才觀,強調代碼化的執行力。OpenAI的啟示還在于,ChatGPT等技術的差距只是表象,本質是創新機制、創新生態、創新文化的差距。

五、對中國人工智能產業高質量發展的建議

一是堅持市場導向,引導地方智算中心有序健康發展。規范智算中心基礎設施建設標準,減少地方政府直接投資,以市場機制引導大型科技企業加大新型基礎設施投資力度,參與全球競爭。

二是采用創新應用先行、芯片替代跟上的路徑策略。現在中國大模型和應用創新達到了國際先進水平,但須逐步完成芯片的國產化替換。

三是聚焦做強做優,支持平臺企業投入下一代人工智能技術研發。

四是構建通用人工智能產業生態。支持基于公共云搭建從AI芯片、智能算力、AI工程化工具、開源模型庫到數據集的一體化平臺,有效降低大模型訓練開發門檻,構建大模型訓練、調試、商業化的技術生態和產業生態。

五是創新監管理念,營造穩定、公平、透明、可預期的營商環境。

(作者單位:阿里研究院。本文許多重要觀點,來自張影強、羅治兵、郭敏、史大治、張天劼、李樹翀、陳魯川等多位阿里專家)

主站蜘蛛池模板: 毛片免费观看视频| 色综合天天娱乐综合网| 这里只有精品在线播放| 日本精品影院| 欧美五月婷婷| 手机永久AV在线播放| 亚洲伊人久久精品影院| 国产精品偷伦在线观看| 国产成人高精品免费视频| 黄色网站在线观看无码| 亚洲娇小与黑人巨大交| 性69交片免费看| 99人体免费视频| 美女无遮挡被啪啪到高潮免费| 成年人久久黄色网站| 亚洲成a人片77777在线播放| 亚洲无码37.| 成人亚洲天堂| 影音先锋丝袜制服| 91精品久久久久久无码人妻| 女人18一级毛片免费观看| 国产成人精品男人的天堂下载| 国产真实乱人视频| 欧美va亚洲va香蕉在线| 中文字幕va| 风韵丰满熟妇啪啪区老熟熟女| 国产高清色视频免费看的网址| 色综合综合网| 国产精品综合色区在线观看| 亚洲最大看欧美片网站地址| 欧美有码在线观看| 亚洲综合色在线| 国产免费a级片| 激情乱人伦| 人妻丰满熟妇AV无码区| 中文精品久久久久国产网址 | 欧美特黄一免在线观看| 久久国产高清视频| 67194成是人免费无码| 国产导航在线| 日韩成人在线一区二区| 日本午夜影院| 日韩成人午夜| 亚洲二区视频| 9cao视频精品| 老司机精品99在线播放| 婷婷五月在线视频| 国产精品美乳| 欧美在线伊人| 国产成人一区在线播放| 青青草原国产一区二区| 精品人妻系列无码专区久久| 麻豆国产在线不卡一区二区| 欧美中文字幕一区| 国产成人1024精品| 伊人天堂网| 综合色88| 人妻无码一区二区视频| 91色在线视频| 日本欧美在线观看| 伊人网址在线| yjizz视频最新网站在线| 久久久久人妻精品一区三寸蜜桃| 久久国产精品嫖妓| 国产一区二区三区日韩精品| 国产精品成| 国产男女免费视频| 成人在线观看不卡| 亚洲人成网站观看在线观看| 欧美性爱精品一区二区三区| 国产自视频| 精品国产欧美精品v| 亚洲欧美日韩精品专区| 日韩人妻无码制服丝袜视频| 美女毛片在线| 中文字幕无码制服中字| 91精品综合| 久久精品只有这里有| 国产精品成人AⅤ在线一二三四| 久久99精品久久久久纯品| 黄色在线不卡| 国产精品lululu在线观看|