3月15日,OpenAI公司發布了全新一代多模態大模型GPT-4。相比于4個月前問世的ChatGPT,GPT-4在圖片識別、圖文數據綜合處理、邏輯推理等領域的能力有了質變飛躍。美國在人工智能大模型領域的快速迭代創新使我國存在被快速甩離主流發展路線甚至在關鍵環節上有被“卡脖子”之虞。“執果索因”回溯美西方人工智能領域飛速進展之源,“庖丁解牛”解析我國相關領域發展困局之因,“盡銳出戰”綜合施策扭轉不利態勢,對于打贏人工智能舉國之戰,支撐高水平科技自立自強,避免未來在人工智能大模型領域美西方對我國“極限施壓”具有重大現實意義。
一、美國人工智能大模型快速迭代之因
從2018年發布GPT-1開始,OpenAI公司旗下的GPT系列產品呈現超快迭代、一路狂飆之勢,不到5年即迭代了四代產品。從GPT-3到GPT-4甚至僅歷時3個多月,遠超摩爾定律。2023年3月15日,多模態大模型GPT-4橫空出世,震撼全球。究其原因,在于GPT的快速迭代得到技術、資金、政策等要素的全方位加持。
(一)“創新力”成就人工智能大模型技術迭代
科技創新是人工智能發展無盡的前沿。回顧GPT類人工智能的發展歷程可知,OpenAI公司自GPT-1開始,就將堅持創新視為人工智能大模型的必由之路。為了避免谷歌在人工智能領域形成壟斷,OpenAI與谷歌開啟了狂飆競速。2018年,OpenAI推出了1.17億參數的GPT-1,谷歌推出了3億參數的BERT。更擅長“寫作文”的GPT與更擅長“完形填空”的BERT采用了不同的技術路線,競爭結果是發布更早的GPT-1完敗于晚4個月發布的BERT。但出師不利后,OpenAI并沒有改變技術策略,而是堅持走“大模型路線”加速創新。2019—2020年,在幾乎沒有改變模型架構的基礎上,OpenAI陸續推出參數更大的迭代版本GPT-2、GPT-3,前者有15億參數,在性能上已經超過BERT;后者則有1750億參數,幾乎可以完成自然語言處理的絕大部分任務。GPT-3發布之后,OpenAI研究人員依舊在思考如何對模型進行進一步升級。經過創新性地引入“人類反饋強化學習機制”(RLHF),OpenAI獲得了更好遵循用戶意圖的語言模型InstructGPT,并最終成功構建了InstructGPT的姊妹模型——ChatGPT。
(二)“鈔能力”確保創新型企業可持續高投入
2015—2020年間,用于訓練人工智能大模型的計算量增加了6個數量級。計算量的增加導致其需要龐大資金投入,否則難以為繼。據估算,OpenAI的模型訓練成本高達1200萬美元,GPT-3的單次訓練成本高達460萬美元。人工智能公司DeepMind從零開始訓練AlphaZero的花費在3500萬美元左右。目前,ChatGPT每月的計算成本可能達數百萬美元。美國官方對人工智能的投資逐年增加。2020年達到18.37億美元,較2019年增長了25%,支出前三位的美國政府機構分別是國防部(14億美元)、宇航局(1.391億美元)和國土安全部(1.123億美元)。美國國家科學基金(NSF)在2021年要求將8.68億美元資金用于與人工智能相關的方面,并撥款1.6億美元用于新增8家人工智能研究所;NSF還與合作伙伴共同宣布向11個其領導的國家人工智能研究中心投資2.2億美元。美國民間掀起人工智能投資熱。據Leonis Capital統計,自2020年至今,對生成人工智能的風險投資增長了400%以上,2022年已達21億美元。
(三)“政策力”全方位夯實人工智能發展基礎
一是積極建立人工智能頂層規劃體系。美國先后發布《維護美國人工智能領導力的行政命令》《美國人工智能計劃》《人工智能、自動化和經濟(2016)》《人工智能戰略概要(2018)》《國家人工智能計劃法案(2020)》《關鍵和新興技術國家戰略》《人工智能/機器學習戰略計劃》等一系列人工智能戰略與政策,建立起了美國政府在人工智能領域的頂層規劃體系。二是積極夯實人工智能開發必備的訓練數據基礎。美國在《維護美國在人工智能領域領先地位》行政令中指出:所有機構的負責人應審查他們的聯邦數據和模型,以確保更多非聯邦人工智能研究團隊訪問和使用的機會。這也給美國人工智能大模型發展奠定了堅實的數據基礎。三是主動完善人才戰略培養體系。美國完善K-12階段基礎教育及高等教育的人工智能學科建設及儲備人才培養;同時通過發展STEM領域的學徒制和終身學習計劃幫助美國工人獲得人工智能技能培訓,培養滿足人工智能時代要求的全方位專業人才隊伍。
二、我國人工智能大模型發展的現實挑戰
以國內最早投入人工智能領域的領軍企業百度為例,GPT-4發布一天之后,百度發布了號稱“中國版ChatGPT”的“文心一言”。但無論產品表現,還是資本市場反響,“文心一言”明顯“技不如人”。我國與美國在人工智能大模型方面的差距有快速拉大之患。
(一)發展失衡:重應用需求輕技術創新
與國外人工智能企業更注重自然語言處理等基礎技術不同,國內企業更看重終端產品的應用需求。據《中國新一代人工智能科技產業發展報告(2021)》數據,截至2020年底,中國人工智能企業布局在應用層的占比高達84.05%。以應用需求為主要牽引動能的發展模式,勢必導致我國人工智能企業更急于實現業務應用和商業化。產品略有雛形即被迫“倉促上陣”。例如,百度機器人剛具備基本對話功能,便急切通過小度AI及其家電場景應用謀求快速盈利。阿里無人駕駛技術剛實現開放道路上低速行駛,便急于推出無人車配送概念。反觀OpenAI,2019年其用于云計算技術的研發支出已達3100萬美元,三年內翻了13倍之多,但員工整體薪酬仍低于行業均值,基礎設施比人金貴、技術研發比盈利重要儼然成為了獨特企業文化。
(二)融資失調:總量不足與結構化短板并存
在投融資規模上,美國規模優勢明顯。根據2021年美國智庫數據創新中心報告,2020年獲得100萬美元以上資金的活躍人工智能公司數量,美國約為中國的5.4倍;在風險投資和私募股權融資額方面,美國約為中國的2.5倍;在研發投入方面,美國公司約為中國公司的5.3倍。在投融資全鏈條中,我國存在明顯弱項。由于初創型企業融資金額與估值相對較合理,泡沫較小,國內資本更傾向于參與人工智能企業的早期投資。以2021年為例,人工智能行業A輪融資占比為37.9%,明顯領先于C輪融資占比的11.37%。據IT桔子數據顯示,截至2022年11月,人民幣交易有42.8%投向了早期AI項目,僅有7.2%投向中后期AI項目(遠低于美國同期的18.8%)。但這與人工智能產業發展所需的龐大接續投入特征不匹配,容易導致技術性強而融資能力不夠的公司“高開低走”,難以為繼。
(三)人才失序:人才資源儲備仍顯短缺
我國高校人工智能專業培育起步較晚,2019年,教育部印發了《教育部關于公布2018年度普通高等學校本科專業備案和審批結果的通知》,全國共有35所高校獲首批建設“人工智能”本科專業資格。但與美西方人才儲備情況相比差距依舊明顯。一方面是人才供需嚴重失衡。根據工信部相關數據,人工智能不同技術方向崗位的人才供需比均低于0.4,人才供不應求成為常態。從細分行業來看,智能語音和計算機視覺的崗位人才供需比分別為0.08、0.09,相關人才極度稀缺。另一方面是高層次科研人才與美國差距較大。《2019年全球AI人才流動報告》顯示,美國高校培養了全球44%的人工智能領域博士,大于歐盟(21%)和中國(11%)的總和。《智慧人才發展報告(2021)》也顯示,相比中國(10.69%),美國人工智能高層次學者數量占全球的67.87%,領先優勢明顯。
三、啟示與建議
(一)發揮新型舉國體制優勢,加快推動人工智能技術創新
一是建議建立人工智能產業重點企業清單管理制度,形成各類企業自主申報、跟蹤監測、動態調整、持續更新等配套機制,加快形成以頭部平臺企業為先導、以人工智能龍頭企業為主體、以廣大科技型中小企業為補充的企業“雁陣”,以產業攻關為導向推進我國人工智能技術的快速迭代。二是依托全國一體化大數據中心和“東數西算”工程加快數據要素釋放,作為大模型訓練素材。三是加強人工智能領域國際合作,在“一帶一路”科技創新合作專項規劃框架內組織實施人工智能國際大科學計劃和大科學工程,打造科技共同體,共建聯合實驗室。
(二)借助資本市場改革紅利,引導社會資本助力產業發展
一是充分利用創業板、科創板對于高科技、創新型企業的融資“倍增器”功能,不斷完善我國多層次資本市場的建設,為涉及核心關鍵技術、稀缺緊俏產業與服務的人工智能企業開辟“綠色通道”,適時降低投資者準入門檻,進一步縮短新股注冊審核流程與時間,以更高質量的風險共擔、收益共享機制緩解企業融資瓶頸。二是優化政府引導基金“指揮棒”作用。一方面,堅持“全國一盤棋”,力戒各地“重復建設”,以更可預期的投資策略、更精細的標的清單管理統籌推進基金運行;另一方面,引導地方產業引導基金在確保長期、全局利益最大化的基礎上合理降低本地“返投”比例。精準引導社會資本投向,更好地調動銀行、擔保等金融機構對企業的貸款和擔保,解除人工智能高新技術企業挑戰更先進技術、更強算力的后顧之憂。
(三)涵養合作共贏市場生態,推動針對關鍵環節集智攻關
一是提振數據和算力資源的關鍵支撐作用。藉由規劃指引、政策補貼、試點示范、揭榜掛帥等方式,在保障數據安全的基礎上,加強數據歸集、算力統籌、算法開源等平臺和基礎能力建設。二是推進政產學研用融合聯動協同創新。圍繞人工智能產業發展規律與技術創新特點,推動行業層面在算力能力、算法技術等方面的聯合攻關,支持政產學研用各界合作構建訓練與測試標準數據集,加速共性基礎技術創新研發。
(四)構筑人工智能人才高地,確保人才梯隊系統性魯棒性
一是強基固本。系統研究人工智能學科特點,結合人工智能涉及的基礎學科與應用學科,依托高校優勢學科完善人工智能學科人才培養體系。特別是積極探索“高校+企業”的科技協同創新機制,推進“企業家出題、大學生答題”“課題組給技術、好企業用技術”的聯動模式。二是兩翼并舉。將人工智能相關領域人才培養向兩頭延伸,一方面,注重中小學人工智能科普,探索將相應課程與實踐納入“小升初”、中考考核范圍,推動高校、科研院所科普活動走進中小學;另一方面,加快碩博研究生人工智能相關基礎研究能力、原始創新能力的培養,優化國家重大專項、基金的投向。三是筑巢引鳳。緊密圍繞我國人工智能攻堅克難之急需,出臺差異化的引才聚才政策,打好“政策補貼+揭榜掛帥+優勝劣汰”組合拳,完善“候鳥型人才”“星期六專家”等人才共享機制,更好實現全球高端人才為我所用。
(徐凌驗,國家信息中心信息化和產業發展部,未來產業和平臺經濟研究中心副秘書長)