摘 要:近年來,以ChatGPT、文心一言等為代表的人工智能大模型相繼發布,其能力快速迭代更新,標志著人工智能技術的重大飛躍。這些大模型不僅僅是技術創新的前沿成果,更是推動產業革新、激發經濟新模式、培育發展新動能的新質生產力。在產業發展浪潮和國家政策引導下,全國多地搶抓大模型機遇,開展大模型創新算法及關鍵技術研究,致力于打造人工智能創新高地。然而,與歐美發達國家相比,我國大模型發展仍存在不少短板和弱項。同時,地方在發展大模型產業過程中,也存在項目盲目跟風等問題。對此,各地應立足區域發展基礎,圍繞我國大模型技術演進路線及存在短板,科學布局大模型產業,協同做大做強我國人工智能產業。
關鍵詞:大模型;發展模式;算力;人工智能
當前,人工智能技術的快速演進將大模型推向了全球科技競爭的制高點,相關技術進入成果爆發期,通用大模型、行業定制大模型、端側大模型蓬勃發展,使得大模型產業的應用落地和商業化進程顯著加速。這些模型不僅在技術上實現了突破,更在推動各行各業的數字化轉型和智能化升級中發揮著核心作用,推動人工智能發展的奇點時刻更快到來。大模型技術的發展呈現以下三個明顯趨勢:
(一)模型訓練算力增長速度超越摩爾定律
隨著大模型參數規模的持續增大,其算力需求也快速增長,相較于深度學習時代,大模型的整體算力需求已實現2-3個數量級的躍遷。以英偉達為代表的人工智能芯片廠商加速推進計算芯片創新升級,在過去8年間,英偉達GPU單卡算力性能增長了1000倍,遠超芯片摩爾定律的晶體管數量每18個月翻一倍的增長速度。未來10年將是人工智能算力的“超摩爾時代”,通過計算芯片、軟件棧、網絡等智能計算系統全域協同優化,構建出大型人工智能超算集群,將進一步超越摩爾定律的約束。
(二)龍頭企業創新牽引推動大模型創新
大模型發展浪潮主要由大模型算法企業和智能芯片設計企業共同主導,技術門檻高,高科技龍頭企業的主體作用明顯。從大模型看,2022年年底引爆行業的ChatGPT以及2024年爆火的Sora均由OpenAI公司研發推出,受業界廣泛認可的開源大模型LLaMA系列由Meta公司推出。國內的ChatGLM、通義千問、文心一言等也均由人工智能領軍企業研發推出。從智能芯片來看,英偉達、AMD等龍頭企業主導并推動了算力變革,國內華為、摩爾線程等企業也在加速追趕。
(三)高質量數據集支撐模型訓練
大量高質量的數據是人工智能訓練和學習的基礎,數據對于人工智能就如同燃料對于引擎,豐富的數據能讓模型更好地理解和識別各種模式,隨著數據的不斷積累和更新,模型還可以持續進化并提升性能,更好地適應不斷變化的環境和需求。OpenAI公司為迭代升級GPT模型,投入大量資金和人力建立高質量數據集,從維基百科、電子書、新聞網站、博客、推特和Reddit等平臺和論壇中搜羅了大量數據用于模型訓練,數據要素產業也因此迎來了發展風口。
隨著人工智能領域中大模型技術的快速發展,我國各地方政府紛紛出臺相關支持政策,加快推動大模型產業的持續發展,但在發展過程中也面臨一些挑戰和瓶頸。
(一)區域分布上,全國形成三大聚集區
目前,我國已經形成了京津冀、長三角、珠三角三大產業集聚發展區,涌現出一批行業龍頭和獨角獸企業,推動我國人工智能產業集群快速發展,其中,北京在全國優勢突出。《中國新一代人工智能科技產業發展報告2023》顯示,在全國2200家人工智能骨干企業中,北京的企業數量占比為28.09%,位居全國第一。全國已有117家“大模型”完成備案,其中北京市51個、上海市24個,廣州市9個、深圳市8個、杭州市7個,其他城市備案數量均不超過2個。賽迪顧問發布的《中國人工智能區域競爭力研究報告(2024)》顯示,我國31個省(市、區)人工智能發展分為四個梯隊,其中北京、廣東、上海形成的引領者梯隊具備明顯優勢;浙江、江蘇、山東、湖南構成的挑戰者梯隊已初步形成區域特色產業;安徽、四川、天津組成的期待者梯隊產業基礎較為扎實;其余19個省(市、區)處于跟隨者梯隊。
(二)算力、算法、數據三大要素方面依然存在短板
算力方面,發展供需不平衡、“大而不強”的現象仍然存在,主要表現在芯片關鍵技術受制于人,我國算力關鍵技術面臨“卡脖子”問題,超算算力和智算算力總體規模較小。算法方面,與歐美國家相比,國內企業仍然存在差距,底層架構設計方面,目前國內外大模型訓練時均采用谷歌公司的Transformer模型,國內尚沒有類似的底層架構,大模型的預訓練方面只能“在別人的地基上蓋房子”。在大模型的迭代升級、更新換代方面,國內企業也普遍落后于歐美企業,競爭劣勢較為明顯。數據方面,雖然我國的數據量很大,但產業化發展還存在不足,相對標準化的數據服務商較少,數據質量普遍較低,存在不少噪音和錯誤,使得大模型的訓練面臨巨大挑戰,影響了模型的準確性和穩定性。
(三)演進路線上,垂直行業應用成為競爭關鍵賽道
通用大模型的國內應用主要圍繞寫作、作圖等淺層階段,而深入場景、靠用戶驅動的行業大模型將會迎來爆發式增長。與通用大模型相比,垂直行業大模型能夠更直接地深入特定行業與業務場景,更精準地滿足行業特定需求,彌補通用大模型無法最優化適配到垂直行業中的不足。國內大模型的發展路徑是“通用+垂直”雙軌并行,其中垂直類大模型落地速度最快。通過通用大模型企業和行業頭部企業的聯合創新,教育、旅游、醫療、汽車、化工、生物醫藥等垂直行業大模型大量出現。2023年12月,中國信通院發布的《2023大模型落地應用案例集》評選出52個大模型商業落地優秀示范,其中超過65%為垂直行業應用。
當前,我國大模型發展勢頭迅猛,各地和各大企業紛紛加大對大模型的布局,但部分地方仍簡單地將發展大模型歸結于硬件投資,盲目跟風上項目,很可能導致大模型項目的過度投資、重復布局和低效建設。從全國發展布局來看,一方面發展大模型門檻高、投入大,人才素質要求高,在我國眾多地區不具備研發和培育通用大模型的基礎條件。另一方面,我國大模型在算力、數據和應用等多方面仍存在短板,產業化水平不高。各地發展除了需要聚焦大模型本身,更應立足區域發展水平和企業發展條件,合理布局發展大模型產業鏈,聯合做大做強我國大模型產業。
通過地方實踐,我國大模型產業初步形成了三種主要發展模式,即產業聚集和技術創新模式、行業應用導向模式以及資源要素導向模式。
(一)產業聚集和技術創新模式
以北京市、上海市和深圳市等地區為典型代表,此類地區是我國大模型產業發展的高地和聚集區,科研實力強大,人工智能軟硬件優勢突出。在推進路徑上,此類地區應重點推進大模型基礎理論研究和關鍵技術的突破,建設具有全國影響力的數據要素市場、打造優質數據流通產業生態,研發具有全球影響力的通用大模型底座。此外,全面推動軟件企業融入大模型,引導行業領域開放應用場景,以“通用大模型+行業模型+軟件生態”等多要素合力建設大模型產業集群。
以北京市為例,北京致力于打造大模型之都,預計2025年基本形成要素齊全、技術領先、生態完備的通用人工智能大模型產業發展格局。在推進路徑上,北京市將推動人工智能大模型創新體系發展作為重點任務,通過揭榜掛帥、創新聯合體等方式,支持新型研發機構、領軍企業、創新型企業等各類創新主體攻關大模型全流程關鍵核心技術,推進開源開放,打造全棧國產化人工智能體系。此外,北京市重點圍繞提升算力資源供給、提升高質量數據要素、推動創新場景應用等維度全面構建全產業鏈生態。
(二)行業應用導向模式
以重慶市、武漢市和蘇州市等地區為典型代表,此類地區人工智能產業鏈相對完善,已形成一批具備競爭力的人工智能產品和行業解決方案,同時,這些地區傳統產業基礎雄厚,應用場景豐富,為大模型的應用提供了廣闊空間。在推進路徑上,重點以行業模型和高質量行業數據集為抓手,推進大模型在行業的應用示范,以提供軟硬件一體化解決方案為目標進行招商和布局產業,占據產業鏈高端環節。
以武漢市為例,武漢市是我國中部地區首個軟件名城,在基礎軟件、工業軟件、嵌入式系統、遙感解譯、地理信息等領域優勢突出,已形成涵蓋基礎層、技術層、應用層的較為完整的人工智能產業鏈,在智能機器人、智能網聯汽車、機器視覺等領域形成了一批特色產品。但在發展大模型產業方面,武漢市有影響力的大模型龍頭企業較少,缺乏有影響力且能夠面向用戶提供服務的大模型,本地的人工智能人才缺口較大,制約了當地大模型產業的發展。在發展路徑上,武漢市擬選取工業制造、醫療健康等重點行業領域開展數據產品開發利用,形成高價值數據集,推動人工智能企業與各領域頭部企業合作,打造深度匹配行業需求的人工智能垂直領域大模型,在制造、醫療、教育、物流、城市治理等領域培育應用場景,打造大中小場景協同發展體系,形成場景牽引大模型產業發展的良好局面。
(三)資源要素導向模式
以貴州、寧夏、內蒙古等地區為典型代表,圍繞算力資源導向,由政府主導建設高水平的算力基礎設施,營造有利的政策環境,依托區域能源稟賦和氣候優勢構建算力綜合成本優勢,以算力資源和價格進行強有力的招商引資。一方面為落地的大模型龍頭企業提供配套產業和服務,另一方面,依托全國一體化算力網,將本地算力服務于全國大模型企業。圍繞數據要素資源導向,以大同、海口等地區為典型代表,通過建設全國數據標注基地,助力行業大模型產業化。
以寧夏為例,寧夏氣候環境適宜,數據中心采用全自然風冷,PUE值最低達到1.1,年平均氣溫8.8℃,全年環境優良天數達280天以上,非常適宜建設全自然風冷數據中心,是國家認定的最適宜建設數據中心的一類地區,同時其電力供給充足穩定、價格優惠,數據中心到戶電價不高于0.36元/千瓦時。在推進路徑上,寧夏以智算來搶占大模型風口,已建成我國西部唯一的算力和互聯網交換“雙中心”和全國首批“萬卡級”智算基地,算網融合支持落地企業開展大規模模型訓練,建成了全國首批人工智能芯片適配基地,可以為國產芯片提供測試、驗證等服務。下一步,寧夏將盡快建成全國大型智算基地,依托“東數西算”,讓寧夏的電力變成全國的算力,支持全國大模型產業發展。
今年“人工智能+”首次被寫入《政府工作報告》,凸顯了以大模型為代表的人工智能技術已成為國家發展戰略的關鍵組成部分,因此前瞻布局大模型產業是各地區因地制宜發展新質生產力的應有之舉。當前,大模型產業化進程以前所未有的速度提檔推進,技術潛力與市場空間巨大,但實現與產業場景的深度融合離不開各方合作。面向未來,我國需進一步加強產業協同攻關和技術創新,在全國范圍內強化算法、算力和數據以及通用大模型和行業模型等各層級生產力要素的統籌布局,從技術、市場、政策等多維度支持共同推動我國大模型產業的突破性發展,打造新質生產力重要引擎。
參考文獻
[1] 《北京市人工智能行業大模型創新應用白皮書(2023年)》[J].中國信息安全,2023(12):92.
[2] 李論.大模型發展仍需系統布局,有序引導[J].通信世界,2023(14):7-7.
[3] 汪玉凱.“數據要素×”與“東數西算”:全國一體化算力網建設的關鍵[J].人民論壇,2024(08):52-56.
[4] 趙子忠,王喆.2023年國內大模型發展綜述與趨勢研判[J].青年記者,2024(02):44-47.
[5] 肖仰華.生成式語言模型與通用人工智能:內涵,路徑與啟示[J].學術前沿,2023(14):49-57.
[6] 陳嬋,韓栩仟.武漢數字經濟高質量發展探索[J].合作經濟與科技,2024(5):34-35.
[7] 石勇,劉平,馮錦源.“東數西算”寧夏節點數字經濟產業發展研究[J].大數據,2023,9(05):100-110.
(作者單位:中國信息通信研究院工業互聯網與物聯網研究所 、中國信息通信研究院產業與規劃研究所)