7月4日—6日,2024世界人工智能大會暨人工智能全球治理高級別會議在上海舉行。國務院總理李強出席開幕式并致辭。李強強調,要推動人工智能更好服務全球發展、增進人類福祉,并建議要推進網絡、算力、數據等普惠化,為廣大中小企業和普通民眾提供低門檻、低價格的人工智能服務,實現更大程度的數字包容。
人工智能的核心命題是讓計算機學會完成各類復雜任務的知識。在經歷了符號智能和專用智能等發展階段后,以OpenAIGPT為代表的大模型技術建立了通用的模型架構和學習方法,能夠從大規模數據中持續學習和積累知識,在諸多任務上表現出強大乃至超越人類的性能,標志著人工智能進入通用智能階段。
2022年底,OpenAI發布ChatGPT后,引發全球關注。近兩年,大模型技術突飛猛進,中國國內上演了“百模大戰”。然而,在追逐更“大”模型的熱潮中,我們也需審視,“越大越好”是否是未來發展的最優解。
數字社會的關鍵元器件——大規模集成電路的發展,或可為智能社會大模型技術的發展提供一定啟示。如摩爾定律所示,集成電路的成功關鍵在于晶體管密度的迅速提升,而非僅數量的持續增加。通過持續改進制造工藝,電路密度的提升在增強電路性能的同時,也優化了能效與成本。對照至大模型技術,模型規模的增長確實帶來了性能提升,但這種提升并非無限制。隨著模型規模增長,所需的計算資源與能耗也在迅速提升,這將成為制約大模型發展的瓶頸。
因此,提升知識密度——即在給定的計算資源內,模型能夠存儲更多知識、具備更強智能——將成為未來大模型技術可持續發展的重要目標,亦是實現大模型普惠發展的重要路徑。在此背景下,面向大模型技術的普惠發展,圍繞極致提升知識密度,未來有三個方向值得重點關注與布局。
一是人工智能科學化。人工智能科學化旨在將人工智能從工程實踐推向科學理論的形成和系統化發展,圍繞“算法—架構—數據”的技術路線,形成推動大模型知識密度增強的理論基礎。在算法層面,探索模型性能成長規律,在小模型中高效尋找最優數據和配置,進而外推至大模型。在架構層面,探索腦啟發的模型架構,顯著降低完成任務時參與計算的神經元和計算量,提高模型的推理計算效率。數據層面,探索可擴展、多樣化的高質量數據構造體系,實現自動高效生產、篩選和驗證數據。
二是計算系統智能化。計算系統智能化旨在面向智能技術優化和擴展現有硬件和軟件架構,如底層芯片、操作系統、數據庫、網絡通信等,是實現大模型知識密度增強的設施保障。例如,在芯片層面,面向人工智能的專有芯片設計是近年來推動大模型高效運算的重要發展方向。尤其是目前國際上人工智能芯片設計仍處于發展階段,中國在神經網絡處理單元(即NPU)和類腦芯片等人工智能芯片設計方面已形成一定技術與產業優勢,有望在此方向成為技術引領者。基于智能化的軟硬件設施保障,推動算力、網絡、數據等資源的高效利用,實現大模型發展所需基礎設施的普惠化。
三是領域應用廣譜化。領域應用廣譜化旨在推動大模型在各專業領域的應用,實現知識密度增強的應用適配。這意味著,首先大模型需要具備更高的專業素養。在高價值應用場景,例如科學發現、高精尖制造業等領域,大模型具有低成本持續探索的優勢,但前提是要讓大模型具備超越常規的專業能力和決策精度。這需要模型具備對專業領域知識的深度理解。再者,大模型需增強風險管控能力。在高風險應用場景,例如自動駕駛、醫療診斷,大模型需要具備極高的情境敏感性、適應性以及決策可靠性,從而在盡可能規避風險的前提下,進行高效決策。通過增強大模型在各專業領域的適配能力,推動大模型應用的專業性、穩定性、安全性。
通用人工智能的發展目前尚處于初步發展階段,距離人工智能技術的普惠應用仍需長期持續探索與投入。中國作為世界大國,理應在人工智能的發展中做引領者、擔當者和示范者,協同世界各國,共同走向更加美好的智能未來。