

“中國的一些人工智能研究機構正在探索實現通用人工智能的替代路徑,其核心是將人工智能算法植入現實環境進行具身智能學習……武漢成為這一前瞻性通用人工智能發展路徑的試驗場。”近日,一項成果受到國際智庫關注。
該智庫報告提到的這項成果,名為通用人工智能大型社會模擬器,由北京通用人工智能研究院院長朱松純領銜、北京大學武漢人工智能研究院與北京通用人工智能研究院等共同研發。相關機構認為,模擬器可優化生產效能與規范社會交互,同時為人工智能提供持續學習場景,加速其向通用人工智能演進。
那么,大型社會模擬器如何運行,又如何賦能社會治理?筆者日前采訪了該成果研發團隊。
大型社會模擬器,通俗來講,可以理解為數字版的平行世界。
在自然科學領域,粒子對撞機等大科學裝置,不斷加深著科學家對自然界的認識,推動科學技術不斷向前發展。在社會科學領域,研究人員同樣希望能夠借助科學實驗裝置,深入研究人類社會,探索社會運行規律,賦能社會治理。大型社會模擬器就是這樣一個對一定范圍內人類社會整體運行過程進行系統性模擬的科學裝置。其中,百萬量級的智能體模擬著人類的一舉一動,推動虛擬社會運行。
“借助百萬量級的智能體,科學家可觀察整個虛擬社會的運行、演化,并以此為基礎,為真實人類社會的發展提供參考。”北京大學武漢人工智能研究院執行院長吳志強介紹,團隊將整個武漢東湖高新區518平方公里的高清路網、人口等各類數據匯集,打造出一個虛擬的數字東湖高新區。
“比如要改變某個區域的交通布局,我們就可以先在模擬器中試驗一下,看看會產生哪些后果,這樣就能為真實的建設工作提供科學支撐。”吳志強說。
要對人類社會進行精確模擬,海量的社會運行數據是重要基礎。“我們匯集了大量高質量、多源、多尺度的真實數據資源,涵蓋人口、經濟、交通、地理等多個領域,并且經過嚴格治理與隱私保護。”吳志強介紹。
除了海量數據,算法規則同樣不可或缺。
不同于大模型主要側重于單智能體優化,大型社會模擬器是一個復雜的多智能體系統,需要結合規則驅動、認知模型、博弈論和大語言模型等多種技術,來模擬智能體之間的復雜交互和社會行為涌現。這就要求其算法不僅關注單體推理,還要能處理大量智能體間的協作、競爭和動態網絡結構。
“在個體認知的基礎上,我們要解決個體智能體與社會級智能體共同演化的問題。比如,政府部門作為社會級智能體作出的宏觀決策會影響個體智能體的行為,而個體智能體行為的變化會導致新的政策需求出現,從而影響社會級智能體的進一步決策。”北京通用人工智能研究院多智能體實驗室負責人陳爍說,團隊重點解決如何建模個體智能體與社會智能體的交互過程,以及如何有效推演不同社會決策的長遠影響等問題,從而為社會治理提供智能決策支持。
人類社會因人而建,但人類的行為通常具有不可預測性。“為此,我們引入了概率化建模、多情景推演與自適應學習機制,結合朱松純教授提出的UV(Utility-Value,即能力—價值)驅動模型,將人的意圖與行為決策抽象為UV函數進行建模與預測。”吳志強說,模擬器可以基于統計規律就單一事件生成多種可能的發展路徑,計算出在不同干擾條件下的多種可能,并與現實世界的真實數據進行對照,動態修正相關參數,從而保持預測的參考價值與決策可靠性。
“個體行為具有不可預測性,但是在統計意義上,群體行為和群體智能可以較高準確度進行模擬。”吳志強說。
大型社會模擬器已經應用于武漢的社會治理,并取得了顯著成果。例如,在交通領域,武漢7個擁堵路口在社會級智能體賦能后,實現車流量提升10%、車速提升3%、排隊長度下降5%。
在其他領域,大型社會模擬器同樣展現出巨大潛力。在公共資源配置領域,模擬器可對人口演變進行長期動態建模,結合出生率、遷移流向、就業結構、老齡化速度等因素,預測區域內未來人口分布與結構變化。“以此為依據,地方政府可提前規劃學校、體育場館、養老機構等公共設施布局,實現資源按需配置、投資效益最大化。”吳志強說。
吳志強介紹,團隊已經在東湖高新區打造了智慧教育、智能公共安全、智慧交通、智慧醫療等大型社會模擬器應用場景,在企業孵化、產業創新和科研創新的結合方面也有所動作。模擬器也是一個開放的科研平臺,目前已有高校團隊在大型社會模擬器上開展科研工作。
國際上此前有多家研究機構開展過類似的大型社會模擬研究。如斯坦福虛擬小鎮2.0、麻省理工社會仿真平臺(MIT Socsim)、歐盟Horizon項目數字社會計劃和DeepMind多智能體協作研究等。這些研究主要聚焦多智能體協作、城市交通、社會公平及災害響應等領域。
吳志強認為,我國不僅在大模型與多智能體技術上具備領先優勢,還擁有豐富且多樣的社會、經濟運行數據,多樣化的實踐場景,強大的政策推動力和廣泛的應用需求。這些優勢為我國建設世界一流大型社會模擬器提供了堅實基礎和廣闊發展空間。
除了賦能社會治理,模擬器在推動實現通用人工智能中也發揮著重要作用。
吳志強介紹,在模擬器中,團隊構建了復雜、多智能體交互的開放環境,來模擬現實社會的多維因果關系和動態演變,這能幫助人工智能系統在真實感知、推理、決策和協作中不斷提升適應性和自主性。此外,模擬器支持對人工智能價值觀、倫理約束和社會規范的嵌入與測試,為通用人工智能解決社會環境中的自主決策、行為可控與價值觀對齊等關鍵難題提供系統性方案。
更重要的是,在模擬器中,多樣化的角色和任務設定能促進人工智能跨領域知識整合與遷移學習能力的提升。通用人工智能的認知能力、倫理約束和多智能體協作機制在這一平臺上可以得到充分探索、驗證與突破。
“覆蓋人類全活動領域的真實數據輸入規避了互聯網虛假信息干擾,將催化通用人工智能的涌現,增強系統性能優化與落地應用的相互促進、自我循環,持續完善發展路徑。”相關報告顯示。
吳志強說,未來,大型社會模擬器將在聚焦提升智能體認知推理與價值觀對齊能力的同時,優化跨領域、多場景的協同仿真架構,強化分布式計算與大規模多智能體調度技術。團隊還將推動模擬器與智能決策系統深度集成,構建開放共享的技術生態,支持通用人工智能在復雜社會環境中的安全、可控發展。
在實踐應用方面,模擬器還將開展多領域探索。例如,嘗試環境與氣候適應模擬,通過模擬氣候變化對城市生態、資源分配及居民生活的影響,探索綠色低碳政策和可持續發展路徑;開展經濟與勞動力市場模擬,深入模擬產業結構調整、就業變化、消費行為和財富分配,為宏觀經濟調控和社會保障政策設計提供支撐;聚焦危機管理與應急響應,開展災害、疫情等突發事件模擬、分析,提升城市韌性和應急調度效率。