通用人工智能論壇：從單一智能向社會智能轉(zhuǎn)變

2025-05-31 00:00:00魏蔚郭思岐

中關(guān)村 2025年4期

在3月29日召開的2025中關(guān)村論壇年會通用人工智能論壇上，北京通用人工智能研究院公布了最新研究成果，覆蓋通用智能體+行業(yè)智能體+社會智能體三大智能體矩陣，其成果以“原創(chuàng)技術(shù)—產(chǎn)業(yè)賦能—社會智能”三級聯(lián)動模式，推動人工智能從單一智能向社會智能轉(zhuǎn)變。

“通通”2.0有了“三觀”

全球首個通用智能人“通通”2.0在論壇上發(fā)布。相較于1.0版本，“通通”2.0在語言、認(rèn)知、動作、學(xué)習(xí)、情緒、交互方面實現(xiàn)了多種核心能力的升級。

當(dāng)前，國內(nèi)外諸多大語言模型通過指令微調(diào)和強化學(xué)習(xí)下的人機價值對齊等技術(shù)手段，雖然能夠較好地完成人機多輪對話任務(wù)，但此類對話更多是圍繞用戶的需求及觀點進行，本質(zhì)上缺乏自身相對連貫的價值觀、世界觀以及據(jù)此演繹出來的對話內(nèi)容，很難實現(xiàn)價值與心智驅(qū)動的多輪對話。

“通通”2.0版本實現(xiàn)了一個有自身價值觀、世界觀的小女孩，在理解對話目標(biāo)意圖的基礎(chǔ)上，遵循自身價值和人格，利用對話策略來引導(dǎo)對話的走向，從而達(dá)到自身的目的。在價值調(diào)控對話生成、消除模型幻覺、保持對話前后連貫性以及“言行一致”等方面取得突破。

基于交互反饋的推理和學(xué)習(xí)方面，“通通”生活在高度仿真的復(fù)雜、動態(tài)三維虛擬場景中，1.0版本的“通通”在任務(wù)執(zhí)行過程中，如果周圍環(huán)境時刻在發(fā)生變化，會導(dǎo)致它原本規(guī)劃的任務(wù)無法順利完成。但“通通”2.0可以實時響應(yīng)外界場景的變化，進行反思和重新規(guī)劃，對已有任務(wù)進行掛起、恢復(fù)、修改或取消等處理，同時動態(tài)生成新的任務(wù)規(guī)劃，從而以更靈活、智能、多變的方式完成指令。

不僅如此，不同于當(dāng)前大語言模型普遍采用的離線數(shù)據(jù)驅(qū)動的學(xué)習(xí)模式，“通通”在和場景交互（自主學(xué)）及與人類的多模態(tài)對話（他人教）過程中，能動態(tài)更新自身的知識庫、價值函數(shù)和技能，使得它初步具備類人的持續(xù)反思和成長的能力。

在多智能體交互方面，研究人員為“通通”打造了幼兒園、六口之家等多智能體場景，并在場景中設(shè)置了各自獨立，具備自身價值、能力、人設(shè)、狀態(tài)的多個智能體，使“通通”擁有了自己的家人和朋友。

在這種多智能體場景中，“通通”不僅需要理解周圍環(huán)境，還需要理解環(huán)境中其他智能體，識別它們的身份、性格和自身的關(guān)系、彼此之間的關(guān)系和物品的關(guān)系、當(dāng)前動作、意圖、氣氛等，并在此基礎(chǔ)之上進行自身的任務(wù)規(guī)劃，包括發(fā)起和響應(yīng)對話，實施幫助、搗亂等復(fù)雜行為交互。

隨著“通通”的持續(xù)迭代，它的能力也在穩(wěn)步提升，目前研究人員正利用認(rèn)知心理學(xué)定義的5—6歲兒童應(yīng)掌握的經(jīng)典任務(wù)對它進行測試，“通通”已經(jīng)通過了多項綜合性強、復(fù)雜度高的任務(wù)考核。未來它將成為通用底座支撐各類垂直應(yīng)用場景，進一步學(xué)習(xí)行業(yè)特定的知識和技能，形成千萬個“通用智能人”賦能千行百業(yè)，同時與具身智能機器人相結(jié)合，為智能制造、智慧城市、養(yǎng)老陪護、數(shù)字助理、家用機器人等領(lǐng)域帶來革命性的變化，更好地服務(wù)居民日常生活。

為人工智能能力評估搭建數(shù)理框架

近年來人工智能技術(shù)取得了顯著進展，但通用人工智能的發(fā)展仍面臨諸多挑戰(zhàn)，如跨領(lǐng)域知識的遷移、自主探索與學(xué)習(xí)、情感與價值觀的融入等。除此之外，通用人工智能的倫理、法律和安全問題也引起了廣泛關(guān)注。

通用人工智能是指具有高效的學(xué)習(xí)和泛化能力、能夠根據(jù)所處的復(fù)雜動態(tài)環(huán)境自主產(chǎn)生并完成任務(wù)的通用人工智能體，具備自主的感知、認(rèn)知、決策、學(xué)習(xí)、執(zhí)行和社會協(xié)作等能力，且符合人類情感、倫理與道德觀念。其研究發(fā)展通常涉及眾多學(xué)科領(lǐng)域，包括計算機科學(xué)、認(rèn)知科學(xué)、心理學(xué)、神經(jīng)科學(xué)等。

當(dāng)前，國際上缺乏通用人工智能的嚴(yán)格數(shù)理定義，更缺少衡量一個AI系統(tǒng)是否達(dá)到了通用人工智能的測試標(biāo)準(zhǔn)與平臺。圖靈測試僅限于定性測試人機對話的表現(xiàn)；OpenAI、DeepMind等機構(gòu)僅給出了AGI較為寬泛的應(yīng)用層面的描述。制訂一個嚴(yán)格的AGI定義和定量評級標(biāo)準(zhǔn)與測試平臺是一個世界性的科學(xué)難題。

論壇上北京通用人工智能研究院發(fā)布了全球通用人工智能數(shù)理定義、評級標(biāo)準(zhǔn)與測試平臺通智測試（TongTest）。該平臺主要是為了測試通用智能體的能力，由北京通用人工智能研究院自主設(shè)計開發(fā)。

通智測試（TongTest）是專為評估通用人工智能（AGI）而設(shè)計的綜合評測體系，該體系包含一個六維度（視覺、語言、認(rèn)知、運動、學(xué)習(xí)、價值）、五層級（初級自身價值、高級自身價值、多智能體互動的價值、基礎(chǔ)社交價值、高級社交價值）的智能體評級標(biāo)準(zhǔn)，以及一個支撐該評級標(biāo)準(zhǔn)實現(xiàn)的智能體虛擬測試平臺。通智測試基于“論績、論跡、論理、論心”四論標(biāo)準(zhǔn)，即以結(jié)果為核心的基礎(chǔ)評價、關(guān)注行為過程與軌跡、聚焦推理路徑的合理性、探究動機與價值觀的正確性，實現(xiàn)了“通用能力測試—專項能力測試—行業(yè)應(yīng)用測試”三位一體。

測試平臺基于動態(tài)具身的物理和社會交互環(huán)境，通過模擬復(fù)雜的真實世界任務(wù)，全面評估AGI在不同維度上的能力與價值等級。在技術(shù)特點上，TongTest可無限測試任務(wù)生成，同時注重能力與價值測量并重，平臺提供與虛擬環(huán)境中的其他角色和元素的互動，并能夠根據(jù)評級體系對AGI達(dá)到的等級進行定量描述。

TongTest突破了傳統(tǒng)人工智能測試方法的局限，填補了通用人工智能評測的國際空白，為規(guī)范通用人工智能的發(fā)展提供了科學(xué)的度量與指揮棒，為人工智能的安全與標(biāo)準(zhǔn)提供了數(shù)理框架，同時也為我國在通用人工智能領(lǐng)域搶占國際話語權(quán)提供了科學(xué)依據(jù)。

經(jīng)過TongTest"86項綜合任務(wù)（比如收拾房間、整理餐桌等）對“通通”進行的階段性測試結(jié)果顯示，與人類兒童發(fā)展階段對比，“通通”主要能力維度已初步達(dá)到5—6歲發(fā)展水平，相當(dāng)于幼兒園小朋友的水平。TongTest也能夠測試當(dāng)前的主流大模型，將其封裝為具身智能體后，測試其場景感知與任務(wù)規(guī)劃、空間交互與任務(wù)執(zhí)行等能力，大模型無法做到知行合一。

論壇上還發(fā)布了三維場景重建與具身智能數(shù)據(jù)構(gòu)建平臺“通通到我家”。該平臺能“把現(xiàn)實世界搬進電腦”，讓智能體“通通”走進千家萬戶。通用人工智能行業(yè)智能體工場（TongAgents），是助力行業(yè)AI"Agent快速孵化的高效工具與平臺，就像一個智能體的“制造工廠”。北京通用人工智能研究院多智能體實驗室負(fù)責(zé)人陳爍介紹了社會級智能體，并現(xiàn)場演示了大型社會模擬器（Large Social Simulator）。

與此同時，北京通用人工智能研究院還聯(lián)合樂聚機器人、宇樹科技等多家人形機器人公司共同發(fā)起成立“通智大腦聯(lián)盟”。該聯(lián)盟通過打破技術(shù)壁壘，聚焦垂域場景的通智大腦和具身本體協(xié)同研發(fā)及應(yīng)用，將實現(xiàn)在物理空間上具身智能體從感知到?jīng)Q策、從學(xué)習(xí)到執(zhí)行的閉環(huán)，加速核心技術(shù)突破與成果轉(zhuǎn)化。

北京通用人工智能研究院分別與樂聚機器人、宇樹科技等公司合作，通過共建人形機器人聯(lián)合實驗室，打造具身智能科研中心，加速推進具身智能、人形機器人等關(guān)鍵技術(shù)和底層技術(shù)的攻關(guān)突破。聯(lián)合實驗室將共同打造具備感知、認(rèn)知、決策和行動能力，在復(fù)雜動態(tài)環(huán)境下能自主識別需求并執(zhí)行相關(guān)任務(wù)的具身智能機器人，并拓展其在高危作業(yè)、工業(yè)生產(chǎn)、家庭服務(wù)、導(dǎo)覽導(dǎo)購等多個垂直領(lǐng)域的場景應(yīng)用技能開發(fā)，實現(xiàn)場景的多模態(tài)識別、場景目標(biāo)物作業(yè)互動、人機交互等能力，助推產(chǎn)業(yè)規(guī)模化、賦能新質(zhì)生產(chǎn)力發(fā)展。

此外，會上還發(fā)布了“北京人工智能安全治理協(xié)同創(chuàng)新矩陣”，該矩陣以北京市科委、中關(guān)村管委會組織設(shè)立的6家北京市重點實驗室為關(guān)鍵節(jié)點，鏈接國家級科研機構(gòu)、頂尖高校、新型研發(fā)機構(gòu)與行業(yè)領(lǐng)軍企業(yè)的創(chuàng)新資源，共織生態(tài)網(wǎng)絡(luò)、共享創(chuàng)新勢能，構(gòu)建系統(tǒng)化的安全與治理體系。