在3月29日召開的2025中關(guān)村論壇年會通用人工智能論壇上,北京通用人工智能研究院公布了最新研究成果,覆蓋通用智能體+行業(yè)智能體+社會智能體三大智能體矩陣,其成果以“原創(chuàng)技術(shù)—產(chǎn)業(yè)賦能—社會智能”三級聯(lián)動模式,推動人工智能從單一智能向社會智能轉(zhuǎn)變。
“通通”2.0有了“三觀”
全球首個通用智能人“通通”2.0在論壇上發(fā)布。相較于1.0版本,“通通”2.0在語言、認(rèn)知、動作、學(xué)習(xí)、情緒、交互方面實現(xiàn)了多種核心能力的升級。
當(dāng)前,國內(nèi)外諸多大語言模型通過指令微調(diào)和強化學(xué)習(xí)下的人機價值對齊等技術(shù)手段,雖然能夠較好地完成人機多輪對話任務(wù),但此類對話更多是圍繞用戶的需求及觀點進行,本質(zhì)上缺乏自身相對連貫的價值觀、世界觀以及據(jù)此演繹出來的對話內(nèi)容,很難實現(xiàn)價值與心智驅(qū)動的多輪對話。
“通通”2.0版本實現(xiàn)了一個有自身價值觀、世界觀的小女孩,在理解對話目標(biāo)意圖的基礎(chǔ)上,遵循自身價值和人格,利用對話策略來引導(dǎo)對話的走向,從而達(dá)到自身的目的。在價值調(diào)控對話生成、消除模型幻覺、保持對話前后連貫性以及“言行一致”等方面取得突破。
基于交互反饋的推理和學(xué)習(xí)方面,“通通”生活在高度仿真的復(fù)雜、動態(tài)三維虛擬場景中,1.0版本的“通通”在任務(wù)執(zhí)行過程中,如果周圍環(huán)境時刻在發(fā)生變化,會導(dǎo)致它原本規(guī)劃的任務(wù)無法順利完成。但“通通”2.0可以實時響應(yīng)外界場景的變化,進行反思和重新規(guī)劃,對已有任務(wù)進行掛起、恢復(fù)、修改或取消等處理,同時動態(tài)生成新的任務(wù)規(guī)劃,從而以更靈活、智能、多變的方式完成指令。
不僅如此,不同于當(dāng)前大語言模型普遍采用的離線數(shù)據(jù)驅(qū)動的學(xué)習(xí)模式,“通通”在和場景交互(自主學(xué))及與人類的多模態(tài)對話(他人教)過程中,能動態(tài)更新自身的知識庫、價值函數(shù)和技能,使得它初步具備類人的持續(xù)反思和成長的能力。
在多智能體交互方面,研究人員為“通通”打造了幼兒園、六口之家等多智能體場景,并在場景中設(shè)置了各自獨立,具備自身價值、能力、人設(shè)、狀態(tài)的多個智能體,使“通通”擁有了自己的家人和朋友。
在這種多智能體場景中,“通通”不僅需要理解周圍環(huán)境,還需要理解環(huán)境中其他智能體,識別它們的身份、性格和自身的關(guān)系、彼此之間的關(guān)系和物品的關(guān)系、當(dāng)前動作、意圖、氣氛等,并在此基礎(chǔ)之上進行自身的任務(wù)規(guī)劃,包括發(fā)起和響應(yīng)對話,實施幫助、搗亂等復(fù)雜行為交互。
隨著“通通”的持續(xù)迭代,它的能力也在穩(wěn)步提升,目前研究人員正利用認(rèn)知心理學(xué)定義的5—6歲兒童應(yīng)掌握的經(jīng)典任務(wù)對它進行測試,“通通”已經(jīng)通過了多項綜合性強、復(fù)雜度高的任務(wù)考核。未來它將成為通用底座支撐各類垂直應(yīng)用場景,進一步學(xué)習(xí)行業(yè)特定的知識和技能,形成千萬個“通用智能人”賦能千行百業(yè),同時與具身智能機器人相結(jié)合,為智能制造、智慧城市、養(yǎng)老陪護、數(shù)字助理、家用機器人等領(lǐng)域帶來革命性的變化,更好地服務(wù)居民日常生活。
為人工智能能力評估搭建數(shù)理框架
近年來人工智能技術(shù)取得了顯著進展,但通用人工智能的發(fā)展仍面臨諸多挑戰(zhàn),如跨領(lǐng)域知識的遷移、自主探索與學(xué)習(xí)、情感與價值觀的融入等。除此之外,通用人工智能的倫理、法律和安全問題也引起了廣泛關(guān)注。
通用人工智能是指具有高效的學(xué)習(xí)和泛化能力、能夠根據(jù)所處的復(fù)雜動態(tài)環(huán)境自主產(chǎn)生并完成任務(wù)的通用人工智能體,具備自主的感知、認(rèn)知、決策、學(xué)習(xí)、執(zhí)行和社會協(xié)作等能力,且符合人類情感、倫理與道德觀念。其研究發(fā)展通常涉及眾多學(xué)科領(lǐng)域,包括計算機科學(xué)、認(rèn)知科學(xué)、心理學(xué)、神經(jīng)科學(xué)等。
當(dāng)前,國際上缺乏通用人工智能的嚴(yán)格數(shù)理定義,更缺少衡量一個AI系統(tǒng)是否達(dá)到了通用人工智能的測試標(biāo)準(zhǔn)與平臺。圖靈測試僅限于定性測試人機對話的表現(xiàn);OpenAI、DeepMind等機構(gòu)僅給出了AGI較為寬泛的應(yīng)用層面的描述。制訂一個嚴(yán)格的AGI定義和定量評級標(biāo)準(zhǔn)與測試平臺是一個世界性的科學(xué)難題。
論壇上北京通用人工智能研究院發(fā)布了全球通用人工智能數(shù)理定義、評級標(biāo)準(zhǔn)與測試平臺通智測試(TongTest)。該平臺主要是為了測試通用智能體的能力,由北京通用人工智能研究院自主設(shè)計開發(fā)。
通智測試(TongTest)是專為評估通用人工智能(AGI)而設(shè)計的綜合評測體系,該體系包含一個六維度(視覺、語言、認(rèn)知、運動、學(xué)習(xí)、價值)、五層級(初級自身價值、高級自身價值、多智能體互動的價值、基礎(chǔ)社交價值、高級社交價值)的智能體評級標(biāo)準(zhǔn),以及一個支撐該評級標(biāo)準(zhǔn)實現(xiàn)的智能體虛擬測試平臺。通智測試基于“論績、論跡、論理、論心”四論標(biāo)準(zhǔn),即以結(jié)果為核心的基礎(chǔ)評價、關(guān)注行為過程與軌跡、聚焦推理路徑的合理性、探究動機與價值觀的正確性,實現(xiàn)了“通用能力測試—專項能力測試—行業(yè)應(yīng)用測試”三位一體。
測試平臺基于動態(tài)具身的物理和社會交互環(huán)境,通過模擬復(fù)雜的真實世界任務(wù),全面評估AGI在不同維度上的能力與價值等級。在技術(shù)特點上,TongTest可無限測試任務(wù)生成,同時注重能力與價值測量并重,平臺提供與虛擬環(huán)境中的其他角色和元素的互動,并能夠根據(jù)評級體系對AGI達(dá)到的等級進行定量描述。
TongTest突破了傳統(tǒng)人工智能測試方法的局限,填補了通用人工智能評測的國際空白,為規(guī)范通用人工智能的發(fā)展提供了科學(xué)的度量與指揮棒,為人工智能的安全與標(biāo)準(zhǔn)提供了數(shù)理框架,同時也為我國在通用人工智能領(lǐng)域搶占國際話語權(quán)提供了科學(xué)依據(jù)。
經(jīng)過TongTest"86項綜合任務(wù)(比如收拾房間、整理餐桌等)對“通通”進行的階段性測試結(jié)果顯示,與人類兒童發(fā)展階段對比,“通通”主要能力維度已初步達(dá)到5—6歲發(fā)展水平,相當(dāng)于幼兒園小朋友的水平。TongTest也能夠測試當(dāng)前的主流大模型,將其封裝為具身智能體后,測試其場景感知與任務(wù)規(guī)劃、空間交互與任務(wù)執(zhí)行等能力,大模型無法做到知行合一。
論壇上還發(fā)布了三維場景重建與具身智能數(shù)據(jù)構(gòu)建平臺“通通到我家”。該平臺能“把現(xiàn)實世界搬進電腦”,讓智能體“通通”走進千家萬戶。通用人工智能行業(yè)智能體工場(TongAgents),是助力行業(yè)AI"Agent快速孵化的高效工具與平臺,就像一個智能體的“制造工廠”。北京通用人工智能研究院多智能體實驗室負(fù)責(zé)人陳爍介紹了社會級智能體,并現(xiàn)場演示了大型社會模擬器(Large Social Simulator)。
與此同時,北京通用人工智能研究院還聯(lián)合樂聚機器人、宇樹科技等多家人形機器人公司共同發(fā)起成立“通智大腦聯(lián)盟”。該聯(lián)盟通過打破技術(shù)壁壘,聚焦垂域場景的通智大腦和具身本體協(xié)同研發(fā)及應(yīng)用,將實現(xiàn)在物理空間上具身智能體從感知到?jīng)Q策、從學(xué)習(xí)到執(zhí)行的閉環(huán),加速核心技術(shù)突破與成果轉(zhuǎn)化。
北京通用人工智能研究院分別與樂聚機器人、宇樹科技等公司合作,通過共建人形機器人聯(lián)合實驗室,打造具身智能科研中心,加速推進具身智能、人形機器人等關(guān)鍵技術(shù)和底層技術(shù)的攻關(guān)突破。聯(lián)合實驗室將共同打造具備感知、認(rèn)知、決策和行動能力,在復(fù)雜動態(tài)環(huán)境下能自主識別需求并執(zhí)行相關(guān)任務(wù)的具身智能機器人,并拓展其在高危作業(yè)、工業(yè)生產(chǎn)、家庭服務(wù)、導(dǎo)覽導(dǎo)購等多個垂直領(lǐng)域的場景應(yīng)用技能開發(fā),實現(xiàn)場景的多模態(tài)識別、場景目標(biāo)物作業(yè)互動、人機交互等能力,助推產(chǎn)業(yè)規(guī)模化、賦能新質(zhì)生產(chǎn)力發(fā)展。
此外,會上還發(fā)布了“北京人工智能安全治理協(xié)同創(chuàng)新矩陣”,該矩陣以北京市科委、中關(guān)村管委會組織設(shè)立的6家北京市重點實驗室為關(guān)鍵節(jié)點,鏈接國家級科研機構(gòu)、頂尖高校、新型研發(fā)機構(gòu)與行業(yè)領(lǐng)軍企業(yè)的創(chuàng)新資源,共織生態(tài)網(wǎng)絡(luò)、共享創(chuàng)新勢能,構(gòu)建系統(tǒng)化的安全與治理體系。