999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向大模型多智能體系統(tǒng)的多維評(píng)估方法

2025-04-12 00:00:00董之南張勤學(xué)胡進(jìn)仵志鵬盧志龍
指揮控制與仿真 2025年2期

摘 要:大模型驅(qū)動(dòng)的多智能體系統(tǒng)在增強(qiáng)人工智能水平方面具有巨大的潛力,為軍事智能化提供了創(chuàng)新解決方案。但是,目前的大模型驅(qū)動(dòng)的多智能體系統(tǒng)能夠獨(dú)立完成任務(wù)目標(biāo)的自主性受任務(wù)復(fù)雜程度的影響較大,且系統(tǒng)處理結(jié)果與初始目標(biāo)之間的一致性程度較差,有必要對(duì)大模型驅(qū)動(dòng)的多智能體系統(tǒng)的自主性和一致性進(jìn)行評(píng)估分析。已有研究尚未對(duì)大模型多智能體系統(tǒng)的自主性和一致性水平進(jìn)行全面評(píng)估。提出了一種多維評(píng)估方法,能夠分析提取大模型驅(qū)動(dòng)的多智能體整體架構(gòu)的自主性和一致性,得到系統(tǒng)的整體性能評(píng)估結(jié)果和具體改進(jìn)方法。通過對(duì)7個(gè)已有選定系統(tǒng)的實(shí)驗(yàn)分析,研究驗(yàn)證了多維評(píng)估方法在實(shí)際應(yīng)用中的可行性。

關(guān)鍵詞:大模型;多智能體;系統(tǒng)評(píng)估;多智能體協(xié)同;自主性

中圖分類號(hào):TP181:E919 文獻(xiàn)標(biāo)志碼:A DOI:10.3969/j.issn.1673-3819.2025.02.016

A multi-dimensional evaluation method for large language

model-powered multi-agent systems

DONG Zhinan, ZHANG Qinxue, HU Jin, WU Zhipeng, LU Zhilong

(No. 8511 Research Institute of CASIC, Nanjing 210007, China)

Abstract:The multi-agent system driven by large models has great potential in enhancing the level of artificial intelligence, providing innovative solutions for military intelligence. However, the degree of autonomy of current large model driven multi-agent systems in independently completing task objectives is greatly affected by task complexity, and the consistency between system processing results and initial objectives is poor. It is necessary to evaluate and analyze the autonomy and consistency of large model driven multi-agent systems. Previous studies have not yet comprehensively evaluated the autonomy and consistency levels of large model multi-agent systems. This article proposes a multidimensional evaluation method that can analyze and extract the autonomy and consistency of the overall architecture of multi-agent systems driven by large models, and obtain the overall performance evaluation results and specific improvement methods of the system. Through experimental analysis of 7 selected systems, the feasibility of multidimensional evaluation methods in practical applications has been verified.

Key words:large language model; multi-agent; system evaluation; multi-agent collaboration; automation

近年來,大語(yǔ)言模型技術(shù)的出現(xiàn)對(duì)人工智能領(lǐng)域產(chǎn)生了重大影響[1-2]。大語(yǔ)言模型經(jīng)過大量文本數(shù)據(jù)的預(yù)訓(xùn)練,通過實(shí)現(xiàn)復(fù)雜的語(yǔ)言理解和生成功能,催化了人工智能技術(shù)的重大進(jìn)步,為各領(lǐng)域廣泛的應(yīng)用打開了大門。在軍事領(lǐng)域,大模型為軍事智能化提供了創(chuàng)新型的解決方案和更廣闊的發(fā)展空間,其包含的豐富知識(shí)庫(kù)同時(shí)可以為軍事需求生成提供支撐。在現(xiàn)代軍事領(lǐng)域,作戰(zhàn)指揮對(duì)應(yīng)的作戰(zhàn)仿真具有重要作用,基于多智能體的建模與仿真技術(shù)能夠詳細(xì)描述軍事系統(tǒng)結(jié)構(gòu)框架、分析作戰(zhàn)要素和能力,在戰(zhàn)場(chǎng)上幫助完成任務(wù)并做出決策,主要體現(xiàn)在信息收集與情報(bào)分析、武器系統(tǒng)開發(fā)、軍事訓(xùn)練與作戰(zhàn)仿真、醫(yī)療診斷與治療、認(rèn)知滲透攻擊與網(wǎng)絡(luò)安全防御、任務(wù)規(guī)劃與供應(yīng)鏈管理等方向[3]。

然而,在特定應(yīng)用場(chǎng)景中單一運(yùn)用大模型仍存在時(shí)效性弱、適應(yīng)力差、專業(yè)性欠缺等問題。為解決單一大模型的局限性問題,已有研究提出大模型驅(qū)動(dòng)多智能體協(xié)作的架構(gòu),通過多個(gè)自主的智能體的認(rèn)知協(xié)同作用來完成復(fù)雜的任務(wù)、目標(biāo)或問題[4-5]。大模型驅(qū)動(dòng)的多智能體框架將特定應(yīng)用場(chǎng)景中的目標(biāo)分解為更小的可管理任務(wù),并將任務(wù)分配給具有不同推理能力的智能體,提升大模型利用數(shù)據(jù)集、專業(yè)領(lǐng)域工具或其他基礎(chǔ)模型等環(huán)境資源的能力。

針對(duì)不同的領(lǐng)域需求特點(diǎn),結(jié)構(gòu)化方法能夠?qū)Χ嘀悄荏w系統(tǒng)進(jìn)行評(píng)估,為多智能體系統(tǒng)在不同領(lǐng)域的性能分析提供標(biāo)準(zhǔn)。基于多智能體系統(tǒng)的評(píng)估領(lǐng)域提供了基于通信方法、任務(wù)分解、資源共享和沖突解決等評(píng)估策略的研究結(jié)果[6-8]。但是,早期的多智能體系統(tǒng)評(píng)估法相對(duì)簡(jiǎn)單,不適用于評(píng)估復(fù)雜的大模型驅(qū)動(dòng)下的多智能體系統(tǒng)。此外,雖然自主性和一致性標(biāo)準(zhǔn)在人工智能系統(tǒng)的架構(gòu)設(shè)計(jì)中具有基礎(chǔ)性作用[9],且已有研究證明自主性和一致性對(duì)基于大模型的多智能體系統(tǒng)的運(yùn)行結(jié)果產(chǎn)生較大影響,但是,目前國(guó)內(nèi)研究對(duì)基于大模型的多智能體的評(píng)估策略尚未結(jié)合自主性和一致性指標(biāo)來分析系統(tǒng)性能。因此,已有的系統(tǒng)評(píng)估法存在一定限制,不適用于大模型驅(qū)動(dòng)的多智能體系統(tǒng)的評(píng)估研究。

本文基于自主性和一致性特征對(duì)系統(tǒng)進(jìn)行評(píng)估分析,并對(duì)各核心功能的系統(tǒng)性能進(jìn)行評(píng)估,快速高效地生成評(píng)估結(jié)果,有助于對(duì)系統(tǒng)架構(gòu)動(dòng)態(tài)進(jìn)行細(xì)致的分析和評(píng)估。

1 大模型驅(qū)動(dòng)的多智能體架構(gòu)

在人工智能領(lǐng)域,智能體是指有能力感知周圍的環(huán)境,做出決策,然后采取行動(dòng)的實(shí)體,具有巨大的智能活動(dòng)潛力,被認(rèn)為是實(shí)現(xiàn)人工通用智能的關(guān)鍵技術(shù)。大模型在知識(shí)獲取、指令理解、泛化、規(guī)劃和推理方面具備強(qiáng)大的能力,并且能夠與用戶進(jìn)行有效的自然語(yǔ)言交互,因此成為驅(qū)動(dòng)多智能體協(xié)同合作以解決復(fù)雜任務(wù)的有力工具。

因?yàn)榇竽P万?qū)動(dòng)的多智能體技術(shù)在處理復(fù)雜任務(wù)時(shí)具有強(qiáng)大效能,能夠針對(duì)目標(biāo)或突發(fā)情況自主運(yùn)行,可適用于軍事系統(tǒng)的智能化應(yīng)用。此外,相關(guān)學(xué)術(shù)研究已建立多個(gè)能夠自主完成復(fù)雜任務(wù)的大模型驅(qū)動(dòng)的多智能體架構(gòu),其中具有代表性的多智能體系統(tǒng)包括AUTOGPT[10]、BABYAGI[11]、SUPERAGI[12]、HUGGINGGPT、CAMEL[13]、AGENTGPT和METAGPT[14]。

1.1 架構(gòu)組成

為了全面描述大模型驅(qū)動(dòng)的多智能體架構(gòu)特征,本文參考Kruchten提出的軟件“4+1”視圖架構(gòu)模型,建立通用的大模型驅(qū)動(dòng)的多智能體架構(gòu)模型。模型在Kruchten提出的4個(gè)關(guān)鍵工作模式,即目標(biāo)驅(qū)動(dòng)的任務(wù)管理、智能體構(gòu)建、多智能體協(xié)作和外部環(huán)境交互的基礎(chǔ)上,提取出12個(gè)大模型驅(qū)動(dòng)的多智能體系統(tǒng)的核心功能特征,對(duì)每個(gè)提取特征進(jìn)行自主性和一致性評(píng)估。相較于直接對(duì)整個(gè)系統(tǒng)進(jìn)行自主性和一致性評(píng)估的方法,本文的方法能夠提供一種綜合的多視角分析,揭示對(duì)系統(tǒng)內(nèi)行為和組成等復(fù)雜運(yùn)行模式的評(píng)估結(jié)果。

本文采用的大模型驅(qū)動(dòng)的多智能體系統(tǒng)的主要架構(gòu)如圖1所示。該框架可根據(jù)不同的應(yīng)用領(lǐng)域進(jìn)行功能定制。多智能體在架構(gòu)中主要發(fā)揮如下3個(gè)作用:首先,根據(jù)用戶輸入需求提取目標(biāo)任務(wù),對(duì)目標(biāo)任務(wù)進(jìn)行分解、編排和合成,生成處理結(jié)果;其次,驅(qū)動(dòng)大模型進(jìn)行多智能體協(xié)作和智能體構(gòu)建管理等;最后,與外部環(huán)境進(jìn)行交互,獲取外部工具、數(shù)據(jù)集和基礎(chǔ)模型等外部資源。可知,大模型能夠提供自然語(yǔ)言理解、分布式?jīng)Q策、群體智能交互模擬和關(guān)鍵詞生成等輔助功能,具備根據(jù)多智能體的提示和管理指令,驅(qū)動(dòng)智能體生成和角色定義、智能體與外部資源交互、智能體提取用戶需求內(nèi)容并編排合成的能力。

首先,目標(biāo)驅(qū)動(dòng)的任務(wù)管理模式描述系統(tǒng)根據(jù)用戶的功能需求實(shí)現(xiàn)的邏輯結(jié)構(gòu)。目標(biāo)驅(qū)動(dòng)的任務(wù)管理采用交互式和多視角的策略來完成用戶提示的目標(biāo)或復(fù)雜任務(wù)。在面對(duì)指定目標(biāo)時(shí),系統(tǒng)會(huì)根據(jù)功能點(diǎn)將復(fù)雜任務(wù)分解為更小、更易于管理的任務(wù),并將子任務(wù)分配給各個(gè)具備特定能力的智能體,該策略能夠有效關(guān)聯(lián)子任務(wù),并綜合模式結(jié)果,提升最終結(jié)果的全面性和連貫性。

其次,智能體構(gòu)建模式描述系統(tǒng)根據(jù)功能模塊開發(fā)需求實(shí)現(xiàn)的開發(fā)架構(gòu)。作為基礎(chǔ)組件的構(gòu)建系統(tǒng),每個(gè)智能體都具有獨(dú)特的功能,包括明確定義的角色、個(gè)人記憶、與其他智能體之間的通信以及對(duì)任務(wù)所需的外界資源的訪問,包括數(shù)據(jù)、工具或基礎(chǔ)模型。

再次,多智能體協(xié)作模式描述系統(tǒng)根據(jù)模塊管理需求實(shí)現(xiàn)的進(jìn)程架構(gòu)。多智能體協(xié)作通過交互層建立大模型驅(qū)動(dòng)的多智能體網(wǎng)絡(luò)。在執(zhí)行分配的任務(wù)時(shí),多個(gè)智能體通過消息交換相互協(xié)作,包括指定任務(wù)、詢問信息或評(píng)估任務(wù)結(jié)果。

最后,外部環(huán)境交互模式描述系統(tǒng)根據(jù)物理配置需求實(shí)現(xiàn)的物理結(jié)構(gòu)。外部環(huán)境交互獲取專家工具、數(shù)據(jù)、基礎(chǔ)模型或其他應(yīng)用程序等外部資源,提升系統(tǒng)收集、適應(yīng)和響應(yīng)復(fù)雜環(huán)境信息的能力,有效執(zhí)行復(fù)雜任務(wù)。

1.2 架構(gòu)工作流程

大模型驅(qū)動(dòng)的多智能體架構(gòu)每個(gè)關(guān)鍵模式的工作流程如圖2所示,系統(tǒng)架構(gòu)共包括12個(gè)核心功能,大模型的驅(qū)動(dòng)作用主要體現(xiàn)在分解、編排、合成、角色定義、資源集成和資源利用等特征功能中。框架的運(yùn)行流程如下:首先,用戶指定領(lǐng)域目標(biāo)和功能定義,提供數(shù)據(jù)、工具和模型等外部資源;其次,多個(gè)專業(yè)智能體協(xié)同處理外部資源信息,通過大模型驅(qū)動(dòng)進(jìn)行目標(biāo)分析和子任務(wù)分解,并與用戶進(jìn)行交互;再次,系統(tǒng)形成任務(wù)模塊,并通過與外部環(huán)境資源交互進(jìn)行深入求解。最后,多智能體生成處理結(jié)果并反饋給用戶。

首先,目標(biāo)驅(qū)動(dòng)的任務(wù)管理模式的工作流程包括分解、編排和合成三個(gè)核心功能。在目標(biāo)分解功能,系統(tǒng)能夠?qū)?fù)雜任務(wù)分解為可管理的任務(wù)和子任務(wù);通過解決子任務(wù)之間的相互關(guān)系,從而產(chǎn)生具有優(yōu)先級(jí)排序的任務(wù)列表。在任務(wù)編排功能,系統(tǒng)獲取分解后的任務(wù)列表,組織合適的智能體網(wǎng)絡(luò)進(jìn)行任務(wù)的分配和委派,并指定具有特定功能的智能體進(jìn)行子任務(wù)的處理。在結(jié)果合成功能,系統(tǒng)對(duì)智能體網(wǎng)絡(luò)反饋的處理結(jié)果進(jìn)行評(píng)估和合并,最終呈現(xiàn)統(tǒng)一的處理結(jié)果,并傳輸至用戶界面進(jìn)行結(jié)果反饋。

其次,智能體構(gòu)建模式的工作流程包括智能體生成、角色定義、內(nèi)存使用和網(wǎng)絡(luò)管理4個(gè)核心功能。在智能體生成功能,系統(tǒng)根據(jù)用戶或架構(gòu)師的預(yù)定義規(guī)則或外部資源條件,生成多個(gè)處理指定任務(wù)的智能體,并對(duì)多智能體網(wǎng)絡(luò)進(jìn)行任務(wù)分配。在角色定義功能,系統(tǒng)根據(jù)子任務(wù)編排結(jié)果,對(duì)智能體的功能角色和執(zhí)行功能等屬性進(jìn)行定義,使得智能體能夠自動(dòng)執(zhí)行分配任務(wù)。在內(nèi)存使用功能,系統(tǒng)根據(jù)多智能體運(yùn)行產(chǎn)生的已有記憶節(jié)點(diǎn)總量分配相應(yīng)靜態(tài)和動(dòng)態(tài)內(nèi)存,并進(jìn)行分配內(nèi)存的實(shí)時(shí)管理。在網(wǎng)絡(luò)管理功能,系統(tǒng)根據(jù)任務(wù)編排結(jié)果,對(duì)多智能體網(wǎng)絡(luò)的運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)督和任務(wù)分配的實(shí)時(shí)調(diào)整。

再次,多智能體協(xié)作模式的工作流程包括通信協(xié)議管理、提示工程、行動(dòng)管理3個(gè)核心功能。在通信協(xié)議管理功能,系統(tǒng)根據(jù)外部資源條件和硬件系統(tǒng)配置確定多智能體之間交互的通信協(xié)議,并對(duì)通信進(jìn)程進(jìn)行實(shí)時(shí)監(jiān)督管理。在提示工程功能,系統(tǒng)通過提示指令的開發(fā)和優(yōu)化,與大模型進(jìn)行交互,以引導(dǎo)大模型產(chǎn)生所期望的結(jié)果。在行動(dòng)管理功能,系統(tǒng)對(duì)多智能體之間的交互和智能體與大模型的交互行為進(jìn)行實(shí)時(shí)監(jiān)督和進(jìn)程管理。

最后,外部環(huán)境交互模式的工作流程包括資源集成和資源領(lǐng)域兩個(gè)核心功能。在資源集成功能,系統(tǒng)獲取外部環(huán)境提供的工具、數(shù)據(jù)集或基礎(chǔ)模型資源,并集成到多智能體交互層。在資源利用功能,系統(tǒng)根據(jù)任務(wù)編排和分配結(jié)果,從外部環(huán)境獲取任務(wù)處理所需的特定資源,并通過智能體網(wǎng)絡(luò)進(jìn)行資源處理和結(jié)果生成。

2 基于大模型驅(qū)動(dòng)的多智能體系統(tǒng)的多維評(píng)估體系

基于人工智能理論,大模型驅(qū)動(dòng)的多智能體系統(tǒng)實(shí)現(xiàn)有效運(yùn)行的核心因素是建立自主性和一致性之間的最佳平衡[13,15-17]。多智能體系統(tǒng)的自主性和一致性分別衡量系統(tǒng)自動(dòng)實(shí)現(xiàn)指定目標(biāo)的能力,以及系統(tǒng)運(yùn)行結(jié)果與用戶意圖的一致程度。具有高自主性、低一致性的系統(tǒng)能夠有效地處理復(fù)雜任務(wù),但結(jié)果與預(yù)期目的存在一定偏離;具有高一致性、低自主性的系統(tǒng)能夠嚴(yán)格遵守預(yù)期目的,但在變化環(huán)境中靈活性較差。

本文通過建立多維評(píng)估體系,分析大模型驅(qū)動(dòng)的多智能體系統(tǒng)架構(gòu)中自主性和一致性之間的相互作用,并對(duì)大模型驅(qū)動(dòng)的多智能體系統(tǒng)進(jìn)行全面的評(píng)估。評(píng)估方法主要包括3個(gè)關(guān)鍵維度,即自主性級(jí)別、一致性級(jí)別以及架構(gòu)組成模式。多維評(píng)估體系的簡(jiǎn)化表示如圖3所示,其中x軸表示自主性級(jí)別,y軸表示一致性級(jí)別,z軸表示系統(tǒng)架構(gòu)的4個(gè)組成模式。本文通過將大模型驅(qū)動(dòng)的多智能體系統(tǒng)的特征置于此評(píng)估結(jié)構(gòu),實(shí)現(xiàn)對(duì)多智能體系統(tǒng)的性能評(píng)估。

2.1 自主性評(píng)估

自主性程度是指人工智能系統(tǒng)能夠獨(dú)立于用戶定義的規(guī)則和機(jī)制做出決策和行動(dòng)的程度。在大模型驅(qū)動(dòng)的多智能體系統(tǒng)中,自主性程度表示系統(tǒng)以自組織方式解決用戶指定的目標(biāo)或任務(wù),適應(yīng)環(huán)境和重新校準(zhǔn)給定情況的復(fù)雜性能力。從圖4所示的用戶、規(guī)則機(jī)制和大模型驅(qū)動(dòng)的多智能體之間的相互作用中可以看出,低自主性的系統(tǒng)嚴(yán)重依賴于預(yù)先設(shè)置的定義規(guī)則和框架,難以獨(dú)立解決用戶指定的目標(biāo)或意圖,而高自主性的系統(tǒng)不依賴于定制的規(guī)則框架,能夠直接處理用戶給定任務(wù)需求。

在大模型驅(qū)動(dòng)的多智能體系統(tǒng)中,自主性水平表示在多智能體獨(dú)立于預(yù)定義和自動(dòng)化機(jī)制的情況下做出有關(guān)系統(tǒng)操作的決策的程度,主要可劃分為靜態(tài)自主性、自適應(yīng)自主性和自組織自主性。L0表示靜態(tài)自主性級(jí)別,對(duì)應(yīng)系統(tǒng)嚴(yán)重依賴于架構(gòu)師嵌入的規(guī)則、條件和機(jī)制,且智能體無權(quán)在運(yùn)行時(shí)修改規(guī)則,僅能夠有效執(zhí)行分配的任務(wù);L1表示自適應(yīng)自主性級(jí)別,對(duì)應(yīng)系統(tǒng)能夠在架構(gòu)師建立的結(jié)構(gòu)和程序指南內(nèi)調(diào)整其行為,智能體能夠根據(jù)給定應(yīng)用場(chǎng)景需求,在提供的框架(例如靈活的基礎(chǔ)設(shè)施和協(xié)議)內(nèi)調(diào)整系統(tǒng)操作;L2表示自組織自主性級(jí)別,對(duì)應(yīng)系統(tǒng)智能體成為主要參與者,能夠自我組織、主動(dòng)學(xué)習(xí)并根據(jù)環(huán)境線索和經(jīng)驗(yàn)實(shí)時(shí)動(dòng)態(tài)調(diào)整其操作。

2.2 一致性評(píng)估

一致性程度是指對(duì)與用戶指定的目標(biāo)或復(fù)雜任務(wù)相關(guān)的偏好、策略、約束和邊界等條件的詳細(xì)校準(zhǔn),衡量系統(tǒng)用戶影響或調(diào)整系統(tǒng)行為的程度。低一致性的系統(tǒng)設(shè)置了廣泛的行為邊界,而不關(guān)注特定的用戶偏好;高一致性的系統(tǒng)適應(yīng)性更強(qiáng),并以用戶指定的任務(wù)為中心,用戶可以靈活在其活動(dòng)操作期間設(shè)置偏好,系統(tǒng)的動(dòng)態(tài)范圍確保生成結(jié)果更貼合用戶目標(biāo)。

在大模型驅(qū)動(dòng)的多智能體系統(tǒng)中,一致性水平衡量了系統(tǒng)用戶影響或調(diào)整系統(tǒng)行為的程度,主要可劃分為集成一致、用戶引導(dǎo)一致和實(shí)時(shí)響應(yīng)式一致。L0表示集成一致級(jí)別,對(duì)應(yīng)系統(tǒng)中的一致機(jī)制是靜態(tài)的和規(guī)則驅(qū)動(dòng)的,用戶無法更改;L1表示用戶引導(dǎo)一致級(jí)別,對(duì)應(yīng)系統(tǒng)提供了一定程度的自定義,允許用戶在系統(tǒng)開始運(yùn)行之前設(shè)置或調(diào)整特定的一致參數(shù)(例如條件、規(guī)則或邊界);L2表示實(shí)時(shí)響應(yīng)式一致級(jí)別,對(duì)應(yīng)系統(tǒng)可以在關(guān)鍵時(shí)刻或決策點(diǎn)主動(dòng)征求用戶反饋和用戶決策,使得用戶和系統(tǒng)之間能夠持續(xù)反饋,從而實(shí)現(xiàn)高水平的協(xié)作。

2.3 自主性與一致性綜合評(píng)估體系

通過結(jié)合自主性和一致性兩個(gè)維度,圖5展示了大模型驅(qū)動(dòng)的多智能體系統(tǒng)中不同層次的自主性和一致性之間的相互作用。y軸代表一致性級(jí)別,箭頭起始為用戶角色為被動(dòng)的集成一致級(jí)別(L0)指向到需要主動(dòng)參與的實(shí)時(shí)響應(yīng)一致級(jí)別(L2);x軸代表自主性級(jí)別,箭頭起始為靜態(tài)自主性級(jí)別(L0)發(fā)展到自組織自主性級(jí)別(L2)。

可知,不同層次的自主性和一致性之間的相互作用能夠形成9種評(píng)估標(biāo)準(zhǔn),如表1所示。當(dāng)系統(tǒng)的自主性水平為靜態(tài)自主性級(jí)別(L0),一致性水平為集成一致級(jí)別(L0)時(shí);或者系統(tǒng)的自主性水平為自適應(yīng)自主性級(jí)別(L1),一致性水平為用戶引導(dǎo)一致級(jí)別(L1)時(shí);或者系統(tǒng)的自主性水平為自組織自主性級(jí)別(L2),一致性水平為實(shí)時(shí)響應(yīng)一致級(jí)別(L2)時(shí),系統(tǒng)的自主性與一致性能夠達(dá)到平衡狀態(tài),分別對(duì)應(yīng)為規(guī)則驅(qū)動(dòng)的自動(dòng)化系統(tǒng)、用戶引導(dǎo)適應(yīng)系統(tǒng)和用戶響應(yīng)系統(tǒng)。此外,若系統(tǒng)的自主性水平高于一致性水平,系統(tǒng)可能出現(xiàn)處理結(jié)果與用戶預(yù)期意圖偏離較大的問題;若系統(tǒng)的一致性水平高于自主性水平,系統(tǒng)可能出現(xiàn)對(duì)復(fù)雜任務(wù)的處理能力低下、過度依賴用戶預(yù)制規(guī)則的問題。因此,大模型驅(qū)動(dòng)的多智能體系統(tǒng)通過建立自主性和一致性水平之間的平衡,能夠?qū)崿F(xiàn)多智能體的高效協(xié)作。將自主性與一致性的綜合評(píng)估結(jié)果應(yīng)用于大模型驅(qū)動(dòng)的多智能體架構(gòu)的4個(gè)組成模式中,形成36個(gè)不同的相互作用結(jié)果,如表2所示。

圖6展示大模型驅(qū)動(dòng)的多智能體架構(gòu)的評(píng)估體系的特征,系統(tǒng)架構(gòu)的4個(gè)組成模式對(duì)應(yīng)的12個(gè)核心功能都集成了自主性和一致性級(jí)別的評(píng)估,對(duì)應(yīng)每個(gè)運(yùn)行功能存在9種可能的評(píng)估結(jié)果。因此,系統(tǒng)架構(gòu)在4個(gè)組成模式下的核心功能總數(shù)分別為A1=A2=3、A3=4和A4=2,每個(gè)功能對(duì)應(yīng)的自主性或一致性的評(píng)估級(jí)別數(shù)量L=3,能夠計(jì)算系統(tǒng)運(yùn)行功能總數(shù)量T0、每個(gè)運(yùn)行功能對(duì)應(yīng)所有可能的評(píng)估結(jié)果數(shù)量S0、總單一配置數(shù)量T1和總組合配置數(shù)量T2,關(guān)系公式如下:

在此基礎(chǔ)上,對(duì)系統(tǒng)性能的綜合評(píng)估結(jié)果可包括3種形式:第一種是系統(tǒng)各功能之間相互獨(dú)立,即不存在相互影響和耦合關(guān)系,對(duì)應(yīng)的每個(gè)核心功能的評(píng)估結(jié)果不受其他功能的評(píng)估結(jié)果影響,這種完全獨(dú)立系統(tǒng)的所有不重復(fù)的評(píng)估結(jié)果總數(shù)為T1;第二種是系統(tǒng)的各功能僅受到相同架構(gòu)組成模式下的其他核心功能影響,在不同架構(gòu)組成模式下的兩個(gè)運(yùn)行功能均相互獨(dú)立,這種模式耦合的系統(tǒng)的所有不重復(fù)的評(píng)估結(jié)果總數(shù)為T2;第三種是系統(tǒng)的所有運(yùn)行功能之間均能夠互相影響或存在耦合作用,不存在相互獨(dú)立的兩個(gè)核心功能,這種完全耦合的系統(tǒng)的所有不重復(fù)的評(píng)估結(jié)果總數(shù)為T3。這三類系統(tǒng)分別對(duì)應(yīng)的評(píng)估結(jié)果總數(shù)能夠間接反映系統(tǒng)的復(fù)雜程度,關(guān)系公式如下:

根據(jù)上式,可得T1=108,T2=2×93+92+94=8 100,T3=912≈282×109。因此,在系統(tǒng)的所有運(yùn)行功能下,完全獨(dú)立的系統(tǒng)通過多維評(píng)估體系能夠生成108個(gè)不同的評(píng)估結(jié)果;完全耦合的系統(tǒng)需要考慮各功能的所有可能組合,能夠得出總共912個(gè)組合評(píng)估結(jié)果,相當(dāng)于2 820億個(gè)可用于配置大模型驅(qū)動(dòng)的多智能體架構(gòu)的組合。該數(shù)據(jù)體現(xiàn)了基于大模型多智能體系統(tǒng)的多維評(píng)估方法能夠有效應(yīng)用于具備不同特征功能的復(fù)雜系統(tǒng)的性能綜合評(píng)估。

3 實(shí)驗(yàn)

為驗(yàn)證多維評(píng)估體系的實(shí)用性,本文基于現(xiàn)有的大模型驅(qū)動(dòng)的多智能體系統(tǒng),包括AUTOGPT[10]、BABYAGI[11]、SUPERAGI[12]、HUGGINGGPT,METAGPT[13]、 CAMEL和AGENTGPT[14],評(píng)估已有系統(tǒng)的自主性和一致性水平。這7個(gè)選定的大模型系統(tǒng)研究均提供了開源項(xiàng)目代碼,本文通過檢查選定系統(tǒng)的技術(shù)文檔、開源代碼庫(kù)來確認(rèn)系統(tǒng)的實(shí)時(shí)功能,對(duì)大模型多智能體架構(gòu)在不同功能點(diǎn)下的自主性和一致性水平。下面以典型的AutoGPT、HuggingGPT和CAMEL項(xiàng)目為例,通過技術(shù)文檔、代碼庫(kù)提取性能級(jí)別的評(píng)估方法進(jìn)行概述。

首先,AutoGPT是一種基于GPT-4的自動(dòng)化文本生成模型,能夠根據(jù)用戶設(shè)定角色,自動(dòng)拆解任務(wù)并協(xié)作完成。在任務(wù)分解過程中,AutoGPT系統(tǒng)能夠?qū)τ脩舳x目標(biāo)進(jìn)行自主分解獲取任務(wù),確定任務(wù)的優(yōu)先級(jí),對(duì)應(yīng)分解自主性為L(zhǎng)2;在編排過程中,該系統(tǒng)包含3個(gè)不同的任務(wù)管理智能體:執(zhí)行智能體、任務(wù)創(chuàng)建智能體和任務(wù)優(yōu)先級(jí)排序智能體,但所有任務(wù)都由單一的執(zhí)行智能體按優(yōu)先級(jí)順序執(zhí)行,對(duì)應(yīng)編排自主性為L(zhǎng)0;在合成過程中,系統(tǒng)完成每項(xiàng)任務(wù)后會(huì)評(píng)估中間結(jié)果并進(jìn)行自我批評(píng),最終處理結(jié)果是所有智能體處理結(jié)果的集合,并輔以簡(jiǎn)潔的摘要,對(duì)應(yīng)合成自主性為L(zhǎng)1;在通信協(xié)議管理中,系統(tǒng)3個(gè)代理之間的通信遵循預(yù)定義的通信協(xié)議,無須進(jìn)行通信協(xié)議管理,對(duì)應(yīng)通信協(xié)議管理自主性為L(zhǎng)0;在提示工程中,系統(tǒng)的提示工程能夠基于模板進(jìn)行生成,對(duì)應(yīng)提示工程自主性為L(zhǎng)1;在行動(dòng)管理中,系統(tǒng)能夠?qū)崿F(xiàn)對(duì)智能體執(zhí)行的操作進(jìn)行自組織管理,對(duì)應(yīng)行動(dòng)管理自主性為L(zhǎng)2;在智能體生成中,該系統(tǒng)中的智能體是預(yù)先配置的,并且只能實(shí)例化一次,對(duì)應(yīng)智能體生成自主性為L(zhǎng)0;在角色定義中,系統(tǒng)的執(zhí)行智能體的角色是自適應(yīng)的,對(duì)應(yīng)角色定義自主性為L(zhǎng)1;在內(nèi)存管理中,系統(tǒng)的內(nèi)存使用和網(wǎng)絡(luò)管理都遵循預(yù)定義的規(guī)則,對(duì)應(yīng)內(nèi)存管理和網(wǎng)絡(luò)管理功能的自主性均為L(zhǎng)0;在資源集成中,系統(tǒng)配備了一套預(yù)定義的外部環(huán)境資源,無須集成其他外部環(huán)境資源,對(duì)應(yīng)資源集成的自主性為L(zhǎng)0;在資源利用中,系統(tǒng)將這些資源根據(jù)場(chǎng)景的需要以自組織的方式使用,在資源利用功能表現(xiàn)出L2的自主性。此外,系統(tǒng)在各個(gè)方面僅提供了低級(jí)別的用戶交互,除了目標(biāo)傳輸之外,進(jìn)一步的用戶交互僅可通過授權(quán)后續(xù)執(zhí)行步驟才能使用,且在大部分情況下系統(tǒng)通過連續(xù)模式跳過該授權(quán)步驟,使用戶無法進(jìn)一步干預(yù),因此系統(tǒng)在所有功能的一致性級(jí)別均為L(zhǎng)0。

HuggingGPT是一個(gè)基于ChatGPT的大模型協(xié)作系統(tǒng),它通過語(yǔ)言接口連接和管理平臺(tái)上的智能體模型,解決多模態(tài)和復(fù)雜的人工智能任務(wù)。HuggingGPT系統(tǒng)采用不同的多智能體協(xié)作策略,將大模型驅(qū)動(dòng)的智能體作為自主控制器,結(jié)合各種多模態(tài)智能體模型來解決復(fù)雜任務(wù)。系統(tǒng)集成了HUGGING FACE平臺(tái),該平臺(tái)提供了大量可供使用的基礎(chǔ)模型。在任務(wù)分解過程中,系統(tǒng)采用的由大模型驅(qū)動(dòng)的單一中央代理適用于解決給定目標(biāo),能夠自主地將目標(biāo)或復(fù)雜任務(wù)分解為可管理的任務(wù),對(duì)應(yīng)分解功能自主性水平為L(zhǎng)2;在其他過程中,系統(tǒng)通過提示選擇、組合和應(yīng)用適當(dāng)?shù)哪P停沟眉伞①Y源利用、提示工程、行動(dòng)管理、智能體生成和角色定義功能的自主性級(jí)別達(dá)到L2;此外,系統(tǒng)可適應(yīng)給定的任務(wù),包括由預(yù)定義流程組成的通信協(xié)議管理、高級(jí)流程框架規(guī)劃、模型選擇、任務(wù)執(zhí)行和響應(yīng)生成,對(duì)應(yīng)編排、通信協(xié)議管理、內(nèi)存管理功能的自主性級(jí)別為L(zhǎng)1;系統(tǒng)的網(wǎng)絡(luò)管理遵循預(yù)定義的規(guī)則,對(duì)應(yīng)網(wǎng)絡(luò)管理功能的自主性級(jí)別為L(zhǎng)0。盡管HuggingGPT在大模式功能的自主性水平較高,但它并沒有給予用戶在任何功能下的定制或監(jiān)督選擇,導(dǎo)致系統(tǒng)的一致性級(jí)別均為L(zhǎng)0。

CAMEL系統(tǒng)框架是目前首個(gè)基于大模型的多智能體框架。CAMEL系統(tǒng)采用由大模型驅(qū)動(dòng)的通信智能體之間自主合作以完成復(fù)雜任務(wù)的方式,自主處理用戶給定的提示目標(biāo)。在任務(wù)分解過程中,系統(tǒng)通過專用任務(wù)指定智能體將目標(biāo)分解為可管理任務(wù)列表,對(duì)應(yīng)分解功能的自主性為L(zhǎng)2;在其他過程中,系統(tǒng)通過循環(huán)對(duì)話模式協(xié)同的智能體處理任務(wù),對(duì)應(yīng)編排、通信協(xié)議管理和網(wǎng)絡(luò)管理中的自主性為L(zhǎng)0;用戶可以選擇預(yù)定義智能體原型的特定角色,通過智能體的定義和相互關(guān)系進(jìn)行調(diào)控,對(duì)應(yīng)角色定義、網(wǎng)絡(luò)管理和智能體生成功能的一致性均為L(zhǎng)1;系統(tǒng)在提示工程和行動(dòng)管理中都實(shí)現(xiàn)了較高的自主性。

3.1 系統(tǒng)自主性和一致性水平評(píng)估

表3、表4分別為選定系統(tǒng)在不同核心功能下的自主性和一致性水平的評(píng)估結(jié)果。圖7為大模型驅(qū)動(dòng)的多智能體系統(tǒng)的自主性和一致性水平的雷達(dá)圖[18],其中系統(tǒng)架構(gòu)下的核心運(yùn)行功能構(gòu)成極坐標(biāo)軸,自主性和一致性級(jí)別由連接這些軸的灰色圓圈表示;藍(lán)色實(shí)線代表自主性水平的評(píng)估結(jié)果;綠色虛線代表一致性水平的評(píng)估結(jié)果。綜上所述,所選系統(tǒng)在不同的架構(gòu)組成或運(yùn)行功能下的自主性和一致性存在較大差距,系統(tǒng)一致性水平普遍低于自主性水平,系統(tǒng)在分解、生成、提示生成、行動(dòng)管理、角色定義和資源利用等核心功能下的性能優(yōu)于其他核心功能下的性能。

在自主性方面,較多系統(tǒng)在核心功能下的自主性水平表現(xiàn)出相同的變化規(guī)律,故可根據(jù)評(píng)估結(jié)果統(tǒng)計(jì)分析所有系統(tǒng)在不同運(yùn)行功能下的自主性水平分布。首先,具有高自主性表現(xiàn)的運(yùn)行功能的基本特征為具有自組織、自主決策的大模型驅(qū)動(dòng)智能體參與運(yùn)行,主要包括目標(biāo)分解、行動(dòng)管理、外部環(huán)境交互功能,對(duì)應(yīng)自主性級(jí)別基本能夠達(dá)到L2;其次,系統(tǒng)在具有中等自主性水平的運(yùn)行功能采用半自主策略,即通過由大模型驅(qū)動(dòng)的多智能體適應(yīng)的預(yù)定義機(jī)制進(jìn)行任務(wù)處理,主要包括合成、提示工程功能;再次,系統(tǒng)在低自主性水平的運(yùn)行功能采用基于規(guī)則的機(jī)制和自動(dòng)化的確定性策略,主要包括編排、通信協(xié)議管理、內(nèi)存管理、網(wǎng)絡(luò)管理和資源集成功能。最后,系統(tǒng)在智能體生成和角色定義功能的自主性水平表現(xiàn)出多樣性,因?yàn)椴煌到y(tǒng)的多智能體協(xié)作采用不同的策略。

在一致性方面,大多數(shù)系統(tǒng)的主要策略是在所有評(píng)估方面保持較低水平的一致性,并且在已經(jīng)集成到系統(tǒng)架構(gòu)中的一致性技術(shù)中,幾乎沒有可供用戶調(diào)整的選項(xiàng)。此外,系統(tǒng)通過具有預(yù)定義和自動(dòng)化機(jī)制的高自主性功能來補(bǔ)償對(duì)應(yīng)功能在一致性方面的不足。但是,少數(shù)大模型系統(tǒng)能夠在特定功能提供中等水平的一致性,對(duì)應(yīng)功能包括智能體生成、角色定義和資源利用。此外,數(shù)據(jù)顯示所有受檢系統(tǒng)都缺乏實(shí)時(shí)響應(yīng)的一致性選項(xiàng),少數(shù)大模型系統(tǒng)為用戶提供了可用的監(jiān)控功能,提升執(zhí)行智能體在任務(wù)反思和規(guī)劃期間的推理能力和決策的透明度。

此外,研究將所選的7個(gè)系統(tǒng)按不同功能下的性能表現(xiàn)分為3個(gè)不同的系統(tǒng)組,包括通用系統(tǒng)組、中央控制器系統(tǒng)組和角色智能體系統(tǒng)組。需要注意的是,本文采用的評(píng)估系統(tǒng)組沒有涵蓋大模型驅(qū)動(dòng)的多智能體系統(tǒng)的全部范圍,如需全面了解現(xiàn)有系統(tǒng)評(píng)估類別可參考已有研究[19-20]。下面將討論3類大模型驅(qū)動(dòng)的多智能體系統(tǒng)組對(duì)應(yīng)的關(guān)鍵特征。首先,通用系統(tǒng)組包括AUTO-GPT、 BABYAGI、 SUPERAGI和AGENTGPT系統(tǒng),這些系統(tǒng)因?yàn)橥ㄟ^任務(wù)執(zhí)行智能體的方式進(jìn)行多智能體交互,對(duì)應(yīng)通信協(xié)議管理和網(wǎng)絡(luò)管理的自主性水平較低,行動(dòng)管理和資源利用的自主性級(jí)別達(dá)到L2,因此這類系統(tǒng)具有較強(qiáng)的適應(yīng)能力,能夠適用于具有廣泛功能的任務(wù);其次,中央控制器系統(tǒng)組包括HUGGINGGPT系統(tǒng),系統(tǒng)特點(diǎn)為單個(gè)由大模型驅(qū)動(dòng)的中央控制智能體被賦予了最高級(jí)別的自主權(quán),且沒有以用戶為中心的一致性選項(xiàng),對(duì)應(yīng)一致性水平均為L(zhǎng)0,自主性水平基本接近較高級(jí)別,這類系統(tǒng)處理復(fù)雜任務(wù)的能力較強(qiáng),但用戶交互性較差,對(duì)應(yīng)HuggingGPT的自主性水平明顯高于其他選定系統(tǒng);最后,角色智能體系統(tǒng)組包括METAGPT和CAMEL系統(tǒng),特點(diǎn)為采用多個(gè)專用角色智能體之間的相互作用或模擬,對(duì)應(yīng)編排和通信協(xié)議管理的性能較差,適用于特點(diǎn)應(yīng)用領(lǐng)域或解決多視角協(xié)作的任務(wù)。

3.2 系統(tǒng)發(fā)展方向分析

圖8為7個(gè)選定系統(tǒng)的已識(shí)別的自主性和一致性水平關(guān)于12個(gè)運(yùn)行功能的分布結(jié)果。表5為選定系統(tǒng)在各功能的自主性和一致性水平對(duì)比結(jié)果。綜上所述,大模式系統(tǒng)的架構(gòu)在所有評(píng)估方面基本保持較低水平的一致性和較高水平的自主性。在自主性方面,選定系統(tǒng)在分解、合成、提示工程、行動(dòng)管理、角色定義和資源利用等特定功能下的自主性水平較高,在編排、通信協(xié)議管理、內(nèi)存管理、網(wǎng)絡(luò)管理、資源集成等核心功能下的自主性水平較低;在一致性方面,幾乎沒有系統(tǒng)架構(gòu)集成用戶調(diào)整的選項(xiàng),并且能夠觀察到系統(tǒng)明顯傾向于在特定方面達(dá)到用戶引導(dǎo)的一致性級(jí)別(L1),對(duì)應(yīng)特征包括多智能體生成、角色定義和外部環(huán)境利用。數(shù)據(jù)顯示,所有受檢系統(tǒng)都缺乏實(shí)時(shí)響應(yīng)級(jí)別的一致性選項(xiàng)(L2)。

在自主性方面,選定的系統(tǒng)在編排、通信協(xié)議管理、內(nèi)存管理、網(wǎng)絡(luò)管理和資源集成等核心功能的自主性水平較低,大模型系統(tǒng)自主性級(jí)別僅為L(zhǎng)0;在分解、行動(dòng)管理和資源利用功能的自主性水平較高,大模型系統(tǒng)的自主性級(jí)別達(dá)到L2;在合成、提示工程、智能體生成和角色定義功能的自主性處于中等水平,大模型系統(tǒng)的自主性級(jí)別為L(zhǎng)1。目前,因?yàn)橹悄荏w之間的協(xié)作主要依靠預(yù)定義的任務(wù)執(zhí)行智能體之間的受限通信協(xié)議,或具有預(yù)定義執(zhí)行鏈的順序或多周期過程,研究人員可通過使用大模型驅(qū)動(dòng)的智能體來管理,或者調(diào)整智能體網(wǎng)絡(luò)的生成及其協(xié)作模式,從而提升系統(tǒng)的編排、通信協(xié)議管理、內(nèi)存管理和網(wǎng)絡(luò)管理功能的自主性水平;此外,研究人員可通過配置智能體可直接獲取的外部接口或提供可集成的資源環(huán)境,提升系統(tǒng)的資源集成功能的自主性水平。

在一致性方面,選定的系統(tǒng)在12個(gè)核心功能的一致性水平均較低,大模型系統(tǒng)的一致性級(jí)別僅為L(zhǎng)0,遠(yuǎn)低于系統(tǒng)的自主性水平。因此,用戶能夠訪問和影響系統(tǒng)內(nèi)部工作的選項(xiàng)非常有限,并且代理的內(nèi)部組成和協(xié)作對(duì)用戶來說基本是不透明的,這降低了系統(tǒng)操作的透明度,影響系統(tǒng)決策的可信度。雖然某些系統(tǒng)提供了用戶反饋和規(guī)劃的渠道,但大模型系統(tǒng)的內(nèi)部機(jī)制的定制選擇不提供給用戶。因此,系統(tǒng)需要在代理生成和角色定義功能加入用戶調(diào)整選項(xiàng),并在通信協(xié)議管理、任務(wù)編排或結(jié)果綜合功能加入用戶可修改的內(nèi)容,通過增強(qiáng)實(shí)時(shí)監(jiān)控,提升系統(tǒng)在各功能的一致性水平。

4 結(jié)束語(yǔ)

本文提出了一種基于大模型驅(qū)動(dòng)的多智能體系統(tǒng)的多維評(píng)估體系,通過層次結(jié)構(gòu)矩陣在4個(gè)架構(gòu)組成模式下的映射,產(chǎn)生的復(fù)雜評(píng)估系統(tǒng)能夠?qū)ΜF(xiàn)有系統(tǒng)架構(gòu)中自主性和一致性之間的相互作用進(jìn)行評(píng)估。該評(píng)估法通過目標(biāo)驅(qū)動(dòng)的任務(wù)管理、多智能體協(xié)作、智能體構(gòu)建和外部環(huán)境交互組成模式對(duì)應(yīng)的12個(gè)不同的核心功能,能夠?qū)Υ竽P万?qū)動(dòng)的多智能體系統(tǒng)中的架構(gòu)復(fù)雜性進(jìn)行細(xì)致的分解。本文對(duì)已有的7個(gè)典型大模型驅(qū)動(dòng)的多智能體系統(tǒng)進(jìn)行性能評(píng)估,得到3組具有不同性能特征的多智能體系統(tǒng)組,并對(duì)系統(tǒng)現(xiàn)有性能和發(fā)展前景進(jìn)行綜合分析,驗(yàn)證了多維評(píng)估體系在實(shí)際系統(tǒng)評(píng)估領(lǐng)域中的有效性。

目前,本文通過7個(gè)大模型多智能體系統(tǒng)的實(shí)驗(yàn)結(jié)果驗(yàn)證方法的有效性,但選取的驗(yàn)證系統(tǒng)尚未全面覆蓋不同規(guī)模和復(fù)雜程度的多智能體系統(tǒng),可能影響實(shí)驗(yàn)結(jié)果的廣泛性和普適性。在未來發(fā)展中,本文所提的方法將在更大規(guī)模、更復(fù)雜的大模型多智能體系統(tǒng)上進(jìn)行驗(yàn)證,進(jìn)一步提升研究的完備性和應(yīng)用價(jià)值。

參考文獻(xiàn):

[1] BROWN T B, MANN B, RYDER N, et al. Language models are few-shot learners[C]//Proceedings of the 34th International Conference on Neural Information Processing Systems. Vancouver, 2020: 1 877-1 901.

[2] OUYANG L, WU J, XU J, et al. Training language models to follow instructions with human feedback[C]//Proceedings of the 36th International Conference on Neural Information Processing Systems. New Orleans, 2024: 27 730-27 744.

[3] 季鵬飛, 華松逸, 張煜晨, 等. 軍事大模型發(fā)展現(xiàn)狀與算力基礎(chǔ)設(shè)施需求分析[J]. 軍民兩用技術(shù)與產(chǎn)品, 2024(6): 36-44.

JI P F, HUA S Y, ZHANG Y C, et al.

Current development status of military large models and analysis of computing infrastructure requirements[J]. Dual Use Technologies amp; Products, 2024(6): 36-44.

[4] CHAN C M, CHEN W Z, SU Y S, et al. ChatEval: towards better LLM-based evaluators through multi-agent debate[EB/OL]. 2023: 2308.07201. https://arxiv.org/abs/2308.07201v1.

[5] WU Q Y, BANSAL G, ZHANG J Y, et al. AutoGen: enabling next-gen LLM applications via multi-agent conversation[EB/OL]. 2023: 2308.08155. https://arxiv.org/abs/2308.08155v2.

[6] BIRD S D. Toward a taxonomy of multi-agent systems[J]. International Journal of Man-Machine Studies, 1993, 39(4): 689-704.

[7] MOYA L J, TOLK A, MOYA L J, et al. Towards a taxonomy of agents and multi-agent systems[C]//Proceedings of the 2007 Spring Simulation Multiconference-Volume 2. Norfolk, 2007: 11-18.

[8] VAN DYKE PARUNAK H, BRUECKNER S, FLEISCHER M, et al. A design taxonomy of multi-agent interactions[C]//Agent-Oriented Software Engineering IV. Berlin, Heidelberg: Springer Berlin Heidelberg, 2004: 123-137.

[9] RUSSEL S. Human compatible: AI and the problem of control[M]. Penguin Uk, 2019.

[10]YANG H, YUE S F, HE Y Z. Auto-GPT for online decision making: benchmarks and additional opinions[EB/OL]. 2023: 2306.02224. https://arxiv.org/abs/2306.02224v1.

[11]TALEBIRAD Y, NADIRI A. Multi-agent collaboration: harnessing the power of intelligent LLM agents[EB/OL]. 2023: 2306.03314. https://arxiv.org/abs/2306.03314v1.

[12]ZHAO P Y, JIN Z J, CHENG N. An in-depth survey of large language model-based artificial intelligence agents[EB/OL]. 2023: 2309.14365. https://arxiv.org/abs/2309.14365v1.

[13]HONG S R, ZHUGE M C, CHEN J Q, et al. MetaGPT: meta programming for A multi-agent collaborative framework[EB/OL]. 2023: 2308.00352. https://arxiv.org/abs/2308.00352v7.

[14]RASAL S. LLM harmony: Multi-agent communication for problem solving[EB/OL]. 2024: 2401.01312. https://arxiv.org/abs/2401.01312v1.

[15]RUSSELL S. Artificial intelligence and the problem of control[M]//Perspectives on Digital Humanism. Cham: Springer International Publishing, 2021: 19-24.

[16]WOLF Y, WIES N, AVNERY O, et al. Fundamental limitations of alignment in large language models[EB/OL]. 2023: 2304.11082. https://arxiv.org/abs/2304.11082v6.

[17]ROZANSKI N, WOODS E. Software Systems Architecture: Working With Stakeholders Using Viewpoints and Perspectives[M]. Boston: Addison-Wescey, 2012.

[18]TUFTE E R. The visual display of quantitative information[M]. "Florida: Graphics Press, 1983.

[19]WANG L, MA C, FENG X Y, et al. A survey on large language model based autonomous agents[J]. Frontiers of Computer Science, 2024, 18(6): 186 345.

[20]XI Z H, CHEN W X, GUO X, et al. The rise and potential of large language model based agents: a survey[EB/OL]. 2023: 2309.07864. https://arxiv.org/abs/2309.07864v3.

(責(zé)任編輯:胡前進(jìn))

主站蜘蛛池模板: 国产不卡网| 亚洲毛片一级带毛片基地| 2019国产在线| 亚洲va视频| 波多野结衣中文字幕一区二区| 色偷偷一区二区三区| 97在线碰| 亚洲精品视频免费看| 天堂在线亚洲| 久久五月视频| 免费无码网站| 熟妇丰满人妻av无码区| 国产高潮流白浆视频| 暴力调教一区二区三区| 日本人妻丰满熟妇区| 精品91视频| 91精品人妻一区二区| 中文字幕中文字字幕码一二区| 久久国产精品电影| 日韩av在线直播| 99精品视频播放| 日韩成人免费网站| 国产91成人| 欧美精品H在线播放| 国产草草影院18成年视频| 中文无码精品A∨在线观看不卡 | 欧美在线导航| 国产精品成人免费综合| a欧美在线| 最新日韩AV网址在线观看| 国产丰满大乳无码免费播放| 无码中文字幕乱码免费2| 国产成人欧美| 中文字幕天无码久久精品视频免费 | 日韩美一区二区| 亚洲视频四区| 午夜福利免费视频| 免费 国产 无码久久久| 欧美一级高清视频在线播放| 国产无码高清视频不卡| 99久视频| 热re99久久精品国99热| 日韩午夜伦| 欧美国产精品不卡在线观看| 亚洲另类国产欧美一区二区| 久久黄色影院| 亚洲av无码人妻| 91欧美亚洲国产五月天| 欧美日本在线播放| 亚洲 欧美 日韩综合一区| A级毛片高清免费视频就| 国产美女无遮挡免费视频网站| 男女精品视频| 99久久性生片| a级毛片免费看| 亚洲高清免费在线观看| 四虎永久免费地址| 国产91高清视频| 99re这里只有国产中文精品国产精品 | 欧美高清视频一区二区三区| 欧美精品在线看| 狠狠做深爱婷婷久久一区| 国产区成人精品视频| 少妇精品网站| 免费可以看的无遮挡av无码| 久久精品亚洲专区| 一本久道久久综合多人| 亚洲侵犯无码网址在线观看| 一级全免费视频播放| 欧美日韩亚洲综合在线观看| 免费人成又黄又爽的视频网站| 无码aaa视频| 国产一区二区三区在线观看视频| 亚洲天堂伊人| 国产极品美女在线播放| 欧美一级特黄aaaaaa在线看片| 在线不卡免费视频| 精品人妻无码中字系列| 国产无码精品在线播放| 亚洲欧美日韩精品专区| 久久精品日日躁夜夜躁欧美| 亚洲国产综合精品一区|