999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于行動(dòng)邏輯的智能主體行為表征研究

2013-08-15 00:53:20張曉君郝一江
關(guān)鍵詞:主體智能模型

張曉君,郝一江

(1.廈門(mén)大學(xué) 哲學(xué)系,福建廈門(mén) 361005;2.福建省仿腦智能系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,福建廈門(mén) 361005;3.華中科技大學(xué)哲學(xué)系,武漢 430074;4.中國(guó)社會(huì)科學(xué)院 哲學(xué)所,北京 100732)

“行動(dòng)或行為(action)”是哲學(xué)、心理學(xué)、語(yǔ)言學(xué)、法學(xué)、經(jīng)濟(jì)學(xué)、歷史、文學(xué)等人文科學(xué)和社會(huì)科學(xué),以及計(jì)算機(jī)科學(xué)和人工智能的核心概念[1]1。就自主移動(dòng)機(jī)器人而言:行為就是通過(guò)感知信息控制執(zhí)行過(guò)程的算法(algorithm);①算法實(shí)際上就是定義良好的計(jì)算過(guò)程,它取一個(gè)或一組值作為輸入,并產(chǎn)生出一個(gè)或一組值作為輸出。即,算法是將輸入數(shù)據(jù)轉(zhuǎn)換成輸出結(jié)果的一系列計(jì)算步驟。我們可以通過(guò)基于行為的方法為機(jī)器人設(shè)計(jì)一系列簡(jiǎn)單行為,這些行為相互協(xié)調(diào)和協(xié)作,從而得到我們所需求的機(jī)器人整體行為;把比較簡(jiǎn)單的行為進(jìn)行組合就可以得到復(fù)雜行為[2]。行為是保證機(jī)器人安全運(yùn)行并成功完成任務(wù)的功能模塊,每種行為通常都遵循“感知—決策—控制”的架構(gòu)。按照相關(guān)設(shè)計(jì),機(jī)器人利用傳感器信息決定行為是否執(zhí)行,并結(jié)合行為子任務(wù)實(shí)時(shí)規(guī)劃和計(jì)算出運(yùn)動(dòng)控制量,并據(jù)此控制自身的運(yùn)行[3]344。

人工智能中推理決策的有關(guān)理論和方法是實(shí)現(xiàn)行為決策的常用方法。如何綜合各種因素,高效地進(jìn)行行為決策是行為決策層研究的重點(diǎn)。行為決策邏輯是行為決策層的核心,它綜合各類信息,最后向行為規(guī)劃層發(fā)出行為指令。一個(gè)好的行為決策邏輯是提高系統(tǒng)自主性的必然要求[4]33。本文研究的動(dòng)態(tài)認(rèn)知行動(dòng)邏輯和BDI邏輯(即信念(belief)、愿望(desire)和意向(intension)邏輯)是行動(dòng)邏輯和行為決策邏輯的兩個(gè)最為重要的分支,其研究成果將直接為行為決策邏輯所運(yùn)用。動(dòng)態(tài)認(rèn)知行動(dòng)邏輯和BDI邏輯的研究屬于國(guó)內(nèi)外研究前沿和重點(diǎn)領(lǐng)域,其成果對(duì)邏輯學(xué)、經(jīng)濟(jì)、軍事、法律、計(jì)算機(jī)科學(xué)和人工智能等領(lǐng)域都有著重要的理論意義和實(shí)踐價(jià)值,尤其對(duì)人工智能領(lǐng)域?qū)<蚁到y(tǒng)中的推理機(jī)的開(kāi)發(fā)、多傳感器信息融合技術(shù)(其實(shí)質(zhì)就是對(duì)多源不穩(wěn)定性信息的分析與綜合)的研發(fā)、移動(dòng)機(jī)器人目標(biāo)識(shí)別與路徑規(guī)劃,以及機(jī)器人行為的自學(xué)習(xí)研究都有著極其重要的參考價(jià)值。這是因?yàn)樾袆?dòng)(一個(gè)程序的執(zhí)行和調(diào)用就是一個(gè)行動(dòng))在這些領(lǐng)域中無(wú)處不在。比如,對(duì)機(jī)器人而言,“行為”是它所具有的表達(dá)能力和行動(dòng)能力,比如對(duì)話、描寫(xiě)、刻畫(huà)、移動(dòng)、行走、碰撞保護(hù)、避障、操作以及抓取物體等。對(duì)機(jī)器的擬人行為的研究是人工智能的高難度課題[5]18。

計(jì)算機(jī)通過(guò)執(zhí)行以某種程序設(shè)計(jì)語(yǔ)言編寫(xiě)的程序語(yǔ)句的形式來(lái)完成行動(dòng),并以此改變計(jì)算機(jī)的內(nèi)部世界,并通過(guò)與外部世界的接口來(lái)改變外部世界。行動(dòng)邏輯提供了關(guān)于程序的推理方式,更確切地說(shuō),提供了關(guān)于程序的執(zhí)行及其效果的推理方式,這使得我們能夠證明程序的正確性。因此,行動(dòng)邏輯在計(jì)算機(jī)科學(xué)中也發(fā)揮著重要的作用[1]7。

一、智能主體的行為機(jī)制

人工智能研究領(lǐng)域影響最大的符號(hào)主義學(xué)派認(rèn)為:人的智能表現(xiàn)為認(rèn)知,認(rèn)知的基元是符號(hào),認(rèn)知過(guò)程則表現(xiàn)為操作過(guò)程,所以可以用計(jì)算機(jī)的符號(hào)操作模擬人的智能行為。知識(shí)既是信息的主要形式,又是構(gòu)成智能的基礎(chǔ);因而,人工智能三大核心問(wèn)題是知識(shí)表示、知識(shí)推理和知識(shí)應(yīng)用。知識(shí)既可用符號(hào)表示,也可用符號(hào)推理,據(jù)此才有可能建立起基于知識(shí)的人類智能和機(jī)器智能的統(tǒng)一理論體系[6]67。知識(shí)表示和知識(shí)推理的研究主要是提供對(duì)世界的描述方法,并在此基礎(chǔ)上提出相應(yīng)的算法。大致說(shuō)來(lái),關(guān)于世界的知識(shí)可以分為事實(shí)和規(guī)則這兩大類。事實(shí)用于描述已知的世界狀態(tài),而規(guī)則主要用于預(yù)言外部世界的變化、動(dòng)作的后果,并從已知的事物演繹未知的事物。

由于從符號(hào)處理的角度研究知識(shí)的本性太低級(jí),紐厄爾提議在符號(hào)處理的上層增加以合理性原則作為其行為法則的知識(shí)級(jí)。做知識(shí)級(jí)分析的系統(tǒng)則被稱為智能主體(agent,也翻譯為“主體”、“真體”、“智能體”,比如人或仿人機(jī)器人或具有智能的高級(jí)動(dòng)物都可以視為智能主體),它由動(dòng)作集、目標(biāo)集和一個(gè)知識(shí)體組成;合理性原則把知識(shí)、目標(biāo)、動(dòng)作聯(lián)系在一起,而不需要具體的物理關(guān)聯(lián)機(jī)制。知識(shí)既是知識(shí)級(jí)處理的媒介,又是合理性原則工作的依據(jù),它使系統(tǒng)能夠選擇適當(dāng)?shù)膭?dòng)作去達(dá)到目標(biāo),從而表現(xiàn)出合理的行為。知識(shí)是能力的反映,永遠(yuǎn)是抽象的。知識(shí)并非真實(shí)地存在,只能由智能主體的行為來(lái)表現(xiàn)。雖然做知識(shí)級(jí)分析可以確保系統(tǒng)的可行性和總體性能,但是其操作化必須在符號(hào)級(jí)實(shí)現(xiàn)。知識(shí)表示就是實(shí)現(xiàn)知識(shí)級(jí)系統(tǒng)向符號(hào)級(jí)系統(tǒng)歸約的方式。可見(jiàn),作為知識(shí)級(jí)系統(tǒng)的智能主體并不是計(jì)算機(jī)系統(tǒng)的操作化模型,而是基于合理化原則的概念設(shè)計(jì)。在符號(hào)級(jí)的操作化實(shí)現(xiàn)不僅需要定義數(shù)據(jù)結(jié)構(gòu)(即符號(hào)結(jié)構(gòu)),而且需要定義從數(shù)據(jù)結(jié)構(gòu)抽取知識(shí)的處理機(jī)制[7]56。

好的知識(shí)表示方式有助于智能主體獲取和應(yīng)用感知的信息。常見(jiàn)的知識(shí)表示方式有:一階謂詞邏輯、產(chǎn)生式表示、結(jié)構(gòu)化表示。由于一般要求專家控制系統(tǒng)具有可靠性、實(shí)時(shí)性及靈活性等,所以專家控制系統(tǒng)中的知識(shí)表示常采用產(chǎn)生式規(guī)則,于是知識(shí)庫(kù)就變成了規(guī)則庫(kù)。規(guī)則庫(kù)是由條件-動(dòng)作型規(guī)則(即所謂的產(chǎn)生式規(guī)則)組成的集合。產(chǎn)生式規(guī)則(其典型描述為“如果(條件),那么(結(jié)果)”)的形式為:“條件單元”→“動(dòng)作”……若規(guī)則中所有條件部分都匹配,則執(zhí)行動(dòng)作。推理機(jī)則用于重復(fù)尋找所有匹配的規(guī)則,它選擇其中的一種執(zhí)行動(dòng)作;執(zhí)行的結(jié)果則是給數(shù)據(jù)庫(kù)添加新的內(nèi)容、刪除舊的內(nèi)容或執(zhí)行用戶編寫(xiě)的程序函數(shù)等;新的存儲(chǔ)內(nèi)容又引起新的規(guī)則的匹配,推理機(jī)就是這樣不斷地進(jìn)行匹配的[8]30。換個(gè)角度看,推理機(jī)就是一組執(zhí)行程序,它根據(jù)數(shù)據(jù)庫(kù)中提供的系統(tǒng)當(dāng)前和過(guò)去的動(dòng)態(tài)特征以及動(dòng)態(tài)特征變化數(shù)據(jù),利用推理規(guī)則,從規(guī)則庫(kù)中尋找合適的控制規(guī)則和參數(shù)調(diào)整規(guī)則,給出最合適的控制參數(shù)[8]46。筆者對(duì)此的理解是:推理機(jī)研究的重點(diǎn)和難點(diǎn)是執(zhí)行動(dòng)作的激發(fā)條件的制定,即條件單元中的規(guī)則的制定,也就是說(shuō),我們需要弄清成功執(zhí)行一個(gè)動(dòng)作的前提條件究竟是什么;這也應(yīng)該是動(dòng)態(tài)認(rèn)知行動(dòng)邏輯和BDI邏輯研究的關(guān)鍵。由于條件—?jiǎng)幼餍鸵?guī)則的條件部分不限于謂詞公式(也可以是關(guān)系表達(dá)式和真值函數(shù)),而且動(dòng)作可以是任何操作(這與規(guī)則演繹系統(tǒng)中的右部只能是推理結(jié)論有所不同),此外產(chǎn)生式規(guī)則可以設(shè)置沖突解法,①在一個(gè)循環(huán)的識(shí)別階段,如果有多于一條的規(guī)則被激活,就引起了一個(gè)沖突。沖突解法就是基于某種控制策略去選定需要執(zhí)行的規(guī)則。因而條件—?jiǎng)幼餍鸵?guī)則可以有效控制推理過(guò)程,適合表示各種啟發(fā)式知識(shí),使得事物間的經(jīng)驗(yàn)性關(guān)系得以表征,因此為大多數(shù)成功的專家系統(tǒng)所采用[7]25。

近10多年來(lái),主體和多主體(multi-agent)系統(tǒng)的研究已經(jīng)成為分布式人工智能研究的一個(gè)熱點(diǎn),這些研究極大地促進(jìn)了人工智能和計(jì)算機(jī)軟件工程的發(fā)展。主體實(shí)際上是一種通過(guò)傳感器感知環(huán)境,并通過(guò)執(zhí)行器作用于環(huán)境的智能實(shí)體,可以定義為一種從感知序列到實(shí)體動(dòng)作的映射[5]208。主體具有行為自主性、作用交互性、環(huán)境協(xié)調(diào)性、面向目標(biāo)性、存在社會(huì)性、工作協(xié)作性、運(yùn)行持續(xù)性、系統(tǒng)適應(yīng)性和可擴(kuò)展性、結(jié)構(gòu)分布性、功能智能性等特性。主體強(qiáng)調(diào)理性作用,可作為描述機(jī)器智能、動(dòng)物智能和人類智能的統(tǒng)一模型。而且主體的功能具有較高智能,這種智能往往構(gòu)成社會(huì)智能的一部分[5]315。

理想的智能主體是基于知識(shí)的問(wèn)題求解系統(tǒng),它運(yùn)用知識(shí)作推理,以達(dá)到某種目標(biāo)。智能主體的行為則可理解成無(wú)窮的推理循環(huán):感知、推理和行動(dòng)。每當(dāng)主體(通過(guò)傳感器)感覺(jué)到外部世界的變化時(shí),就根據(jù)自身的信念、目標(biāo)和關(guān)于外部世界的模型進(jìn)行推理,并決定適當(dāng)?shù)膭?dòng)作去應(yīng)答這種變化。所以,主體行為的主要任務(wù)就是獲取外部世界的模型,并努力保持模型與外部世界的一致性。推理的目的是依據(jù)外部世界模型區(qū)分出外部世界狀態(tài)并規(guī)劃出主體的動(dòng)作。由于推理僅僅導(dǎo)致主體內(nèi)部世界模型的改變,故有必要檢查內(nèi)部模型是否與主體動(dòng)作導(dǎo)致的外部世界變化相一致,所以在主體行為圖(即:感知、推理和行動(dòng))的基礎(chǔ)上應(yīng)該增加“期望”環(huán)節(jié),以便主體做好準(zhǔn)備去感知期望的外部世界的變化[7]21。

多主體系統(tǒng)主要研究自主的智能主體之間智能行為的協(xié)調(diào),研究智能主體如何為了一個(gè)共同的全局目標(biāo)(包括各自的不同目標(biāo))共享知識(shí),進(jìn)而對(duì)問(wèn)題協(xié)作求解[9]104。多主體聯(lián)合行動(dòng)的建立可以通過(guò)一個(gè)二相協(xié)議來(lái)實(shí)現(xiàn)。其第一相確定哪些熟人愿意參加協(xié)作并遵從聯(lián)合負(fù)責(zé)原則;第二相則是由組織者指派聯(lián)合行動(dòng)中每個(gè)擬定動(dòng)作應(yīng)該由誰(shuí)去執(zhí)行以及在什么時(shí)刻執(zhí)行。關(guān)于動(dòng)作執(zhí)行的時(shí)間要求,則是在聯(lián)合意向的指導(dǎo)下參與者反復(fù)進(jìn)行協(xié)商,直到協(xié)商全部成功。這時(shí)就產(chǎn)生了贊同一致的公共處方,并通過(guò)組織者將公共處方通知到所有愿意參與聯(lián)合行動(dòng)的主體。開(kāi)發(fā)共享本體,并將共享本體的通信內(nèi)容翻譯為與各主體特有的本體相容的形式是促進(jìn)各主體間語(yǔ)義互操作、實(shí)現(xiàn)信息和知識(shí)共享的關(guān)鍵。從哲學(xué)的角度看,本體是對(duì)“存在”的系統(tǒng)化闡述;而從人工智能的角度看,本體則被視為設(shè)計(jì)智能系統(tǒng)時(shí)建立的世界觀,清晰表示的本體實(shí)際上是對(duì)應(yīng)用領(lǐng)域概念化的說(shuō)明。我們可以通過(guò)定義由基本術(shù)語(yǔ)構(gòu)成詞匯,并用基本術(shù)語(yǔ)去合成詞匯外延(即領(lǐng)域知識(shí))的法則來(lái)建立智能主體協(xié)作時(shí)的共享本體。共享本體定義了智能主體在相互交換詢問(wèn)和斷言時(shí)使用的公共詞匯,從而避免了建立和維護(hù)大型知識(shí)庫(kù)的諸多煩惱,而智能主體經(jīng)由通信共享知識(shí)的機(jī)制則可視為共享一個(gè)虛擬的公用知識(shí)庫(kù)[7]347-349。

二、智能主體典型的行為模型:BDI邏輯框架

智能主體必須利用知識(shí)修改其內(nèi)部狀態(tài)(即心理狀態(tài)),以適應(yīng)環(huán)境變化和協(xié)作求解的需要。主體的行動(dòng)受其心理狀態(tài)的驅(qū)動(dòng)。人類心理狀態(tài)的要素主要有認(rèn)知(信念、知識(shí)、學(xué)習(xí)等)、情感(愿望、興趣、愛(ài)好等)和意向(意圖、目標(biāo)、規(guī)劃和承諾等)這三種。著重研究信念(belief)、愿望(desire)和意向(intension)的關(guān)系及其形式化描述,力圖建立主體的BDI(信念、愿望和意向)模型,已經(jīng)成為主體理論模型研究的主要方向[5]314。

主體技術(shù)的研究主要集中在主體行為理論、體系結(jié)構(gòu)和通信三方面。主體行為理論把智能主體定義為有意識(shí)系統(tǒng),這個(gè)系統(tǒng)中的主體行為可以通過(guò)歸因于信念、愿望和理性的方法去預(yù)言。智能主體典型的行為模型——BDI邏輯框架是以模態(tài)邏輯和可能世界來(lái)描述主體的心理狀態(tài)的。體系結(jié)構(gòu)則主要研究個(gè)體主體的構(gòu)成模塊和模塊間的交互作用(數(shù)據(jù)和控制流),并對(duì)輸入信息(傳感器數(shù)據(jù)和經(jīng)由通信接收的消息)和當(dāng)前內(nèi)部狀態(tài)如何決定主體的行動(dòng)加以解釋。通信機(jī)制則構(gòu)成支持主體間互操作和協(xié)同工作的重要基礎(chǔ)[7]15-16。

主體和多主體系統(tǒng)正在崛起,并成為人工智能研究實(shí)用化和分布計(jì)算環(huán)境中軟件智能化的重要技術(shù)。主體和多系統(tǒng)能夠提供所研究的社會(huì)和領(lǐng)域的知識(shí),并能夠依據(jù)心理狀態(tài)BDI(信念、愿望和意向)自主工作,是具有語(yǔ)義互操作、合作行為和協(xié)調(diào)能力的軟件實(shí)體。主體行為理論將主體定義為有意識(shí)系統(tǒng)。所謂有意識(shí),是指主體的行為可以通過(guò)歸因于信念、愿望和理性的方法去預(yù)言。經(jīng)典的一階邏輯并不適合用來(lái)表示涉及意識(shí)的觀念,因?yàn)檫@會(huì)引起語(yǔ)法和語(yǔ)義問(wèn)題。為了解決語(yǔ)法問(wèn)題,我們可以引入模態(tài)邏輯和元語(yǔ)言;為了解決語(yǔ)義問(wèn)題,我們可以借助可能世界語(yǔ)義和解釋的符號(hào)結(jié)構(gòu)[7]346-347。

1971年,Dennet認(rèn)為,理性主體的行為選擇受到其信念和愿望的支配[10]。1987年,Bratman的相關(guān)研究為主體行為描述的BDI方法奠定了堅(jiān)實(shí)的基礎(chǔ),他認(rèn)為意向在所期望的行為選擇方面發(fā)揮著重要的作用[11]。之后,許多研究者試圖使用邏輯的方法對(duì)這一理論進(jìn)行形式化。其中,影響最為深遠(yuǎn)的是Rao和Georgeff(1991)[12]使用分支時(shí)間時(shí)態(tài)邏輯的方法對(duì)BDI主體的形式化研究。他們引入了信念、目標(biāo)(有時(shí)也用愿望來(lái)代替)和意向這三個(gè)模態(tài)算子,并建立帶有這些算子所涉及的可能世界之間的可及關(guān)系的克里普克模型。并在對(duì)不同類型的主體進(jìn)行建模時(shí),允許加入特定的條件以保持主體的信念、目標(biāo)和意向的持續(xù)性。此后,諸多學(xué)者發(fā)表多篇論文對(duì)他們的理論進(jìn)行不斷完善和改進(jìn)。例如:Casali等人(2005)[13]在無(wú)窮值的 ?ukasiewicz 邏輯的基礎(chǔ)上對(duì)等級(jí)(graded)BDI主體進(jìn)行了建模和實(shí)例分析,這為不確定性的表示和推理提供了很好的范例;張曉君等人(2012)[14]把無(wú)窮值的 ?ukasiewicz邏輯和命題動(dòng)態(tài)邏輯進(jìn)行融合后對(duì)等級(jí)BDI主體模型進(jìn)行公理化,并說(shuō)明了信念、愿望、意圖對(duì)主體行為的影響;Pereira等人(2008)[15]通過(guò)情感對(duì)主體的可適應(yīng)性和自主性的影響的形式分析,來(lái)刻畫(huà)害怕、自信、焦慮等情感對(duì)主體行為的影響,達(dá)到對(duì)情感BDI主體的行為推理和決策過(guò)程進(jìn)行建模的目的;張曉君(2012)[16]對(duì)情感等級(jí) BDI主體模型進(jìn)行了公理化,清晰地表示了主體的信念、愿望、意圖等心理狀態(tài)以及害怕、自信、焦慮等情感狀態(tài)對(duì)主體的不確定性行為的影響。

與Rao和Georgeff的方法不同,van Linder等人(1995)[17]在對(duì)Bratman提出的BDI方法進(jìn)行邏輯化時(shí)則是以動(dòng)態(tài)邏輯而不是以時(shí)態(tài)邏輯為基礎(chǔ)的。他們?cè)趧?dòng)態(tài)邏輯的基礎(chǔ)系統(tǒng)——命題動(dòng)態(tài)邏輯的基礎(chǔ)上增加知識(shí)、信念和愿望以及表示執(zhí)行動(dòng)作的能力的模態(tài)算子,這為動(dòng)態(tài)認(rèn)知邏輯乃至動(dòng)態(tài)認(rèn)知行動(dòng)邏輯的發(fā)展提供了諸多可資汲取的養(yǎng)料。

三、智能主體的行為刻畫(huà):動(dòng)態(tài)認(rèn)知行動(dòng)邏輯

20世紀(jì)70年代,為了解決計(jì)算機(jī)中程序調(diào)用與執(zhí)行方面的邏輯問(wèn)題,在模態(tài)邏輯基礎(chǔ)上產(chǎn)生的動(dòng)態(tài)邏輯發(fā)展迅速。動(dòng)態(tài)邏輯把程序的輸入—輸出關(guān)系看作是克里普克語(yǔ)義學(xué)中的可及關(guān)系。作為動(dòng)態(tài)邏輯的基礎(chǔ)系統(tǒng)的命題動(dòng)態(tài)邏輯則致力于處理關(guān)于主體的行動(dòng)(更確切地說(shuō)是程序,因?yàn)橐粋€(gè)程序的執(zhí)行和調(diào)用就是一個(gè)行動(dòng))和行動(dòng)選擇的推理。命題動(dòng)態(tài)邏輯對(duì)可以解釋成基于狀態(tài)集合上的二元關(guān)系的基本行為進(jìn)行抽象和推理。在命題動(dòng)態(tài)邏輯中,基本行為是初始的,這一特點(diǎn)使得動(dòng)態(tài)邏輯能夠在諸多領(lǐng)域中得到應(yīng)用。例如,當(dāng)我們把基本行為解釋成對(duì)相互作用的主體集合的認(rèn)知狀態(tài)起作用的行為,則動(dòng)態(tài)邏輯就變成動(dòng)態(tài)認(rèn)知邏輯[18]91-92。由于主體知識(shí)的動(dòng)態(tài)變化可理解為:“知識(shí)—行動(dòng)—新?tīng)顟B(tài)—新知識(shí)”,其中,對(duì)各項(xiàng)知識(shí)之間的關(guān)系的處理可以由原先的認(rèn)知邏輯完成,而對(duì)“行動(dòng)—新?tīng)顟B(tài)—新知識(shí)”的處理則是由動(dòng)態(tài)邏輯處理。認(rèn)知邏輯與動(dòng)態(tài)邏輯這兩種邏輯處理方式的結(jié)合催生出了動(dòng)態(tài)認(rèn)知邏輯[19]77。

如果將動(dòng)態(tài)認(rèn)知邏輯中的行動(dòng)定位于公開(kāi)宣告,則得到關(guān)于公開(kāi)宣告的動(dòng)態(tài)認(rèn)知邏輯,簡(jiǎn)稱公開(kāi)宣告邏輯。本文研究的動(dòng)態(tài)認(rèn)知行動(dòng)邏輯(Dynamic Epistemic Action Logic)可以說(shuō)是公開(kāi)宣告邏輯的擴(kuò)展或推廣,因?yàn)椤肮_(kāi)宣告”這一認(rèn)知行動(dòng)是把相同的信息傳達(dá)給所有的主體,而認(rèn)知行動(dòng)邏輯研究的更為復(fù)雜的認(rèn)知行動(dòng)則可以把不同的信息傳達(dá)給不同的主體[20]109。認(rèn)知行動(dòng)邏輯研究包括“博弈”在內(nèi)的更為復(fù)雜、更為廣泛的認(rèn)知行動(dòng),比如:左轉(zhuǎn)、右轉(zhuǎn)、走路、開(kāi)或關(guān)、觀察、玩牌、閱讀、可能閱讀、可能都閱讀、選擇、展示、告訴、說(shuō)悄悄話、傳播流言等等。動(dòng)態(tài)認(rèn)知行動(dòng)邏輯是對(duì)這些認(rèn)知行動(dòng)進(jìn)行模型化的動(dòng)態(tài)認(rèn)知邏輯,它不僅可以對(duì)由外部行動(dòng)引起的知識(shí)變化過(guò)程中的推理進(jìn)行刻畫(huà)和表達(dá),而且可以刻畫(huà)由交流行動(dòng)引起的互動(dòng)性知識(shí)的更新,以及信息流動(dòng)的整個(gè)過(guò)程中的知識(shí)變化及相應(yīng)推理。

1977年,Moore在其《關(guān)于知識(shí)和行動(dòng)的推理》一文中,提出了行動(dòng)的“認(rèn)知前提(epistemic precondition)”的概念,用以表示成功執(zhí)行一個(gè)行動(dòng)需要的知識(shí)[21]。1989年,Plaza建立了第一個(gè)公開(kāi)宣告邏輯系統(tǒng),在對(duì)主體間的知識(shí)分布進(jìn)行了靜態(tài)描述和認(rèn)知推理的基礎(chǔ)上,對(duì)主體之間在交流過(guò)程中的知識(shí)變化和認(rèn)知推理進(jìn)行了刻畫(huà),并對(duì)不帶有公共知識(shí)但包含公開(kāi)宣告的多主體認(rèn)知邏輯進(jìn)行了形式化和公理化[22]201-216。1997 年,Gerbrandy和Groeneveld對(duì)內(nèi)省主體的更多宣告形式(如半公開(kāi)宣告、私下宣告)的研究,為公開(kāi)宣告邏輯的最終確立奠定了堅(jiān)實(shí)的基礎(chǔ)[23]。之后,諸多學(xué)者對(duì)公開(kāi)宣告邏輯進(jìn)行擴(kuò)展,他們要么在公開(kāi)宣告邏輯中加入公共知識(shí),要么研究比公開(kāi)宣告更為復(fù)雜的認(rèn)知行動(dòng),這樣就使得動(dòng)態(tài)認(rèn)知行動(dòng)邏輯得以逐漸形成。

當(dāng)今國(guó)際上,van Bethem、van Eijck、van Dimarsch等是動(dòng)態(tài)認(rèn)知行動(dòng)邏輯研究的領(lǐng)軍人物。動(dòng)態(tài)認(rèn)知行動(dòng)邏輯研究主要有三個(gè)方向:

(1)通過(guò)對(duì)公開(kāi)宣告邏輯的改進(jìn)和擴(kuò)展研究各類認(rèn)知行動(dòng)。具體包括:引入相對(duì)化公共知識(shí),得出帶有公共知識(shí)算子的公開(kāi)宣告邏輯的較為簡(jiǎn)單的完全性證明(van Bethem,1999)[24];對(duì)并發(fā)知識(shí)行動(dòng)的語(yǔ)義學(xué)研究、對(duì)博弈行動(dòng)的描述(van Dimarsch,2001)[25];對(duì)交叉并發(fā)行動(dòng)的邏輯刻畫(huà)(Kooi,2003)[26];對(duì)玩牌博弈的建模(de Lavalette,1999)[27];對(duì)流言傳播行動(dòng)的考察(van Dimarsch,2000)[28]等等。

(2)使用基于行動(dòng)模型的方法分析刻畫(huà)各種認(rèn)知行動(dòng)。具體而言有:Baltag等(2004)[29]在行動(dòng)模型框架的基礎(chǔ)上提出了認(rèn)知程序邏輯;范艾杰克等人(2006)[30]用行動(dòng)仿真的概念代替互模擬來(lái)研究認(rèn)知行動(dòng);van Bethem等人(2006)[31]對(duì)命題動(dòng)態(tài)邏輯做認(rèn)知解釋后提出的交流與更新邏輯,這種邏輯能夠表達(dá)帶有有窮行動(dòng)模型的所有模型轉(zhuǎn)換運(yùn)算,為更大范圍的信息事件提供了綜合分析的方法;van Eijck(2004)[32]對(duì)認(rèn)知更新進(jìn)行建模,并圖示了更新的結(jié)果和行動(dòng)模型。而van Dimarsch 等人(2008)[20]141-174在 Baltag 等人工作的基礎(chǔ)上研究了行動(dòng)模型邏輯,其基本思路和方法是通過(guò)刻畫(huà)動(dòng)作對(duì)知識(shí)的影響來(lái)完成對(duì)動(dòng)作的處理。這種思路在單主體認(rèn)知行動(dòng)邏輯的基礎(chǔ)上加入帶有公共知識(shí)等群體知識(shí)的研究即可進(jìn)入多主體認(rèn)知行動(dòng)邏輯的研究。建立行動(dòng)模型的關(guān)鍵是:在所建立的行動(dòng)模型中為每個(gè)原子行動(dòng)指派相應(yīng)語(yǔ)言中的公式作為執(zhí)行該行動(dòng)的前提條件,這一前提條件相當(dāng)于克里普克模型中的賦值。

(3)在認(rèn)知行動(dòng)邏輯的基礎(chǔ)上增添對(duì)認(rèn)知主體的各種考察因素,從而試圖建立自動(dòng)推理系統(tǒng)。主要研究有 Raimondi等(2004)[33]通過(guò)認(rèn)知模型檢驗(yàn)方法來(lái)考察對(duì)時(shí)態(tài)的認(rèn)知的相關(guān)研究。Schwarzentruber(2010)[34]在模態(tài)邏輯的基礎(chǔ)上,研究了單主體和多主體的“務(wù)必做到”邏輯,提出了關(guān)于行動(dòng)、知識(shí)和偏好的認(rèn)知博弈模態(tài)邏輯,旨在為智能主體建立一個(gè)自動(dòng)推理系統(tǒng)。其基本思路是:把 Pauly(2002)[35]提出的聯(lián)盟邏輯中的算子〈J〉分解成為“diamond”、“box”、“next”這三個(gè)正規(guī)算子后,提出“務(wù)必做到”邏輯,并在此邏輯的基礎(chǔ)上添加“知識(shí)”、“義務(wù)”和“意向”等算子,以此建立相應(yīng)的系統(tǒng);以模態(tài)邏輯和博弈論為基礎(chǔ)來(lái)研究分析智能主體“seeing、knowing、doing”等行動(dòng);并使用動(dòng)態(tài)認(rèn)知邏輯的一些結(jié)構(gòu)對(duì)認(rèn)知博弈模態(tài)邏輯進(jìn)行擴(kuò)展,從而更好地處理了嚴(yán)格劣策略的重復(fù)剔除問(wèn)題。

四、思考:基于BDI結(jié)構(gòu)的動(dòng)態(tài)認(rèn)知行動(dòng)邏輯

通過(guò)對(duì)上述理論的評(píng)述,筆者認(rèn)為:

首先,現(xiàn)有的各種邏輯體系都無(wú)法滿足計(jì)算機(jī)科學(xué)和人工智能中精確描述和研究各種各樣的不確定性推理的需要,因此邏輯理論的創(chuàng)新成為不可避免的需求。一個(gè)好的認(rèn)知行動(dòng)邏輯是提高智能系統(tǒng)的可靠性和魯棒性,①魯棒性(robustness)就是系統(tǒng)的健壯性,指控制系統(tǒng)在一定(結(jié)構(gòu),大小)的參數(shù)攝動(dòng)下,維持某些性能的特性。它是在異常和危險(xiǎn)情況下系統(tǒng)生存的關(guān)鍵。比如說(shuō),計(jì)算機(jī)軟件在輸入錯(cuò)誤、磁盤(pán)故障、網(wǎng)絡(luò)過(guò)載或有意攻擊情況下,能否不死機(jī)、不崩潰,就是該軟件的魯棒性。尤其是自主行為優(yōu)化決策能力的必然要求。

其次,由于第二部分的BDI邏輯和第三部分的動(dòng)態(tài)認(rèn)知行動(dòng)邏輯都是建立在模態(tài)邏輯、可能世界語(yǔ)義學(xué)和克里普克模型的基礎(chǔ)上,通過(guò)認(rèn)真分析比對(duì)這兩種邏輯,對(duì)它們進(jìn)行取長(zhǎng)補(bǔ)短和融合,提出新的邏輯系統(tǒng),即關(guān)于BDI主體的動(dòng)態(tài)認(rèn)知行動(dòng)邏輯系統(tǒng),從而為智能主體的行為表征和不確定性推理提供更好的邏輯基礎(chǔ)是完全可能的。建立這種新的邏輯系統(tǒng)的關(guān)鍵是:在所建立的行動(dòng)模型中為每個(gè)原子行動(dòng)指派相應(yīng)語(yǔ)言中的公式作為執(zhí)行該行動(dòng)的前提條件時(shí),要充分考慮信念、愿望、意向、情感對(duì)行動(dòng)的影響。這一邏輯融合過(guò)程,應(yīng)建立在無(wú)窮值Lukasiewicz邏輯(或模糊邏輯)和命題動(dòng)態(tài)邏輯的基礎(chǔ)之上,因此該邏輯系統(tǒng)應(yīng)該是符號(hào)的形式演繹和數(shù)值計(jì)算并存的連續(xù)值柔性邏輯系統(tǒng)。其可能的研究難點(diǎn)在于:其一,不同模態(tài)算子之間應(yīng)該如何融合的問(wèn)題;其二,在邏輯推理過(guò)程中如何處理符號(hào)的形式演繹和數(shù)值計(jì)算的問(wèn)題。

[1]Segerberg K.The logic of action[EB/OL].[2012-05-20].http://plato.stanford.edu/entries/logicaction/.

[2]Jones J L.Robot Programming:A Practical Guide to Behavior-Based Robotics[M].[S.L.]:McGraw-Hill Education(Asia)Co.,China Machine Press,2006.

[3]徐德,鄒偉.室內(nèi)移動(dòng)式服務(wù)機(jī)器人的感知、定位與控制[M].北京:科學(xué)出版社,2008.

[4]蔡自興,賀漢根,陳虹.未知環(huán)境中移動(dòng)機(jī)器人導(dǎo)航控制理論與方法[M].北京:科學(xué)出版社,2009.

[5]蔡自興,徐光佑.人工智能及其應(yīng)用[M].4版.北京:清華大學(xué)出版社,2010.

[6]張曉峰,賈世祥,柳嬋娟,等.計(jì)算機(jī)科學(xué)與技術(shù)導(dǎo)論[M].北京:清華大學(xué)出版社,2011.

[7]高濟(jì).人工智能高級(jí)技術(shù)導(dǎo)論[M].北京:高等教育出版社,2009.

[8]姜長(zhǎng)生,王從慶,魏海坤,等.智能控制與應(yīng)用[M].北京:科學(xué)出版社,2007.

[9]譚建豪,章兢,黃耀,等.數(shù)據(jù)挖掘技術(shù)[M].北京:中國(guó)水利水電出版社,2009.

[10]Dennett D C.Intentional systems[J].Journal of Philosophy,1971,68(4):87-106.

[11]Bratman M E.Intentions,Plans,and Practical Reason[M].Harvard:Harvard University Press,1987.

[12]Rao A S,Georgeff M P.Modeling rational agents within a BDI-architecture[C]//Proceedings of the 2nd International Conference on Principles of Knowledge Representation and Reasoning,1991:473-484.

[13]Casali A,Godo L,Sierra C.Graded BDI models for agent architecture[C]//Leite J,Torroni P.Computational Logic in Multi-agent Systems.Berlin:Springer,2005:126-143.

[14]Zhang Xiaojun,Jiang Min,Zhou Changle,et al.Graded BDI models for agent architectures based on ?ukasiewicz logic and propositional dynamic logic[C]//Wang F L.WISM2012,LNCS 7529.Berlin,Heidelberg:Springer-Verlag,2012:439-450.

[15]Pereira D,Oliveria E,Moreira N.Formal modeling of emotions in BDI agents[C]//Sadri F,Satoh K.Computational Logic in Multi-Agent Systems.Berlin:Springer,2008:62-81.

[16]Zhang Xiaojun.Modeling emotional agents based on graded BDI architectures[C]//volume 0345 of the Communications in Computer and Information Science series.Berlin,Heidelberg:Springer-Verlag,2011.

[17]van Linder B.Actions that make you change your mind[C]//Laux A,Wansing H.Knowledge and Belief in Philosophy and Artificial Intelligence,1995:103-146.

[18]郝一江,張曉君.動(dòng)態(tài)邏輯:關(guān)于程序的模態(tài)邏輯[J].哲學(xué)動(dòng)態(tài),2009(11):90-94.

[19]唐曉嘉,郭美云.現(xiàn)代認(rèn)知邏輯的理論與應(yīng)用[M].北京:科學(xué)出版社,2010.

[20]van Dimarsch H.Dynamic Epistemic Logic[M].Berlin:Springer,2008:109,141-174.

[21]Moore R C.Reasoning about knowledge and action[C]//Proceedings of the fifth International Joint Conference on Artificial Intelligence(IJCAI-77).Cambridge,Massachusetts:[s.n.],1977.

[22]Plaza J A.Logics of public communications[C]//Emrich M L.Proceedings of the 4th International Symposium on Methodologies for Intelligent Systems,1989:201-216.

[23]Gerbrandy J D.Groeneveld W.Reasoning about information change[J].Journal of Logic,Language,and Information,1997(6):147-169.

[24]van Bethem J.Update as relativization[EB/OL].[2012-05-20]http://www.illc.uva.nl/lgc/postings.html,1999.

[25]van Dimarsch H.The semantics of concurrent knowledge actions[C]//Pauly M,Sandu G.ESSLLI 2001 workshop on Logic and Games,2001.

[26]Kooi B.Knowledge,Chance,and Change[D].Ph.D.thesis,University of Groningen,2003.

[27]de Lavalette R.The anatomy of epistemic actions[EB/OL].[2012-05-20].http://www.cs.rug.nl/~ grl/pub/anatomy.pdf,1999.

[28]van Dimarsch H.Knowledge games[D].Ph.D.thesis,U-niversity of Groningen,2000.

[29]Baltag A,Moss L S.Logics for epistemic programs[J].Synthese,2004(139):165-224.

[30]van Eijck J.Action emulation[EB/OL].[2012-05-20].http://www.cwi.nl/jve/papers/06/ae/ae.pdf,2006.

[31]van Bethem J,van Eijck J,Kooi B.Logic for communication and change[J].Information and Computation,2006,204(11):1620-1662.

[32]van Eijck J.Dynamic epistemic modeling[EB/OL].[2012-05-20].http://www.db.cwi.nl/rapporten,2004.

[33]Raimondi F,Lomuscio A.Verification of multi-agent systems via ordered binary decision diagrams:an algorithm and its implementation[C]//AAMAS 04,2004:630-637.

[34]Schwarzentruber F.Seeing,Knowing,Doing:Case Studies in Modal Logic[EB/OL].[2012-05-20].Ph.D.thesis,http://www.irisa.fr/prive/fschwarz/publications/thesis.pdf,2010.

[35]Pauly M.A modal logic for coalitional power in games[J].Journal of Logic and Computation,2002,12(1):149-166.

猜你喜歡
主體智能模型
一半模型
論自然人破產(chǎn)法的適用主體
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
3D打印中的模型分割與打包
關(guān)于遺產(chǎn)保護(hù)主體的思考
主站蜘蛛池模板: 热这里只有精品国产热门精品| 亚洲午夜福利在线| 亚洲AV电影不卡在线观看| 午夜精品福利影院| 手机在线看片不卡中文字幕| 国产成人福利在线视老湿机| 天天色天天综合网| 成人午夜视频免费看欧美| 成人中文字幕在线| 黑人巨大精品欧美一区二区区| 国产嫩草在线观看| 国产一级小视频| 欧美va亚洲va香蕉在线| 日韩小视频网站hq| 久久婷婷六月| 欧美久久网| 免费观看亚洲人成网站| 中文字幕无码电影| 91尤物国产尤物福利在线| 亚洲精品午夜无码电影网| 香蕉视频在线精品| 免费在线视频a| 久久99这里精品8国产| 国模极品一区二区三区| 九九九精品成人免费视频7| 国产av色站网站| 91精品国产丝袜| 国产成人精品高清在线| 91成人免费观看在线观看| 亚洲精品视频网| 亚洲狼网站狼狼鲁亚洲下载| 国产综合欧美| 国产区免费| 欧美伦理一区| 国产欧美成人不卡视频| 色综合五月| 狠狠色综合久久狠狠色综合| 日本道中文字幕久久一区| 国产精品刺激对白在线| a级毛片网| 欧美一级高清片欧美国产欧美| 午夜精品影院| 成人91在线| 日韩123欧美字幕| 成人久久精品一区二区三区| 在线播放真实国产乱子伦| 先锋资源久久| 国产日本欧美在线观看| 国产精品网拍在线| 国产69囗曝护士吞精在线视频| 91精品国产一区自在线拍| 亚洲伊人久久精品影院| 久久久四虎成人永久免费网站| 人妻中文字幕无码久久一区| a毛片基地免费大全| 5555国产在线观看| 最新精品久久精品| 伊人成人在线| 亚洲另类国产欧美一区二区| 国产电话自拍伊人| 亚洲小视频网站| 91无码国产视频| 亚洲国产精品VA在线看黑人| 91丝袜乱伦| 老司机精品久久| 国产福利影院在线观看| 久久精品国产999大香线焦| 国产福利影院在线观看| 欧美日韩一区二区在线免费观看| 黄色网在线免费观看| 国产亚洲精品91| 午夜不卡福利| 国产美女无遮挡免费视频| 五月婷婷综合网| 丰满人妻久久中文字幕| 国产三区二区| 欧美精品啪啪| 欧美色视频网站| 久久精品国产国语对白| av一区二区三区在线观看| 欧美一级片在线| 婷婷色丁香综合激情|