摘 要:MP模型是由麥卡洛克和皮茨所建立的人工神經(jīng)網(wǎng)絡(luò)模型,為后續(xù)認(rèn)知科學(xué)的研究提供基礎(chǔ),MP模型的提出可以用于模擬人類的思維過程,模型中的單元和聯(lián)結(jié)可以使用命題邏輯進(jìn)行表示,其基本理論與形式語言的使用具有密切的關(guān)聯(lián)。聯(lián)結(jié)表征是以聯(lián)結(jié)主義為基礎(chǔ)而產(chǎn)生的對(duì)人的心智進(jìn)行表征的方式,通過使用模型的簡(jiǎn)單結(jié)構(gòu)和復(fù)雜結(jié)構(gòu),能夠?qū)?jiǎn)單的推理、決策和溯因過程進(jìn)行表示,由于不同的推理過程所具有的不同特點(diǎn),所以需要在對(duì)具體的推理過程分析時(shí)更改模型中的單元和聯(lián)結(jié)的解釋。
關(guān)鍵詞:薩伽德;聯(lián)結(jié)主義;推理
Abstract:The McCullochPitts(MP)model,established by McCulloch and Pitts,constitutes a foundational artificial neural network(ANN)framework that underpins subsequent research in cognitive science.The proposal of this model demonstrated the feasibility of simulating human cognitive processes through computational architectures.Within the MP model,individual units and their synaptic connections can be formally represented using propositional logic,reflecting its intrinsic alignment with the principles of formal languages.Connectionist representation,a paradigm rooted in connectionism,provides a mechanistic approach to modeling mental states.By leveraging both simple and complex structural configurations of such models,it becomes possible to represent basic reasoning,decisionmaking,and abductive processes.Crucially,the heterogeneous characteristics inherent to distinct forms of reasoning necessitate adaptive reinterpretations of unit functionalities and connection semantics during the analysis of specific cognitive operations.This framework highlights the interdependence between connectionist architectures and the dynamic nature of human inferential systems.
Keywords:Thagard;Connectionism;Reasoning
1 聯(lián)結(jié)在人工智能中的體現(xiàn)
符號(hào)主義和聯(lián)結(jié)主義作為探討人工智能哲學(xué)背景的兩大學(xué)派,為人工智能的建立和發(fā)展提供了思想基礎(chǔ)。其中,符號(hào)主義主張使用邏輯符號(hào)來表達(dá)思維的過程,強(qiáng)調(diào)數(shù)理邏輯的形式化作用,以邏輯推理為工具模擬人腦的思考過程,是一種基于規(guī)則的形式化方法,通過規(guī)則的定義使機(jī)器進(jìn)行推理和決策,代表為專家系統(tǒng)。聯(lián)結(jié)主義,又稱仿生學(xué)派或生理學(xué)派,通過模仿生物神經(jīng)系統(tǒng)(即神經(jīng)元及其之間的聯(lián)結(jié))進(jìn)行數(shù)據(jù)的處理,實(shí)現(xiàn)對(duì)人腦心智的模擬。在實(shí)現(xiàn)人工智能的過程中,符號(hào)系統(tǒng)更適合處理規(guī)則的情況,以公理形式十分精確地描述定義的概念和規(guī)則,神經(jīng)網(wǎng)絡(luò)更適合處理不規(guī)則的情況,形成概念的方式更不精確,結(jié)果為概率式的,會(huì)在其中選擇概率高的結(jié)果,與人的思考方式類似,聯(lián)結(jié)主義強(qiáng)調(diào)神經(jīng)元之間的聯(lián)結(jié),存在局部式聯(lián)結(jié)網(wǎng)絡(luò)與分布式聯(lián)結(jié)網(wǎng)絡(luò)兩種類型。
從人工智能的發(fā)展歷程看,在麥卡洛克和皮茨所建立的MP模型(人工神經(jīng)元模型)中,神經(jīng)元以及其連接方式可以通過命題邏輯的形式進(jìn)行表示,將神經(jīng)元處理成為一個(gè)多輸入單輸出的信息處理單元。[1]接著人工神經(jīng)網(wǎng)絡(luò)的早期工作,羅森布拉特提出了感知機(jī)的神經(jīng)網(wǎng)絡(luò)模型,證明了單層神經(jīng)網(wǎng)絡(luò)在處理線性可分的模式識(shí)別時(shí),可以收斂,認(rèn)為以此為基礎(chǔ)可以構(gòu)建模擬大腦的機(jī)器。但是明斯基和派珀特認(rèn)為人工神經(jīng)網(wǎng)絡(luò)不能解決人工智能的問題,原因是感知機(jī)能夠擬合輸入的數(shù)據(jù),但是表示的很少,并且單層感知機(jī)不能解決XOR問題,表明神經(jīng)網(wǎng)絡(luò)的計(jì)算能力是有限的。在此之后,人工智能的發(fā)展方向走向了物理符號(hào)系統(tǒng),所建立的專家系統(tǒng)將機(jī)器推理的步驟連在一起模擬人腦推理的過程,通過規(guī)則做出預(yù)測(cè),但專家系統(tǒng)面對(duì)復(fù)雜領(lǐng)域的處理時(shí),仍存在問題:一是很難適應(yīng)外部環(huán)境的變化,二是無法解決從經(jīng)驗(yàn)中學(xué)習(xí)的問題。沃波斯將神經(jīng)網(wǎng)絡(luò)由單層變?yōu)槎鄬樱梅聪騻鞑ニ惴ń鉀QXOR問題,神經(jīng)網(wǎng)絡(luò)再次受到重視。
2 聯(lián)結(jié)表征與MP模型的關(guān)聯(lián)
聯(lián)結(jié)主義網(wǎng)絡(luò)的表征僅由單元和聯(lián)結(jié)組成,可以用以實(shí)現(xiàn)并行約束滿足,即認(rèn)知任務(wù)可以在計(jì)算上理解為同時(shí)滿足多個(gè)約束條件的處理。局部式表征與分布式表征的不同之處在于,局部式表征中的類神經(jīng)元結(jié)構(gòu)可以根據(jù)特定的概念和命題被賦予確定的解釋,而分布式表征的意義則在于類神經(jīng)元的結(jié)構(gòu),以更復(fù)雜的方式學(xué)習(xí)表征概念和命題,分布式表征中,網(wǎng)絡(luò)經(jīng)過訓(xùn)練后對(duì)數(shù)據(jù)做出準(zhǔn)確地反映,才可以認(rèn)為網(wǎng)絡(luò)模型具有了所表示的概念。
2.1 簡(jiǎn)單結(jié)構(gòu)的解釋
在局部式的聯(lián)結(jié)主義網(wǎng)絡(luò)中,單元可以被解釋為命題或概念,單元的激勵(lì)值可以被解釋為概念或命題的真假,可以表述為結(jié)點(diǎn)與概念之間的對(duì)應(yīng)關(guān)系。麥卡洛克和皮茨論證了MP模型與并非、合取、析取等邏輯運(yùn)算符的對(duì)應(yīng)關(guān)系,并以圖示的表示方式給出了對(duì)應(yīng)關(guān)系。對(duì)于一個(gè)基礎(chǔ)的神經(jīng)元而言,由于其具有“allornone”的形式,因而狀態(tài)分為激活和靜息兩種,只有當(dāng)神經(jīng)元的輸入超過閾值時(shí),才會(huì)被激活,輸出信息。神經(jīng)元之間的聯(lián)結(jié)分為興奮型和抑制型兩種,相應(yīng)地,兩個(gè)單元之間的聯(lián)結(jié)分為興奮型(+)和抑制型(-)兩種,即激活的單元要么引起另一單元的激活,要么抑制另一單元的激活。[1]因此可以通過人工神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),對(duì)人的心智進(jìn)行思維和判斷的方式從更為形象的角度給出解釋。
在局部式的聯(lián)結(jié)主義網(wǎng)絡(luò)中,可以對(duì)單元和聯(lián)結(jié)給出邏輯的解釋,以或的表示為例,可以解釋為只有在第一個(gè)單元或第二個(gè)單元中被激活時(shí),第三個(gè)單元才會(huì)被激活。這樣可以給某一命題提供解釋:?jiǎn)卧?表示感受到熱,單元2表示感受到冷,單元3表示感受到熱或感受到冷,這樣作為對(duì)命題的解釋而言是足夠的,可以通過網(wǎng)絡(luò)的方式表示出關(guān)于邏輯或的推理,即p→(p∨q)、q→(p∨q),使用真值表的方式進(jìn)行表示更為直觀。其他邏輯聯(lián)結(jié)詞的表征方法與之類似,可以對(duì)特定的概念和命題,提供確定的解釋給網(wǎng)絡(luò)中的單元,據(jù)此解釋心智進(jìn)行推理的過程。
以上的例子較為簡(jiǎn)單,只包含有兩個(gè)單元之間的聯(lián)結(jié)都是興奮型的情況。進(jìn)一步地,對(duì)人而言,冷和熱的感受在很大程度上是互相抑制的,可以使用抑制型的聯(lián)結(jié)方式進(jìn)行更詳細(xì)的表征。比如,手接觸到冰塊時(shí)會(huì)感受到冷,接觸到溫水時(shí)會(huì)感受到熱,此時(shí)同一個(gè)部位在感受時(shí)會(huì)形成一致的感覺,在感受到熱和感受到冷的兩個(gè)單元之間的聯(lián)結(jié)是互相抑制的,抑制型的聯(lián)結(jié)會(huì)絕對(duì)阻止單元的激活。使用單元表示具體的概念,單元間的聯(lián)結(jié)都為單向的,因此可以通過激活的方向,判斷出具體的感受,做出二者之間非此即彼的判斷,即兩個(gè)命題一真一假。
2.2 復(fù)雜結(jié)構(gòu)的解釋
麥卡洛克和皮茨在文中提到了對(duì)冷和熱進(jìn)行解釋的更為復(fù)雜的例子,其表示的精神現(xiàn)象是,當(dāng)冰塊短時(shí)間接觸皮膚時(shí),人會(huì)感覺到熱,而當(dāng)冰塊長(zhǎng)時(shí)間接觸皮膚時(shí),人會(huì)感覺到冷,表示如下。[1]
N3(t)≡N1(t-1)∨(N2(t-3)∧N2(t-2))
N4(t)≡N2(t-2)∧N2(t-1)
該人工網(wǎng)絡(luò)的邏輯符號(hào)可解釋為,單元1為接受熱的神經(jīng)元,單元2為接受冷的神經(jīng)元,單元3表示人感受到了熱,單元4表示為人感受到了冷。N3(t)的邏輯表達(dá)式表示的含義為單元1或單元2在距離當(dāng)前時(shí)刻不遠(yuǎn)前某個(gè)的時(shí)刻被短暫的激活1次,則當(dāng)前時(shí)刻下單元3被激活,人感覺到了熱。N4(t)的邏輯表達(dá)式的含義為單元2在當(dāng)前時(shí)刻前被連續(xù)的激活兩次,則人會(huì)感覺到冷。
此處對(duì)人工神經(jīng)網(wǎng)絡(luò)的解釋中,沒有對(duì)單元a和b兩個(gè)單元給出明確的概念或者命題真值的解釋,在單元的互相聯(lián)結(jié)中有隱藏層的出現(xiàn),神經(jīng)網(wǎng)絡(luò)變?yōu)槎鄬樱憩F(xiàn)出了部分類似于分布式網(wǎng)絡(luò)表征的特征。[2]神經(jīng)網(wǎng)絡(luò)中的隱藏層沒有初始的解釋,其解釋的方式完全依賴于與其他單元的聯(lián)結(jié)方式與激活形式,可以通過調(diào)節(jié)權(quán)重來給出解釋,將其中的概念視為分布式網(wǎng)絡(luò)上的單元的激活模式,仍可以對(duì)判斷和推理進(jìn)行表示,對(duì)具體的命題給出解釋。以圖1為例,其中單元1到3之間的聯(lián)結(jié)是跨層的,激活的傳遞是直接的,而單元2到3和4之間的聯(lián)結(jié)需通過單元a和b進(jìn)行分類,具體的實(shí)現(xiàn)方式為單元a的閾值比單元b高,短時(shí)間的刺激只能夠激活單元b,從而使人感受到熱,當(dāng)刺激的時(shí)間延長(zhǎng)后,單元b被激活,由于單元a和b之間擁有抑制型的聯(lián)結(jié)方式,單元b的激活被阻止,使得激活傳遞的方向?yàn)閱卧?,使人產(chǎn)生冷的感覺。隨著神經(jīng)網(wǎng)絡(luò)復(fù)雜度的增加,當(dāng)輸出單元的激活返回至輸入單元時(shí)會(huì)形成回路,此時(shí)的計(jì)算情況更為復(fù)雜,可以進(jìn)行非線性的計(jì)算,概念的獲得和命題真假的判斷完全取決于輸入的數(shù)據(jù)與單元聯(lián)結(jié)而成的激活模式,是大量神經(jīng)元組合在一起活動(dòng)時(shí)才能產(chǎn)生的現(xiàn)象,分布式的存儲(chǔ)于神經(jīng)網(wǎng)絡(luò)之中。
3 聯(lián)結(jié)的局部式網(wǎng)絡(luò)在推理過程中的應(yīng)用
神經(jīng)網(wǎng)絡(luò)的MP模型可以給出明確的邏輯推理的解釋,通過神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可以進(jìn)行簡(jiǎn)單的推理和決策,在局部式網(wǎng)絡(luò)的應(yīng)用中,每個(gè)神經(jīng)元都能夠給予某一具體的概念或命題的解釋,能夠?qū)?jiǎn)單的心智決策過程和溯因推理的過程進(jìn)行模擬,給出合理的解釋。
3.1 模擬決策過程
薩伽德從審慎相干理論(TDC,目標(biāo)之間的一致性和連貫性)出發(fā),提出應(yīng)用于決策過程的方式,以神經(jīng)網(wǎng)絡(luò)的方式表示心智進(jìn)行選擇時(shí)的判斷過程,與傳統(tǒng)地從經(jīng)濟(jì)的角度考慮效用的決策論不同,TDC的方法對(duì)目標(biāo)的考慮具有更高的優(yōu)先級(jí),而非與經(jīng)濟(jì)理論中效用相關(guān)的偏好。[3]在傳統(tǒng)的決策論的方法中,效用一經(jīng)給出就是被確定的、不可發(fā)生變化的,而以目標(biāo)為方式進(jìn)行分析,則可以根據(jù)情況進(jìn)行改變。具體的實(shí)現(xiàn)方式為:將互相聯(lián)結(jié)的神經(jīng)元間的激活和擴(kuò)散看作計(jì)算的過程,要明確概念和約束的具體內(nèi)容。與傳統(tǒng)決策論計(jì)算效用不同,TDC更強(qiáng)調(diào)目標(biāo),因而在聯(lián)結(jié)主義網(wǎng)絡(luò)中概念由聯(lián)結(jié)主義網(wǎng)絡(luò)中的單元表征,單元用來表示決策中的行動(dòng)與目標(biāo),單元之間的聯(lián)結(jié)被用來表示內(nèi)外部約束的關(guān)系,正約束由興奮型聯(lián)結(jié)表征,負(fù)約束由抑制型聯(lián)結(jié)表征,其來源為兩個(gè)行動(dòng)或目標(biāo)之間的不相容關(guān)系,外部的約束也可以通過單元間的聯(lián)結(jié)進(jìn)行表征,此時(shí)在單元間的聯(lián)結(jié)方式中,不僅包含某單元的激活抑制另一單元激活的情況,也包含某一單元會(huì)在其他單元消減激活時(shí)得到激活的情況。[4]
從偏好的角度對(duì)決策的可能結(jié)果進(jìn)行排序,是有效的決策方法。用TDC的方法進(jìn)行分析,更多的是以目標(biāo)為優(yōu)先,考慮偏好產(chǎn)生的原因,然后再進(jìn)行決策的分析。對(duì)偏好產(chǎn)生的原因則是要分析的目標(biāo),將對(duì)偏好與效用之間直接對(duì)應(yīng)的關(guān)系表現(xiàn)得更為具體,對(duì)偏好的分析轉(zhuǎn)為對(duì)目標(biāo)的分析,當(dāng)進(jìn)行決策的目標(biāo)發(fā)生變化時(shí),決策的結(jié)果可能也會(huì)發(fā)生變化。
3.2 推導(dǎo)最佳解釋
在MP模型中,所使用的邏輯符號(hào)帶有與時(shí)間相關(guān)的因素,反映事件的狀態(tài)及之間的關(guān)聯(lián),因而可以將其理解為因果推理系統(tǒng),具有單向不可逆的特征。但是由于MP的模型中,具有邏輯或的推理,因而推理的前提具有不唯一性,不可以根據(jù)當(dāng)前狀態(tài)反推前提,并且在神經(jīng)網(wǎng)絡(luò)中,具有回饋的結(jié)構(gòu),所以導(dǎo)致了推理的前提也具有不確定性。[2]而最佳解釋的推導(dǎo),實(shí)際上是由結(jié)論尋找原因的過程,如果需要使用局部式網(wǎng)絡(luò)的方式對(duì)溯因的過程進(jìn)行說明,則需要對(duì)局部式網(wǎng)絡(luò)的解釋方式進(jìn)行改變。
薩伽德認(rèn)為在使用神經(jīng)網(wǎng)絡(luò)的進(jìn)行處理的過程中,單元表征各種與證據(jù)相關(guān)的材料,單元之間的聯(lián)結(jié)表征證據(jù)鏈條之間的關(guān)系,當(dāng)證據(jù)之間能夠被證明時(shí),代表一個(gè)單元激活另一個(gè)單元,當(dāng)對(duì)同一現(xiàn)象有不同猜測(cè)的原因和理由時(shí),這些不同的假設(shè)是互相抑制的關(guān)系,需使用抑制型聯(lián)結(jié)表示,在進(jìn)行選擇假說的過程中,還需要考慮對(duì)假說為真的解釋,所構(gòu)成的網(wǎng)絡(luò)中要能夠?qū)ψC據(jù)和假說之間的關(guān)系給出融貫一致的解釋。[4]解釋的融貫性理論包括對(duì)稱、解釋、類比、資料優(yōu)先、矛盾、競(jìng)爭(zhēng)、可接受性七條原則,其中最重要的原則是解釋原則,理論解釋的融貫性與解釋的證據(jù)數(shù)量正相關(guān),與假說命題的數(shù)量負(fù)相關(guān),在解釋中可將證據(jù)與假說都看作命題,所有命題可構(gòu)成命題系統(tǒng),在理論處理的過程中,可以對(duì)每個(gè)命題判斷其可接受性,然后選擇其中最佳的解釋。[56]在神經(jīng)網(wǎng)絡(luò)中表示為,判斷某個(gè)假說被激活,不僅要看證據(jù)數(shù)量的多少,即激活源的數(shù)量,還需要考慮證據(jù)對(duì)假說的支持力度,即單元間聯(lián)系的權(quán)重,一般情況下證據(jù)與假說之間的聯(lián)結(jié)更直接,則表明具有更高的可信度。薩伽德對(duì)單元之間因果關(guān)系的處理,表現(xiàn)為證據(jù)之間以及證據(jù)和假說之間的支持力度,命題之間的因果聯(lián)系是根據(jù)解釋的融貫性被置入在網(wǎng)絡(luò)中的,在后單元的可接受性根據(jù)在先單元的狀態(tài)進(jìn)行判斷。
參考文獻(xiàn):
[1]MCCULLOCH W S,PITTS W.A logical calculus of the ideas immanent in nervous activity[J].The Bulletin of Mathematical Biophysics,1943,5(4):115133.
[2]繆青海,王雨桐,呂宜生,等.McCullochPitts人工神經(jīng)元模型80周年紀(jì)念:思想、方法與意義[J].智能科學(xué)與技術(shù)學(xué)報(bào),2023,5(2):133142.
[3]THAGARD P,MILLGRAM E.Inference to the Best Plan:A Coherence Theory of Decision[M]//RAM A,LEAKE D.GoalDriven Learning[M].Cambridge,MA:The MIT Press,1995:439454.
[4]薩伽德.心智:認(rèn)知科學(xué)導(dǎo)論[M].朱菁,陳夢(mèng)雅,譯.上海:上海辭書出版社,2012.
[5]THAGARD P.Explanatory coherence[J].Behavioral and Brain Sciences,1989,12(3):435467.
[6]賴明東,張?jiān)鲆唬何?薩伽德的解釋連貫性理論及其爭(zhēng)議分析[J].自然辯證法研究,2020,36(2):7378.
作者簡(jiǎn)介:齊浩森(2001— ),男,漢族,陜西渭南人,碩士研究生在讀,研究方向?yàn)檫壿媽W(xué)。