鐘義信
(北京郵電大學 計算機學院,北京 100876)
經典物質科學的研究形成了一套完整的科學觀和方法論,即以“物質”為基本研究對象的機械唯物科學觀和以“分而治之”為特征的機械還原方法論。在整個近代科學研究歷程中,這種科學觀和方法論獲得了極其普遍的成功應用,使近代科學的研究領域越分越細致、研究越來越深入,促成了近代科學的大發展與大繁榮。
20世紀中葉以來,信息科學(智能科學是它的核心、前沿和制高點)在世界范圍內迅猛崛起,成為信息時代的標志性學科[1]。
信息對象與物質對象既有聯系又有原則性的不同,因此信息科學應當遵循信息科學的科學觀和方法論進行研究。但是由于意識通常落后于存在,方法論通常落后于實際研究的需要,而且研究信息科學的人員都是在機械唯物科學觀和機械還原方法論熏陶下成長起來的,因此,面對人工智能這類開放的復雜信息系統研究的時候,人們自然就按照“分而治之”的方法論思想來處理:把復雜的智能系統分解為“結構、功能、行為”3個側面,展開結構模擬(人工神經網絡)[2-7]、功能模擬(物理符號系統)[8-17]和行為模擬(感知動作系統)[18-20]的研究,形成了人工智能研究的三大途徑和流派。
經過數十年的研究與發展,人工智能研究的3種途徑各自都取得了不少意義重大的進展,產生了一批階段性的重要成果。但是與此同時,人工智能的研究也面臨著十分嚴峻的挑戰:雖然3種研究途徑的目標都是探討智能的人工實現,然而,它們之間卻互不認可[18,21-22],堅持各自為戰,未能形成研究的合力,妨礙了人工智能統一理論和通用方法的形成;而且,三者都嚴重忽視了智能的重要基礎——信息、意識和情感的研究。可見,人工智能的研究雖然取得了不少耀眼的成果,但整體上并未真正成熟。
面對這種情況,一批有識之士積極推動人工智能研究的改革,試圖建立人工智能的統一理論。其中最有代表性的是Russell 、Norvig和Nilsson等人的工作。Russell和Norvig[23]于1995年出版了篇幅超過1 000頁的長篇巨著Artificial intelligence: a modern approach,Nilsson[24]也在 1998年出版了新著Artificial intelligence: a new synthesis。前者試圖提出新的研究途徑(modern approach)來實現3種人工智能理論的統一,后者希望利用新的集成方法(new synthesis)來建立人工智能的統一理論。遺憾的是,他們只是把3種人工智能的研究成果直接地“拼接”在Agent的身上,而沒有找到實現統一的理論路徑。
因此,創建“結構–功能–行為”和諧融通、“意識–情感–理智”三位一體的通用人工智能理論,是一個尚未完成而又必須完成的重大研究任務。這是一個內涵深刻、意義深遠,需要從源頭出發而且貫通全程的巨大的創新研究任務。
面對一個熟悉而具體的研究課題,人們通常可以采取“輕車熟路,依規而行”的慣常做法。但是,面對一項創新性極強的研究課題,這種做法就不再可行了。在這種情況下,人們必須研究和發展一套正確清晰而且系統完整的創新研究綱領。
鑒于當前人工智能研究存在的主要問題是:1)在研究廣度上碎片化; 2)在研究深度上淺層化;3)在研究體系上封閉化。所有這些問題共同的根源是“分而治之”機械還原方法論,后者是機械唯物科學觀在宏觀研究方法上的反映。因此,人工智能理論的創新研究無法回避科學觀和方法論的問題,需要采取表1所示的“頂天立地”的研究綱領。

表 1 研究綱領Table 1 The research programs
智能(無論是人類智能還是人工智能)是一個極其深刻的研究對象,觸及人類思維能力的深層奧秘;人的大腦是一類堪稱“小宇宙”的系統,很少有能夠與之比肩的復雜對象。這樣一種十分深刻異常復雜的研究,必須從科學觀和方法論這個研究的源頭和駕馭全局的龍頭展開深入研究。只有高屋建瓴,才能勢如破竹,而且一覽無余[25]。
另一方面,人工智能研究之所以形成“三方割據”的碎片化、淺層化和封閉化的格局,根本的原因也正是因為人們遵循了“分而治之”所體現的機械唯物科學觀和機械還原方法論。因此,為了有效變革人工智能理論研究的現狀,就必須從反思人工智能研究的“科學觀和方法論”這個科學研究的“源頭”和“龍頭”做起,才有成功的可能。
正確的科學觀可以啟迪正確的方法論,有了正確的科學觀和方法論的導引,就可以確保研究工作的大方向不會發生重大偏差。但是,要想真正獲得創新研究的重要成果,還必須認真考問:原有人工智能研究所采用的基本模型和基本路徑是否合理,是否需要做出必要而充分的變革?
這是因為,“研究模型”就是“總體藍圖”,代表了研究者對于研究對象性質和各種關系的全面認識,而“研究路徑”則是研究工作的“總體方向和路線”,表達了研究者對于解決問題所要采取的方法路徑的理解。因此,研究模型與研究途徑的正確與否,將在很大程度上決定研究工作是否真的能夠獲得意義重大的結果。
我們看到,現有人工智能理論研究的研究模型基本局限于腦模型,研究途徑主要圍繞大腦的物質結構和功能展開,從而忽視了源頭信息的理解和利用,導致諸多盲區和誤解。智能的生成是一個復雜的生態演化過程[26],必須在信息生態方法論指導下構建人工智能研究的研究模型,選擇科學合理的研究途徑,避免“一葉障目,不見泰山”的局限。
同其他領域的研究一樣,人工智能理論的研究必須落實到“基本概念和基本原理”上面。因此,在把握了正確的科學觀和方法論,又廓清了研究對象的基本模型和基本路徑之后,進一步的研究事項就是要認真叩問:原有人工智能研究所建立的基本概念和基本原理是否準確和完備,是否需要進行重大的革新和重建?
不難預料,在新的科學觀和方法論的導引之下,研究的基本模型發生了顯著的變化,而且研究的路徑也發生了重大的改變,那么,人工智能理論研究的原有概念體系和原理體系肯定不能適應新的需要。因此,深化和重構人工智能理論研究所必需的基本概念就成為不可避免的工作,相應的基本原理也因而必須重新探討和建構。事實上,現有人工智能理論的信息、知識、智能等基礎概念都存在嚴重的表面性和局限性[1,25];不僅如此,基礎意識、情感、理智及其綜合決策等基礎概念和人工智能系統各個分系統之間相互轉換的原理基本沒有得到應有的關注[27]。
總之,從研究的源頭(科學觀和方法論)出發,到研究的全局展開(研究模型和研究路徑),再到研究結果的扎實落地(基本概念和基本原理),進行全方位的反思、突破、發現和創新,逐層遞進,重新構筑“通用人工智能”的基本理論。這就是本文的研究綱領。
本文將循著這個綱領,敘述通用人工智能理論研究所取得的重要進展。
科學觀要回答的基本問題是:科學研究的對象是什么?這種研究對象的宏觀性質是什么?在此基礎上,方法論要回答的基本問題是:按照科學觀的宏觀理解,研究這類對象的宏觀思路和原則方法是什么?可見,科學研究的科學觀和方法論確實是科學研究的源頭和駕馭科學研究全局的龍頭。
顯然,不同的研究對象需要運用不同的科學觀來理解,因而也需要運用不同的方法論來處置。
迄今,主要存在兩類不同(雖然互有聯系)的研究對象:物質對象和信息對象。與此相應,也存在兩種不同的科學觀和方法論:經典物質科學的科學觀和方法論,信息科學的科學觀和方法論。
經典物質科學的科學觀認為:它所研究的具體對象是有限時空中的物質,這種物質對象是客觀的存在,不因主觀意志而改變。經典物質科學的方法論認為:對于復雜的物質對象,可以通過“分而治之”的方法來研究。這就是機械還原方法論。
智能,是(生物,特別是人類)主體認識環境(認識世界)與改造環境(改造世界)的過程中所表現出來的高級能力。這個過程的宏觀表現是:首先,環境中的客體信息作用于主體;然后,主體憑借自己的目的與知識產生智能行為反作用于客體。這種作用與反作用的過程也許要進行多個回合,如圖1的模型所示。

圖 1 智能的抽象模型Fig. 1 Abstract model of intelligence
根據圖1所表示的抽象模型,人們就可以更具體地說:智能,乃是主體在與環境客體相互作用的過程中,為了成功應對自己所面臨的生存與發展的挑戰而對客體信息進行深度加工演化從而生成智能行為的能力。因此,智能是在主體目的和知識的制約下由客體信息激發生長起來的,是信息生態演進過程的高級產物[26-27]。
有鑒于此,現代信息科學的科學觀認為:它的研究對象是信息,信息對象也是一類存在,能夠在主體與客體相互作用的過程中逐漸生長演化成為有用的智能(表現為智能策略和智能行為)。于是,現代信息科學的方法論認為:信息(智能是信息的高級產物)研究,需要特別關注它的生長演化過程,研究各個生長環節之間的相互關系、信息生長系統與環境之間的相互關系,以保障信息能夠生長成為智能。我們把這個科學研究方法論命名為“信息生態方法論”。
表2給出了兩種科學觀和方法論的簡明對照。

表 2 兩類科學的科學觀與方法論對比Table 2 Comparison of the scientific view and methodology between the two kinds of science
從表2的對比可以看出,兩類科學觀和方法論的作用存在很大的差異:如果遵循機械還原方法論來進行研究,信息學科必然被分解為若干分支(碎片),產生若干分支的理論,而且由于各個碎片之間互相獨立和封閉,必然丟失各個分支之間的相互聯系,因而也必然丟失整個學科的總體聯系和規律;而信息生態方法論則關注各個分支之間相互關系的研究,關注學科系統與其環境相互關系的研究,于是就可以恢復學科原有的總體面貌,進而可以揭示學科的總體規律。
迄今人工智能理論遵循的是“機械唯物科學觀”和“機械還原方法論”;本文人工智能理論研究所遵循的是“辯證唯物科學觀”和“信息生態方法論”。
這個結果,是研究對象的歷史性轉變(由物質對象轉變為信息對象)所使然。由此導致了經典物質科學時代向信息科學時代的轉變,或者更簡練地說,導致了工業時代向信息時代的轉變。這是一個劃時代的偉大轉變。
按照機械還原方法論的精神,迄今的人工智能研究模型通常都是某種孤立的人類大腦模型:或者是大腦的新皮層結構模型(人工神經網絡),或者是大腦的邏輯思維功能模型(專家系統)。這是造成人工智能理論淺層化、碎片化和封閉化的重要原因。
按照信息生態方法論的精神,智能是認識主體(典型的代表是人類主體)在與其環境客體相互作用的過程中對客體信息進行復雜加工所生成的高級產物(體現為智能策略和智能行為)。于是,就可以得到圖1所示的智能宏觀研究模型。
任何客體都會呈現自己的“狀態及其變化方式”。按照后面5.1節的定義1,這便是圖1模型中的“客體信息”。所謂“主體與客體的相互作用”是指:一方面,客體信息作用于主體;另一方面,主體會據此生成智能行為反作用于客體。這是兩者相互作用的一個基本回合。需要強調的是,主體反作用于客體的行為不能隨心所欲,而必須具有足夠的智能水平:一方面,這種行為應當能夠實現主體所追求的目的,否則就算失敗;另一方面,這種行為又應當遵循客觀規律而不破壞環境,否則,主體自身的生存發展就會面臨風險。這就是說,智能行為必須是能夠保證“主客雙贏”的行為。
那么,當受到環境中客體信息作用(刺激)的時候,人類主體應當怎樣做才能生成足以實現“主客雙贏”的智能行為呢?
這顯然是一個十分復雜的過程。但是,無論這個過程怎樣復雜,圖1的宏觀模型還是給出了清晰的啟示:主體收到的是“客體信息”,而它要生成的是“智能行為”,因此,這必定是一個由“客體信息”到“智能行為”的轉換。
問題于是就變為:主體應當怎樣做才能完成這個轉換?圖1的模型也給出了另一個啟發:主體具有明確的目的,也具有相應的知識,因此,這個復雜過程一定是“在主體目的的牽引下,在主體知識的支持下,把客體信息轉換為智能行為的過程”。
如果把這個復雜的轉換過程具體地展開,就可以得到圖2所示的智能生成模型。

圖 2 智能生成:人工智能系統的通用模型Fig. 2 Intelligence generation: a general model of artificial intelligence system
注意,圖2的“綜合知識庫”存儲了主體的目的G和知識K(這是任何主體都必須具備的屬性)。可以看出,圖2其實就是圖1的深化:不僅表現了“客體信息”對主體施加的作用和“智能行為”對客體施加的反作用;而且把主體生成智能行為這個復雜過程都表現出來了。熟悉腦科學和認知科學的研究者都可以做出判斷:無論對人工智能還是對人類智能,圖2的模型都是科學合理的。
不能不指出的是,由于受到“分而治之”方法論的影響,現有人工智能理論的研究模型只把圖2的“理智生成”和“綜合知識庫”部分地分割出來研究,而對模型中的感知選擇、認知、基礎意識、情感生成、綜合決策、策略執行這樣一系列極其關鍵單元的作用原理和相互關系都未有涉足。可見,現有人工智能理論的研究模型多么局限!
那么,面對圖2所示的研究模型,應當采取怎樣的研究路徑才能走向成功?
一個富有啟發意義的例子是:飛機的設計并不是刻板地模仿飛鳥的具體結構,而是抓住了支持整個飛翔活動的“空氣動力學原理”。同樣,人工智能系統的研究也不應當刻意地模仿人腦的具體結構,而應當抓住支撐整個智能活動的“智能生長機制”。
有鑒于此,通用人工智能理論研究獨樹一幟采取了“機制主義”的研究路徑,即著眼于“主體生成智能的共性機制”,這是因為:與智能系統的結構、功能、行為相比,生成智能的共性機制才是最本質的東西,而且是主宰智能系統全局的東西;而結構和功能則都是為機制服務的東西。這個共性的工作機制可以表示為:針對給定的問題、目標和領域知識,執行式(1)的復雜轉換(對照圖2):

圖2表明,式(1)的每一個轉換都對應著一類工作單元:“感知與選擇”單元把客體信息轉換成為感知信息;“認知”單元把感知信息轉換成為知識;“基礎意識–情感生成–理智生成–綜合決策”單元在目的牽引下、在相關知識支持下把感知信息分別轉換成為各種層次和側面的智能策略成分(包括基礎意識、情感、理智和最終綜合形成的智能策略);“執行”單元則把智能策略轉換成為智能行為。其中各個工作單元的基本概念和工作原理將在第5節分別闡述。
式(1)可以更簡潔地表示為式(2)的轉換系列:

轉換系列式(1)、(2)可以稱為“信息轉換與智能創生”原理,即通過一定的信息轉換實現智能策略和智能行為的創生。“信息轉換與智能創生原理”乃是一切智能系統共有的核心工作機制,是一切智能系統共有的基本規律。
顯然,假如不是采取了“機制主義”的研究路徑,而是運用結構主義(神經網絡)、功能主義(專家系統)或者行為主義(感知動作系統)的研究路徑,那么,式(1)、(2)所表達的“智能系統共有的基本規律”就會被閹割和丟失,這正是現有人工智能研究所遭遇的情形。可見,正確的研究路徑將揭示研究對象的深層規律;不恰當的研究路徑將閹割和丟失研究對象的深層規律。這就是研究路徑的重要意義。
現行人工智能理論的研究模型或者是“大腦的結構”,或者是“大腦的功能”,它的研究路徑或者是“結構主義(模擬腦的結構),或者是功能主義(模擬腦的功能),或者是行為主義(模擬智能系統的行為)”,尚未實現統一。本文所述的人工智能理論的研究模型則是“主客相互作用過程的信息生態演進系統”,它的研究路徑是“以信息–知識–智能轉換為標志的機制主義”。這是人工智能由局部研究發展到全局研究、由分散研究發展到統一研究所發生的重要突破和轉變。
如上所見,站在“辯證唯物科學觀”這個信息科學研究的源頭,抓住“信息生態方法論”這個信息科學研究的龍頭,可以構建起通用人工智能理論的研究模型(總體藍圖),并沿著“信息→知識→智能的轉換”這個機制主義的研究路徑,就成功地揭示了人工智能理論的根本規律“信息轉換與智能創生”。
按照“信息生態”這個方法論思想,信息領域的研究任務,遠遠不是僅僅研究信息現象本身,而應當研究信息的整體生態過程,即信息轉換為知識并進而轉換為智能策略和智能行為的完整過程。那么,上述“信息轉換與智能創生”基本規律,就是管控整個信息領域的普適定律!
本節之所以要討論基礎概念和基本原理,目的就是使“信息轉換與智能創生定律”能夠落地生根。為此,以下將對照圖2的模型逐一展開討論。由于篇幅的緣故,以下的討論基本上是結論性的,詳細的內容可以參閱文獻[1, 25-28]。
如前所述,信息是智能生長的激勵源泉,但是迄今信息概念局限于“通信信息”。后者僅僅是智能研究所需要的信息概念的表面(形式)層次。既然信息這個源頭概念已經被淺層化了,就導致現有人工智能理論不會有深刻的理解能力。因此,我們必須重新審視信息的概念。
4.1.1 信息的概念和表示
通信信息的概念:信息是用來為通信接收者消除“關于發送端所發信號波形”的隨機不確定性的東西。這里只有波形的形式因素,沒有內容因素,也沒有價值因素。因此,這種信息概念適用于通信工程,不足以支持智能理論的研究。
對照圖2的模型可以看到,實際存在兩種互相聯系又互不相同的信息概念:客體呈現的“客體信息”和主體所感知的“感知信息”。它們的基本定義如下。
定義1 客體信息。客體信息是指客體所呈現的關于其自身的“狀態及其變化方式”。
定義1表明,事物X的客體信息可以用它呈現的狀態及其變化方式來表示。例如,假設X是有限狀態的事物,即x1, x2, ···, xn,n是有限正整數;又設狀態變化的方式是隨機的方式,即每個狀態發生的概率為p1, p2, ···, pn, 這就是隨機型的客體信息特征,這類信息可以記為{x1, x2, ···, xn;p1, p2, ···, pn}。一般的客體信息也可以記為{x1, x2, ···, xn;c1, c2, ···,cn}。其中,c1, c2, ···,cn是各個狀態發生的肯定度。
客體信息只與客體自身的性質和狀況有關,而與主體的性質及主觀意志無關。因此,客體信息又被稱為“本體論信息”。客體信息是一切其他信息的源泉,其他信息都是客體信息通過相關轉換所產生的結果。
定義2 感知信息。感知信息是指主體從客體信息所感知的客體狀態及其變化方式的形式(稱為語法信息)、內容(語義信息)和效用(語用信息)。
主體具有感覺能力和知覺能力。因此,主體對客體信息感知的結果就會產生“語法信息(形式)、語義信息(內容)、語用信息(效用)的三位一體”。如果X是有限(n)狀態的事物,那么主體從X的客體信息得到的感知信息就要表示為一個矩陣:

式中:c1, c2, ···, cn是各個狀態的肯定度,它們是語法信息的表征參量;t1, t2, ···, tn是各個狀態的邏輯真實度,它們是語義信息的表征參量;u1, u2, ···, un是各個狀態的效用度,它們是語用信息的表征參量。基于式(3)的矩陣描述,可以建立語法信息、語義信息、語用信息以及整個感知信息的數值度量方法,詳細的情形可以參見文獻[1]。
更有創新意義且更為科學的客體信息和感知信息表示方法,是汪培莊教授創建和發展起來的因素空間理論[29]。當然,文獻[1]的信息表示方法和文獻[29]的信息表示方法之間是相通的,但是后者具有更多的優越性。
感知信息不僅與客體的性質和狀況有關,而且與認識主體的目的和知識狀況有關。因此,感知信息也稱為“認識論信息”,代表了主體對于客體的主觀認識。也正因為感知信息不僅與客體的因素有關而且與主體的因素有關,因此感知信息要比客體信息的內涵豐富得多復雜得多。
為了進一步理解感知信息的概念,需要考察圖3的感知信息生成機理。

圖 3 感知信息的生成機理Fig. 3 Generation mechanism of perceived information
圖3顯示:1)通過主體的感覺器官(技術上就是傳感系統)可以直接把客體呈現的客體信息轉換為語法信息; 2)通過主體的回憶和檢驗(技術上是檢索和計算)可以由語法信息生成語用信息;3)通過對“語法信息與語用信息兩者的聯合體”的抽象化處理(技術上是映射與命名)就可以生成語義信息,三者共同構成感知信息。關于感知信息生成機理更詳細的分析,還可以參見4.1.2節。
現有人工智能理論沿用的“通信信息”概念只相當于語法信息的概念,因此現行的人工智能理論只關注了信息的形式而沒有關注信息的內容和價值,致使現有人工智能理論研究在起點(感知信息)上就存在了致命性缺陷,導致理解能力的喪失。
4.1.2 語義信息理論
由客體信息轉換為感知信息的原理稱為第一類信息轉換原理[1]。對照圖3感知信息的生成機理,可以構造第一類信息轉換原理的模型,如圖4表示。
在圖4的模型中,知識庫代表了主體的記憶系統,它包含了主體的目標G、主體已經擁有的語法信息與語用信息的偶對集合{xn, zn}以及主體的邏輯處理能力(包括檢索、運算、抽象化等)。模型表明,客體信息向感知信息的轉換是在主體操作下完成的。具體的轉換過程包括3個步驟(可以對照圖4和圖3):
1)生成相應的語法信息:客體信息(即圖4中的本體論信息)S通過傳感系統的感覺功能轉換為語法信息X,這在數學上就是映射。

圖 4 第一信息轉換原理:客體信息→感知信息Fig. 4 The first information conversion principle: object information→perceived information
2)生成相應的語用信息:分兩種情況處理,即檢索和計算。檢索:以語法信息X為檢索子,在知識庫內對{xn, zn}進行檢索,如能在其中找到與檢索子匹配的語法信息項xn,則相應的zn就是X的語用信息Z。計算:如果無法在知識庫內找到匹配項,說明S是一個新事物。這時就要采用新的方法:把語法信息矢量X與主體的目標矢量G進行相關性計算,所得到的相關性結果就是相應的語用信息Z。3)生成相應的語義信息:將偶對(X, Z)映射到語義信息空間并給映射的結果命名,就得到了相應的語義信息Y。這個操作也可通過圖5來理解。

圖 5 由(語法信息,語用信息)到語義信息Fig. 5 From (syntactic information, pragmatic information) to semantic information
這樣就完成了由客體信息S到感知信息(X, Y,Z)的轉換。不難看出,第1類信息轉換原理的全部信息轉換過程,不但可以在人類主體系統內輕松實現(見圖3),而且也可以在機器系統內方便實現(見圖4)。

第1類信息轉換原理揭示了1個重要的關系,這就是語法信息、語義信息、語用信息三者之間所存在的相互關系(對照圖4和圖5):式中λ是“映射與命名”算子。式(4)表明,語義信息Y是語法信息X和語用信息Z兩者的聯合(X,Z)映射到語義信息空間(和命名)的結果。
式(4)關系的合理性:語法信息表達的是事物的形態,很具體,因此可以被直接感受到;語用信息表達的是事物對主體目標而言的效用,也很具體,因此可以通過回想或檢驗得到;而語義信息是抽象的,既不能直接感受到也不能直接體驗到,只能通過對語法信息和語用信息的聯合體進行抽象化處理(映射與命名)才能得到。
初看上去,式(4)似乎很抽象。其實,人們時刻都在熟練地運用這個方法,只是因為太熟練而不經意了。例如,“水杯”的語義信息(內容)Y是什么?實際就是給“具有水杯的語法信息(水杯的形態)X和語用信息(水杯的效用)Z的那種事物”所取的名字。“給某某取名”,就是“將它映射并命名”。讀者不難由此而及其余。
歷史上曾有很多關于語法信息、語義信息、語用信息的討論,卻從來沒有闡明它們之間的關系,以至造成諸多混亂。本文總結的關系式(4)之所以十分重要,就在于,只有闡明了關系式(4),才能真正理解,為什么人們最關心的是語義信息,為什么只有語義信息能夠代表語法信息和語用信息,從而也能代表整個感知信息。
本節討論的結果,不但闡明了語法信息、語義信息、語用信息的準確含義以及它們之間的相互關系,而且還可以用來澄清幾個重要而又常常被混淆的概念。
1)傳感與感知
值得注意的是,信息的感知包含了“感”和“知”兩個互有聯系又互不相同的概念。所謂“感”,是指感受是否有某種客體信息的存在(即存在性檢驗),如果確實存在某種客體信息,那么,“感”的結果可以得到這個客體信息的形態(語法信息),但得不到這個信息的內容(語義信息)和價值(語用信息),參見圖3與圖4。所謂“知”,是指在“感”的基礎上,通過把它所產生的語法信息與主體目的進行相關考察(即目的性檢驗),從而知道這個信息具有什么效用(語用信息),進而將這個語用信息與語法信息的偶對映射到語義信息空間并予以命名,才能得到相應的語義信息。全面獲得了語法信息、語義信息和語用信息,才實現了“感知”。
可見,“感知”的概念比“感”的概念要復雜得多。現在受到普遍關注和廣泛應用的傳感器只具有“感”的功能,沒有“知”的功能。人們把傳感器理解為完整的“感知”單元,這是一個非常普遍而嚴重的誤解!
2)數據與信息
參照圖3與圖4可以看出,一切傳感系統(或者人的感覺系統)輸出的是只有形態因素而沒有內容和價值因素的語法信息,數據就屬于語法信息。換一種說法,數據和其他各種傳感器產生的信號一樣,都是信息的載體;而語法信息也正是以自己的形態作為載荷信息的載體。因此,數據與語法信息是同一概念的不同名稱。
那么,數據、信號、語法信息它們所載荷的“信息”又是什么呢?嚴格地說,這里所說的信息其實不是別的,正是“語義信息”。正如4.1.2節所闡明的,“語義信息”可以代表語法信息和語用信息,當然也就代表了語法信息、語用信息和語義信息。因此,只有“語義信息”才有資格簡稱為“信息”;而語法信息和語用信息都不能擁有這樣的簡稱。可見,人們所說的“從數據中提煉信息”實際上說的應當是“從語法信息中提煉語義信息”。于是,數據只是信息的載體。這些概念就在信息科學概念體系中得到了很好的厘清。
進一步的問題是,怎么才能“從數據中提煉信息”?在數據科學中,這個問題似乎仍在探索之中。但是,既然“從數據中提煉信息”更準確地說就是“從語法信息中提煉語義信息”,那么,在信息科學理論體系中(如圖3~5),這個問題已經得到非常清晰的解答。
由此可見,用信息科學的理論體系準確厘清“數據”和“信息”這類術語的真實含義之后,不但可以消除術語含義上的混亂,而且可以準確而清晰地找到解決問題的有效方法。
4.1.3 信息選擇
對照圖2,信息選擇的作用是,根據系統的目標G,針對作用于系統輸入端的客體信息S(或由它映射得到的語法信息X),計算S相對于G的語用信息Z,并依據語用信息的大小做出決定:凡是與目的無關的客體信息都予以舍棄,只需關心與目的有關的新鮮信息。這相當于認知科學的“注意”功能。
這是智能系統的第一道關口:智能門戶,根據系統目標對客體信息做出取舍。假如沒有這道智能門戶,智能系統就可能被洶涌澎湃、排山倒海而來的信息所淹沒,變得手足無措自顧不暇,喪失信息處理的能力。因此,“信息選擇”的作用極其重要。
在當代“大數據(big data)”的信息環境下,這個“智能取舍”的作用具有特別重大的意義。這是因為,按照學術界的定義,所謂“大數據”是指那些具有“巨大的規模(volume)、龐雜的種類(variety)、極高的速度( velocity)而又具有潛在價值 (value)的數據”,它的總體標志則是“現有信息技術的能力無法處理的數據”。然而,通過智能系統的“選擇”和“舍棄”功能,就可以直接把現有信息技術無法處理的“大數據”轉變為可以輕松處理的“小數據”。“有舍才有得”,如果不懂得舍棄,大數據就會因為系統無法處理而無所收獲。這是普通的辯證法。與“云計算”和“云存儲”方法相比,在系統輸入端口的“智能取舍”可以節約巨量的儲算資源!
對照圖2的模型可以知道,“感知單元”獲得的是感知信息,相當于人類認識過程中的“感性認識”。為了成功應對系統的外來刺激,僅有感性認識是遠遠不夠的,必須設法把“感性認識”提升為“理性認識”,即“知識”。因此,感知單元之后應當有認知單元,它的作用就是完成“感知信息→知識”的轉換,即第二類信息轉換原理。
目前,人們對“認知”存在許多不同的理解。本文的理解是:“感知”是獲得感性認識的認識過程,“認知”是獲得理性認識的認識過程,“決策”是獲得求解問題的智能策略的過程。為此,這里給出本文的“認知”定義。
定義3 認知。認知是感知(語義)信息轉換為知識的過程,“獲得知識”是認知過程的目的。
那么,作為認知完成的標志,知識的定義又是什么?
定義4 知識。主體關于某類事物的知識,是指主體從該類事物的大量感知信息中提煉出來的關于“該類事物共有的狀態及其變化規律的形式、內涵和價值”的認識。
知識與感知信息具有天然聯系,它們都是認識論范疇的概念,是主體對客體信息的感知和認知。但知識與感知信息又有原則的不同:感知信息是對某個事物的狀態及其變化方式的形式、內容和效用的感知,知識是對某類事物運動狀態及其變化規律的形式、內涵和價值的認知。“變化方式”是具體的個別的,“變化規律”是抽象的普遍的。所以,感知信息屬于淺表的“現象”層次,知識則屬于深刻的“本質”層次。
根據上述知識與認知的定義,“感知信息→知識”的轉換其實就是要完成“由現象到本質”的轉換。這就清楚地表明,完成“感知信息→知識”轉換的方法,通常是歸納型算法。第二類信息轉換原理:由感知信息到知識的轉換,見圖6。
圖6的輸入是“語義信息”,代表了主體對“問題”的感性認識,是第一類信息轉換的產物;輸出是“知識”,代表了“認知(第二類信息轉換)”所得到的結果。模型表明,“綜合知識庫”是認知系統的核心,它要包含信息的表示、知識的表示、認知的目的、歸納型的邏輯方法(包括歸納、類比、聯想、分類、聚類、抽象化等)。沒有這樣的綜合知識庫,認知的任務就難以完成。圖6中的預處理是為了使用歸納型算法所要采取的一些預備步驟,后處理則是為了規范“知識的表示”所需要的一些處理。

圖 6 第二類信息轉換原理模型示意圖Fig. 6 A schematic diagram of second type of information conversion principles
圖7是“由語義信息轉換為知識”的一個具體例子,即由鋼筆、毛筆、鉛筆這類具體的事物名稱(語義信息)歸納出“筆”這個抽象概念(知識)的過程。從中可以看出,語義信息(由相應的語法信息和語用信息映射命名所確定)是生成知識(概念是知識的“原子”)的基礎和前提:通過分別對具體事物(鋼筆、毛筆、鉛筆)的語義信息的共性形態特征和共性功能(效用)特征的提取,就歸納出抽象概念(筆)的共性形態特征和共性功能(價值)特征,從而抽象出了“筆”的概念(知識的一個原子)。

圖 7 由語義信息轉換為知識的例子Fig. 7 An example of conversion from semantic information to knowledge
讀者不難由此舉一反三,分析更多“由語義信息歸納知識”的實際案例。所有的案例都會表明,如果沒有語義信息這個前提,獲得知識就會成為無源之水。知識還具有兩個特別有用的性質,這就是知識的內生態規律和知識的外生態規律。
1) 知識的內生態規律
在先天的本能知識支持下,后天的經驗知識才可以從語義信息(它是感知信息/認識論信息的代表)歸納出來,它是“欠成熟”的知識,可通過修正和提煉而生長成為“成熟”的規范知識,兩者又可通過自然凝練生長成為“過成熟”的常識知識。本能知識、常識知識、經驗知識、規范知識的概念易由圖8獲知。
2) 知識的外生態規律
圖9給出了知識的外生態規律模型,即由語義信息通過歸納生長成為知識,后者通過演繹可以生長成為智能策略;圖中的虛線聯系表示,如果通過演繹過程不足以生成智能策略,就可以返回去要求歸納新的知識,以支持更好的演繹。

圖 8 知識的內生態規律Fig. 8 The internal ecological law of knowledge

圖 9 知識的外部生態規律模型Fig. 9 Model of external ecological law of knowledge
同信息的表示方法類似,也可以用因素空間理論有效地表示知識[29]。
對照圖2的模型可知,智能系統最為核心也是最復雜的任務是:針對主體所選定的具體問題(語義信息代表了主體對于“問題”的感性認識),在相關知識支持下,在目標牽引下,創生解決問題達到目標的智能策略。之所以這樣說,是因為:智能策略是系統解決問題的“智能水平”的最集中體現,而生成智能策略的過程也是最為復雜的過程,包括基礎意識的生成、情感的生成、理智的生成以及綜合決策。
其中所說的“理智”,大體上相當于現行人工智能術語中的“智能”;不過,真正的智能應是基礎意識(基礎智能)、情感(感性智能)和理智(理性智能)的綜合表現,因此,為了與“基礎意識”和“情感”的名稱形成和諧默契的關系,這里就把過去習慣上稱為“智能”的這個術語專門規范為“理性智能”,簡稱“理智”。
另外,這里把智能生成稱為“智能創生”,這是因為,由語義信息生成智能策略并非一般簡單的邏輯演繹過程,其間存在許多不確定性:實際獲得的語法信息和語用信息的非完善性,由此導致語義信息的不精準性以及知識的不充分性,預設目標的欠合理性等。因此,由語義信息生成智能策略的過程帶有難以避免的誤差性,需要通過不斷學習來優化,其間也包含著“涌現”的復雜機制,是創造性生成,故曰“創生”。
如前所說,信息生態過程“源于信息,長于知識,成于智能”。因此,“智能創生”是人工智能理論的“集大成者”也是最精彩最復雜的環節,而且也是現行人工智能理論局限性最為突出的部分。
在展開具體的討論之前,也有必要先明確意識、情感、理智等幾個相關的基本概念。
注意到,智能是人類意識活動的表現;試想,如果一個人連意識能力都沒有,怎么可能創生智能呢?換言之,意識是智能生長的前提;另一方面,智能又是意識的高級表現形態。同樣,人類的情感也是智能的一種表現,也要以意識為前提。因此,為了研究智能的生成機理,意識和情感兩者都是不可回避的概念。
以往的人工智能理論研究忽視和回避了意識和情感的要素,這是它的“片面性與失真性”的突出表現,是重大的失誤。為了回到智能研究的正確軌道,我們必須正視意識和情感的研究以及意識、情感、理智集成融通的研究。
定義5 意識(哲學范疇的含義)。意識,是人的頭腦對于客觀物質世界的反映,是感覺、思維等各種心理過程的總和。存在決定意識,意識又反作用于存在。
哲學范疇的意識概念幾乎是說:意識是物質以外的全部精神現象,非常寬泛,非常籠統,非常難以精準描述和模擬。因此,需要聚焦更具體更基礎的意識定義。
定義6 意識(臨床醫學的含義)。一個人的意識主要指他對周圍環境、自身狀況、周圍環境事物之間的關系以及自身與環境之間相互關系的覺察、理解與反應的能力。
顯然,與哲學范疇的意識概念相比,醫學范疇的意識概念就具體明確多了,不但比較容易理解和把握,而且容易檢驗和測試。不過,醫學意義上的意識概念過于局限,而且幾乎是一種純粹現象學層面的定義,沒有涉及意識的生成機制。因此,需要建立一種更合理更有用的意識定義——基礎意識的定義。
定義7 基礎意識(智能科學的含義)。基礎意識是指主體在本能知識和常識知識支持下,在主體目標引導下,對來自外部環境和自身內部的刺激信息所產生的覺察、理解并做出合乎本能知識和常識知識及合乎目標的反應能力。
概言之,意識是指在一定的知識支持下和在目標牽引下對來自外部和內部的刺激信息所產生的覺察、理解和反應能力。由此可以確信:意識是智能的基礎,智能則是意識的高級形態。
基礎意識的定義規定:支持基礎意識的知識范疇是本能知識和常識知識。雖然這樣定義的“基礎意識”沒有覆蓋全部的(寬泛而籠統的)意識概念,但它把意識的基礎部分定義得明確而具體,不但給出了基礎意識的概念內涵,而且揭示了基礎意識的生成機理,即由“代表主體對問題的感性認識的語義信息Isem、本能知識和常識知識組成的知識體系Ka以及主體目標G組成的聯合空間”到基礎意識反應Ra的復雜映射Ca:

需要注意,正如語義信息Isem要由“語法信息和語用信息的聯合”表示一樣,這里生成的基礎意識反應Ra也要由“基礎意識反應的形態和效果的聯合”來表示,這樣才能把基礎意識反應Ra的含義明確表達出來。
定義8 情感。情感是指主體在本能知識、常識知識和經驗知識支持下,在目標引導下,對外來的和內部的刺激信息所產生的覺察、理解并做出合乎本能知識、常識知識和經驗知識及合乎目標的反應能力。
可以看出,情感與基礎意識之間存在密切聯系,它們都是主體對客體信息所做出的覺察、理解和反應。但是,情感比基礎意識利用了更多的知識(經驗知識),情感只有在基礎意識的基礎之上才能發生,兩者之間直接相通。因此,情感生成的機制也可以表示為由“代表主體對問題的感性認識的語義信息Isem、本能知識、常識知識和經驗知識三者的知識集合Kb以及主體目標G組成的聯合空間”到情感反應Rb的復雜映射:

同樣,系統所生成的情感反應Rb也要由“情感反應Rb的形態和情感反應Rb的效果的聯合”來表示,只有這樣才能把情感反應Rb的含義明確表達出來。
定義9 理智。理智是指主體在本能知識、常識知識、經驗知識和規范知識支持下,在目標的引導下,對外來的刺激信息所產生的覺察、理解并做出合乎本能知識、常識知識、經驗知識和規范知識及合乎目標的反應能力。

同樣可以看出,理智與基礎意識之間存在密切的聯系,它們都是主體對客體信息所做出的覺察、理解和反應。但是,理智比基礎意識利用了更多的知識(經驗知識和規范知識),理智只有在基礎意識的基礎之上才能發生,且兩者之間直接相通。于是也有式中:Kc表示本能知識、常識知識、經驗知識和規范知識四者的集合;Rc表示理智反應;Isem為語義信息,G為目的。這里生成的理智反應Rc同樣也要由“理智反應的形態和理智反應的效果的聯合”來表示,這樣才能把理智反應Rc的含義明確表達出來。
生理學特別是神經生理學已經證明,在人類大腦信息處理系統中存在兩個并行的通路,一個是快通路,一個是慢通路。結合定義8、定義9和圖2的人工智能通用模型可以判斷,快通路支持的是情感生成過程,慢通路支持的是理智生成過程。這是因為,情感生成過程是關于相對比較淺層的本能知識、常識知識和經驗知識的處理,通常只需要簡潔的操作,因此可以比較快速完成;而理智生成過程是關于本能知識、常識知識、經驗知識和比較復雜的規范知識的處理,往往需要比較復雜的深層推理,因而需要比較長的時間才能完成。
綜合定義7、定義8和定義9,可以構造圖10所示的基礎意識生成、情感生成和理智生成的通用模型。

圖 10 基礎意識、情感、理智的通用生成模型Fig. 10 A universal generation model of primary consciousness, emotion and reason
模型表明,無論是基礎意識的生成,還是情感和理智的生成,它們的共同輸入都是語義信息,它代表了主體對客體(問題)的感性認識,即代表了主體所認識的“需要求解的問題”。同樣,無論是基礎意識的生成,還是情感和理智的生成,共同的前提都是要事先給定求解問題的目的和相關知識,把它們恰當地表示出來并存儲在知識庫內備用。再者,無論是基礎意識的生成,還是情感和理智的生成,在上述給定前提(待求問題、預設目標和相關知識)的基礎上,關鍵的步驟都是“在相關知識的支持下,在目標的引導下,針對待求問題而展開的知識演繹處理”。
在不同情況下,知識演繹的不同特點在于:生成基礎意識所需要的是對“本能知識和常識知識”的演繹處理,比較直截了當,它所生成的反應策略是“基礎意識”表達;生成情感所需要的是對“本能知識、常識知識和經驗知識”的演繹處理,只需要比較簡潔的處理,它所生成的反應策略是情感表達;而生成理智所需要的是對“本能知識、常識知識、經驗知識和規范知識”的演繹處理,需要比較復雜的深層演繹,它所生成的反映策略是“理智”表達。那么,這些不同類型的“知識演繹”分別又是怎樣實現的呢?
1)生成基礎意識所需要的知識演繹
由于基礎意識的生成只依賴于對本能知識和常識知識的演繹,其中本能知識的演繹基本上是“條件反射”式的過程,而且引起反射的“條件”也很明晰;常識知識所需要的知識演繹原則上就是“自動檢索”的過程。因此,圖9模型中的知識庫所儲存的本能知識和常識知識都可以表示為以下形式:

式(8)的含義是:假設輸入的“刺激”是某種“語義信息(語法信息,語用信息)”,那么,如果這個語義信息(代表主體所認識的待求問題)是屬于本能知識的范疇,系統就直接輸出(響應形態,響應效果)的表述;如果輸入的語義信息(語法信息,語用信息)屬于常識知識的范疇,就要用輸入的“語義信息(語法信息,語用信息)”作為檢索子,在系統知識庫的常識知識集合里進行搜索,試圖在常識知識集合內發現與輸入語義信息(語法信息,語用信息)相匹配的語義信息(語法信息,語用信息)。只要實現了匹配,就把常識知識集合內與該語義信息(語法信息,語用信息)對應的(響應形態,響應效果)作為系統輸出的反應(響應),如圖11所示。

圖 11 基礎意識(響應)知識演繹Fig. 11 The knowledge deduction of the primary consciousness response
顯然,這是最為簡單的“知識演繹”。事實上,所有的本能知識和常識知識幾乎都具有“收到這樣的刺激,就生成那樣的響應”這種一一對應結構,不需要推理演繹。唯一需要做的事情,就是在輸入的“語義信息(語法信息,語用信息)”與圖11知識庫儲存的“語義信息(語法信息,語用信息)”之間進行搜索和匹配(也就是檢索)。
如何判斷輸入的語義信息(語法信息,語用信息)需要用本能知識處理還是需要用常識知識處理?其實,并不需要進行這樣的判別。當語義信息輸入到圖11的本能知識庫和常識知識庫的時候,如果輸入的語義信息(語法信息,語用信息)屬于本能知識的范疇,本能知識庫就會如同條件反射那樣自動輸出(響應形態,響應效果),而這時的常識知識庫就不發生反應;如果輸入的語義信息(語法信息,語用信息)屬于常識知識的范疇,本能知識庫就不會發生反應,在這種情況下,常識知識庫就會通過檢索程序而輸出(響應形態,響應效果)。
2)生成情感所需要的知識演繹
生成情感所需要的知識演繹,通常比生成基礎意識所需要的知識演繹復雜。因為這里所需要的知識除了必須包含體現情感特色的“經驗知識”之外,還必須能夠調用它的基礎知識,即“本能知識和常識知識”,如圖12所示。

圖 12 情感響應的知識演繹Fig. 12 Knowledge deduction of emotional response
注意到“經驗知識”與“常識知識”具有一定的共同之處:只要識別出外來的刺激信息屬于曾經經驗過的類型,原則上就可以執行已有的經驗來解決問題。因此,這里的知識演繹的特點與基礎意識的“識別–執行”類似。不過,經驗知識還具有如下特點:1)經驗知識所能支持的活動大致都是一些“同類”的活動,而不支持“他類”活動;2)經驗知識通常是主體所積累的比較淺層的知識;3)經驗知識往往需要因時因地做出適當的調整才能成功。針對經驗知識的這些特點,圖12知識庫的語義信息(語法信息,語用信息)與響應(響應形態,響應效果)的關系就不再是嚴格的一一對應的關系,而可能是“一多對應”,即一種語義信息(語法信息,語用信息)與多種響應(響應形態,響應效果)相對應。這時,就需要在多種響應(響應形態,響應效果)中選擇“響應效果”與“目標”之間差異最小的響應作為系統輸出的情感反應。另一方面,由于人類情感表達的分類本身的有限性:典型的情感分類是8類(興奮、開心、厭惡、驚訝、害怕、憤怒、沮喪、羞恥),也有的分為6類(興奮、溫和、恐懼、憤怒、悲傷、快樂),所以(響應形態,響應效果)的選擇比較粗略,不會太過復雜。綜合以上情形,情感反應所需要的知識演繹特點就是“模糊分類–擇優執行”。
如果輸入的語義信息(語法信息,語用信息)是系統此前未曾經驗過的,這時的處置比較困難。一種可能的處置方法是:不立即產生情感響應,等待理智響應的結果,這當然會使系統顯得“尷尬”。但是,人類自己在這種情況下往往也會出現這種尷尬的局面,這是難以避免的情形。另一種處置的辦法是:把輸入的語義信息(語法信息,語用信息)盡量與曾經經驗過的最接近的語義信息(語法信息,語用信息)相聯系,從而產生“最接近的”響應(響應形態,響應效果)。在這種情況下,系統的響應有可能顯得“勉強”。其實,人類自己也會出現這種“勉強(或不夠自然)”響應的局面。
至于那些“偽裝的情感響應”和“扭曲的情感響應”,雖然在人類活動中并不少見,但是,在機器系統的場合,屬于過分復雜的情形。本文暫時不做討論。
3)生成理智所需要的知識演繹
這是最復雜的情形,因為這里要面對的是求解問題所需要的規范知識的演繹,規范知識是一類比較深入和復雜的知識。具體地,這里的知識演繹可分3種情形討論:
①如果問題簡單規范,用本能知識、常識知識或經驗知識就能解決,在這些情況下,生成理智所需要的知識演繹就只需要默認上面的結果即可。
②如果求解的問題比較復雜,遠遠超出本能知識、常識知識和經驗知識的范疇,那就得靠生成理智來尋求恰當的答案。這時的知識演繹就要在規范知識范疇內動用深層的計算和推理。這部分工作,大體相當于現行人工智能理論(特別是專家系統)中的“問題求解”功能,這里可以繼承。
③如果不僅問題復雜,而且具有各種不確定性,那么,這時所需要的知識演繹就不止是上述的“問題求解”,而是需要動用復雜的搜索技術和不確定性推理,需要高級的機器學習方法、柔性的和辯證的邏輯理論,詳見何華燦教授的《泛邏輯學原理》和《論第2次數理邏輯革命》[30-31]。
總之,理智反應所需要的知識演繹一般來說非常復雜,還有大量的工作需要開發和研究。不過這種知識演繹的原理性模型,卻可用圖13表示。

圖 13 理智響應的知識演繹Fig. 13 Knowledge deduction of intellect response
值得指出,理智響應的知識演繹過程確實最為復雜,在目標牽引下,基于本能知識、常識知識、經驗知識和規范知識的復雜推理包含著各種不確定性,有時推理的結果甚至不一定能夠滿意地達到目的。此時,往往就需要通過“反饋(把誤差作為新的信息反饋到系統輸入端)、學習(學習到新的知識)、優化(優化推理結果)”的措施循環往復逐次改進,在這種“反饋–學習–優化”的逐次迭代過程中,往往也包含“涌現”的機制和進程。
至此,還有必要討論基礎意識反應、情感反應、理智反應之間的協調機制。為了方便討論,可以參照圖2的模型把“基礎意識生成單元”命名為下級單元,把“情感生成單元”和“理智生成單元”命名為上級單元。
上級單元與下級單元之間的協調機制 通常采用“正常–通過”和“求助–啟動”的工作方式,具體包含以下兩種不同的工作流程。
①如果下級單元能夠生成正常的反應,它就向上級單元發出“正常”的信息,上級單元收到這個信息以后就將自己置于“通過”狀態。這時,下級單元生成的反應表達就可以直接通過上級單元向前傳遞,成為整個系統的響應表達。
②如果下級單元不能生成正常的反應(輸入的問題超出了該單元的知識范疇),它就向上級單元發出“求助”的信息,并把自己所收到的語義信息(語法信息,語用信息)直接轉給上級單元。這時,上級單元就進入“啟動”狀態,針對下級單元送來的語義信息(語法信息,語用信息)啟動自己的知識演繹過程。
通過這樣的機制,可以保障上級單元與下級單元之間互相配合默契,使整體工作順暢進行。至于“情感生成單元”與“理智生成單元”之間的協調,則有下面的論述。
定義10 智能策略。智能策略是指:面對具體問題(客體信息)的人工智能系統所生成的能夠保障“主客雙贏”的問題求解策略,它是基礎意識響應、情感響應、理智響應三者綜合協調的產物,是人工智能系統智能水平的最高體現。
上面的討論和圖2的模型都表明:面對客體信息,人工智能系統將生成基礎意識的反應、情感反應和理智反應。顯然,作為一個有機的整體,這三者必須協調一致。上面已經討論過上級單元與下級單元之間的協調機制,這里還需要討論情感單元和理智單元之間的協調機制。這兩個協調機制的有機綜合,就是人工智能系統的“綜合決策”。它的產物,才是人工智能系統所生成的“智能策略”。
情感反應與理智反應之間的協調機制 一方面,由于情感反應生成得比較快,理智反應生成得比較慢,兩者在時間上不同步;另一方面,由于情感反應比較簡單粗曠(基于本能知識、常識知識和經驗知識),理智反應比較深刻和全面(基于本能知識、常識知識、經驗知識和規范知識),兩者在科學合理性上不一致,因此,這里的協調存在一定的難度。通常的協調原則可以分為3種情形:
①在不太重要也不緊急的情況下,兩者不協調也不會有損失。例如,與普通朋友相會的時候,首先做出一番友好的情感表示,然后見景生情或有的放矢地表達理智性的歡迎話語,這不會有什么不妥。
②在重要而不緊急的情況下,情感反應必須等待并服從理智反應。例如,在許多外交或社交場合,面對一些重大而非緊急的事件,就不應貿然唐突地表示自己的情感,而應當經過深思熟慮,有理有利有節地表達自己的立場。
③在重要而很緊急的情況下,情感反應無需等待理智反應。例如,在旅游的時候突然發現一只猛虎正朝著自己走來,這時首先就要“逃避”(逃生情感),然后再理性地思考如何采取有效的逃生策略躲過危險,而不能等到理智思考好了以后才逃避。
在這里,對于如何區分“重要性”和“緊急性”的情況,唯一的依據就是主體所生成的“語義信息(語法信息,語用信息)”。這是因為,語義信息的一個分量就是“語用信息”,它就表現了外部刺激(客體信息)對主體目標的實現而言是否重要(不管是正面意義上的重要還是負面意義上的重要),而其中的“語法信息”分量可以顯示外部刺激對目標而言是否緊急(比如老虎離自己還有多遠)。
以上就是“綜合決策”的基本概念和理論。圖2中“綜合決策”所產生的結果應當就是能保障“主客雙贏”的智能策略。
至于如何把“智能策略”轉換為“智能行為”,原則上說,只要把智能策略恰當地描述出來,就可以找到方法把這種描述轉換成為相應動作。不過,這部分工作屬于比較常規的內容,讀者可以很方便地在有關控制系統的資料中找到相關的闡述,這里就從略了。
到此,我們完成了“客體信息→感知信息→知識→智能策略→智能行為”的全部討論(也就是“信息→知識→智能”的討論),看到了在客體信息刺激下(人工)智能系統如何根據預設的系統目標,按照信息生態的規律轉換創生解決問題達到目標的智能策略和智能行為,從而實現(人工)智能系統的基本功能。
如前所說,由于現實世界不可避免地存在各種不確定性因素,系統所生成的智能策略往往難以一次成功。這樣,當系統生成的智能行為反作用于環境的客體的時候,結果就常常很難滿意地使客體狀態演變到系統預設的目標狀態。換言之,客體受控所產生的實際狀態與目標狀態之間就會存在一定的誤差。
在這種情況下,系統就應當把這個“誤差”作為1種“新的客體信息”反饋到系統的輸入端,并且根據這個新的信息通過學習獲得“新的知識”,從而在新的知識支持下生成新的更為優秀的智能策略和智能行為,再以這個新的智能行為反作用于客體,就可能使客體的新狀態比原來更接近于目標狀態。這種“反饋–學習–優化”的過程可能需要重復多次,每次都離目標更近一點,直至滿意為止。或許,在這種循環往復螺旋前進的過程中潛藏著“涌現”的機制,通過涌現而到達預設的目標。
萬一“反饋–學習–優化”不能減小誤差(有時甚至使誤差變大),就要作出反思:當初主體所設定的“目標”是否合理?如果不合理,就要重新預設目標。當然,這個工作不是人工智能系統本身所能完成的,而是應當由人工智能系統的設計者來承擔。這也是人工智能工作中 “人機合作”的重要內容。
第4節的全部結果全面表現在圖2的人工智能通用模型中,圖2系統體現了人工智能研究的辯證唯物科學觀和信息生態方法論,體現了立足于信息生態方法論所啟迪的人工智能通用模型,以及沿著式(1)、(2)所展示的機制主義研究路徑,重構了人工智能理論重要的基礎概念,建立了轉換原理、機制主義的人工智能理論。
機制主義人工智能理論的重要意義之一,就是可以證明:現有人工智能理論長期鼎足三分互不認可的三大學派 (即結構主義的人工神經網絡理論學派、功能主義的物理符號系統/專家系統理論學派和行為主義的感知動作系統理論學派)恰好是機制主義人工智能理論的3個互補分支理論,如表3所示。

表 3 機制主義人工智能理論與結構主義、功能主義、行為主義人工智能理論的關系Table 3 The relationship between the theory of mechanism artificial intelligence and the theory of structuralism, functionalism and behaviorism artificial intelligence
表3顯示:機制主義人工智能理論的核心是“信息–知識–智能”的轉換(見表3的第一行)。依據不同的知識進行求解的時候,它就分別退化為基于經驗知識的A型、基于規范知識的B型、基于常識知識的C型這3種具體的型式。而機制主義人工智能理論的A型、B型、C型恰好分別對應于結構主義的人工神經網絡(基于經驗知識)、功能主義的物理符號系統/專家系統(基于規范知識)、行為主義的感知動作系統(基于常識知識)的研究。
這就說明,結構主義人工智能理論、功能主義人工智能理論和行為主義人工智能理論乃是機制主義人工智能理論在不同知識條件下的3個特例,而且是“和諧相生”的3個特例,這是因為,根據4.2節的知識內生態規律,經驗知識可以被加工提煉成為規范知識,經驗知識和規范知識又可以被沉淀成為常識知識。這就是說,人工神經網絡的經驗知識可以被提煉成為專家系統所需要的規范知識,而人工神經網絡的經驗知識和專家系統的規范知識又可能被凝聚為常識知識供感知動作系統應用。可見,過去數十年來互不認可、互不服氣、各行其是的人工智能三大理論和方法之間其實存在某種“相生”而不是“相克”的關系。
這個事實說明,正確的科學觀、方法論、研究模型和研究路徑可以揭示智能的深層奧秘(包括結構主義方法、功能主義方法、行為主義方法之間的相互關系),建立起智能的理論大廈。而不恰當的科學觀、方法論、研究模型和研究路徑則可能模糊了甚至掩蓋了智能的深層奧秘,掩蓋了甚至丟失了不同研究方法之間的內在聯系!由此,也反過來驗證了科學觀、方法論、研究模型、研究路徑、基本概念和基本原理的重要性。
到此,本文不得不提及當今人工智能研究的一項最新發展,這就是著名的人工智能圍棋程序AlphaGo。它的棋力已經眾所周知,為了節約筆墨這里不再復述。為什么它能具有這么強大的棋力?這來源于它“不自覺地采納了機制主義人工智能理論 ——人工智能3種方法應當互相和諧融合”作為自己的設計理念。
如前所述,在一定意義上,人工智能的歷史就是結構主義、功能主義、行為主義三者之間互不認可各行其道的發展歷史[18-22]。
但是,AlphaGo的設計者們卻打破了這種陳規陋習,撇開了門戶之見:本來,博弈是功能主義人工智能(專家系統)的分支,神經網絡是結構主義人工智能的成果,但是他們卻把結構主義人工智能(神經網絡)的成果利用到功能主義人工智能分支來了,即一方面利用功能主義的博弈搜索技術去發現“可能的下步走法”;另一方面又用結構主義深層神經網絡的深度學習方法(取代原來的“啟發式估價函數”)來估算“這些可能走法之中何者勝算更大”。這一結合,就使AlphaGo的棋力得到極大提升!
顯然,AlphaGo的勝利,就是機制主義人工智能理論的勝利!是機制主義人工智能理論成功的一個有力客觀證據。雖然AlphaGo的設計者們并不知道“機制主義人工智能理論”,但是正確的理論和方法遲早會在不同的研究者之間產生共鳴和共行。
總之,本文遵循“只有高屋建瓴,才能勢如破竹”的哲理,首先從人工智能理論研究的頂層(也是人工智能理論研究的“源頭”和“龍頭”)分析得出明確的結論:應當把物質科學的機械唯物科學觀轉變到信息科學的辯證唯物科學觀,把物質科學的機械還原方法論轉變到信息科學的信息生態方法論,才能實現人工智能理論研究的歷史性轉變與跨越。
進一步,本文遵循辯證唯物的科學觀和信息生態方法論對人工智能的中層展開了研究,發現了體現信息生態規律(也正是智能生長機制)的“信息生態模型(也正是智能生長機制模型)”。據此得出結論:應當把“分而治之”的結構主義研究路徑、功能主義研究路徑、行為主義研究路徑轉變為統一的、以“信息–知識–智能”轉換為標志的機制主義的研究路徑,實現人工智能研究范式的根本性轉變與突破。
最后,本文在辯證唯物科學觀、信息生態方法論的指引下,依據所發現的智能研究的信息生態(智能生長機制)模型,沿著機制主義研究路徑,重構了信息、感知、認知、知識、基礎意識、情感、理智、決策等人工智能理論的基礎概念,構建了“客體信息–語義信息” “語義信息–知識” “語義信息–智能策略”三大信息轉換原理,建立了“感知–認知–決策”三者貫通且“基礎意識–情感–理智”三位一體的嶄新的機制主義人工智能理論,證明了原先互不溝通的結構主義人工智能理論(人工神經網絡)、功能主義人工智能理論(物理符號系統/專家系統)、行為主義人工智能理論(感知動作系統/智能機器人)原來就是機制主義人工智能理論的3種和諧互補的特例,實現了人工智能理論的和諧統一。本文的創新研究結果與現有理論的相互對照也可簡明列于表4。
表4中的對比清晰地顯示,機制主義人工智能理論的建立,實現了對現有人工智能研究的顛覆性突破。具體地說:
1)顛覆了機械唯物科學觀和機械還原方法論在人工智能研究中的統領地位;

表 4 顛覆性的突破、劃時代的創新Table 4 Overturning breakthroughs and epoch-making innovations
2)突破了現有人工智能研究模型(腦模型)的局限;
3)突破了現有人工智能研究路徑(結構主義、功能主義和行為主義)的局限;
4)突破了現有人工智能基本概念(信息、知識和智能等基本概念)的局限;
5)從而突破了現有人工智能研究的“碎片化、淺層化、封閉化”的局限性。
與此同時,依據“辯證唯物科學觀”,機制主義人工智能理論超越現有(基于工業時代物質科學的機械唯物科學觀和機械還原方法論的)人工智能理論,創建了具有信息時代標志意義的以下成果:
1)人工智能的科學方法論 ——信息生態方法論;
2)人工智能的研究模型——主客互動演進模型;
3)人工智能的研究路徑——機制主義研究路徑;
4)人工智能的基礎概念——語義信息、知識生態、基礎意識、情感、綜合決策等;
5)人工智能的基本原理——第一、第二、第三信息轉換原理。
基于以上創新成果,本文的研究還發現和總結了意義重大的“信息轉換與智能創生”定律,它是整個信息科學和智能科學領域通用的普適規律,即面對任何選定的問題和求解問題的目標,人工智能機器的任務就是執行“獲取信息并通過相應的信息轉換,生成解決問題的智能策略和智能行為”。這是與“質量轉換與物質不滅定律”和“能量轉換與能量守恒定律”同樣重要(如果不是更為重要)的基本定律。
必須指出,本文所建立的機制主義人工智能理論,在任何意義上都不局限于“人工”的智能理論,幾乎所有的工作也都適合于“人類”的智能理論。只是限于目前國內外的科學研究水平,這里沒有展開“人類發現問題和定義問題”能力的研究,這是“人類”智能理論特有的精彩篇章。因此,在人類選定問題的前提下,本文的理論既適用于人類智能,也適用于機器智能,是一種更深意義的“通用型”智能理論。
可以看出,現行人工智能理論(主要包括模式識別、自然語言處理、問題求解、博弈搜索、定理證明、檢索咨詢、機器學習等) 大體相當于本文4.3 節中3) 的①類的情形,既沒有考慮(基礎) 意識的反應,也沒有考慮情感的反應,更沒有考慮復雜的辯證問題求解,因此都是人工智能理論中相對容易處理的部分。而且,它的基礎概念包括信息、知識和智能等,都存在巨大的局限性。
毋庸諱言,本文主要給出了通用人工智能理論的科學觀、方法論、研究模型、研究路徑、基礎概念和基本原理體系,以此創建了機制主義人工智能理論基本體系,并沒有解決通用人工智能研究的所有問題(特別是關于“如何發現問題和定義問題”的能力),同時也留下了難以計數的具體問題需要人們不斷去研究和解決。可以肯定,隨著人們對人工智能的研究越來越走向深入,新的更復雜更困難更有意義的問題還會接踵而至,對新的理論和方法也會產生越來越復雜的需求。所幸的是,有了正確的科學觀、方法論、研究模型、研究路徑、基礎概念和基本原理,當面對那些層出不窮的新問題的時候就有了明確的科學觀念、科學方法論、基本模型和路徑以及堅實的理論基礎去研究。
還要指出,在本文所論“主體客體互動演進模型”中,“客體”通常是“非生物”。如果“客體”是與“主體”具有同樣等級的生物、甚至是多個具有同樣等級的生物(比如都是人類),于是就構成了“社會”(比如人類社會)。在這種情況下,社會系統中的每個個體的模型依然可用本文所研究的“機制主義人工智能理論”來描述,但是在此基礎上還需要考慮“各個個體之間的相互協調”,見涂序彥教授的著作《協調學》。
最后有必要強調,鑒于人工智能對于科學技術、經濟社會、文化教育、國計民生以及國家安全的極度重要性,把發展智能科學技術作為國家整體發展的全局戰略是完全必要的,也是十分緊迫的。
[1]鐘義信. 信息科學原理[M]. 福州: 福建人民出版社, 1988.
[2]MCCULLOCH W S, PITTS W. A logical calculus of the ideas immanent in nervous activity[J]. The bulletin of mathematical biophysics, 1943, 5(4): 115–133.
[3]ROSENBLATT F. The perceptron: a probabilistic model for information storage and organization in the brain[J]. Psychological review, 1958, 65(6): 386–408.
[4]HOPFIELD J J. Neural networks and physical systems with emergent collective computational abilities[J]. Proceedings of the national academy of sciences of the United States of America, 1982, 79(8): 2554–2558.
[5]KOHONEN T. The self-organizing map[J]. Proceedings of the IEEE, 1990, 78(9): 1464–1480.
[6]KOSKO B. Adaptive bidirectional associative memories[J].Applied optics, 1987, 26(23): 4947–4960.
[7]RUMELHART D E, MCCLELLAND J L. Parallel distributed processing[M]. Cambridge, MA, USA: MIT Press,1986.
[8]MCCARTHY J, MINSKY M L, ROCHESTER N, et al.Proposal for the Dartmouth summer research project on artificial intelligence[R]. Technology Report. Dartmouth: Dartmouth College, 1955.
[9]SIMON H A. The sciences of the artificial[M]. Cambridge,MA, USA: MIT Press, 1969.
[10]NEWELL A. Physical symbol systems[J]. Cognitive science, 1980, 4(2): 135–183.
[11]TURING A M. Computing machinery and intelligence[J].MIND, 1950, 59: 433–460.
[12]NEWELL A, SIMON H A. GPS, a program that simulates human thought[M]//FEIGENBAUM E A, FELDMAN J.Computers and Thought. New York: McGraw-Hill, 1963:279–293, .
[13]FELGENBAUM E A. The art of artificial intelligence:themes and case studies of knowledge engineering[C]//Proceedings of the 5th International Joint Conference on Artificial Intelligence. Cambridge, USA, 1977: 1014–1029.
[14]FEIGENBAUM E A, FELDMAN J. Computers and thought[M]. New York: McGraw-Hill, 1963.
[15]NEWELL A, SIMON H A. Human problem solving[M].Englewood Cliffs, NJ: Prentice-Hall, 1972.
[16]NILSSON N J. Principles of artificial intelligence[M]. Berlin: Springer-Verlag, 1982.
[17]MINSKY M. The society of mind[M]. New York: Simon and Schuster, 1986.
[18]BROOKS R A. Intelligence without representation[J]. Arti-ficial intelligence, 1991, 47(1/2/3): 139–159.
[19]BROOKS R A. Elephant cannot play chess[J]. Autonomous robert, 1990, 6: 3015.
[20]BROOKS R A. Engineering approach to building complete, intelligent beings[C]//Proceedings of the SPIE Intelligent Robots and Computer Vision VII. Boston, MA,United States, 1989: 618–625.
[21]MINSKY M L, PAPERT S. Perceptron[M]. Cambridge:MIT Press, 1969.
[22]PAPERT S. One AI or many?[J]. Daedalus, 1988, 117(1):1–14.
[23]RUSSELL S J, NORVIG P. Artificial intelligence: a modern approach[M]. Upper Saddle River: Pearson Education,Inc, 1995.
[24]NILSSON N J. Artificial intelligence: a new synthesis[M].San Francisco: Morgan Kaufmann Publishers, 1998.
[25]鐘義信. 高等人工智能原理——觀念·方法·模型·理論[M]. 北京: 科學出版社, 2014.
[26]鐘義信. 信息科學與技術導論[M]. 第3版. 北京: 北京郵電大學出版社, 2015.
[27]ZHONG Y X. The law of “information conversion and intelligence creation”[M]//BURGIN M HOFKIRCHNER W.Information Studies and the Quest for Transdisciplinarity.New York/London/Singapore: World Scientific, 2017:165–190.
[28]ZHONG Y X. A theory of semantic information[J]. China communications, 2017, 14(1): 1–17.
[29]WANG P Z. A factor spaces approach to knowledge representation[J]. Fuzzy sets and systems, 1990, 36(1):113–124.
[30]何華燦, 王華, 劉永懷, 等. 泛邏輯學原理[M]. 北京: 科學出版社, 2001.HE Huacan, WANG Hua, LIU Yonghuai, et al. Universal logics principle[M]. Beijing: Science Press, 2001.
[31]何華燦, 何智濤, 王華. 論第2次數理邏輯革命[J]. 智能系統學報, 2006, 1(1): 29–37.HE Huacan, HE Zhitao, WANG Hua. On the second revolution of mathematical logic[J]. CAAI transactions on intelligent systems, 2006, 1(1): 29–37.