摘要:該文結合人類自身認識世界和優(yōu)化世界的決策過程,分別研究了數據與信息,信息、知識與策略的內涵和他們之間的關系,討論了知識的各種表示方式,重點分析了面向對象的知識表示方法并提出了基本描述框架,總結了由數據生成信息、信息抽象成知識、知識激活智能的過程,為探索智能的生成機制提供一條重要思路。
關鍵詞:數據信息知識策略;知識表示;決策過程;智能
Research of Evolution and Representation on Data Information Knowledge
DING Jie-min
(School of Computer Science and Engineering, Wuhan Institute of Technology, Wuhan 430073, China)
Abstract: Combined with the decision-making process of human beings on understanding and optimizing the world, respectively, we studied the data and information, information, knowledge and strategy content and their relationship, discussed variety representations of knowledge, focused on analysis of object-oriented knowledge representation and putted forward the basic description framework, summarized the process of how data building information, information abstracting into knowledge and knowledge activating intelligence, provided an important way for exploring the product mechanism of intelligent.
Key words: data information knowledge strategy; knowledge representation; decision-making process; intelligence
文獻[1]指出:把信息提煉成知識,進而把知識激活成智能,這是信息學的核心和靈魂。因此,“信息—知識—智能轉化理論”當不亞于物理學的“能量守恒與轉換定律”。文獻[1]研究了信息與知識、知識與智能的關系,文獻[2]提出“信息—知識—策略—行為”的統(tǒng)一理論。但這只是理論上的構想,要實現這種統(tǒng)一,關鍵在于建立“信息—知識—策略—行為”的形式化體系。也就是說,面對給定問題的目標和環(huán)境,計算機如何簡潔地表示收集到的信息和知識;同時,能按照某些規(guī)則,生成解決問題所需要的知識;又從這些信息和知識生成解決該問題的策略,并對這些策略進行評價。因此,建立能明了表示信息和知識、具有生成知識、產生和評價策略的規(guī)則的形式化體系,已成為當前迫切需要研究的基礎問題。文獻[3]提出利用可拓論和可拓方法,把信息、知識和智能統(tǒng)一在一個形式化體系中,用可拓推理和可拓變換,去建立生成策略的推理規(guī)則,把可拓集合和關聯函數作為策略生成和策略評價的定量化工具,探討建立“可拓信息—知識—智能形式化體系”,給出了建立該體系的框架。本文提出從信息和知識的源頭——數據著手,研究數據--信息—知識—策略的關系,探尋它們之間的規(guī)律和表示方法。
1 數據與信息
1.1 數據
數據是反映客觀事物屬性的記錄,任何事物的屬性狀態(tài)都是通過數據來表示的。數據是構成信息的基本單位,是信息的具體表現形式。離散的數據沒有任何實用價值。
采用可拓學的物元理論來描述客觀事物的屬性及其量值。給定事物N,N關于特征屬性c的量值v可用有序三元組R=(N,C,V)描述,則稱R為物元。當事物具有n個特征和相應的n個量值時,則稱R為n維物元,可表示為:
1.2 信息
數據經過加工處理之后,成為信息。“事物運動的狀態(tài)以及狀態(tài)變化的方式”是信息的核心要素,是信息的價值所在,信息必須通過數據才能傳播,才能發(fā)揮作用。
對于某隨機事件的本體論信息Y,若它有N種可能的運動狀態(tài),狀態(tài)的變化方式按照某種概率分布的規(guī)律P進行,且各個狀態(tài)相應的邏輯真實度分布為T,這些狀態(tài)相對于主體目的的效用度分布為U,那么,建立在狀態(tài)數據v基礎上的事物信息的形式就可以由下面的表達式來描述:
2 信息、知識與策略
知識是認識論范疇的概念,表述事物運動的狀態(tài)和狀態(tài)變化的規(guī)律。與認識論信息的定義相比,知識強調的是“事物運動狀態(tài)變化的規(guī)律”,而不是簡單的“事物運動狀態(tài)變化的方式”[4]。認識論信息和知識概念演化過程是:由具體的“狀態(tài)變化方式”到抽象的“狀態(tài)變化規(guī)律”,其間經歷的變化正是人們對信息所進行的加工,也就是通過分析變化的客觀規(guī)律得出主觀的規(guī)則,進而建立規(guī)則庫。因此,信息是一種原材料,信息的核心價值就在于能夠從中提煉出知識。所以,應當把數據、信息、知識作為一個整體,在它們相互聯系和相互作用的系統(tǒng)中來把握它們。
策略就是為了實現某一個目標,預先根據可能出現的問題制定的若干對應的方案,即:面對具體的問題(原始狀態(tài)),應當按照什么方法和步驟(狀態(tài)變化的方式),才能把問題的原始狀態(tài)一步一步地轉變?yōu)槟繕藸顟B(tài),使問題得到滿意的解決。因此,它既要體現主體的目標利益,又要符合客觀規(guī)律。所以,策略庫中不僅有行為規(guī)則而且還應有結果的評判準則。
要從數據庫的大量數據中發(fā)現具有規(guī)律性的數據關聯,即知識,但還相當局限,遠未形成體系也沒有與智能的產生聯系起來。知識表示方法主要有一階謂詞邏輯表示法、產生式表示法、框架表示法、腳本表示法、語義網絡表示法等[5]。
2.1 一階謂詞邏輯表示法
謂詞邏輯是一種形式語言,也是目前能夠表達人類思維活動的一種最精確的語言,它與人類的自然語言比較接近,因此一階謂詞邏輯表示方法也是最早使用的一種知識表示方法。它具有簡單、自然、精確、靈活、容易實現等特點。謂詞的一般形式為P(x1,x2,…,xn)。其中,P是謂詞;x1,x2,…,xn是個體(常量、變元或函數)。謂詞邏輯適用于表示事物的狀態(tài)、屬性、概念等事實性的知識,也可以用來表示事物間確定的因果關系,即規(guī)則。如果采用謂詞邏輯作為系統(tǒng)的理論骨架,則可將數據庫系統(tǒng)很方便就能擴展改造成知識庫。
2.2 產生式表示法
產生式表示法又稱為產生式規(guī)則表示法。它具有自然、靈活、清楚、模塊性好、通用性強等優(yōu)點,目前已成為人工智能中應用最多的一種知識表示模式。產生式的基本形式為:if(前提1)(前提2)…then(結論1)(結論2)…。其中,前提亦稱前件、條件,結論也可以為要執(zhí)行的操作。整個產生式的含義是:如果前提被滿足,則可推出結論或執(zhí)行所規(guī)定的操作。產生式系統(tǒng)中的知識單位是產生式規(guī)則,但是,這種知識單位由于太小而難于處理復雜問題。
2.3 框架表示法
框架(Frame)理論是描述對象屬性的一種數據結構。在框架表示法中,框架被看成是知識表示的基本單元。不同的框架之間可以通過屬性之間的關系建立聯系,從而構成一個框架網絡,充分表達相關對象間的各種關系。它的突出特點是易于表示結構性知識,具有良好的繼承性,不僅減少框架網絡表示知識的冗余,而且較好地保證了知識的一致性。框架的一般形式如下:
框架名:〈框架名的值〉
〈槽名1:{側面名11:側面名11值〈約束:約束條件〉
側面名12:側面名12值〈約束:約束條件〉
…
側面名1n:側面名1n值〈約束:約束條件〉}
{槽名2:{側面名21:側面名21值〈約束:約束條件〉
側面名22:側面名22值〈約束:約束條件〉
…
側面名2n:側面名2n值〈約束:約束條件〉}
…
槽名n:{…}}
一個框架由若干個被稱為槽的結構組成,每一個槽又可根據實際需要分為若干個側面。一個槽用于描述對象某一方面的屬性,一個側面用于描述相應屬性的一個方面,每一個方面又可以給出具有的約束條件。框架表示法的主要不足之處是不易于表達過程性的知識,因此,它經常與產生式表示法結合起來使用,以取得互補的效果。
2.4 語義網絡表示法
相對于產生式規(guī)則主要用以描述因果知識,語義網絡則能夠用來表達更加復雜的概念及其之間的相互關系,形成一個由節(jié)點和弧組成的語義網絡描述圖。它是一種通過概念及其語義關系來表示知識的一種網絡圖。一個語義網絡就是一個帶有標志的有向圖。其中,有向圖的節(jié)點表示各種事物、概念、屬性、動作、狀態(tài)等。有向弧表示它所連接的節(jié)點間的某種語義聯系,每個節(jié)點可以帶有若干屬性。它具有靈活、自然、易于實現、善于表示結構性知識等優(yōu)點。
2.5 模糊技術的知識表示方法
在各種實際領域中,嚴格精確與確定的知識并不多見,大量知識帶有一定的模糊性和不確定性。可以說,不確定性是智能問題的本質特征。因此,智能系統(tǒng)能力的提升更能體現在模糊理論的研究上。目前,常用的應用于知識表示的模糊理論主要有:基于概率論經典理論的知識表示,但它要求直接給出知識的概率,因此,其應用受到限制。基于可信度的不確定理論是肖特里菲等人在確定性理論基礎上提出的,因其直觀、可信度的計算比較簡便,而得到廣泛應用。
2.6 神經網絡知識表示方法
神經網絡是反映人腦結構及其功能的一種抽象數學模型。它是由大量神經元節(jié)點互連而成的復雜網絡,用以模擬人類進行知識表示、儲存和推理的行為。具有代表性的模型主要有感知器、GMDH網絡、RBF網絡、多層影射BP網絡、Hopfield反饋神經網絡以及雙向聯想記憶等。
2.7 面向對象的知識表示方法[6-9]
用對象表示的知識與客觀情況更為接近,易于理解。面向對象表示法的推理機制散布于各對象中,因而可以根據具體情況混合使用不同的知識表示方案。面向對象技術所提供的繼承機制允許子類繼承,有利于表示實際情況,形成以問題對象為基礎的層次結構。在面向對象的知識庫中,將問題求解中涉及的概念、實體等作為對象,并以框架形式表示,即每一個框架都是一個對象。各對象以它們之間的超類、子類、實例的關系形成一個層次網絡。每個對象的所有屬性、對該對象的屬性進行操作的方法以及操作時使用的規(guī)則,都封裝在對象框架之中。對象中涉及的方法可以是規(guī)則推理、框架、語義網絡,也可以是其他任何求解功能,如對數據庫的訪問或人工神經網絡的訪問和用戶定義的求解過程等。整個求解過程就是消息在各對象之間傳遞的過程,即對象之間相互聯系的唯一方式是消息傳遞(過程調用)。
由于面向對象的方法將對象類、參數類、規(guī)則類等分別進行了封裝和隱藏并且各封裝類還可以根據知識的特點進行子類的劃分和封裝。不同的子類采用不同的知識表示方法,如結構性的知識采用框架或是語意網絡,規(guī)則性知識采用產生式表示法,模糊性知識采用增強的產生式表示或是基于模糊理論的知識表示等。通過這種形式可以將各種知識表示方法混合運用,充分發(fā)揮了各自的優(yōu)點,既提高了智能系統(tǒng)的工作效率,又方便了知識的管理和系統(tǒng)的維護。
根據決策模型的層次關系,采用面向對象技術,將面向對象的知識統(tǒng)一表示在對象結構中,用如下的元組來表示,即:
面向對象廣義知識=(類集合,對象集合,對象間的關系,對象屬性集合,對象方法集合)
為了更明確的闡述,用巴科斯范式進行描述面向對象的知識表示。
知識的巴科斯范式BNF描述:
<知識>::=< Class >|< Class >
3 數據信息知識策略的演化過程
總結起來,數據、信息、知識、策略之間的關系可以這樣來表述:數據是客觀存在的基本資源;信息是數據中有用成分的提取;知識是對信息進行加工所得到的抽象化產物;策略是由客體數據和主體目標演繹出來的智慧體現。所以,把數據資源加工成知識、進而把知識激活成解決問題的策略并在策略信息引導下具體解決問題的能力就是智能。圖1所示的數據、信息、知識、策略的關系,正好符合人類自身認識世界和優(yōu)化世界活動過程中由數據生成信息、由信息抽象成知識、由知識激活智能的過程。其中,獲取數據的功能由感覺器官完成,傳遞的功能由神經系統(tǒng)完成,處理和再生的功能由思維器官完成,施用信息的功能由效應器官完成。
4 結束語
本文提出從信息和知識的源頭——數據著手,分別研究數據與信息,信息、知識與策略的內涵和他們之間的關系,討論了知識的各種表示方式,重點分析了面向對象的知識表示方法并提出了基本描述框架,結合人類自身認識世界和優(yōu)化世界活動過程中由數據生成信息、信息抽象成知識、知識激活智能的過程,總結了數據--信息--知識--策略的演化過程,為探索智能的生成機制提供一條重要思路。
參考文獻:
[1] 鐘義信.核心問題-信息-知識-智能的統(tǒng)一理論[J].電子學報,2001(4).
[2] 鐘義信.知識學:信息-知識-策略-行為的統(tǒng)一理論[C].北京:中國人工智能進展,2003.
[3] 楊春燕,蔡文.可拓信息-知識-智能形式化體系研究[J].智能系統(tǒng)學報,2007,6(3).
[4] 鐘義信.“信息-知識-智能”生態(tài)意義下的知識內涵與度量[J].計算機科學與探索,2007,1(2).
[5] 年志剛,梁式,麻蘭芳,等.知識表示方法研究與應用[J].計算機應用研究,2007,5(5).
[6] 閆志剛,杜培軍.關系數據庫表示規(guī)則知識的理論與方法[J].計算機工程與應用,2006(26).
[7] 徐麗平,張俊卿,姜利群,等.基于知識庫的知識發(fā)現的研究[J].計算機工程與設計,2008,5(10).
[8] 王素芬,楊保安.基于描述邏輯的面向管理決策的異構知識的表示[J].控制與決策,2006(4).
[9] Ding Jiemin,She Wei,Li Weibo.Research onExtension Evaluation Model of Knowledge-Based Decision-Making Support System[C].Proceedings 2009 Pacific-Asia Workshop on Computational Intelligence and Industrial Application,2009:236-240.