999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

因素空間理論
——機制主義人工智能理論的數學基礎

2018-03-12 01:44:52汪培莊
智能系統學報 2018年1期
關鍵詞:背景概念

汪培莊

(遼寧工程技術大學 智能工程與數學研究院,遼寧 阜新,123000)

一場重大的科技革命必以一門新學科作為標志,這門新學科又必須以一支新數學作為支撐。工業革命以牛頓力學為標志學科,以微積分作為數學支撐。信息革命以信息科學作為標志,機制主義人工智能理論[1-2]是把結構主義、功能主義和行為主義這三大流派有機統一起來的以柔性邏輯[3]包容的通用人工智能理論,是信息科學的重要發展。那么,什么是信息科學的數學支撐呢?本文對此問題的回答是,因素空間是機制主義人工智能理論的數學基礎, 它是為迎接人工智能的深刻革命而作的數學準備。

信息科學與物質科學的根本差別是有沒有認識主體的參與。客體是離開認識主體的存在,認識主體按其目標需求從客體信息提取語義信息,再將語義信息轉化為知識,提高智能,改造主、客觀世界,這就是信息科學的主要內容。因素是信息提取的導向標,是信息向知識轉化的分析與融合器。信息生態的機制就是要以因素為導向,首先關注客體的形式與效用這兩個方面。用目標需求從后往前倒逼,用儲備的知識從前往后疏通,這樣前后夾逼,所得到的語義信息就是形式與效用相統一的全信息。客體的狀態千變萬化,必須用因素來進行分析與綜合,例如形狀、大小、顏色、質量等,統稱為狀態因素,狀態因素使人形成對事物外形的知覺。事物的內在屬性也要用因素來梳理,杯子可以是日常飲具或者是保健食品容器,也可能是供人鑒賞的藝術品,不同的目標需求按效用來觀察事物的內在屬性,屬性因素揭示事物的內在效用。狀態因素與屬性因素之間的結合衍生出特定的概念;因素之間的相互關聯決定事物的因果,提供邏輯推理以進行決策。基于因素空間理論所建立的數據庫以培植數據的方式來實現數據生態與知識生態之間的同構,用因素來組織數據,運用知識把傳統的搜索技術提到一個新的高度,這些都是機制主義人工智能所需要的數學理論和方法。

1 因素空間的基本框架

什么是因素?按字面來理解,因字既言本事物之所以是,亦言它事物之所以生。前者講事物構成,后者講因果關聯。因素非因,乃因之素。雨量充沛是豐收的一個原因,但它不是因素。因素是降雨量,由它統領“洪澇”、“雨量充沛”、“雨量欠缺”和“干旱”等性狀。因素通過變化來顯示其影響。如果降雨量的變化不能改變豐收這一結果的話,那么雨量充沛就不是豐收的原因;降雨量之所以對古代農業那么重要,是因為它的變化既可以使大眾喜迎豐收,也可以使遍地顆粒無收,這才使人們知道降雨量對糧食收成來說是多么重要的一個因素,遇到少雨就要考慮防旱。從原因到因素是人在認識上的一種升華。只有掌握因素才能找到原因,看透原因。因素是比屬性高一個層次的東西,它是屬性的統領,是屬性之名。事物都是質與量的統一,屬性是質表,因素是質根。屬性被動描寫事物,因素則具有啟發的特質,在信息科學和人工智能的數學描述中,因素是一個特別關鍵的詞。只有強調質根,才能找到事物和認識的成因。哲學家早已對屬性下過定義,但至今仍忽視質根。屬性像是珍珠,質根是串聯珍珠的線頭。線頭一斷,珍珠就灑滿遍地,搜索起來格外困難。人腦是信息提取的優化結構,人腦的感覺細胞是按特征(即因素)來組織的;生命科學中所誕生的基因就是生命的質根。基因最早的英文名稱是Factor,因素就是廣義的基因。信息革命需要將打開生命之門的這把鑰匙引向信息之門,哲理指明了因素空間乃是信息科學和人工智能對數學的期望之所在。

1.1 因素與因素空間的數學定義

在數學上,因素被定義成映射,更具體一點地說,因素是一種性狀映射,它把事物映射成它們的性狀。

定義1[4]設U是所要討論的一類事物的集合,叫作論域。一個定義在論域U上的映射f: U→X(f)叫作U上的一個因素,其中X(f)是映射f所映照出來的事物性狀的集合,叫作f的性狀空間。

性狀有兩種類型,一種是連續的實數值,例如,因素身高可表示為特定的人群U上的一個映射f =(cm),它把張三映射成實數185 cm,把李四映射成175 cm ···這樣的性狀空間叫作定量的性狀空間,此時的因素就是我們過去所熟悉的變量,變量是一種特殊的因素,因素就是變量的推廣。定量性狀空間是歐氏空間中的一個超矩形(或),n叫作性狀空間的維數。因素身高還可以有另外一種形式的性狀空間:X(身高)={高,中,低},它把張三映射成高個子,把李四映射成中等個子 ···這是離散的用自然語言描述的性狀,這種性狀空間叫作定性的性狀空間。性狀都是按因素成串地呈現,世界上沒有單一的性狀,性狀的數目m叫作相數,必 須大于1。單一的特征用來識別時都是二相,例如,臉上長痣是一種特征,但在識別過程中注意的焦點不是去描述痣的特性而是要區別“有痣”和“無痣”,仍是二相映射。為了方便,我們將特征稱為二相因素,但在這樣稱呼時必須聲明:特征本來指的是痣,是一個屬性,若把它視為因素,則它就不再是一個屬性而是一個二相映射了。因素與屬性是不同層次的東西,前者統帥后者。當然,同一個詞在不同的場合中可以從屬性變為因素,也可以從因素變為屬性。

只取定量性狀空間的因素叫作定量因素,只取定性性狀空間的因素叫作定性因素。這樣稱呼僅僅是為了敘述的方便。嚴格來說,定性與定量是一對普遍矛盾,它們對立統一地寓于事物之中,相互轉化,因素既可以定性,也可以定量,我們對任何因素都同時預備著定性與定量兩種性狀空間,以備相互轉換。在同時出現兩種性狀空間的時候,我們用X(f)來表示定量性狀空間。要將中的性狀轉化為 X(f)上的模糊或非模糊子集。這些事情要靠模糊集和直覺模糊集等學科來完成。這種工作涉及坐標框架的標定,對于因素空間來說至關重要。

定性映射決定論域的劃分。設 f是定義在論域U上的一個因素,按這個因素的性狀在論域 U中定義了一個等價關系~:對任意 u,v∈U , u~v當且僅當f(u)=f(v)。一個等價關系決定 U中對象的一個分類,記對象u所在的類為 [u]f={v∈U|f(v)=f(u)}。

定義2 記 H(f,U)={[u]|u∈U} ,我們將它稱為f對U的劃分。

因素有簡單與復雜之分,所謂 f 對 U 比 g 對 U的劃分更細 (記作 H(f,U)}H(g,U))是指:任給一個由g 所分出的類 [u]g,必有 f 所分出的類 [ν]f使 [v]f?[u]g。

定義3 設 f,g 是定義在 U上的兩個因素,如果H(f,U)}H(g,U),則稱因素 f 比 g 復雜,記作 f≥g。反之,則稱因素 f 比g 簡單,記作 f≤g。

不難證明,任給 U上的一個因素集 F?,(F?,})形(成)一個偏序集。給定U上的一組因素fj:U→Xfj(j=1,2,···,n),由它們所構成的集合F?={f1,f2,···,fn}稱為元因素集。對F*的任意子集 {f(1),f(2),···,f(k)},可以定義一個U上的合成因素 F:U→X(F),其狀態空間是

記此因素的合成運算為 F=f(1)∪ f(2)∪···∪ f(k)。式(1)的意思是:合成因素的性狀空間被定義成其所含元空間的笛卡爾乘積。對于任意兩個合成因素,我們可以定義它們的二次合成,其性狀空間被定義成兩組元的并集中諸元的性狀空間的乘積。如此可以在 F?的冪集中定義因素之間的任意多次合成運算∪。類似地,用兩組元的交集中諸元性狀空間的乘積可以定義因素之間的另外一種運算,叫作分解運算。分解運算可以直觀地理解為提取兩因素的最大子公因素。分解兩個不含公共元的因素,可得零因素0。一組因素稱為兩兩不可約,如果兩兩之交為0。不難證明 P(F?)=(P(F?);∪,∩)形成一個因素格,這個因素格可以由偏序集 (F?,})按下述方式形成:

F?=f1∪ f2∪···∪ fn是在所定義的系統中最大的因素,叫作全因素。由此還可以定義余運算c。 Fc的性狀空間是那些不被F所包含的元性狀空間的乘積。不難證明形成一個因素布爾代數。

這個定義在以前一直引用的文獻[5]的基礎上做了簡化。

所有笛卡爾空間,例如力學的運動空間、控制論的狀態空間、模式識別的特征空間等,都是性狀空間。它們都可作為因素空間的特例,因素空間是笛卡爾空間的推廣。如圖1所示,任何事物都可以像張三這樣地被映射成為性狀空間中的一個點,因素空間為一般事物的描述提供了普適性的數學框架。一群對象被映射成為性狀空間中的樣本點集。要對這群對象分類,就必須將它們投射到因素性狀空間中來進行分割。

圖 1 張三被映射為因素空間中的一個點Fig. 1 Mapping Zhang San mapped to a point in the factor space

1.2 背景關系與背景分布

定義5[4]給定U上的定性因素空間? =(U,XF?), 對 任 意 a=(a1,a2,···,an)∈ X, 記 其 在U上的原相為

[a]可能是空集 ?,若 [a]≠ ?,則稱a是一個實性狀顆粒,否則稱a是一個虛組態。全體實性狀的集合記為

定義5多用于定性因素,其中的a是指性狀顆粒。但定義5也可用于連續情形,此時a細化為一個實數點。

背景關系是因素空間的核心概念,下面會看到它既可以決定概念的自動生成,又可決定概念之間的一切推理,由它可以建立知識描述的確定性理論框架。但現實中的背景關系多帶有不確定性。原因有二:1) 性狀粒度往往過大,說一個人的性狀容易,說一群人的性狀就不確定了,存在著抽樣的隨機性;2) 定性因素相的劃分不明確,例如年齡這個因素,究竟怎樣劃分青年、中年和老年?存在著模糊性。為此,要引入背景分布和模糊背景關系的概念,為了節省篇幅,本文只介紹背景分布。

設論域 U=(U,A,p)是一個概率場,? =(U,XF?)是定義在 U 上的一個因素空間。又設 X =(X,B)是總性狀空間 X 上的一個可測結構。若所有 F?中的元fj都是從{U到X的可}測映射,即對任 B∈B,都有(B)=u ∈ U|fj(u)∈ B∈ A,則不難證明,所有因素F ∈ P(F?),包括 F?,都是從U到X的可測映射。

定義6 設論域 U=(U,A,p)是一個概率場,?=(U,XF?)是定義在 U 上的一個因素空間,X=(X,B)是總性狀空間上的一個可測結構。若所有 F?中的元fj都是可測映射,記 p=pF?為 p經過 F?在 X上(所誘導)出來的概率,亦即對任意 B∈B,都有 p(B)=pF??1(B),那么 p叫 作因素 F?的背景分布。

背景分布是背景關系的隨機化。隨機化后的因素都可視為廣義的隨機變量,特別對定性因素而言,因素可以叫作隨機詞。為了方便,我們常將因素的記號改為隨機變量的記號,甚至約定: F?中的元因素的替代符號是 xi(i=1,2,···,n): F?={x1,x2,···,xn},

為了簡便,我們以后講可測因素空間就是指定義6中所說的帶有可測結構的因素空間而且所有元都是從 U 到 X的隨機變量。

背景分布 p是背景關系 R的隨機化。對定性因素而言,不難證明,背景關系 R就是背景分布的支撐,亦即

由此,可以將背景分布的概念推廣到定量因素的情形。

定義7 對定量因素而言,背景分布密度函數p(x)的支撐集 R叫作因素元之間的背景集。亦即

1.3 因素數據庫與背景基

數據工作者熟知信息系統和形式背景理論,它們為數據建立了表格,為非數值信息找到了初步的符號表示。因素空間理論正是它們的提升,為信息系統建立坐標框架,把一張形式系統表可視化地變為因素性狀空間的一組樣本點,背景關系就成為它們的母體。背景關系是因素空間的形骸,塑造這個形骸的工具就是背景基。

將按因素空間思想組織起來的數據叫作因素數據庫,主要的庫表叫作因素表,具表頭t =(u;x1,x2,···,xk)。若把對象去掉,以 s=(x1,x2,···,xk)為表頭,則表中的每一行就是因素空間中的一個點,由于與對象割斷了聯系,這個點就不再反映個人的隱私。

定義8[4]記S={si=(x1i,x2i,···,xki;yi)|i=1,2,···,m},叫作相樣本或隱私樣本。

因素庫中首先考慮樣本怎樣表現背景關系。很明顯的事實是,當樣本逼近母體時,相樣本就變成背景關系。

設 S 是相樣本,始終有 S?R;所有同表頭相樣本的并就是背景關系:

只要表頭相同,對相樣本不斷地求并,就可以單調遞增地逼近目標。同表頭的相樣本求并就是行的疊加。這個過程是可以并行處理的。因素庫的目標是要將數據培育成背景關系,形成認知包以產生知識。要使這一思想得以實現,關鍵在于信息壓縮。

定義9[4]若每個元性狀空間 X(fj)都是有序集,且背景關系 R 是 X{ 中的凸集,記} R的所有頂點所成的集為 B=B(R)=P|P是R的頂點 ,叫作背景基。將R{ 換作樣本 S ,}記 B 的所有頂點所成的集為叫作樣本背景基。

背景基可以生成背景關系,它是背景關系的無信息損失的壓縮,對因素庫的實際應用具有重要的意義。無論數據多大,樣本背景基的數量始終保持在低維度上。在網上吞吐數據時,每輸入一個新的數據,都要判斷它是否是樣本背景基的內點,若是,則刪除此數據,否則將它納入樣本背景基,此時,要逐一檢驗原有的基點,它若在新基點中變成內點,則淘汰刪除之。

夾角判別法[4]P 是 S的一個內點當且僅當在S 中存在一點 Q ,使射線 PQ 與射線 PO形成鈍角,亦即(Q?P,O?P)<0。

例1 在圖2中,S包含三點: a=(2,1)、b=(4,5)、c=(5,3),試問d =(2,4)是內點嗎? e =(3,2) 呢?

都是非負,d不是S的內點。

一旦出現負數就是內點,e是S的內點。

圖 2 背景基內點的夾角判別法Fig. 2 The angle criterion for inner points of background base

這個判別法雖然是近似的,正有改進研究,但此方法卻有應用價值。計算量很小,復雜度是O(nk)(n 是因素個數,k是樣本點個數),能適應大數據的需求。

1.4 因素藤、因素神經網絡與智聯網

因素空間是一個概念劃分單元,不同單元聯結起來形成因素藤。劉增良[6]提出了因素神經網絡,使因素空間理論和神經網絡方法結合起來,把學習機制引入因素空間。因素藤又與因素神經網絡相對應,呈現新的活力。黃崇福[7]提出了智聯網,把因素空間作為智聯網的數學刻畫工具,進一步上升到網絡數學,具有比筆者更加廣闊的視野和更加宏偉的歷史使命。

因素空間是信息系統和形式背景理論的提升,能為客體提供一個可以存放其形式信息和效用信息的坐標系統,把關系數據庫中的數據變成可視的樣本點,它們的母體所形成的背景分布,乃是因素空間的形骸,塑造它的工具是背景基。

2 形式概念的生成與基本概念半格的提取

1982是不平凡的一年,在這一年中同時出現了3個數學分支,公開宣稱以知識和智能作為自己的數學研究對象。在這3個分支中,首先要介紹的是德國數學家R. Wille所提出的形式概念分析(normal concept analysis)[8]。在他以前,數學家們認為,任何概念的外延都是集合,而任何集合都是概念的外延。Wille明確地對后一句話說不。他提出了內涵和外延的對合性準則,認為只有滿足對合性,才能把一個集合視為一個概念的外延。給定對象集O和 屬性集 A,從它們{之中分別取出一組對象} E和一組屬性 I ,記 f(E)=a∈A|?o∈E;o具有屬性a,它是E 中對象共有屬}性所形成的集。記g(I)={o∈O|?a∈I;o具有屬性a,它是 I中屬性共同依附的對象所形成的集。如果 f(E)=I 且記 g(I)=E,則稱配對a=(I,E)滿足對合性,并稱 a 是一個以 I為內涵和以E為外延的概念。

他以科教電影《生物與水》的資料制作了1張形式背景表(見表1),其中有8類生物和9種屬性:需要水,b 在水中生活,c 在陸地生活,d有葉綠素,雙子葉,f 單子葉,g 能運動,h 有四肢,i哺乳。表1以對象為行以屬性為列,當且僅當第i對象具有第j 屬性在第i 行第 j列的格子中出現符號“×”。為了檢驗對合性,他讓我們先隨意選1個對象,螞蟥,即取,它具有屬性 a ,b 和 g ,即 f(E)={a,b,g}=I。然后再從這3個屬性所在的列,找他們共同依附的對象有螞蟥、魚和蛙,即 g(I)={1,2,3}=E′,因 E′≠ E,故不滿足對合性。繼續往前,看這3個對象所共有的屬性是 a 、b 和 g ,即 f(E′)={a,b,g}=I。于是,E′與 I滿足對合性,這樣我們便找到了一個對合配對,這就是水生動物的樣本概念 (a∧b∧g,{1,2,3})。之所以稱為樣本概念是因為這概念是從表1生成的,表1只是一個樣本,所生成的概念是否有效,要看樣本是否接近母體。像這樣地搜索下去,最后找到了19個概念,按序生成一個概念體系,他稱之為概念格(見圖3)。

表 1 科教電影“生物與水”的背景Table 1 The background of science and education film"biology and water"

圖 3 “生物與水”的‘概念格’圖Fig. 3 The concept lattice of "biology and water"

需要強調兩點:1)Wille第一次給概念下了一個嚴格的數學定義,強調了內涵與外延的對合性。內涵是使概念得到統一認識的語義信息,外延是檢驗信息傳遞是否符合客觀實際的關口。若內涵與外延不對合,信息傳遞就不可能可靠地反映客觀現實,信息科學的根基便會動搖,所有的信息實踐活動都將缺乏根據。2)自從他的論文發表以后,計算機就開始自動生成概念,這是人工智能的一大飛躍。機器早就可以證明定理,但機器卻從未生成概念。定理只能在已有的概念之間兜圈子,人的智能卻能從對比中產生新的概念,為定理制造新的猜想。Wille必定明白:我們不可能也不需要使機器像人腦一樣真正地感知世界,但只要機器能機械地按他的算法構建概念體系,又能保證這個體系能隨時回歸聯通到人腦,就能幫助人類大大加速智力建設!因為,信息科學雖與腦學科緊密相連,但卻有獨立于人腦的特色,其中存在著用數學可以描述的規律。概念體系無需全部浸泡在感知的海洋里,它可以有間歇地脫離實際,脫離大腦,就像我們自己的知識并非每一步都要親眼見到或經過大腦(理解)一樣。關鍵是,只有堅持內涵與外延的對合性,機器自動生成的概念才能向人腦回歸和聯通。沒有回歸聯通人腦能力的機器概念體系所具有的功效和價值為零。

Wille的工作缺陷在于:1)他的形式背景表以屬性來分列,制造了列表困難,由此導致他的算法復雜。為了尋找對合的概念,從每一行或列開始搜索,再每兩行或兩列 ······這樣的搜索方式本身就是指數爆炸的。他一整本書就是為了避免指數爆炸而設立各種算法,但仍然無法擺脫N-hard陷阱。2)Wille所說的概念,都是屬性的析取,只含“且”字而不含“或”字,這不是一般概念而是基本概念。對合性只對基本概念成立,帶或字的概念是無法對合的。基本概念只能形成半格,所以,他說的概念格應該改為基本概念半格。

在此,我們要介紹1982年由以Pawlak為代表的波蘭學派所提出的粗糙集(rough sets)[9]。粗糙集明確地以數據庫為研究對象,他們的學派也是KDD(數據知識發現)的倡導者。粗糙集把重點從屬性值轉為屬性名。用屬性名列表,避免了Wille的列表困難。所列的表叫作信息系統,稱為關系數據庫的庫表。他們用數學描述知識,用內外夾逼的思想來刻畫概念,提出了決策的一般模型。粗糙集是關系數據庫的數學基礎。

形式概念分析雖然與粗糙集同年提出,但卻隱藏了十余年,后來才引起粗糙集學者們的廣泛重視。Wille的嚴謹性觸動了粗糙集作者的粗獷風格,曾在粗糙集文獻中說過:劃分就是知識。按此說法,任一集合與其余集就是一個劃分,就是知識,就有概念,這集合就應當是某個概念的外延,這就直接違反了Wille的對合性原則。在這一點上,粗糙集是有缺點的。然而粗糙集突出了屬性名,就是突出了因素,比起形式概念分析,是一個重大的進步,可惜的是,他們并沒有把屬性名提到因素的高度。粗糙集在人工智能的應用熱點是屬性約簡,靠的是區分矩陣,每一個矩陣方格中放置的是一組屬性名。由這個矩陣要造就一個區分函數,中間必須涉及屬性名的運算,可是,粗糙集沒有定義屬性名的運算,把它與屬性值的邏輯運算混雜在一起,出現數學描述的漏洞,所提出的算法也過于繁雜,并沒有取得應用的實效。盡管存在著這些問題,粗糙集仍取得了重要的發展[10-11]。

因素空間也在1982年由筆者提出[12],早期曾用于模糊智能的研究,直到2012年才與形式概念分析及粗糙集合流。因素空間為概念生成提供了貼切的數學描述。人靠什么分男女?靠的是性別。靠什么分中外?靠的是國籍。靠什么分老少?靠的是年齡。性別、國籍和年齡都是因素。同一個人群按照不同的因素可以做出不同的劃分。它們又可以綜合起來形成更細的劃分。因素是概念的劃分器,要講概念,必須從因素講起。概念產生于比較,比較發現異同。但是世界上沒有絕對的異,也沒有絕對的同,所謂異同都是相對于一定因素而言的。因素是比較的角度和依據。風馬牛不相及的東西不能進行比較,因為它們之間沒有可比較的基礎。因素就是比較基。若 f 代表顏色,a 和 b是有顏色的兩個東西,我們便可以用“f (a)=f(b)?”來比較 a和 b在顏色方面的異同。若 g 代表吸引力,a和 b是有吸引力可言的兩個東西,便可以用“g (a)=g(b)?”來比較 a 和 b在吸引力方面的異同。總之,比較離不開因素。一個因素把事物從一個方面進行劃分,多個因素把事物從多個方面進行劃分。因素越多,對事物的劃分就越細,概念產生得就越多。知識發展的生態就是概念的不斷分割過程。嬰兒出世時只有零概念,其內涵是零描述而外延是混沌一團的宇宙。生存需求的本能因素把母親從萬物中區分出來,在外延上進行分割。人們形象地把外延稱為概念的團粒。概念在何時不夠用呢?就是目標需求的差異發生在一個概念團粒的內部,用這個概念無法區分差異,在這個時候,認知的需求就要力求打破團粒,使之由粗變細,而相應的內涵便要在原概念(稱為上位概念)的內涵上再增添新的劃分內容。人類的知識大樹這就是這樣一步一步形成的。每一步都是上位概念的分割,都要靠因素。知識的圖譜必須以因素作為導引。

新因素對上位概念團粒劃分的貢獻可以用分辨度來刻畫,把U中任意兩個不同的對象序列叫作一個對子。能分辨的對子數目越多,分辨度就越大。

定義10[4]設

叫作因素 f 對 U中對象的分辨度。

現在讓我們回到前面所說的背景關系 R 。 R是性狀空間 X中所有原子內涵所成之集,它當然是描寫內涵的。外延是論域中的事情,但是由于 F是從H(U,F)到 R 的同構映射。 R又是論域的代表,所以背景關系成了內涵與外延的重合體,這就使背景關系R是概念生成的雙料調色板。

定義11[4]給定定性因素空間 (U,X(F)),設 R是因素 F?={f1,f2,···,fn}的背景關系,則對任意 a∈R,稱a=(a,[a])為原子概念,a 和 [a]分別叫作概念 α的原子內涵和原子外延;對任意A ?R,記 [A]=∪{[a]|a∈A},Γ={γ=(A,[A])|A?R},稱 γ=(A,[A])分別是以 A,[A]為內涵和外延的概念;稱 Γ =(Γ,∨,∧,?)是由 (U,X(F))所生成的概念布爾代數。

這個定義告訴我們,對于定性因素空間而言,原子概念的提取是不需要計算的,只要背景關系知道了,它的每一個性狀顆粒就決定一個原子概念。

由原子概念用“且”字連接起來,可以生成其他的所有概念,形成布爾代數,這在計算機上就可實現概念的自動生成,理論上極其簡單。自動生成的概念不是怕少而是怕多,設原子概念的個數是 k,則生成的概念個數就是 2k。我們需要把概念的范圍縮小,非原子概念不一定滿足對合性,其中滿足對合性的概念是哪些呢?

定義12 內涵能表為合取范式的概念叫作基本概念。

所謂合取范式就是形如(a11∨a12∨···∨a1k(1))∧···∧(an1∨an2∨···∨ank(n))這樣的式子,其中 ∨與 ∧分別代表“或”與“且”。每個小括號都是析取式,最后都用且字合起來。它們在因素的相空間中是擬超矩形(聯通或不聯通的超矩形)。原子概念都是基本概念。所有基本概念的集合對合取運算封閉,形成一個半格,叫作基本概念半格。Wille在圖2中所畫的就是基本概念半格,只不過在最下面加了一個極限概念,它的外延是空集,內涵無限制。

定義13 給定因素空間和背景關系。包含所有原子概念的基本概念子半格叫作粒子半格。

通過粒子半格的建立,能在給定因素下將上位概念團粒細化到所有原子概念。在實際運用中,基本概念半格中的概念還嫌多。粒子半格中不一定有最小的半格,要找的是到達原子分割步數盡可能少的粒子半格。下面是所要求的一種基本算法,其復雜度是

基本算法1 最短粒子半格算法[13]

1) 給定U,計算每個因素對U中對象的分辨度;

2) 選對U分辨度最大的因素f來實現f對U的分類: 置換對象足碼即(行足碼)使同類對象連接在一起;

3) 用所分出的子類U′取代U, 重復步驟1)和2),直到所有的子類都變成粒子為止,總結出粒子半格。

例2 給定表2:

表 2 成員狀況因素表Table 2 Member status factors

X=X(f1)×X(f2)×X(f3)={男高重,男高常,男高輕,男中重,男中常,男中輕,男低重,男低常,男低輕,女高重,女高常,女高輕,女中重,女中常,女中輕,女低重,女低常,女低輕}

X被分成18個格子,去掉其中的虛組態,得到U上3個因素所形成的背景關系:

R={男高重,男高常,男中常,男中輕,女中重,女中常,女低常,女低輕}

共有8個原子內涵,這8個原子內涵將U分成8塊:

[男高重]={1, 2, 3}, [男高常]={4, 5}, [男中常]={6, 7, 8}, [男中輕]={9, 10}, [女中重]={11, 12},[女中常]={13, 14, 15}, [女低常]={16}, [女低輕]={17, 18, 19, 20}

于是,對合性地生成8個原子概念:

由這8個原子概念任意取并,可以生成全部概念。例子說明,從背景關系提取概念代數的方法是直接方法,是自然對合的算法,是無需計算的算法。

布爾代數中的概念并不都是對合的,例如:

其內涵與外延不滿足對合性,取并以后就不應該再談對合。

共有28–9=247個非空的新概念,太多,需要尋找基本概念,這時才需要基本算法1。

表 3 表2的變換Table 3 Transformation of table 2

此時,對象已經按體重排好,得到分類:

表 4 表3的轉換Table 4 Transformation of table 3

同時, C2中的對象未經置換就已經按身高排好,于是得到分類:

3類分別與內涵常高、常中、常低對合,得到3個基本概念 β21=(常高,C21), β22=(常中,C22),β23=(常低,C23)。

同時,C3中的對象未經置換就已經按性別排好,于是得到分類:

各子類分別與內涵輕中、輕低對合,得到兩個基本概念 β31=(輕中,C31),β32=(輕低,C32)。

4) 再就因素 f3(性別)逐類考察,看看該類對象是否男女分相排列. 發現性別在所有類中的排列都無需置換,類似可將C22=C221{6,7}+C221{8,13,14,15}得到兩個基本概念β221=(常中男,C221),β222=(常中女,C222) 。所有類都無法再劃分。

5) 畫出基本概念半格圖(見圖4)

圖 4 成員狀況粒子半格Fig. 4 Member state particle semi-lattice

在此半格中共有13個基本概念,即 β0=(?,U),β1=(重,C1),β2=(常,C2),β3=(輕,C3),β11=(重高,C11),β12=(重中,C12), β21=(常高,C21), β22=(常中,C22),β23=(常低,C23),β31=(輕中,C31),β32=(輕低,C32),β221=(常中男,C221),β32=(常中女,C222),其中,不能再分的有 β11、 β12、 β21、 β23、 β31、 β32、 β221、 β222等8個,它們就是前述的8個原子概念。其余5個基本概念,除β0=(?,U)外, β1=(重, 1, 2, 3, 11, 12),β2=(常, 4, 5, 6, 7,8, 13, 14, 15, 16), β3=(輕, 9, 10, 17, 1819, 20)和β22=(常中, 6, 7, 8, 13, 14, 15)。它們都是我們格外關心的非原子的基本概念。

基本概念半格的提取,得到的原子概念是相同的,但中間的基本概念半格不是唯一的,與因素劃分的先后次序有關。好的排序會加快實現原子分割,排除冗余的因素最大分辨度原則提供了一種較好的排序。這個算法強調的是對象的足碼置換,就是士兵集合按營、連、排、班站隊的方法. 具有大數據所要求的快捷性。

回到Wille的例子,怎樣用因素空間理論來處理同樣的問題呢?

首先,要將以屬性值分列的表,改為以因素分列的因素表。它有9個屬性,分屬于7個因素:f1=需水性,具有性狀空間 X(f1)={Y,N}, f2=棲性,具有性狀空間 X(f2)={水,陸,兩棲}, f3=有無葉綠素,具有性狀空間 X(f3)={Y,N}, f4=單雙子葉,具有性狀空間 X(f4)={單,雙}, f5=能動性,具有性狀空間X(f5)={Y,N},f6=有無四肢,具有性狀空間X(f6)={Y,N}, f7=是否哺乳,具有性狀空間X(f7)={Y,N}。于是可將形式背景表1改寫為下面的表5,在表中出現了符號*,例如問句是單字葉還是雙子葉,這是毫無意義的,不能用No。問螞蟥有四肢嗎?回答雖然是No,但問題卻是有意義的。Wille沒有區分No和*,都是空白。

表 5 將形式背景表按因素并列Table 5 Juxtaposition of formal background tables by factors

蓄水性這個因素對所有對象的呈相都一樣,沒有變化的因素失去了存在價值,我們把這一列從表中刪除。同一因素空間中所有因素必須對所有對象都有意義,因而我們必須分成兩個因素空間來處理,對表5的左列進行適當變換,得到了表5的右列,就可以分開了。得到表6,表6的左右兩個表,各是一個因素空間。可以有交集,如棲性在兩個表中都有。

表 6 將形式背景表分解成兩個因素性狀表Table 6 Form background table is decomposed into two factor traits

我們把不起變化的因素刪除得到表7。

表 7 兩個因素性狀表的化簡Table 7 Simplification of the table of two factors

按照因素空間的概念生成理論很容易得到簡捷的粒子半格(見圖5)。經過適當處理,可以得到清晰的概念體系。動物因素空間生成4個原子概念:1)無肢非哺水動物(NN水,螞蟥);2)有肢非哺水動物(YN水,魚);3)哺肢兩棲動物(YY水,蛙);4)哺肢陸動物(NN水,螞蟥)。還生成兩個非原子的基本概念:1)非哺水動物(N水,{螞蟥,魚});2)哺肢動物(YY,{蛙,狗})。植物因素空間生成4個原子概念:1)水單植物(水單,水草);2)兩棲單植物(兩單,蘆葦);3)陸雙子葉植物 (陸雙,豆);4. 陸單子葉植物(陸單,豆玉米)。還生成兩個非原子的基本概念:1)單子葉植物 (單,{水草,;蘆葦,玉米}); 2)陸植物 (陸,{豆,玉米})。例畢。

圖 5 因素空間對生物與水的形式概念分析圖Fig. 5 Formal concept analysis for biological and water based on factors space

因為Wille關于科教事物的“概念格”不能直接翻譯成為一張因素表,所以我們不能用因素空間的結果來和它進行直接的比較。但可以看出,概念格中缺少了幾個原子概念,這是不符合實際的。其原因是,對合性與同因素的不同屬性值之間的對等性有時會發生沖突。因素空間用性狀顆粒來分類的方法可以避免這種沖突。

回顧一下本節的內容,Wille從內涵和外延的對合性出發,給概念下了嚴格的數學定義,以保障信息傳遞能可靠地反映現實。他大膽地譜寫了計算機自動生成概念的新篇章,使機械制造的概念能隨時向人腦回歸與聯通,這是人工智能的一大飛躍。他的形式背景表以屬性來分列,導致算法復雜,無法擺脫N-hard陷阱。他說的概念格也不準確,應該改為基本概念半格。因素空間繼承他的理論,把形式背景提升為因素空間的核心理論,用因素統帥屬性值,用背景關系來定義原子概念,自然對合,無需計算。對于基本概念也有3次冪以下的簡捷算法。

Wille不知道機制主義的人工智能理論,對形式(語法)信息、效用信息和語義全信息不加區分,他所舉的例子都是語法信息。所以,本節可以視為形式信息的提取。至于如何用因素空間將形式信息與效用信息向語義信息,提升,是我們在下一節要做的事情。

3 因素之間的關聯,語義信息的提升

在介紹語義信息提升之前,先介紹因素之間的關聯特性。

則稱因素 f1,f2,···,fn是相對獨立的。

不難證明,相互獨立一定相對獨立,反之不盡然。不相對獨立的一組因素,它們的背景關系不能涵蓋整個笛卡爾乘積空間,這說明它們的性狀搭配是受到制約的,這種制約反映了它們之間是相互關聯的

定義15 若。R ≠ X(f1)× X(f2)×···× X(fn)則稱因素f1,f2,···,fn之間有關聯。

取n = 2,采用1.2節中約定的簡單記號。若R≠X(x)×X(y),則因素 x 與 y之間互有關聯。對任意x∈X ,記 R(x)={y∈Y|(x,y)∈R},叫作 R 在 x點的截集,它是 Y的子集。

對于定性因素而言,記 |R(x)|為R(x)中所含性狀顆粒的個數。若 |R(x)|越小,則 x 對 y的制約性越強。

記RX={x|?y∈ Y;(x,y)∈ R}和RY={y|?x∈ X;(x,y)∈R}分別叫作 R 在 X 和 Y 中的投影。 (RX)c叫作x 對 y 的盲區, (RY)c叫作 y 對 x的盲區。排除盲區可以提高搜索效率。

R的領域越小,關聯性越強。當小到只有一個性狀顆粒 (a,b)的時候,則輸入 x的 任意前提 A,關聯到y 只有兩種可能:若 A 包含 a ,則 y=b ,否則 y≠b。當b 是關鍵性狀時,R 可以用作由x 測y 的精準預報器。

對于定性因素而言,若存在一個 a∈X,使|R(a)|=1,則 x 對 y的最大制約強度達到1。此時截集 R(x)只能包含一個性狀顆粒,設為 b,這便引出了因果律:若 x=a 則y =b。

因素間互為因果,若將因素 x當作條件因素而將 y當 作結果因素,對任意 E?X,E′?Y,以E(x)表示x∈E ,以 E′(y)表示 y∈E,試問在何種條件下,才能保證有 E(x)→ E′(y)?

注意, x、y 本身可以是復雜因素, X,Y可以是任意高維的,這個定理適用于任意維數的空間,它說明背景關系決定了因素X到Y的全部因果律。

這個定理證明的思路很簡單,在圖6中把 X的子集 E 拿到 X×Y 中來就變成它的柱體擴張 E×Y;把Y 的子集 E′拿到X×Y中來就變成它的柱體擴張X×E′。它們都是 X×Y中的子集,就可以檢驗一下E×Y是否被X×E′所包含,若是,則二者形成前因與后果。但注意, X×Y中有很多點是虛空的,背景集R才 是實際存在的疆域,所以二者都要與 R取交然后才能比較。式(10)又可寫成

符號 ?R叫作在背景 R之下的蘊涵關系。因素空間以背景蘊涵為集運算(,以背景推理為邏輯。)

怎樣從表頭為 T=u;f1,f2,···,fn?1;g=fn的相樣本 S 中來提取因果規則呢?設 s∈X(f),t∈X(g),記[s]={u|f(u)=t},[t]={u|g(u)=t}。

圖 6 背景關系決定因果Fig. 6 Determinants of background relations

定義16 如果 [s]?[t],則稱 [s]是因素 f的一個決定類。因素 f的所有決定類的并集叫作它對結果的決定域。因素 f 的決定域所占行數 h與表的行數(即全體對象個數)m之比稱為它對結果的決定度[14],記作 c(f)=h/m。

條件因素 f與結果因素 g 都在對 U進行分類,如果 f 分出的某個類 [s]變成 g 的一個類 [t],則 [s]中的對象都具有相同的結果t,這時就得到一個推理句:“若u∈[s]則 g(u)=t ” 。若記 x=f(u),x=f(u),則推理句變為“若 x=s ,則 y=t”,簡寫為s→t。于是,因素表就可以對諸條件因素進行劃分,類越分越細,鉆入結果類的機會就越來越多,得到的推理句也越來越多,直到不能再分為止。整個表就轉化為一組規則,叫作因果規則,這種方法叫作因果分析法。在大數據面前,必須進行因素的約簡,這與因素的分類次序相關,下面算法的思想是按決定度的大小次序來排列,使因素能得到較好的約簡。

基本算法2 因果關聯

給定以表頭 T=(u;f1,···,fk;g)為表頭的因素表S,要從表中提取因果關聯規則,可采取下列步驟:

1) 計算各個因素 fj對結果 g的決定度;

2)選決定度最大的因素對 U分類,若出現能鉆入結果類的類別,就寫出相應的因果句;逐次細化分類,直到所分類全部鉆入結果類或不能再分為止。所有因果句的全體稱為因果規則集。

因果關聯規則的提取,是一種有用的歸納方法,具有很高的概括性,是歸納、學習、分類、評價、預測、控制等高級思維活動的統一算法。以它為基礎可以向任何領域精細化。該法與決策樹的算法很相似,只是用決定度取代了信息增益。在這方面已經發表了很多關于因素空間的文章[15-19]。

有了以上的準備,讓我們來處理語義信息的提升問題。狀態與效用是有緊密關聯的兩個或兩組因素。利用這兩組因素的數據可以提取從狀態到效用的因果關聯,得到一組因果規則作為知識儲備起來,當要從形式信息推測效用信息的時候,就要利用狀態效用因果關聯所提供的一組規則。看看我們所面對的對象,其狀態和那條規則的前件相匹配,就推斷它有哪種效用。若硬匹配不行,就用相似性測度,選最貼近的一個作為推斷,最后將形式信息與效用信息結合起來,得到語義信息,這就是從形式信息向語義信息的提升過程。

例3 服務對象狀況到服務效用的因果關聯

表8給出了用戶(服務對象)的狀況和服務效用之間的關聯數據,把用戶狀況看作形式信息,把購買力看作服務效用信息,我們要來分析從形式信息到效用信息的因果關聯。具體地說,要提取從用戶狀況來判斷其購買力。表達形式信息有4個因素:f1=年齡,具有性狀空間 X(f1)={老,中,青};f2=職業,X(f2)={師,生,商};f3=信貸,X(f3)={好,可,差};f4=收入,X(f4)={高,平,低};效用形式的因素是g=購買力,具有性狀空間X(g)={購買, 不買}。

表 8 因果關聯分析表Table 8 Causal association analysis table

先看因素f1與因素g之間的因果關系。按年齡可把9個用戶分成老、中、青3類,從表8中可以看到這 3 類分別是:[老]={1, 5, 6},[中]={2, 4, 9},[青]={3, 7, 8}。這3類有哪一類是對購買的決定類呢?在3個老年用戶中,用戶1和5是不買,用戶6是購買,他們的購買情況不一致,就不是對購買的決定類。再看中年用戶2、4和9,他們都是購買,于是[中]就可以鉆入[購買],[中]就是 g 的一個決定類。青年用戶不是決定類。所以年齡對g的決定度是3/9。

類似地,對因素職業來說, [師]={1, 2, 9}, [生]={3, 7, 8},[商]={4, 5, 6},他們都不是決定類 f2對g的決定度=0;對因素還貸來說, [好]={2, 6, 9},[可]={3, 4, 5}, [差]={1, 7, 8},還貸好的用戶類[好]鉆入[購買],還貸差的用戶類[差]鉆入[不買],都是決定類,f3對g的決定度是 6/9;對因素收入來說,只有收入高的用戶類[高]是決定類,f4對g的決定度是2/9。

選取決定度最高的因素“信貸”,它有兩個決定類,由這兩個決定類的鉆入情況分別得到兩個因果推理句:

因果規則1:信貸好購買。

因果規則2:信貸差不買。

從論域中刪除這兩個決定類,得到新的論域,取U′=[可]={3,4,5},得表 9。

表 9 由表8的刪除而得的表Table 9 A table obtained by the deletion of table 8

按表9重新計算各個因素對g的決定度。取決定度最大的因素f1,它有3個決定類:[老]={5},[中]={4},[青]={3},分別寫成下列推理句:

因果規則3:信貸可且年齡不老→購買。

因果規則4:信貸可且年齡老→不買。

因果規則5:信貸可且年齡青→購買。

刪除表中的用戶3、4和5,表9被刪空,因果規則提取完畢。最后共得到五條因果規則。面對一個新用戶,只需先查他的信貸狀況,再補充考慮其年齡,就可以判斷其購買傾向。 例畢。

因果規則的可靠性依賴于樣本的大小和準確性,還要隨時間場合的變化而不斷調整。

本節介紹了因素空間如何將形式信息與效用信息關聯起來,提升為全面的語義信息。以上兩節為機制主義人工智能的信息轉化第一定律提供了有用的數學理論。

4 用因素空間下九宮棋

在實現信息向知識的轉化中,需要有更好的搜索工具。因素是啟發指引搜索的關鍵詞。本節將介紹如何用因素思維實現目標因素與場景因素的對接和搜索,為信息轉化的第二定律從數學上作一點探索性的思考。傳統人工智能教科書上以九宮棋來講述搜索策略,為了說明思想,本節特以九宮棋為例來進行闡述。要想使用因素空間理論進行信息的智能化處理,先要在思維上習慣于因素分析。隨時隨處都要問:“我思考的目標是什么?我面臨的對象是什么?要使二者合籠,最為關鍵的因素是什么?”下面以下九宮棋為例來說明這個問題。

1) 確立目標,選定目標因素

智能是一個目標驅動的活動,下棋也是這樣,在任何比賽中,棋手的目標是贏得比賽。獲勝是棋手的目標因素。

2) 注意對象,確定對象因素

目標因素的實現離不開對象描述。九宮棋的對象描述依賴于兩個對象因素:棋盤和游戲規則。

棋盤。九宮棋的棋盤是由3條橫線和3條豎線繪制的9點陣。在人工智能書中,也被描述成3行3列的九宮格。

游戲規則。分別由執黑白兩色棋子的棋手交替放子于棋盤未被占用的格子點上,黑子先手。如果一方在1條線(水平、垂直或對角線)上連接放上了3個棋子,該方就贏;如果在棋盤的所有格點都被占用時仍沒有贏家,那就成和棋。這兩種結局都叫作下完了一盤棋。

一盤棋在下完第t步棋時,黑白子在棋盤上的分布狀態可以描述為一個3×3的矩陣,元素bij描述第i 條橫線和第 j條豎線交點所呈現的狀況(白、黑或空), B(t)叫作一個棋局。下三子棋的論域U 是所有棋局的集合: U ={{B(t)}|t=1,2,···,t?}},其中t?是下完一盤棋的步數,總有 t?≤ 9。

3) 目標因素與對象因素的對接

因素空間在哪里?因素空間在目標因素與對象因素對接的過程中出現。設 O是目標因素,它有性狀空間{白勝,黑勝,對弈}。對象因素是什么?黑方為了取勝,首先需要從棋盤中選擇下子的位置,這就要考慮9個格子點在博弈中各自具有的戰略地位。對每一步棋,建立1個因素 ft,ft稱為第t 步棋的“點勢”,其性狀空間是 X(ft)={中心,頂點,邊點}。9個格子點中有1個中心、4個頂點和4個邊點。中心是4條線的交匯,頂點是3條線的交匯,邊點是2條線的交匯。搶占中心是決定勝負的關鍵。黑子下了一步棋之后,還要考慮白子如何應對,所涉及的因素記為 gt,它具有性狀空間X(gt)={搶占中心,堵于頂點,堵于邊點,放任},于是就出現了一個最簡單的因素空間 (U,XFo),其中Fo={f1,g2,f3,g4,f5,g6,···;hi(t?),O(t?)}, h 表示 f 或 g。

有了因素空間,就可以應用因素空間的理論。將f1,g2,f3,g4,f5,g6,···,hf(t?)當作條件因素,而將O(t?)當作結果因素來設計因素數據庫。我們從數據庫中選了100個樣本點,也就是下了100盤棋來進行學習,得到因素表10(為了節省篇幅,不寫被約間的因素)。

表 10 一字棋的因果關聯分析表Table 10 A causal link analysis table for Chinese characters

應用因素空間的因果分析算法2,可以從表10中提取因果規則:如果 f1=中心,則“O (t?)=黑勝”的頻率是84/90。這一規則說明,只要黑子在第一步占領中心,對方就只有招架之功而無還手之力。黑方很容易取勝。

4) 精細化與棋譜

為了使這一規則更加確切,需要分析黑棋不能取勝的原因。要區分情況就要增加因素。當黑子占中心點以后,再下一子,無論下在何處,必與中心相連而構成一字的勝利威脅。此時白子必在對稱點上堵截。黑子求勝必須在被圍堵的情況下形成一字?在圖1的第三局勢中,畫了兩條一字線,只要第二枚黑子下在這兩條紅線(但不包括右下角)上,黑棋就能取勝,否則下和。這就形成一個棋譜(見圖7)。

圖 7 棋譜1的圖示Fig. 7 Chess 1 Icon

在這個棋譜中有一個關鍵詞,就是希望線。

如果白棋堵在邊上,在圖2的第3局勢中,畫了兩條一字線,第2黑子下在這兩條紅線的任何一條上,黑棋就能取勝,否則下和。這就形成一個棋譜 (見圖 8)。

圖 8 棋譜2的圖示Fig. 8 Chess 2 Icon

當黑棋失誤被白棋搶占了中心以后,白棋取勝的細節可以進一步引進新的因素來進行分析,不再詳說。如何引進新的因素,在這里還是要靠人的因素思維。

5 因素空間的歷史與未來

早在20世紀60年代,筆者參與了在我國高校設立概率論課程的工作。在那時,筆者就用因素空間來處理柯爾莫戈洛夫所提出的概率基本空間[20]。一枚硬幣在一次投擲中可能出現兩個基本事件,得到基本空間={正,反}。要弄清楚這兩個基本事件為什么是隨機的,就要找出那些影響硬幣面向的因素,如硬幣性狀、手的動作、桌面條件、環境影響等,這些因素都會對結果產生影響。我們可以作這樣一個決定論性的假設:當所有因素的狀態都固定以后,所得的結果便會唯一確定。如其不然,就必有其他某些具有影響力的因素尚未被考慮到,若把這些被遺漏的因素統統都考慮進去,則這個決定性假設便應告成立。每個因素都有一個狀態變化的維度,所有這些因素就張成一個高維空間,這正是我們后來所說的因素空間。是因素的集合,的充分性便確定了從到的一個映射,使偶然現象得到必然性的描述。充分的條件可以導致必然的結果;但若存在著難以觀測和控制的因素,則人的辨別和控制范圍便從點x蛻化成為團粒。在進行一種試驗時,所能識控的范圍叫作條件。我們只知在中但卻不知在其中的何處,當的范圍跨越了正反兩面的邊界時,確定性就轉化為隨機性,世界是必然的也是隨機的,這是辯證的統一,否定任何一方都是錯誤的。我們不承認隨機性可以被消滅,但是卻承認二者可以相互轉化,只有用因素空間來描述基本空間才能刻畫這種轉化。柯爾莫戈洛夫心目中所要定義的基本空間其實就是一個因素空間。

不充分的條件也是條件,它雖不能決定結果但卻能制約結果的發生頻率,體現這種內在必然性聯系的就是概率,概率是廣義的因果律。概率論是一種廣義的因果論,這就注定了概率統計會在人工智能中占有重要的地位,我們現在能對概率論有這樣一種較為深刻的認識,是因為有了因素空間。

用因素空間來構造基本空間,可以實現決定性向隨機性的逼進。概率論不僅要研究概率的邏輯規律,更應實現隨機性向確定性的轉化。雖然,大數定律和貝葉斯概率都體現這種轉化,但還有很大的發展空間。筆者所提的構架是,將基本空間的因素分為兩個部分,可觀察、可控的因素算第1部分,這部分因素所導引的變量是非隨機變量,余下的因素算第2部分,統歸為一個余因素[12],它所引導的變量是隨機性的。從中挑選出少數幾個特別突出的因素作為精細處理的對象,剩下那些影響微弱且相互獨立的眾多因素,都歸順于中心極限定理。這樣一來,隨機變量的一般分解式為

1965年,Zadeh教授提出了模糊集合論[21],這是人工智能在數學上取得突破的重要歷史進展。他把模糊集定義成從論域到[0, 1]上的一個映射表示對的隸屬程度;至于論域是什么,則很少有人問津。然而,論域是刻畫模糊信息極為重要的一環,筆者提出因素空間的理論來刻畫論域,以實現模糊性與清晰性之間的相互轉換。例如,年輕是一個模糊概念,要看一個人是否年輕,單就年齡這個因素打分(確定隸屬度)相當困難。若加上因素面貌,打起分來就容易一些;若再加上精力、體魄、反應、朝氣等因素,打分就更容易了。問題的關鍵是因素的增加會降低認識的模糊性。

模糊數學與概率論都需要因素空間的理論,借用因素空間可以探討隨機性與模糊性這兩種不確定性之間的聯系與區別。在隨機試驗中,事件是因素空間中一個固定的集合,因素的變異點在條件域中變,所以隨機試驗模型的特征是“圈圈固定,點子在變”。模糊試驗則相反,要考慮張三是否年輕,張三是論域中的一個固定的點子,年輕這一模糊概念在人的腦海中有著不確定的邊界,成了在變的圈圈,模糊試驗模型的特征是“點子固定,圈圈在變”。這種對偶性有很深刻的意義,在數學上可用論域(地面)和冪集(天上)來作一種轉換:中的圈圈變成里的一個點,中的點子可以變成上的一個圈圈,于是地上的模糊試驗就可轉化成天上的隨機試驗。天上的隨機變量是隨機集,相應的統計不是普通的數理統計而是集值統計或區間統計。靠著隨機區間對的覆蓋頻率來確定隸屬度,隸屬曲線就成了隨機集的落影,這就形成了模糊落影理論[22]。文獻[22]把序、拓撲和可測結構提升到冪上,建立了8種超拓撲和超可測結構,由之建立了隨機集和信度的嚴密數學理論,證明了4種非可加信度與隨機集分布對應關系的存在性和唯一性定理,把測度擴張定理的擴張起點從半環提前到π-系,這是一個有相當難度的數學成果。1988年,北師大張洪敏等研究生在筆者指導下研制出國際第二臺模糊推理機[23],與日本山川烈在1987年的首臺“模糊計算機”相比,推理速度從每秒一千萬次提高到一千五百萬次,體積不到它的1/10。在錢學森教授的鼓勵下,因素空間被作為人工智能的數學支持理論來抓。1994年筆者和李洪興合著的《知識表示的數學理論》[5]一書問世,用因素空間描述了概念生成,推理、控制、決策、評價等問題;在1995年又出版了《模糊系統理論和模糊計算機》[24],為智能計算機的研制提供了數學基礎。

2012年以后,筆者將因素空間的研究重點轉向數據智能化的數學理論,與形式概念分析及粗糙集結緣。現有的關系數據庫所面臨的大數據的挑戰是因素空間所要迎頭解決的首要問題。因素空間對形式信息的處理對象囊括了非結構化數據。以因素空間為基礎的機制主義人工智能是數據智能化的靈魂,它不俯首聽命于大數據的擺布,而是要設計、制造、運用和培育數據,用數據來營造信息生態和知識生態,建立信息、知識與神經結構的同構體。它要改變當今世界人工智能自下而上的手工式格局,代之以自上而下與自下而上相結合的發展理念。有許多文章可以參考[25-50],盡管作者們在寫作的時候還沒有形成自己思維的大局。

6 結束語

因素是信息描述的關鍵詞,因素空間是描寫事物和信息的普適性框架,它把數據變成可視的樣本點,形成背景分布的母體,據以自動概念生成和因果規則,由此可以產生學習、預測、評價和決策控制等一系列的數學操作。因素空間能將形式信息與效用信息關聯起來,提升為全面的語義信息,為機制主義人工智能的信息轉化第一定律提供了堅實的數學理論。用因素思維實現目標因素與場景因素的對接和搜索,可為信息轉化的第二定律提供手段。以因素空間為基礎的機制主義人工智能是數據智能化的靈魂,它將要設計、制造、運用和培育數據,用數據來營造信息生態和知識生態,建立信息、知識與神經結構的同構體。總之,因素空間的發展前景巨大,對信息科學和人工智能的發展有重要作用。

[1]鐘義信. 高等人工智能原理: 觀念·方法·模型·理論[M]. 北京: 科學出版社, 2014.

[2]鐘義信. 信息科學與技術導論[M]. 3版. 北京: 北京郵電大學出版社, 2015.

[3]何華燦. 泛邏輯學原理[M]. 北京: 科學出版社, 2001.HE Huacan. Universal logics principle[M]. Beijing: Science Press, 2001.

[4]WANG Peizhuang, HE Ouyan, ZHONG Yixin, et al. Cognition math based on factor space[J]. Annals of data science,2016, 3(3): 281–303.

[5]汪培莊, 李洪興. 知識表示的數學理論[M]. 天津: 天津科學技術出版社, 1994.

[6]劉增良. 因素神經網絡理論[M]. 北京: 北師大出版社,1990.

[7]HUANG Chongfu. Principle of internet of intelligences and development of its core technology[J]. Journal of risk analysis and crisis response, 2017, 7(3): 146–155.

[8]WILLE R. Restructuring lattice theory: an approach based on hierarchies of concepts[M]//RIVAL I. Ordered Set.Dordrecht: Springer, 1982: 445–470.

[9]PAWLAK Z. Rough sets[J]. International journal of computer and information sciences, 1982, 11(5): 341–356.

[10]WANG Guoyin, WANG Yan. 3DM: domain-oriented datadriven data mining[J]. Foundamenta informaticae, 2009,90(4): 395–426.

[11]LIANG Jiye, BAI Liang, DANG Chuangyin, et al. The kmeans-type algorithms versus imbalanced data distributions[J]. IEEE transactions on fuzzy systems, 2012, 20(4):728–745.

[12]汪培莊, SUGENO M. 因素場與Fuzzy集的背景結構[J].模糊數學, 1982(2): 45–54.

[13]汪培莊. 因素空間與因素庫[J]. 遼寧工程技術大學學報:自然科學版, 2013, 32(10): 1297–1304.WANG Peizhuang. Factor spaces and factor data-bases[J].Journal of Liaoning technical university: natural science,2013, 32(10): 1297–1304.

[14]WANG Peizhen. Rules detecting and rules-data mutual enhancement based on factors space theory[J]. International journal of information technology and decision making,2002, 1(1): 73–90.

[15]汪培莊, 郭嗣琮, 包研科, 等. 因素空間中的因素分析法[J]. 遼寧工程技術大學學報: 自然科學版, 2014, 33(7):865–870.WANG Peizhuang, GUO Sicong, BAO Yanke, et al. Causality analysis in factor spaces[J]. Journal of Liaoning technical university: natural science edition, 2014, 33(7):865–870.

[16]劉海濤, 郭嗣琮. 因素分析法的推理模型[J]. 遼寧工程技術大學學報: 自然科學版, 2015, 34(1): 124–128.LIU Haitao, GUO Sicong. Reasoning model of causality analysis[J]. Journal of Liaoning technical university: natural science, 2015, 34(1): 124–128.

[17]曲國華, 李春華, 張強. 因素空間屬性簡約的區分函數[J].智能系統學報, 2017, 12(6): 890–894.QU Guohua, LI Chunhua, ZHANG Qiang. The differential function for attributes reduction in factors SPACE[J].Journal of intelligent systems, 2017, 12(6): 890–894.

[18]包研科, 茹慧英, 金圣軍. 因素空間中知識挖掘的一種新算法[J]. 遼寧工程技術大學學報: 自然科學版, 2014,33(8): 1141–1144.BAO Yanke, RU Huiying, JIN Shengjun. A new algorithm of knowledge mining in factor space[J]. Journal of Liaoning technical university: natural science, 2014, 33(8):1141–1144.

[19]曾繁慧, 鄭莉. 因素分析法的樣本培育[J]. 遼寧工程技術大學學報: 自然科學版, 2017, 36(3): 320–323.ZENG Fanhui, ZHENG Li. Sample cultivation in factorial analysis[J]. Journal of Liaoning technical university: natural science, 2017, 36(3): 320–323.

[20]汪培莊. 隨機過程[M]//郝柏林, 于淥, 孫鑫, 等. 統計物理學進展. 北京: 科學出版社, 1981.

[21]ZADEH L A. Fuzzy sets[J]. Information and control, 1965,8(3): 338–357.

[22]汪培莊. 模糊集與隨機集落影[M]. 北京: 北京師范大學出版社, 1985.

[23]唐旬. 國內首臺模糊推理機分立元件樣機研制成功[N].光明日報, 1988-05-07.TANG Xun. The first prototype of a fuzzy inference machine in China was successfully developed by[N]. Guangming Daily, 1988-05-07.

[24]汪培莊, 李洪興. 模糊系統理論與模糊計算機[M]. 北京:科學出版社, 1995.

[25]歐陽合. 不確定性理論的統一理論: 因素空間的數學基礎(特約報告)[C]//東方思維與模糊邏輯—紀念模糊集誕生五十周年國際會議. 中國, 大連, 2015.OUYANG He, The unified theory of uncertainty theory:the mathematical foundation of factor space (special report)[C]//Oriental Thinking and Fuzzy Logic-the 50th Anniversary International Conference to Commemorate the Birth of Fuzzy Sets. Dalian, China, 2015.

[26]馮嘉禮. 思維與智能科學中的性質論方法[M]. 北京: 原子能出版社, 1990.

[27]YUAN Xuehai, WANG Peizhuang, LEE F S. Factor space and its algebraic representation theory[J]. Journal of mathematical analysis and applications, 1992, 171(1): 256–276.

[28]袁學海, 汪培莊. 因素空間和范疇[J]. 模糊系統與數學,1995, 9(2): 25–33.YUAN Xuehai, WANG Peizhuang. Factor spaces and categories[J]. Fuzzy systems and mathematics, 1995, 9(2):25–33.

[29]PENG X T, KANDEL A, WANG P Z. Concepts, rules,and fuzzy reasoning: a factor space approach[J]. IEEE transactions on systems, man, and cybernetics, 1991, 21(1):194–205.

[30]WANG P Z. A factor spaces approach to knowledge representation[J]. Fuzzy sets and systems, 1990, 36(1):113–124.

[31]汪培莊. 因素空間與概念描述[J]. 軟件學報, 1992, 3(1):30–40.WANG Peizhuang. Factor space and description of concepts[J]. Journal of software, 1992, 3(1): 30–40.

[32]WANG P Z, LOE K F. Between mind and computer: fuzzy science and engineering[M]//Singapore: World scientific Publishing, 1994.

[33]WANG Peizhuang, LIU Zeng-liang, SHI Yong, et al.Factor space, the theoretical base of data science[J]. Annals of data science, 2014, 1(2): 233–251.

[34]金智新. 安全結構理論[M]. 北京: 科學出版社, 2012.

[35]CHENG Q F, WANG T T, GUO S C, et al. The logistic regression from the viewpoint of the factor space theory[J].International journal of computers communications and control, 2017, 12(4): 492–502.

[36]YU Fusheng, HUANG Chongfu. Building intelligent information systems in factors space[J]. 2002.

[37]ZENG Wenyi, FENG Shuang. An improved comprehensive evaluation model and its application[J]. International journal of computational intelligence systems, 2014, 7(4):706–714.

[38]李德清, 馮艷賓, 王加銀, 等. 兩類均衡函數的結構分析與一類狀態變權向量的構造[J]. 北京師范大學學報: 自然科學版, 2003, 39(5): 595–600.LI Deqing, FENG Yanbin, WANG Jiayin, et al. Structure analysis of two classes of balance functions and construction of a family of state variable weight vectors[J]. Journal of Beijing normal university: natural science, 2003, 39(5):595–600.

[39]李德清, 李洪興. 變權決策中變權效果分析與狀態變權向量的確定[J]. 控制與決策, 2004, 19(11): 1241–1245.LI Deqing, LI Hongxing. Analysis of variable weights effect and selection of appropriate state variable weights vector in decision making[J]. Control and decision, 2004,19(11): 1241–1245.

[40]李德清, 崔紅梅, 李洪興. 基于層次變權的多因素決策[J].系統工程學報, 2004, 19(3): 258–263.LI Deqing, CUI Hongmei, LI Hongxing. Multifactor decision making based on hierarchical variable weights[J].Journal of systems engineering, 2004, 19(3): 258–263.

[41]LI Deqing, ZENG Wenyi, LI Junhong. New distance and similarity measures on hesitant fuzzy sets and their applications in multiple criteria decision making[J]. Engineering applications of artificial intelligence, 2015, 40: 11–16.

[42]余高鋒, 劉文奇, 李登峰. 基于折衷型變權向量的直覺語言決策方法[J]. 控制與決策, 2015, 30(12): 2233–2240.YU Gaofeng, LIU Wenqi, LI Dengfeng. Compromise type variable weight vector based method Intuitionistic linguistic making decision[J]. Control and decision, 2015, 30(12):2233–2240.

[43]余高鋒, 劉文奇, 石夢婷. 基于局部變權模型的企業質量信用評估[J]. 管理科學學報, 2015, 18(2): 85–94.YU Gaofeng, LIU Wenqi, SHI Mengting. Credit evaluation of enterprise quality based on local variable weight model[J]. Journal of management sciences in China, 2015,18(2): 85–94.

[44]岳磊, 孫永剛, 史海波, 等. 基于因素空間的規則調度決策模型[J]. 信息與控制, 2010, 39(3): 302–307.YUE Lei, SUN Yonggang, SHI Haibo, et al. Rule-based scheduling decision-making model based on factor spaces[J]. Information and control, 2010, 39(3): 302–307.

[45]何清, 童占梅. 基于因素空間和模糊聚類的概念形成方法[J]. 系統工程理論與實踐, 1999, 19(8): 99–104.HE Qing, TONG Zhanmei. The concept formation method based on factor spaces and fuzzy clustering[J]. System engineering-theory & practice, 1999, 19(8): 99–104.

[46]米洪海, 閆廣霞, 于新凱, 等. 基于因素空間的多層診斷識別問題的數學模型[J]. 河北工業大學學報, 2003,32(2): 77–80.MI Honghai, YAN Guangxia, YU Xinkai, et al. The mathematical model of multi-layer diagnosis-type recognition problem[J]. Journal of Hebei university of technology,2003, 32(2): 77–80.

[47]何平. 犯罪空間分析與治安系統優化[M]. 北京: 中國書籍出版社, 2013.

[48]崔鐵軍, 馬云東. 連續型空間故障樹中因素重要度分布的定義與認知[J]. 中國安全科學學報, 2015, 25(3):23–28.CUI Tiejun, MA Yundong. Definition and cognition of factor important degree distribution in continuous space fault tree[J]. China safety science journal, 2015, 25(3):23–28.

[49]崔鐵軍, 馬云東. 因素空間的屬性圓定義及其在對象分類中的應用[J]. 計算機工程與科學, 2015, 37(11): 2169–2174.CUI Tiejun, MA Yundong. Definition of attribute circle in factor space and its application in object classification[J].Computer engineering and science, 2015, 37(11): 2169–2174.

[50]崔鐵軍, 馬云東. 基于因素空間的煤礦安全情況區分方

法的研究[J]. 系統工程理論與實踐, 2015, 35(11):2891–2897.

CUI Tiejun, MA Yundong. Research on the classification method about coal mine safety situation based on the factor space[J]. Systems engineering-theory and practice, 2015,35(11): 2891–2897.

猜你喜歡
背景概念
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
“新四化”背景下汽車NVH的發展趨勢
《論持久戰》的寫作背景
當代陜西(2020年14期)2021-01-08 09:30:42
黑洞背景知識
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
學習集合概念『四步走』
聚焦集合的概念及應用
晚清外語翻譯人才培養的背景
論間接正犯概念之消解
背景鏈接
主站蜘蛛池模板: 极品av一区二区| 老司国产精品视频91| 欧美国产精品不卡在线观看| 色欲国产一区二区日韩欧美| 国产欧美日韩视频怡春院| 亚洲一级色| 中文字幕无码制服中字| 亚洲国产精品无码久久一线| 国产流白浆视频| 欧美国产另类| 国模私拍一区二区| 欧美激情视频一区| 欧美va亚洲va香蕉在线| 666精品国产精品亚洲| 日韩无码白| 自拍亚洲欧美精品| 亚洲三级成人| 国产综合另类小说色区色噜噜| 亚洲资源站av无码网址| 最新国产网站| 91精品免费高清在线| 久热中文字幕在线| 欧美色综合久久| 久久久久国产一区二区| 免费国产福利| 女同国产精品一区二区| 国产丝袜91| 在线人成精品免费视频| 欧美黑人欧美精品刺激| 国产成人高清精品免费| 色有码无码视频| 日韩AV无码免费一二三区| 91精品日韩人妻无码久久| 成人国产精品网站在线看| 国产免费久久精品99re丫丫一| 久久国产亚洲欧美日韩精品| 亚洲一区二区约美女探花| 欧美国产在线看| 天天躁狠狠躁| 99热这里只有精品免费国产| 亚洲青涩在线| 超清无码一区二区三区| 久久久久青草线综合超碰| 免费无码在线观看| 国产精品永久久久久| 日本不卡免费高清视频| 国产精品无码久久久久AV| 中文字幕中文字字幕码一二区| 亚洲综合国产一区二区三区| 全午夜免费一级毛片| 日韩123欧美字幕| 91在线视频福利| 亚洲人成在线免费观看| 久久免费视频播放| 国产一级视频在线观看网站| 三上悠亚一区二区| 韩日无码在线不卡| 高清无码一本到东京热| 亚洲日韩AV无码一区二区三区人| 女同久久精品国产99国| 成年A级毛片| 精品亚洲欧美中文字幕在线看| 日韩成人在线视频| 九色国产在线| 在线免费亚洲无码视频| 精品国产aⅴ一区二区三区| 国产黄色片在线看| 中文字幕首页系列人妻| 亚洲乱码在线视频| 无码日韩视频| 亚洲AⅤ永久无码精品毛片| 91在线免费公开视频| 日本一区二区三区精品AⅤ| 亚洲欧美日韩成人在线| 77777亚洲午夜久久多人| 欧美视频免费一区二区三区| 国产后式a一视频| www亚洲天堂| 国产免费怡红院视频| 亚洲区视频在线观看| 日韩一区精品视频一区二区| 69av在线|