史運美 蔣夢雪 袁藝林 王超亞 秦瑜華
(河南師范大學,河南 新鄉 453002)
在日常生活中,一些模糊概念經常會出現在我們的自然語言中,如果想用定量的數據來表示,卻發現很困難。而云模型[1]恰能實現從定性概念到定量數據間的轉化,它通過期望Ex、熵En、超熵He 三個數值來完成這些模糊概念到具體數據之間的轉換,并以云圖表現出來,與傳統的處理模糊概念的方法相比,更加直觀、具體;云模型對于日常生活中的不確定性概念有很好的表達能力。目前,傳統的模糊數學在很多領域已經不能夠滿足模糊研究的需要,而云模型憑借其處理模糊度和隨機性的優勢越來越頻繁的應用到各個領域。為了完善模糊研究中的存在的不足,本文對云模型的理論和應用的發展進行了探討和總結。
與此同時許多不確定性或信息不安全的問題也體現在生活各處,僅用點值描述很難表達其準確的含義,而如果用區間集[2]來描述卻可以有效的表達語義。將信息合理有效地區間分段,可以減少局部區間的波動,保證了結果的科學性和合理性,降低了結果分析的失誤率,因此,區間集被廣泛的應用于人工智能的控制、神經網絡等領域中。區間集不僅能夠反映邏輯推理的模糊性,而且符合人類推理模糊信息的習慣。故此,區間集本文研究的對象,并在區間集的基礎上引出高斯云模型。
在國內外不乏單一的對云模型及區間集進行深入研究的學者,但將兩者結合卻寥寥無幾,本文即是將兩者結合的研究,即基于區間集的云模型研究。
本文首先在區間集上對2013 年統計得到的中國科學院院士的年齡分布情況進行統計分析,可以發現在40-60、60-100 歲上各年齡段的人數在總體呈正態趨勢,同時在各年齡階段范圍內呈現局部正態函數的趨勢。然后運用高斯函數對所有年齡段總體分析和計算,繼而擬合出高斯云的回歸方程。
科學家年齡及其結構是科學社會學研究中一個不可忽略的問題。但是,在研究的過程中,以什么方式研究對結果的產生在一定的程度上會有影響。本文通過采集2013 年中國科學院全部院士的年齡數據,基于區間集對其整體結構進行分析。

表1 院士年齡統計
從表1[3]數據可以得出在40-60 歲、60-100 歲的不同年齡區間局部年齡趨勢呈正態分布,而且以上兩個大年齡段的區間集上離散點的總體趨勢也幾近于正態分布,故可在此區間集上運用云模型加以研究。
從圖1 可以看出院士年齡整體偏高,偏高的院士當選年齡和偏高的院士平均年齡不利于國家的科技創新與科技進步。要綜合運用科學哲學、科學社會學等多種理論和知識,準確把握科學家群體的特殊屬性及要求,完善院士選拔制度、調整院士的年齡結構,使大多數當選院士處在科學創造力和生產力的最佳年齡段。

圖1 不同年齡的分布
由圖1 發現年齡所構成的圖形與高斯云分布[4]的圖形在一定的程度上是相似的。因此,借助高斯函數對采集的數據進行擬合,以此引申為對科學家年齡的研究分析。
運用高斯云的數字特征[5]對表1 中60-100 年齡區間上的數據進行分析計算,得到不同區間集上利用高斯云的數字特征擬合后的數據。高斯云的數字特征如下:
1)高斯云分布的期望E{}X =Ex。


一個云滴[6]是定性概念,在數量上一次實現,大量云滴組成云。盡管在不同的時刻產生的云滴不同,但是云的數字特征決定的云的整體形態基本不變。云的數字特征由期望Ex,熵En,超熵He 三個數值來表示,他們反映了定性概念上的定量特征。
期望Ex:是在數值域空間中最能體現定性概念的點值,是將定性概念數值化的最佳樣本點。在云圖中體現為云的峰值所處的位置,反應了這個概念的云滴群的云重心。
熵En:用來綜合度量定性概念的模糊度和概率,即被定性概念接受的取值范圍大小,反應了定性概念的不確定性。在云圖中體現為云的寬度,熵值越大,概念越宏觀,其模糊度和隨機性也就越大。
超熵He:熵的不確定性的度量,反應云滴的離散程度,代表云滴出現的隨機性,揭示了模糊性和隨機性的關聯。超熵越大,云滴離散程度越大,云圖中的云厚度也就越大。
根據回歸曲線的定義,高斯云的回歸曲線形成過程為:對于給定的 xi,對應確定度μi的期望值為 Eμi,不同的 xi對應的 Eμi擬合形成回歸曲線。高斯云的回歸曲線為

其解析形式難以求出,但可通過線性逼近的方法近似求得。
與回歸曲線不同,高斯云曲線[7]的每一點是投影到該點的所有點的期望值。云主曲線的解析形式也難以給出,但同樣可以通過線性逼近的方法近似求得。
先繪制中國科學院全體院士的年齡分布折線圖,如下從圖2 中可以看出,已分段后的年齡在局部范圍內在不同程度的達到了峰值,因此,截取60 歲之后的數據,共579 個,以年齡段分組,作為研究之用。
利用MATLAB,直接對所采集的數據進行擬合。經過擬合之后,發現只有當套用高斯公式時,圖形的貼近率最高。可得擬合之后的公式和圖形分別為:


圖3
在基于區間集的云模型研究中,利用區間集的不確定概念不但可以得到語義解釋,更能考慮到其計算性,一舉兩得。云模型利用期望、熵和超熵這三個數字特征來定量描述一個不確定性概念,通過正向云發生器[8]實現從概念的內涵向其外延進行轉化,通過逆向云發生器實現從概念的內涵向其內延進行轉化,較好地刻畫了概念內涵與外延之間的雙向認知變換過程,同時也解釋了客觀對象具有的模糊性和隨機性。這種研究使云模型在更廣泛的領域上得以應用。
[1]李德毅,劉常昱.論正態云模型的普適性[J].中國工程科學,2004,6(8):28-34.
[2]李德毅,杜.不確定性人工智能[M].北京:國防工業出版社,2005.
[3]劉禹,李德毅,張光衛,等.云模型霧化特性及在進化算法中的應用[J].電子學報,2009,37(8):1651-1658.
[4]劉玉超,李德毅.基于云模型的粒計算[J].
[5]苗奪謙,李德毅,姚一豫,等.不確定性與粒計算[M].北京:科學出版社,2011:1-23.
[6]劉禹,李德毅.正態云模型霧化性質統計分析[M].北京:航空航天大學學報,2010,36(11):1320-1324.
[7]邱東.模糊分析中的若干問題及與粗糙集理論的結合研究[D].電子科技大學,2009.
[8]張虹.模糊關系下的粗糙近似算子及相關屬性的約簡理論[D].昆明理工大學.2005.