999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

分布輪廓與局部特征融合的云模型不確定性相似度量

2022-04-21 02:05:32王國(guó)胤
電子與信息學(xué)報(bào) 2022年4期
關(guān)鍵詞:概念特征方法

代 勁 胡 彪 王國(guó)胤*③ 張 磊

①(重慶郵電大學(xué)計(jì)算智能重慶市重點(diǎn)實(shí)驗(yàn)室 重慶 400065)

②(重慶郵電大學(xué)軟件工程學(xué)院 重慶 400065)

③(重慶郵電大學(xué)旅游多源數(shù)據(jù)感知與決策技術(shù)文化和旅游部重點(diǎn)實(shí)驗(yàn)室 重慶 400065)

1 引言

不確定性是客觀世界的真實(shí)存在,直接導(dǎo)致作為信息加工與知識(shí)獲取的人類認(rèn)知過程具有顯著的不確定性特點(diǎn)。此外,從視知覺拓?fù)浣Y(jié)構(gòu)和功能層次來看,人類認(rèn)知還存在“整體優(yōu)先”(全局認(rèn)知優(yōu)于局部特征)特點(diǎn)[1],通過大范圍優(yōu)先策略形成對(duì)目標(biāo)的快速判斷,并不需要大腦進(jìn)行精確的、深層次的定量分析,一定程度上加劇了認(rèn)知的不確定性。因此,隨著海量數(shù)據(jù)分析與挖掘任務(wù)的急劇增長(zhǎng),研究不確定性知識(shí)的表達(dá)、處理,尋找并且形式化地表示不確定性知識(shí)中的規(guī)律性,讓機(jī)器模擬人類的認(rèn)知過程,使其具有智能,成為當(dāng)前人工智能領(lǐng)域的研究熱點(diǎn)[2,3]。

概念是知識(shí)表達(dá)的基本組成,認(rèn)知的不確定性也不可避免導(dǎo)致概念存在較大的不確定性。其中隨機(jī)性和模糊性是不確定性的最基本內(nèi)涵,而對(duì)應(yīng)的概率論[4]、模糊集[5]、粗糙集[6]等理論模型在實(shí)踐應(yīng)用中都存在一些不足。例如,在模糊集合中,隸屬度通常是依據(jù)專家的先驗(yàn)知識(shí)給定的,具有較強(qiáng)的主觀性;在概率論中,最基本的假設(shè)是排中律,但自然語(yǔ)言中的概念則未必滿足該假設(shè);在粗糙集中,還存在著過擬合難題,導(dǎo)致數(shù)據(jù)挖掘效率不高。究其原因,以上理論對(duì)于認(rèn)知的不確定性理解還存在一定的片面性[7]。在概率論和模糊數(shù)學(xué)基礎(chǔ)上,云模型[8]從概念的隨機(jī)性和模糊性角度綜合進(jìn)行不確定性分析,建立了定性模糊概念與定量精確數(shù)據(jù)的雙向轉(zhuǎn)換模型,較好地解決了概念的不確定性表示及轉(zhuǎn)換,廣泛應(yīng)用于決策分析、智能控制等領(lǐng)域[9–12]。作為云模型的重要研究?jī)?nèi)容,基于云模型的不確定性相似度量(簡(jiǎn)稱相似度量,以下同)也越來越受到學(xué)者重視。例如在決策系統(tǒng)評(píng)估中,運(yùn)用云相似性度量給出的結(jié)果更符合人的認(rèn)知[13];在協(xié)同過濾推薦系統(tǒng)中,基于用戶喜好的相似度量可有效提高推薦的精度[14]。

現(xiàn)有的云模型相似度量方法主要集中在基于精確數(shù)值的量化計(jì)算或基于云模型本身的形狀特征方面,度量結(jié)果具有較大的片面性,不能充分體現(xiàn)云模型的隨機(jī)性與模糊性特點(diǎn),需要將兩者進(jìn)行綜合考慮。基于此思路,借鑒“大范圍優(yōu)先”理論基礎(chǔ)[15],本文提出了一種結(jié)合云模型整體幾何特征與微觀云滴分布貢獻(xiàn)的不確定性相似度量方法。該方法首先利用較大范圍(即粗粒度)上云模型整體幾何特征(包絡(luò)帶)來確定云模型間的相似性計(jì)算范圍;其次,在此計(jì)算范圍內(nèi),結(jié)合云模型的微觀云滴分布貢獻(xiàn),最終得到綜合考慮粗粒度和細(xì)粒度兩方面的度量結(jié)果。

基于以上策略,本文提出了一種基于包絡(luò)帶及其云滴貢獻(xiàn)度的云模型不確定性相似度量方法(Envelope Area of the Contribution based on Cloud Model, EACCM),該方法利用兩個(gè)云模型的含貢獻(xiàn)度包絡(luò)帶重疊面積來衡量其相似性,綜合考慮了云模型模糊性與隨機(jī)性兩方面的特點(diǎn),其相似度量結(jié)果更加合理可信。本文的工作及創(chuàng)新主要如下:

(1)分析了當(dāng)前云模型相似度量方法存在的問題,提出了從整體定性形狀結(jié)合微觀定量貢獻(xiàn)度綜合進(jìn)行度量的策略,并在此基礎(chǔ)上進(jìn)一步提出了基于包絡(luò)帶及其云滴貢獻(xiàn)度的云模型相似度量方法;

(2)借助云模型數(shù)字特征對(duì)本文方法進(jìn)行深入分析,揭示相似度變化趨勢(shì)及特點(diǎn);

(3)通過仿真實(shí)驗(yàn)對(duì)比其他幾種方法,證明本文方法其度量結(jié)果更為科學(xué)合理,更貼合實(shí)際情況。

2 相關(guān)研究

云模型相似性度量的首要問題在于選取合適的相似性計(jì)算模型。現(xiàn)有的云模型相似性度量方法主要包括以下幾類方法:

(1)基于隨機(jī)云滴的距離度量方法。例如,SCM(Similar Cloud Measurement)[16]方法基于云滴之間的距離計(jì)算云之間的相似度,但由于云滴的選取具有一定的隨機(jī)性,因此會(huì)造成度量結(jié)果不穩(wěn)定,而且對(duì)大量云滴進(jìn)行距離的計(jì)算會(huì)帶來較高的時(shí)間復(fù)雜度;文獻(xiàn)[17]提出了一種基于α截集的云相似度計(jì)算方法,該方法通過計(jì)分函數(shù)計(jì)算相似度,但是計(jì)算結(jié)果依賴云滴的數(shù)量,穩(wěn)定性差。

(2)基于云模型數(shù)字特征的度量方法。例如,LICM(LIkeness comparing method based on Cloud Model)[14]方法將云模型的3個(gè)數(shù)字特征組合在一起作為一個(gè)向量,利用兩個(gè)向量夾角的余弦值來衡量云之間的相似性,然而該方法只考慮了云模型數(shù)字特征而并沒有考慮云模型的整體分布特征,而且當(dāng)某個(gè)數(shù)字特征占優(yōu)時(shí),會(huì)忽略其他數(shù)字特征的影響,產(chǎn)生較大的誤差;PSCM[18]方法(Position and Shape based Cloud Model)將云相似度分為形狀相似度和位置相似度,利用云模型數(shù)字特征分別計(jì)算這兩方面的相似度,然后將兩者相乘得到最終的云相似度,該方法較好地解決了計(jì)算復(fù)雜度高的問題,但主觀地將形狀相似度與位置相似度進(jìn)行簡(jiǎn)單運(yùn)算缺乏合理性。

(3)基于云模型幾何形狀特征的方法。如ECM(Expectation based Cloud Model)方法[19]、MCM(Maximum boundary based Cloud Model)方法[19]、CCM(Concept skipping indirect approach of Cloud Model)方法[20]等。這類方法以云的特征曲線與橫軸圍成的重疊面積作為衡量依據(jù)來度量云模型的相似性,計(jì)算復(fù)雜度較低且結(jié)果穩(wěn)定,但是并沒有準(zhǔn)確地描述云的整體分布特征,從而導(dǎo)致以該重疊區(qū)域作為相似性標(biāo)度缺乏合理性解釋。

以上方法各有優(yōu)勢(shì),但也存在不足之處:將云模型整體幾何形狀特征與微觀云滴分布分離,度量結(jié)果具有較大的片面性。因此,迫切需要一種融合以上方法特點(diǎn),綜合考慮云模型幾何形狀特征與不同位置云滴分布貢獻(xiàn)度差異的相似性度量模型。

3 理論基礎(chǔ)

圖1 正態(tài)云模型(0,3,0.3)

根據(jù)外包絡(luò)曲線和內(nèi)包絡(luò)曲線的 3σ原則,包絡(luò)帶有以下性質(zhì):(1)橫軸在[Ex?3(En+3He),Ex+3(En+3He)]之外的區(qū)域因貢獻(xiàn)度非常低,不將其納入包絡(luò)帶的計(jì)算范圍內(nèi)。(2)將橫軸在[Ex?3(En+3He),Ex?3(En?3He)]之間的區(qū)域定義為曲邊梯形(以橫軸為直角邊,橫軸坐標(biāo)為Ex?3(En+3He) 和Ex?3(En?3He)的兩條線段為上下底,外包絡(luò)曲線μw(x)為曲邊)。同理,橫軸在[Ex+3(En?3He),Ex+3(En+3He)]之間的區(qū)域也定義為一個(gè)曲邊梯形(如圖2所示,虛線矩形框中的陰影區(qū)域?yàn)榍吿菪危瑘D中整個(gè)陰影區(qū)域就是本文所指的包絡(luò)帶)。

定義3 云滴貢獻(xiàn)度[21]

1維論域U中,任一小區(qū)間上的云滴群Δx對(duì)定性概念C的貢獻(xiàn)度為ΔA為,具體為

4 云模型相似度量方法

正態(tài)云是目前研究最多也是最重要的一種云模型,而且正態(tài)分布的普適性與鐘形隸屬函數(shù)的普遍性共同奠定了正態(tài)云模型普遍性的基礎(chǔ)。基于此,本文所研究的相似性度量方法也是針對(duì)正態(tài)云模型。

4.1 相似度量策略

定性概念是認(rèn)知的核心內(nèi)容,其主要通過概念內(nèi)涵與概念外延進(jìn)行不確定性表達(dá)。因此,基于云模型的相似度量也應(yīng)從概念內(nèi)涵與外延展開。其中,概念內(nèi)涵往往是根據(jù)大量的概念外延對(duì)象進(jìn)行抽象而成的,其本身就具有一定的抽象性,不適合直接用于精確的相似性度量。因此,本文選擇了基于云模型云滴的分布—即概念的外延來進(jìn)行相似度量。

此外,云模型本質(zhì)是一個(gè)邊界模糊的泛正態(tài)分布,如何合理地描述正態(tài)云圖(正態(tài)云模型的幾何特征),即云滴的分布特點(diǎn)具有重要意義。理論上,表征某個(gè)定性概念的云是由無(wú)數(shù)個(gè)云滴組成的,而通常只用正向云發(fā)生器生成的有限云滴來描述整體云的大致幾何形狀,并進(jìn)行概念定性表征。這些有限的云滴實(shí)際上不足以來描述云模型的整體特征,在此基礎(chǔ)上度量云之間的相似性是不可取的。雖然云滴的確定度具有一定的隨機(jī)性,但是根據(jù)第3節(jié)定義2可知,云滴絕大部分都是分布在包絡(luò)帶中。因此從概率上分析,用包絡(luò)帶來表示云滴分布區(qū)域更為合理。

基于以上分析,可進(jìn)一步探究云模型相似性的度量方法。在云模型對(duì)定性概念的外延描述中,一個(gè)云滴代表的是定性概念在數(shù)量上的一次實(shí)現(xiàn),云滴數(shù)量越多,越能反映這個(gè)定性概念的整體特征。在極限情況下,若云滴的數(shù)量趨于無(wú)窮大,則所有云滴必然會(huì)形成一個(gè)平面區(qū)域,在概率上可以近似等同于包絡(luò)帶。此時(shí)該平面區(qū)域可以最大限度地反映這個(gè)定性概念的整體特征,即云滴的分布特征(云模型的整體幾何特征)。因此,通過云間的包絡(luò)帶進(jìn)行相似度量,相當(dāng)于是用兩個(gè)定性概念的整體特征來進(jìn)行相似性度量,顯然更具有合理性。

4.2 包絡(luò)帶與局部云滴貢獻(xiàn)相結(jié)合的相似度量模型

圖3 云C1(0,2,0.2)和 C2(4,2,0.2)包絡(luò)帶重疊區(qū)域

圖4 云C1(0,2,0.2)和 C2(1,2,0.1)包絡(luò)帶重疊區(qū)域

5 相似度的影響因素及性質(zhì)分析

5.1 位置對(duì)相似度的影響

根據(jù)兩個(gè)云模型形狀特征,可以將期望對(duì)相似度影響規(guī)律分析劃分為下面兩種情形:(1)一個(gè)云完全包含在另一個(gè)云的內(nèi)包絡(luò)曲線內(nèi)(內(nèi)含式);(2)兩個(gè)云不存在一個(gè)云包含在另一個(gè)云的內(nèi)包絡(luò)曲線內(nèi)(非內(nèi)含式)。

(1)內(nèi)含式3He1+3He2≤En1?En2。當(dāng)兩個(gè)云的形狀特征滿足:一個(gè)云完全包含在另一個(gè)云的內(nèi)包絡(luò)曲線內(nèi)時(shí)(即滿足3He1+3He2≤En1?En2),不失一般性,任取兩個(gè)云模型C1(0,2,0.2),C2(0,0.5,0.1),假設(shè)Ex2變化,則可給定期望Ex2的變化過程Ex2∈[0,10.2](當(dāng)超過10.2時(shí),這兩個(gè)云沒有任何重疊區(qū)域)。如圖6(a),其中顯示了期望變化過程中兩個(gè)云模型的3個(gè)典型的重疊情況,其中紅色為云C2。在這個(gè)位置變化過程中,應(yīng)用本文方法計(jì)算出相似度隨期望變化所呈現(xiàn)的變化趨勢(shì),如圖6(a)所示。

圖5 云模型C 1和C 2相對(duì)位置隨Ex2, Ex′2的變化

圖6 相似度隨Ex2, Ex′2, En2和He2變化趨勢(shì)

由圖6(a)可知,相似度隨著期望的增大呈現(xiàn)先增大后減小的趨勢(shì),且開始點(diǎn)和結(jié)束點(diǎn)的相似度都為0。原因在于起始位置和結(jié)束位置兩個(gè)云的重疊面積都為0,因此根據(jù)本文相似度的計(jì)算公式,此時(shí)相似度為0,而在中間位置,兩個(gè)云重疊面積不為0,因此相似度隨著期望的增大呈現(xiàn)先增大后減小的趨勢(shì)且相似度存在最大值。圖6(a)并不是個(gè)例所呈現(xiàn)出的趨勢(shì),而是所有滿足內(nèi)含式的云模型組其位置對(duì)相似度的影響趨勢(shì)。也符合人類的認(rèn)知特點(diǎn):兩個(gè)不同的定性概念之間的相似度不可能一直增大直到1,除非這兩個(gè)概念是一樣的,否則一定存在一個(gè)最大相似度。

由圖6(b)可知,非內(nèi)含式云模型組在開始位置時(shí)相似度為1,在結(jié)束位置時(shí)相似度為0,而且中間相似度變化并不是單調(diào)遞減,而是存在波動(dòng),不具有完全一致的規(guī)律。這里出現(xiàn)的波動(dòng)性是由云模型的形狀特征(重尾分布[22])所決定的,同時(shí)這種復(fù)雜性也是由定性概念的不確定性(隨機(jī)性和模糊性)所決定的:定性概念存在較大的不確定性,其變化過程中其與另一個(gè)概念間的相似度常常會(huì)呈現(xiàn)出波動(dòng)性。

5.2 形狀對(duì)相似度的影響

(1)熵 En對(duì)相似度的影響。假設(shè)初始兩個(gè)云模型完全相同,不失一般性,令C1(0,2,0.2),C2(0,2,0.2)。若En2變化,可給定En2的變化過程En2∈[2,3.2](當(dāng)En2≥3.2時(shí),由5.1節(jié)的情形1可知相似度為0)。圖7(a)和圖7(b)顯示了熵En2變化過程中開始和結(jié)束時(shí)兩個(gè)云模型的重疊情況,其中紅色為云C2。在這個(gè)形狀變化過程中,應(yīng)用本文方法計(jì)算出相似度隨熵變化所呈現(xiàn)的變化趨勢(shì),如圖6(c)所示。

由圖6(c)可知,在開始位置時(shí),云C1與云C2完全重疊,相似度為1,隨著En2的增大,兩者的相似度逐漸減小,直到云C1完全被包含在云C2的內(nèi)包絡(luò)曲線內(nèi),即5.1節(jié)中情形1的情況,此時(shí)相似度為0。圖6(c)說明當(dāng)兩個(gè)云的期望和超熵相等時(shí),其形狀相差越大(熵相差越大)則相似度越低。當(dāng)兩個(gè)云的期望和超熵不相等時(shí),不具有完全一致的規(guī)律。

(2)超熵 He對(duì)相似度的影響。假設(shè)初始是兩個(gè)云模型完全相同,不失一般性,令C1(0,2,0.2),C2(0,2,0.2)。若He2變化,可給定He2的變化過程He2∈[0.2,0.66](當(dāng)3He2≥En2時(shí),云C2霧化)。圖7(a)和圖7(c)顯示了超熵He2變化過程中開始和結(jié)束時(shí)兩個(gè)云模型的重疊情況,其中紅色為云C2。在這個(gè)形狀變化過程中,應(yīng)用本文方法計(jì)算出相似度隨超熵變化所呈現(xiàn)的變化趨勢(shì),如圖6(d)所示。

圖7 云模型C 1和C 2相對(duì)位置隨En2和He2的變化

由圖6(d)可知,在開始位置云C1與云C2完全重疊,相似度為1,隨著超熵的增大,云C2的包絡(luò)逐漸包裹著云C1,兩者的相似度逐漸減小,直到云C2霧化,此時(shí)不在本文方法度量范圍內(nèi)。圖6(d)說明當(dāng)兩個(gè)云的期望和熵相等時(shí),其形狀相差越大(超熵相差越大)則相似度越低。當(dāng)兩個(gè)云的期望和熵不相等時(shí),不具有完全一致的規(guī)律。

兩個(gè)云的相似度在直觀上會(huì)受其位置和形狀的影響,其影響并不相互獨(dú)立,不能將兩者割裂開來,也不能將兩者簡(jiǎn)單地進(jìn)行運(yùn)算,這也是單獨(dú)討論位置和形狀對(duì)相似度影響的復(fù)雜之處。以上例子分析了某些情況下具有的一般規(guī)律,但是多數(shù)情況下還需要根據(jù)具體的云模型組來分析其位置和形狀對(duì)相似度的影響。

5.3 相似度性質(zhì)分析

(1)連續(xù)性。由式(4)可知,相似度SimEACCM(C1,C2)由S1,S2,Sg1和Sg2共同決定,而這4個(gè)面積是通過兩個(gè)云的數(shù)字特征計(jì)算而來的。由式(5)—式(10)可知,S2,S1,Sg1和Sg2作為數(shù)字特征的函數(shù),顯然具有連續(xù)性。因此,相似度作為數(shù)字特征的函數(shù)也具有連續(xù)性。

(2)單調(diào)性。(a)由5.1節(jié)可知,固定 En和H e不變, Ex變化,此時(shí)相似度為 Ex的函數(shù)。在內(nèi)含式和非內(nèi)含式中,相似度隨 Ex的變化并沒有呈現(xiàn)明顯的單調(diào)性。(b)由5.2節(jié)可知,固定 Ex和H e不變且兩個(gè)云的期望和超熵相等時(shí), En變化,此時(shí)相似度為 En的單調(diào)遞減函數(shù);當(dāng)兩個(gè)云模型的期望和超熵不相等時(shí),需要根據(jù)具體的云模型組來分析。(c)固定 Ex和 En不變且兩個(gè)云的期望和熵相等時(shí),He變化,此時(shí)相似度為H e的單調(diào)遞減函數(shù);當(dāng)兩個(gè)云模型的期望和熵不相等時(shí),需要根據(jù)具體的云模型組來分析。

本節(jié)分別從云模型位置特征和形狀特征兩方面研究了其對(duì)云模型間相似度的影響,對(duì)應(yīng)于云模型的數(shù)字特征,也就是其3個(gè)數(shù)字特征對(duì)相似度的影響。可以看出,每個(gè)數(shù)字特征對(duì)相似度都具有一定的影響,這也客觀說明了忽略任意一個(gè)數(shù)字特征都是不合理的。同時(shí)根據(jù)相似度的計(jì)算公式和云數(shù)字特征對(duì)相似度的影響,分析了相似度的連續(xù)性和單調(diào)性。

6 實(shí)驗(yàn)及分析

6.1 裝備保障系統(tǒng)能力評(píng)估實(shí)驗(yàn)

為了進(jìn)一步驗(yàn)證本文方法的應(yīng)用價(jià)值,將本文方法應(yīng)用于軍隊(duì)某裝備保障系統(tǒng)能力評(píng)估[20,23,24],并與CCM方法[20]、MMDCM方法[23]、文獻(xiàn)[17]和文獻(xiàn)[24]中的方法進(jìn)行對(duì)比。實(shí)驗(yàn)中,采用黃金分割法將裝備保障系統(tǒng)的能力論域([0,100])進(jìn)行劃分,共包括優(yōu)、良、中、差和極差這5個(gè)能力等級(jí)(語(yǔ)言原子),對(duì)應(yīng)子區(qū)間以及建立的評(píng)估標(biāo)尺云如表1所示。

表1 能力等級(jí)劃分對(duì)應(yīng)的子區(qū)間及評(píng)估標(biāo)尺

根據(jù)某裝備保障系統(tǒng)能力評(píng)估的結(jié)果,建立的對(duì)應(yīng)目標(biāo)云為T(84.77,4.0,0.4),目標(biāo)云T與各標(biāo)尺云的相交情況,如圖8所示(藍(lán)色為標(biāo)尺云,從左到右分別為極差、差、中、良和優(yōu),紅色為目標(biāo)云)。分別采用CCM方法、MMDCM方法、文獻(xiàn)[17]和文獻(xiàn)[24]中的方法以及本文的方法計(jì)算目標(biāo)云對(duì)各評(píng)估標(biāo)尺云的相似度,結(jié)果如表2所示。

表2 目標(biāo)云與各標(biāo)尺云的相似度

從圖8可以看出,目標(biāo)云T僅與標(biāo)尺云C4和C5部分重疊,而與其他標(biāo)尺云沒有任何重疊,即目標(biāo)云云滴與這些標(biāo)尺云云滴分布在不同的區(qū)域中,在數(shù)量上的實(shí)現(xiàn)完全不同,此時(shí)認(rèn)為目標(biāo)云T與標(biāo)尺云C1,C2和C3的相似度為0。而文獻(xiàn)[17]方法計(jì)算的結(jié)果遠(yuǎn)大于0,這與以上分析相悖。此外,該方法計(jì)算出目標(biāo)云T與標(biāo)尺云C1,C2和C3的相似度差別較大(分別為0.01, 0.53和0.74),這意味著當(dāng)兩個(gè)云存在重疊時(shí),該方法的區(qū)分度不高(未重疊時(shí)相似度已經(jīng)高達(dá)0.74了,因此在重疊時(shí)只有小于0.26的尺度來描述相似度),容易忽略兩個(gè)云之間的細(xì)節(jié)差異。因此,從上面兩方面分析可知,文獻(xiàn)[17]的方法存在一定的片面性。此外,本文方法和對(duì)比方法計(jì)算出的相似度結(jié)果顯示,目標(biāo)云與等級(jí)為“優(yōu)”的評(píng)估標(biāo)尺云最為相似,評(píng)估結(jié)果為“優(yōu)”(根據(jù)最大相似度原則),與實(shí)際相符。

表2的方法其計(jì)算結(jié)果的差別主要體現(xiàn)在目標(biāo)云T與標(biāo)尺云C4和C5的相似度。因此,下面將詳細(xì)分析利用除文獻(xiàn)[17]外的方法計(jì)算目標(biāo)云T與標(biāo)尺云C4和C5相似度存在的差異。如表2所示,本文方法與對(duì)比方法在計(jì)算目標(biāo)云T與標(biāo)尺云C4和C5的相似度時(shí),存在比較大的差異:對(duì)比方法計(jì)算出的目標(biāo)云T與標(biāo)尺云C5的相似度是目標(biāo)云T與標(biāo)尺云C4的相似度的3到4倍;本文方法計(jì)算的這兩組云的相似度差異并不大。在圖8可以直觀地看到,目標(biāo)云T位于標(biāo)尺云C4和C5之間,在橫軸上略偏向標(biāo)尺云C5,而在形態(tài)上這三者的差異并不是很明顯,反而從形態(tài)上目標(biāo)云T與標(biāo)尺云C4更為接近。因此,從直觀上來看,這兩組云的相似度相差不大。這與對(duì)比方法的計(jì)算結(jié)果相矛盾,與本文方法的計(jì)算結(jié)果相一致,這也進(jìn)一步證明了本文方法更為科學(xué)合理,更加貼合實(shí)際情況。

圖8 目標(biāo)云T與各標(biāo)尺云相交情況

6.2 時(shí)間序列分類實(shí)驗(yàn)

面向時(shí)間序列數(shù)據(jù)的分類方法是數(shù)據(jù)挖掘的重要內(nèi)容,且分類過程中使用的相似度度量方法直接決定著分類結(jié)果的準(zhǔn)確性。因此,本小節(jié)利用時(shí)間序列數(shù)據(jù)來進(jìn)一步驗(yàn)證本文相似度量方法的有效性。本實(shí)驗(yàn)采用UCI中的常用時(shí)間序列數(shù)據(jù)集(synthetic control chart dataset),該數(shù)據(jù)集有6類數(shù)據(jù),每類數(shù)據(jù)包含100個(gè)長(zhǎng)度為60的時(shí)間序列數(shù)據(jù)。實(shí)驗(yàn)中,對(duì)每類數(shù)據(jù)采用10折交叉驗(yàn)證,即將每類的100個(gè)數(shù)據(jù)劃分為相等的10份,每次測(cè)試取其中的一份為測(cè)試集,剩下的數(shù)據(jù)為訓(xùn)練集。

本實(shí)驗(yàn)從分析算法分類正確率入手,對(duì)比不同云模型相似度量方法在時(shí)間序列分類中的計(jì)算結(jié)果。在研究各方法分類正確率時(shí),采用最近鄰分類(K-Nearest Neighbors, KNN)算法進(jìn)行分類實(shí)驗(yàn)(K=10)。每個(gè)時(shí)間序列可以通過MBCT-SR逆向云變換算法[25]生成的云模型來表示,然后利用不同的云模型相似度量方法分別計(jì)算每類測(cè)試集與其他數(shù)據(jù)(包括本類訓(xùn)練數(shù)據(jù)和其他類所有數(shù)據(jù))的相似度矩陣,根據(jù)該相似度矩陣,利用KNN算法來計(jì)算分類結(jié)果,進(jìn)而得到每類測(cè)試集的分類正確率(通過10折交叉驗(yàn)證得到),最后計(jì)算6類數(shù)據(jù)分類正確率的均值,得到各方法的分類正確率如圖9所示。其中,對(duì)比方法為PSCM方法[18]、MCM[19]方法、文獻(xiàn)[17]的方法和LICM[14]方法。

由圖9可清楚看到,本文相似度量方法的平均分類正確率最高,其次為PSCM方法和MCM方法,然后是文獻(xiàn)[17]的方法和LICM方法。因此,該實(shí)驗(yàn)驗(yàn)證了本文方法在時(shí)序序列數(shù)據(jù)分類中良好的性能,進(jìn)一步說明了本文方法的有效性。

圖9 不同度量方法分類的正確率

7 結(jié)束語(yǔ)

云模型作為不確定性知識(shí)獲取的重要研究工具,通過隨機(jī)性與模糊性的統(tǒng)一,較好地解決了概念的不確定性轉(zhuǎn)換難題。當(dāng)前云模型間的相似性度量主要集中在基于精確數(shù)據(jù)的量化計(jì)算上,缺乏對(duì)云模型整體特征綜合考慮,度量結(jié)果缺乏科學(xué)性與有效性。綜合考慮云模型整體幾何特征與微觀云滴分布貢獻(xiàn),本文提出了一種基于分布輪廓與局部特征融合的云模型不確定性相似度量方法。該方法既可合理地刻畫出云模型微觀云滴分布特征,又綜合考慮其宏觀數(shù)字特征,較好地實(shí)現(xiàn)了不確定性相似度量中基于定性概念內(nèi)涵與外延的有效結(jié)合。為了分析該方法的合理性與有效性,本文還深入探究了云模型數(shù)字特征對(duì)云模型間相似度計(jì)算的影響,并通過仿真實(shí)驗(yàn)進(jìn)行了驗(yàn)證。本文提出的相似度量方法是對(duì)云模型理論的有效補(bǔ)充完善,在實(shí)際應(yīng)用中,可結(jié)合云模型的各種分析挖掘任務(wù)進(jìn)行使用,進(jìn)一步提升不確定性知識(shí)獲取能力。

猜你喜歡
概念特征方法
Birdie Cup Coffee豐盛里概念店
幾樣概念店
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
學(xué)習(xí)集合概念『四步走』
聚焦集合的概念及應(yīng)用
抓住特征巧觀察
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 国产精品所毛片视频| 第一页亚洲| 欧美国产日韩在线播放| 无码区日韩专区免费系列 | 国产精品午夜电影| 夜夜拍夜夜爽| 久久99国产精品成人欧美| 国产成人艳妇AA视频在线| 亚洲无码高清一区二区| 一级毛片不卡片免费观看| 99r在线精品视频在线播放 | 青草免费在线观看| 久无码久无码av无码| 精品国产成人三级在线观看| 亚洲中文字幕手机在线第一页| 国产无码制服丝袜| 亚洲成人免费看| 无码一区18禁| 中文字幕第4页| 三上悠亚精品二区在线观看| 欧美视频在线播放观看免费福利资源| 午夜无码一区二区三区| 国产精品尤物铁牛tv| 亚洲精品无码日韩国产不卡| 成年看免费观看视频拍拍| 91外围女在线观看| 日韩欧美91| 国产成人精品2021欧美日韩| 国产精品99在线观看| 久久精品aⅴ无码中文字幕| 亚洲欧美日韩高清综合678| 久草国产在线观看| 日本五区在线不卡精品| 天堂成人av| 国产毛片不卡| 四虎综合网| 国产在线观看人成激情视频| 极品私人尤物在线精品首页 | 欧美成一级| 欧美天堂在线| 欧美人与动牲交a欧美精品| 欧美怡红院视频一区二区三区| 亚洲日韩AV无码一区二区三区人| 日韩东京热无码人妻| 一级毛片在线播放免费观看| 亚洲aⅴ天堂| 久无码久无码av无码| 久久久久免费精品国产| 伊在人亚洲香蕉精品播放| 青青青草国产| 久久99国产乱子伦精品免| 呦系列视频一区二区三区| 91无码人妻精品一区| 亚洲一欧洲中文字幕在线| 久久精品人人做人人爽电影蜜月| 日韩在线欧美在线| 久久黄色一级片| 国产在线无码一区二区三区| 国产精品 欧美激情 在线播放| 美女被操黄色视频网站| 精品视频一区二区三区在线播| 日韩色图区| 亚洲精品麻豆| 毛片卡一卡二| 日本不卡免费高清视频| 亚洲大尺码专区影院| 午夜福利在线观看入口| 久久人人妻人人爽人人卡片av| 毛片久久久| 自拍亚洲欧美精品| 欧美日韩高清在线| 国产精品天干天干在线观看| 久草视频福利在线观看| 2021国产在线视频| 久久久久国色AV免费观看性色| 国产美女久久久久不卡| 亚洲欧美自拍视频| 国产成人精品一区二区免费看京| 熟妇丰满人妻| 久青草网站| 亚洲综合18p| 嫩草在线视频|