摘 要:傳統(tǒng)的模糊聚類分析方法分兩個(gè)步驟,首先使用目標(biāo)函數(shù)進(jìn)行模糊生成,然后應(yīng)用聚類有效性函數(shù)決定聚類的最佳數(shù)目。針對(duì)模糊形成和有效性驗(yàn)證函數(shù)的內(nèi)在不同所導(dǎo)致的聚類不準(zhǔn)確性,應(yīng)用一種新的基于雙目標(biāo)模糊聚類分析(BOFCM)的聚類方法。同時(shí)將基于三角形隸屬函數(shù)的T-S模糊系統(tǒng)應(yīng)用于非線性系統(tǒng)辨識(shí)中,該方法可以很方便地確定輸入空間的劃分及隸屬函數(shù)的形狀,減少了計(jì)算量。將以上方法應(yīng)用于一個(gè)二階系統(tǒng)辨識(shí)分析,證實(shí)了該方法的有效性。
關(guān)鍵詞:TS模糊模型; 雙目標(biāo)聚類; 三角形隸屬函數(shù); 正交最小二乘法
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-373X(2010)10-0015-03
Cluster Analysis and Identification Method of T-S Fuzzy Model
LIU Cui
(Harbin University of Science and Technology, Harbin 150080, China)
Abstract:The traditional fuzzy clustering analysis has two steps, the objective function was used for fuzzy generation and cluster effectivefunction was used for validating numbers of cluster. However, the intrinsic differences of the formation and validation functions may cause Inaccuracy A fuzzy clustering based on bi-objective (BOFCM) analysis is proposed. Moreover,Triangular membership function based on TS Fuzzy Systems is applied to nonlinear system identification. This method can easily determine the input space location and the shape of membership functions, reducing the computational complexity. The above method is confirmed by applying it to analyse a second-order system .
Keywords:TS fuzzy model; bi-objective fuzzy cluster; triangular membership function; orthogonal least squares method
模糊聚類分析是數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘的一種重要技術(shù),判定聚類結(jié)果是否合理以及如何獲取最佳類別數(shù),屬于聚類有效性問(wèn)題,是聚類分析中的核心問(wèn)題之一[1]。
聚類有效性分析就是尋找最優(yōu)的聚類數(shù)目,使得數(shù)據(jù)劃分貼近實(shí)際情況,聚類目標(biāo)函數(shù)最小。聚類數(shù)C關(guān)系到模糊模型的精確度和復(fù)雜性。在模糊聚類領(lǐng)域,模糊C均值聚類算法(FCM)和適合于該算法的聚類有效性函數(shù)已提出很多。例如Bezdek提出的劃分系數(shù)函數(shù)和劃分熵函數(shù),這兩個(gè)函數(shù)是基于模糊劃分矩陣的隸屬度信息定義的,具有明顯的數(shù)學(xué)意義和良好的數(shù)學(xué)性質(zhì),運(yùn)算簡(jiǎn)單高效。但它們的主要缺點(diǎn)是與數(shù)據(jù)本身缺乏直接聯(lián)系,因而存在局限性,針對(duì)此缺點(diǎn),許多學(xué)者提出同時(shí)考慮隸屬度信息和數(shù)據(jù)集本身結(jié)構(gòu)的聚類有效性函數(shù)[2-3],例如XB,F(xiàn)S和最近提出的PBM,PCAE等。
這里提出一種高效的T-S模糊系統(tǒng)辨識(shí)方法,利用雙目標(biāo)模糊聚類分析同時(shí)確定規(guī)則前件的最佳聚類劃分和聚類數(shù)目,無(wú)需參數(shù)調(diào)整過(guò)程。T-S模型的辨識(shí)采用三角形隸屬函數(shù),大大地減少了計(jì)算量,提高了非線性系統(tǒng)辨識(shí)的快速性。最后利用正交最小二乘法確定規(guī)則后件參數(shù),結(jié)果證實(shí)了其高效性。
1 模糊聚類分析
1.1 傳統(tǒng)的模糊聚類分析方法
(1) 對(duì)于預(yù)先設(shè)定的聚類數(shù)C,進(jìn)行模糊聚類算法以最小化目標(biāo)函數(shù);
(2) 利用聚類有效性函數(shù)來(lái)驗(yàn)證模糊劃分的質(zhì)量;
(3) 對(duì)于不同的聚類數(shù)C反復(fù)進(jìn)行步驟(1),(2);
(4) 基于不同C的有效性函數(shù)值來(lái)決定最優(yōu)聚類數(shù)目。
1.2 雙目標(biāo)模糊聚類方法
聚類有效性函數(shù)兼顧了緊致性和分離性這兩個(gè)主要影響因素。緊致性度量類內(nèi)各樣本之間的緊密程度或一致程度。分離性表示類與類之間的離散程度或相異程度。一個(gè)優(yōu)良的模糊劃分應(yīng)具有盡可能大的類間分離度和盡可能小的類內(nèi)緊致度。
一種新的雙目標(biāo)聚類函數(shù)[4-6]可同時(shí)體現(xiàn)聚類緊致性和分離性,無(wú)需過(guò)多的計(jì)算量即可用于模糊生成,其結(jié)構(gòu)如下:
JW(U,V)=b∑Nd=1∑Cl=1(udl)m‖Sd-vl‖2-
a∑Cl=1∑i 式中:C是聚類數(shù);N是數(shù)據(jù)樣本個(gè)數(shù);Sd的形式為{(xd1,xd2,…,xdn,yd)},這里(xd1,xd2,…,xdn)是輸入量,yd是相應(yīng)的輸出量。vl=(vl1,vl2,…,vln,vln+1)是第l個(gè)聚類中心;udl是第d個(gè)數(shù)據(jù)在第l類里的隸屬度;m>1是設(shè)計(jì)參數(shù),一般取為2;b>0,a≥0,a+b =1分別是聚類分離度和緊密度的權(quán)值。 在BOFCM算法中,目的就是要找到U=[udl]∈MfC和V=(V1,V2,…,VC)使JW(U,V)最小化。 其中: MfC={[udl]|∑Cl=1udl=1,d∈{1,2,…,N}, udl≥0, d∈{1,2,…,N},l(wèi)∈{1,2,…,C} 經(jīng)過(guò)推理,這個(gè)最小化問(wèn)題的充要條件如下: 對(duì)于給定的U,充要條件是: vl=rl-a∑Cs=1(rs/qs)/[1+∑Cs=1(a/qs)]ql,l(wèi)(1) ql=b∑Nd=1(udl)m-aC,rl=b∑Nd=1(udl)mSd 對(duì)于給定的V,充要條件是: udl=1∑Cs=1(‖Zd-vl‖/‖Zd-vs‖)2m-1,d,l(2) 上述逐步充要條件必須滿足如下假設(shè)前提: a<minl∑Nd=1(udl)m∑Nd=1(udl)m+C-1, b>maxlC-1∑Nd=1(udl)m+C-1(3) 算法步驟: (1) 給定數(shù)據(jù)S={S1,S2,…,SN},Sd∈Rn+1。設(shè)定C∈{2,3,…,N-1},m∈(1,∞)。同時(shí)初始化U0∈Mfc,設(shè)定g為一個(gè)非常小的值,初始步長(zhǎng)p=0。 (2) 計(jì)算 a=minl∑Nd=1(udl)m∑Nd=1(udl)m+C-1-g, b=maxlC-1∑Nd=1(udl)m+C-1+g,1≤l≤C 滿足式(3)。 (3) 通過(guò)式(1)利用a,b,Up計(jì)算Vp。 (4) 通過(guò)式(2)利用Vp更新Up到Up+1。 (5) 判定如果Up+1不滿足式(3),進(jìn)行p=p+1回到步驟(2)。 (6) 如果Up+1滿足式(3)則更新U,直到‖Up+1-Up‖<ε,計(jì)算停止;否則p=p+1回到步驟(3)。 上述聚類分析方法流程如圖1所示。 圖1 聚類分析流程圖 2 模糊辨識(shí) 一個(gè)MIMO系統(tǒng)可以由多個(gè)MISO系統(tǒng)組成,具有P個(gè)輸入、單個(gè)輸出的MISO系統(tǒng)的離散時(shí)間模型可由C條模糊規(guī)則組成的規(guī)則集來(lái)表示[7-8],第l條規(guī)則的形式如下: Rl:IF x1 is Al1 and x2 is Al2 and…and xn is Aln, THEN yl=Pl0+Pl1x1+Pl2x2…+Plnxn 式中:l=1,2 ,… C,C為規(guī)則總數(shù);P為結(jié)論參數(shù);yl是規(guī)則Rl的輸出;Alj為第j個(gè)變量的第l個(gè)語(yǔ)言值(模糊集合),其隸屬函數(shù)采用三角形函數(shù)[9]表示如下: vlj≤xj≤vl+1j, uAlj=-(xj-vl+1j)/(vl+1j-vlj) uAl+1j=(xj-vlj)/(vl+1j-vlj) 可看出采用三角形隸屬函數(shù)無(wú)需過(guò)多的參數(shù)求證,大大地減少了計(jì)算量,提高非線性系統(tǒng)辨識(shí)的快速性。T-S模糊模型輸出可使用如下加權(quán)平均法計(jì)算得到: =∑Cl=1ylwl∑Cl=1wl=∑Cl=1δlyl =∑Cl=1δl(pl0+pl1x1+pl2x2+…+plnxn) 式中:δl=wl∑Cl=1wl,wl=Al1∧Al2∧…∧Aln。 最小二乘法是最簡(jiǎn)單的一種辨識(shí)T-S模型后件參數(shù)的方法,但是這種方法只能應(yīng)用于簡(jiǎn)單的非性系統(tǒng)辨識(shí)。對(duì)于復(fù)雜的非線性系統(tǒng),需利用正交最小二乘法[10]辨識(shí)后件參數(shù)。 將N個(gè)輸入/輸出數(shù)據(jù)對(duì)代入上式可得矩陣等式: Y=XP(4) 式中:Y為N×1的矩陣;P=[p10…p1n…pC0…pCn]T; X=δ11δ11x11…δ11x1n…δ1Cδ1Cx11…δ1Cx1n δ21δ21x21…δ21x2n…δ2Cδ2Cx21…δ2Cx2n δN1δN1xN1…δN1xNn…δNCδNCxN1…δNCxNn 采用古典的Gram-Schmidt正交化算法,可將矩陣X分解如下式: X=UL(5) 式中:U∈RN×N,其列向量互為正交;L∈RM×M,M=(n+1)×C,是上三角形矩陣,且其對(duì)角線上元素為1。聯(lián)立式(4)和式(5)可得: Y=ULP=Ug(6) 通過(guò)上述算法可得到U和參數(shù)g,為了求得結(jié)論參數(shù)P,利用如下公式: LP=g P=L-1g(L是可逆矩陣) 總結(jié)模糊辨識(shí)步驟如下: (1) 對(duì)于輸入/輸出數(shù)據(jù)集S應(yīng)用BOFCM聚類分析方法決定最佳規(guī)則數(shù)C和模糊劃分。 (2) T-S模糊模型的前件結(jié)構(gòu)和參數(shù)已由上述聚類分析方法求得,然后采用正交最小二乘法進(jìn)行后件參數(shù)辨識(shí)。 3 仿真實(shí)例 一個(gè)二階系統(tǒng)如下: 初始條件:y(1)=y(2)=0,計(jì)算y(t)。 y(t+2)=y(t+1)y(t)[y(t+1)-2.5]1+y(t+1)y(t+1)+y(t)y(t)+u(t+1) 設(shè)輸入變量為[y(t+1) u(t+1)],輸出變量為y(t+2)。控制信號(hào)u(t+1)取[-1,1]內(nèi)的隨機(jī)序列。 利用上述方程產(chǎn)生100個(gè)采樣數(shù)據(jù),初始C=3,m=17,運(yùn)用本文方法可得最佳聚類數(shù)5及聚類中心: -3.010 2-2.702 2-1.920 3-0.828 90.359 7-0.534 8-0.231 5-0.032 50.211 70.581 8 建立TS模糊模型辨識(shí)[11-12]結(jié)果如圖2所示。 計(jì)算辨識(shí)精度為: δ=1102∑102k=1(yk-k)20.009 3 4 結(jié) 語(yǔ) 本文這種新的聚類分析方法,合并劃分目標(biāo)函數(shù)和有效性函數(shù)成一個(gè),使用一個(gè)模糊函數(shù)找到最優(yōu)劃分,然后應(yīng)用正交最小二乘法辨識(shí)后件參數(shù)。由仿真可知,采用本文的方法可以方便快速的找到最佳聚類數(shù)目和劃分,大大減少了計(jì)算的復(fù)雜性。 圖2 T-S模型輸出與真實(shí)值比較 參考文獻(xiàn) [1]陳舵,李雪.一種基于模糊度的聚類有效性函數(shù)[J].模式識(shí)別與人工智能,2008,21(1):34-40. [2]李雙虎,張風(fēng)海.一種新的聚類有效性分析指標(biāo)[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,28(8):1772-1774. [3]PAL N R, BEZDEK J C.On cluster validity for the fuzzy C-means model[J]. IEEE Trans.on Fuzzy Systems, 1995, 3(3): 370-379. [4]KIMD W,LEE K H. On cluster validity index for estimation of the optimal number of fuzzy clusters[J]. Pattern Recognition, 2004,37, 2009-2025. [5]ABONYIJ, BABUSKA R, SZEIFERT F. Modified Gath-Geva fuzzy clustering for identification of Takagi-Sugeno fuzzy models[J]. IEEE Trans.on Systems, Man, and Cybernetics Part B, 2002, 32, 612-621. [6]ZAHIDN, LIMOURIM, ESSAIDA. A new cluster vali-dity for fuzzy clustering[J]. Pattern recognition,1999,32, 1089-1097. [7]祁宏宇,吳小俊,王士同,等.基于特征選擇和協(xié)同模糊聚類的模糊建模研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(19):46-49. [8]李目,劉祖潤(rùn),年曉紅,等.基于TS模型的非線性系統(tǒng)模糊聚類辨識(shí)方法[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(29):239-241. [9]王凡,楊公訓(xùn).一種TS模糊模型的辨識(shí)方法[J].模式識(shí)別,2006,22(9):291-293. [10]劉福才.基于正交最小二乘的非線性系統(tǒng)模糊辨識(shí)[J].系統(tǒng)工程學(xué)報(bào),2005,20(3):299-301. [11]TAKAGI T, SUGENO M. Fuzzy identification of systems and its application to modeling and control[J]. IEEE Trans. on Fuzzy Systems,Man,and Cybernetics, 2002,15: 116-132. [12]劉叔軍,蓋曉華.Matlab 7.0控制系統(tǒng)應(yīng)用與實(shí)例[M].北京:機(jī)械工業(yè)出版社,2006.