滑文強(qiáng) 王 爽 郭巖河 謝 雯
①(西安郵電大學(xué)計(jì)算機(jī)學(xué)院 西安 710121)
②(西安郵電大學(xué)陜西省網(wǎng)絡(luò)數(shù)據(jù)分析與智能處理重點(diǎn)實(shí)驗(yàn)室 西安 710121)
③(智能感知與圖像理解教育部重點(diǎn)實(shí)驗(yàn)室 國(guó)際智能感知與計(jì)算聯(lián)合研究中心西安電子科技大學(xué) 西安 710071)
極化SAR圖像分類作為極化SAR圖像理解與解譯的重要研究?jī)?nèi)容,近年來受到越來越多研究者的關(guān)注,并廣泛應(yīng)用到各個(gè)領(lǐng)域,如土地覆蓋類型判別、地面目標(biāo)檢測(cè)、地質(zhì)勘探、植被種類判別等[1-3]。根據(jù)分類方法中標(biāo)記樣本和無標(biāo)記樣本的利用方式,極化SAR地物分類方法主要可以分為3種類型:無監(jiān)督分類方法[4,5]、監(jiān)督分類方法[6,7]和半監(jiān)督分類方法[8,9]。
對(duì)于極化SAR圖像分類問題,監(jiān)督分類方法通常比無監(jiān)督分類更容易獲得好的分類結(jié)果,但是監(jiān)督分類方法通常需要充足的標(biāo)記樣本作為訓(xùn)練樣本,而實(shí)際中標(biāo)記樣本的獲取是非常困難,需要耗費(fèi)大量的人力物力。而無標(biāo)記數(shù)據(jù)獲取相對(duì)容易,并且無標(biāo)記的數(shù)據(jù)也能反映數(shù)據(jù)的某些信息,能夠有效地幫助學(xué)習(xí)分類器。因此,如何利用大量的無標(biāo)記樣本對(duì)少量的標(biāo)記樣本進(jìn)行補(bǔ)充輔助訓(xùn)練的半監(jiān)督學(xué)習(xí)方法,引起了研究者的廣泛關(guān)注,成為了當(dāng)前研究的熱點(diǎn)。近年來,很多半監(jiān)督分類方法被提出來,如自訓(xùn)練(Self-training)方法[10]、協(xié)同訓(xùn)練方法(Co-training和Tri-training)[11,12]、標(biāo)簽傳播聚類算法、基于圖的半監(jiān)督分類算法[13,14]和基于半監(jiān)督的神經(jīng)網(wǎng)絡(luò)算法[15-17]等。然而針對(duì)極化SAR圖像分類問題的半監(jiān)督方法研究較少,Hansch[18]提出了一種基于聚類算法的半監(jiān)督極化SAR分類方法,將半監(jiān)督思想同聚類方法相結(jié)合,通過被選擇未標(biāo)記樣本對(duì)聚類中心進(jìn)行約束,利用未標(biāo)記樣本的約束影響聚類中心,獲得更好的分類結(jié)果。為利用極化SAR數(shù)據(jù)中的空間信息,Liu等人[19]提出了基于鄰域約束半監(jiān)督特征提取的極化SAR圖像分類方法。為使半監(jiān)督訓(xùn)練中選擇的未標(biāo)記樣本具有更高的可靠性和多樣性,Wang等人[20]提出了基于改進(jìn)協(xié)同訓(xùn)練的半監(jiān)督極化SAR圖像分類方法,通過協(xié)同訓(xùn)練的方式選擇多樣性的樣本,通過預(yù)選擇的方法增加被選擇樣本的可靠性。此外,結(jié)合深度學(xué)習(xí)方法和半監(jiān)督學(xué)習(xí)思想,Geng等人[21]提出了基于超像素約束的深度神經(jīng)網(wǎng)絡(luò)半監(jiān)督極化SAR分類方法。但是這些半監(jiān)督分類方法都需要一定的標(biāo)記樣本,在標(biāo)記樣本非常少,只有幾個(gè)標(biāo)記像素的條件下,很難獲得較好的分類結(jié)果。因此,本文針對(duì)此問題,提出一種基于鄰域最小生成樹的半監(jiān)督極化SAR圖像分類方法。該方法利用鄰域最小生成樹方法輔助半監(jiān)督學(xué)習(xí),在自訓(xùn)練的過程中通過鄰域最小生成樹輔助的方式選擇更可靠的無標(biāo)記樣本擴(kuò)大訓(xùn)練樣本集,改善分類器的性能。
自訓(xùn)練學(xué)習(xí)方法是一種典型的半監(jiān)督學(xué)習(xí)方法,該方法利用現(xiàn)有的標(biāo)記數(shù)據(jù)訓(xùn)練得到的模型對(duì)無標(biāo)記的樣本進(jìn)行預(yù)測(cè),選擇可靠性高的樣本以及其被賦予的標(biāo)簽加入到標(biāo)記樣本集中,通過不斷循環(huán)的自訓(xùn)練,逐漸增加訓(xùn)練集中的樣本數(shù)量并逐步改善分類器性能,該方法的框架圖如圖1所示。由圖1可以看出,自訓(xùn)練方法的關(guān)鍵是選擇可靠性的樣本,如果選擇的樣本不正確,使錯(cuò)誤的樣本加入到訓(xùn)練集中,不僅不能使分類器性能得到改善反而會(huì)降低分類器的性能。因此,如何選擇高置信度的樣本成為自訓(xùn)練算法的關(guān)鍵。而在極化SAR圖像分類中,由于只有少量的標(biāo)記樣本,在少量標(biāo)記樣本下訓(xùn)練的分類器是一個(gè)弱分類器,直接在弱分類器的結(jié)果中選擇的樣本很難保證其可靠性。如果將錯(cuò)誤標(biāo)記的樣本加入到標(biāo)記樣本集中,反而會(huì)使分類器的性能下降。因此,為增加被選擇樣本的可靠性,結(jié)合極化SAR圖像像素間的空間信息,本文提出了基于鄰域最小生成樹的樣本選擇方法,通過鄰域最小生成樹輔助選擇的方法增加被選擇樣本的可靠性。

圖1 自訓(xùn)練方法Fig. 1 Self-training method
因此,本文算法的主要貢獻(xiàn)為:(1)針對(duì)極化SAR圖像分類中標(biāo)記樣本非常少的問題,提出了一種新的基于鄰域最小生成樹的半監(jiān)督極化SAR圖像分類方法,該方法同時(shí)利用未標(biāo)記樣本和標(biāo)記樣本的信息有效地提高分類正確率;(2)為增加自訓(xùn)練過程中被選擇樣本的可靠性,結(jié)合極化SAR圖像像素間的空間信息,在最小生成樹的基礎(chǔ)上針對(duì)極化SAR圖像分類的特性,提出了基于鄰域最小生成樹樣本選擇方法。
在極化SAR數(shù)據(jù)中,每個(gè)像素點(diǎn)都可以表示為一個(gè)相干矩陣T或協(xié)方差矩陣C

其中,HH表示水平發(fā)射水平接收,VV表示垂直發(fā)射垂直接收,HV表示水平發(fā)射垂直接收。由協(xié)方差矩陣C的矩陣表示形式可以看出,協(xié)方差矩陣是一個(gè)對(duì)角線為實(shí)數(shù)的復(fù)共軛對(duì)稱矩陣,并且由協(xié)方差矩陣轉(zhuǎn)換的9維特征向量通常可以作為極化SAR數(shù)據(jù)特征的一種表示,并在極化圖像處理中取得良好的效果[9],該向量表示為

其中,real()表示實(shí)部,imag()表示虛部。
圖2(a)為美國(guó)舊金山地區(qū)的極化SAR數(shù)據(jù),圖2(b)-圖2(j)為由該數(shù)據(jù)的協(xié)方差矩陣轉(zhuǎn)化的9維特征向量中每一元素增強(qiáng)10倍的灰度圖。由9維特征向量每一元素的灰度圖可以看出,每一元素都可以基本描述原始圖像的大致信息,并且不同元素的灰度圖都不相同,具有一定互補(bǔ)性,因此可以直接做為極化SAR圖像的特征信息來描述極化SAR圖像。
為增強(qiáng)自訓(xùn)練過程中被選樣本的可靠性,在訓(xùn)練過程中逐步優(yōu)化基分類器,結(jié)合極化SAR圖像像素間的空間鄰域信息,本文提出了基于鄰域最小生成樹的樣本選擇方法。

由圖3(a)可以看出任意兩個(gè)節(jié)點(diǎn)都通過帶權(quán)重的邊相連,對(duì)于無向圖G來說,可以由不同的節(jié)點(diǎn)出發(fā)得到不同的生成樹模型。圖3(b)為由權(quán)重最小的邊遍歷所有節(jié)點(diǎn)得到的最小生成樹,對(duì)于無向圖G來說,圖3(b)是其唯一的最小生成樹。

圖2 極化SAR協(xié)方差矩陣中9個(gè)元素的灰度值Fig. 2 The gray value of 9 elements in PolSAR covariance matrix

圖3 帶權(quán)無向圖G及其最小生成樹Fig. 3 Weighted undirected graph G and its minimum spanning tree
本文采用Prim算法[23]計(jì)算最小生成樹,該算法是一種產(chǎn)生最小生成樹的算法。該算法從給定的頂點(diǎn)開始,每次選擇一個(gè)與當(dāng)前頂點(diǎn)最近的一個(gè)點(diǎn),將該點(diǎn)與頂點(diǎn)之間的邊加入到樹中。其形式描述如下:
步驟1 輸入:在一個(gè)加權(quán)無向圖G中,頂點(diǎn)集合為V,權(quán)值邊的集合為E;

步驟1 構(gòu)建無向圖G(V,E),其中V為頂點(diǎn)(已標(biāo)記像素點(diǎn)),用式(3)計(jì)算每一頂點(diǎn)于其8鄰域邊的集合E;
步驟2 選擇頂點(diǎn)其8鄰域內(nèi)與其邊的權(quán)值最小的邊,并對(duì)與其權(quán)值最小的像素點(diǎn)進(jìn)行標(biāo)記,然后將其作為標(biāo)記樣本加入到頂點(diǎn)集合V中;
步驟3 重復(fù)步驟1-步驟2過程直到選擇完整幅圖像中所有的像素點(diǎn)。
該方法中需要計(jì)算各個(gè)頂點(diǎn)之間邊的距離,由于極化SAR數(shù)據(jù)服從復(fù)Wishart分布,因此在極化SAR圖像中,兩個(gè)像素點(diǎn)之間的相似距離通常采用Wishart距離[24]表示

圖4為該算法的生成過程,圖中綠色的矩形表示初始的頂點(diǎn),灰色的矩形表示其鄰域的頂點(diǎn),矩形中的數(shù)字表示中心像素點(diǎn)與鄰域像素點(diǎn)的距離,距離越小越相似。第1次學(xué)習(xí)過程,選擇初始頂點(diǎn)鄰域邊最小的頂點(diǎn),距離為‘1’的點(diǎn),如圖4(b)所示,然后再在新的頂點(diǎn)集合的鄰域內(nèi)選擇邊最小的頂點(diǎn),如圖4(c)所示,添加到以初始頂點(diǎn)為根的樹的集合中,依次循環(huán),直到選擇完所有的頂點(diǎn)為止。
本文針對(duì)極化SAR圖像分類中只有少量標(biāo)記樣本的問題,為在少量標(biāo)記樣本的條件下獲得較高的分類正確率,在傳統(tǒng)自訓(xùn)練方法的基礎(chǔ)上提出了基于鄰域最小生成樹的半監(jiān)督極化SAR圖像分類方法。該方法的核心是在自訓(xùn)練的過程中由大量的無標(biāo)記樣本中選擇可靠的樣本,將其添加到標(biāo)記樣本中,擴(kuò)大標(biāo)記樣本的數(shù)量,逐漸優(yōu)化分類器性能,最終實(shí)現(xiàn)提高分類正確率的目的。為此,結(jié)合最小生成樹方法和極化SAR圖像中像素點(diǎn)的空間信息,提出了基于鄰域最小生成的樣本選擇方法,增加被選擇樣本的可靠性。本文所提方法的整個(gè)框架圖如圖5所示,具體步驟如下:

圖4 基于鄰域的最小生成樹生成過程Fig. 4 The spanning process of neighborhood minimum spanning tree

圖5 基于鄰域最小生成樹的半監(jiān)督極化SAR分類方法Fig. 5 Semi-supervised PolSAR classification based on the neighborhood minimum spanning tree

步驟2 以初始的標(biāo)記像素點(diǎn)為初始頂點(diǎn),構(gòu)建無向圖G,生成多個(gè)鄰域最小生成樹,每一個(gè)樹中的像素點(diǎn)具有相同的標(biāo)記;
步驟3 利用初始的標(biāo)記樣本點(diǎn),以view為每一個(gè)像素點(diǎn)的特征信息訓(xùn)練SVM分類器,并用訓(xùn)練好的SVM分類器對(duì)鄰域最小生成樹標(biāo)記的樣本進(jìn)行測(cè)試;
步驟4 挑選由分類器測(cè)試得到的結(jié)果中與鄰域最小生成樹生成的結(jié)果中標(biāo)記一致的樣本,添加到初始的標(biāo)記樣本集中,更新標(biāo)記樣本集;
步驟5 重復(fù)步驟2到步驟4過程t次,直到得到滿意的分類器;
步驟6 用訓(xùn)練好的分類器對(duì)剩余樣本進(jìn)行測(cè)試。

本文以SVM為基本分類器,采用徑向基核函數(shù)和5倍的交叉驗(yàn)證,為了驗(yàn)證本文算法的有效性,將本文方法與傳統(tǒng)的基于自訓(xùn)練的半監(jiān)督方法(Self-training)[10]、基于SVM分類器的監(jiān)督分類方法(采用徑向基核函數(shù)和5倍的交叉驗(yàn)證)[26]和監(jiān)督Wishart方法[27]進(jìn)行比較,并用總分類正確率和Kappa系數(shù)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)估,所有的實(shí)驗(yàn)進(jìn)行10次,用平均值表示最終的分類結(jié)果。
本實(shí)驗(yàn)中每類別選擇不同數(shù)量的標(biāo)記樣本(10,8, 6, 4)作為訓(xùn)練樣本。圖6(a)為Pauli分解的RGB圖,圖6(a1)為真實(shí)地物。實(shí)驗(yàn)結(jié)果如圖6,表1和表2所示。圖6(b)為本文方法的分類結(jié)果,圖6(c)為傳統(tǒng)Self-training算法的分類結(jié)果,圖6(d)為監(jiān)督Wishart方法的分類結(jié)果,圖6(e)為SVM方法的分類結(jié)果。 表1為每類訓(xùn)練樣本數(shù)量為10時(shí)不同方法的分類正確率。
由表1可以看出,本文分類方法的分類正確率為89.92%,高于Self-training分類方法12.73%,高于SVM分類方法19.62%,高于監(jiān)督Wishart方法10.52%,而且本文方法中大部分類別的分類正確率都高于其它的對(duì)比方法。這主要是因?yàn)楸疚乃岢霭氡O(jiān)督分類算法能夠有效地利用標(biāo)記樣本和無標(biāo)記樣本的信息,并采用鄰域最小生成樹的策略輔助選擇高可靠性的樣本,改善了基分類器的性能。但是本文方法在Rapeseed的分類正確率只有59.58%,低于Self-training方法7.56%。由圖6(b)可以看出,在本文方法中一部分Rapeseed被分為了Wheat 2和Wheat 3,這主要是這幾種農(nóng)作物的葉子形狀非常相近,很難區(qū)別。對(duì)比圖6(c)可以看出,在Selftraining方法中一部分Wheat 2和Wheat 3被錯(cuò)分為Rapeseed,因此雖然在Self-training方法中Rapeseed的分類正確率高,但是Wheat 2和Wheat 3分類正確率要低于本文方法的分類結(jié)果。此外本文方法在Bare soil區(qū)域的分類正確率雖然低于Wishart方法的分類正確率,但是分類正確率也已經(jīng)大于96%。而且由圖6(d)可以看出,Wishart方法將很大一部分Water區(qū)域錯(cuò)劃分為Bare soil區(qū)域,使Water區(qū)域的分類正確率只有46.85%,遠(yuǎn)低于本文方法在該區(qū)域的分類正確率93.35%。由表2可以看出不同標(biāo)記樣本時(shí)本文方法的分類正確率都要高于對(duì)比方法的分類結(jié)果;本文方法的Kappa系數(shù)也高于對(duì)比方法的Kappa系數(shù),而且通過對(duì)比圖6中本文方法和對(duì)比方法的分類結(jié)果表示,也可以看出本文方法的分類結(jié)果的區(qū)域一致性也比其它的對(duì)比方法好。

圖6 Flevoland地區(qū)AIRSAR L波段數(shù)據(jù)不同方法的分類結(jié)果Fig. 6 Classification results of the Flevoland data acquired by AIRSAR
本實(shí)驗(yàn)中分別選擇每類別為不同數(shù)量的標(biāo)記樣本(10, 8, 6, 4)作為訓(xùn)練樣本。圖7(a)為Pauli分解的RGB圖,圖7(a1)為真實(shí)地物。實(shí)驗(yàn)結(jié)果如圖7,表3和表4所示。圖7(b)為本文算法的分類結(jié)果,圖7(c)為Self-training方法的分類結(jié)果,圖7(d)為監(jiān)督Wishart方法的分類結(jié)果,圖7(e)為SVM方法的分類結(jié)果。 表3為每類選10個(gè)標(biāo)記樣本時(shí),不同方法的分類正確率。
由表3和表4可以看出,本文方法的分類結(jié)果明顯高于傳統(tǒng)的Self-training方法,SVM方法和Wishart分類方法。由表4可以看出當(dāng)每類訓(xùn)練樣本數(shù)量10時(shí),本文分類方法的分類正確率為84.03%,高于Self-training分類方法4.58%,高于SVM分類方法10.08%,高于監(jiān)督Wishart方法5.22%。由表3可以看出本文方法在Urban和Cropland區(qū)域的分類正確率都要高于對(duì)比方法,但是在Forest區(qū)域的分類正確率低于監(jiān)督Wishart方法的分類正確率。由圖7(d)可以看出,這主要是因?yàn)閃ishart方法中一部分Cropland區(qū)域被分為了Forest類,雖然Wishart方法的Water區(qū)域分類正確率高,但是Cropland區(qū)域的分類正確率只有55.27%,明顯低于本文所提方法,而且本文方法Forest和Cropland區(qū)域總的分類正確率也要高于Wishart方法。而由表4可以看出選擇不同數(shù)量的標(biāo)記樣本時(shí),本文方法的分類正確率都要高于對(duì)比方法;同時(shí)本文方法的Kappa系數(shù)也高于對(duì)比方法的Kappa系數(shù),而且通過對(duì)比圖7中本文方法和對(duì)比方法的分類結(jié)果圖,也可以看出本文方法的分類結(jié)果的區(qū)域一致性也比其它的對(duì)比方法要好。因此可以得出相同的結(jié)論,本文所提方法要明顯優(yōu)于傳統(tǒng)的分類方法,尤其是在標(biāo)記樣本較少的情況下。

圖7 Flevoland地區(qū)Radarsat-2 C波段數(shù)據(jù)不同方法的分類結(jié)果Fig. 7 Classification result of the Flevoland data acquired by Radarsat-2

圖8 舊金山地區(qū)Radarsat-2 C波段數(shù)據(jù)不同方法的分類結(jié)果Fig. 8 Classification result of the San Francisco data acquired by Radarsat-2
本實(shí)驗(yàn)分別選擇每類別為不同數(shù)量的標(biāo)記樣本(10, 8, 6, 4)作為訓(xùn)練樣本。圖8(a)為Pauli分解的RGB圖,圖8(a1)為真實(shí)地物。實(shí)驗(yàn)結(jié)果如圖8,表5和表6所示。圖8(b)為本文方法的分類結(jié)果,圖8(c)為Self-training方法的分類結(jié)果,圖8(d)為監(jiān)督Wishart方法的分類結(jié)果,圖8(e)為SVM方法的分類結(jié)果。表5為每類選10個(gè)標(biāo)記樣本時(shí),不同方法的分類正確率。
由表5和表6可以看出,本文方法的分類結(jié)果明顯高于傳統(tǒng)的Self-training方法,SVM方法和Wishart分類方法。由表6可以看出當(dāng)每類訓(xùn)練樣本數(shù)量10時(shí),本文分類方法的分類正確率為78.71%,高于Self-training分類方法10.29%,高于SVM分類方法16.31%,高于監(jiān)督Wishart方法4.94%。由表5可以看出本文方法在大部分區(qū)域的分類正確率都要高于對(duì)比方法,但是在Low-Density Urban區(qū)域的分類正確率低于監(jiān)督Wishart方法的分類正確率。由圖8(d)可以看出,這主要是因?yàn)閃ishart方法中Low-Density Urban區(qū)域和High-Density Urban區(qū)域沒有被有效地區(qū)分開,一部分的High-DensityUrban區(qū)域被錯(cuò)分為L(zhǎng)ow-Density Urban,導(dǎo)致雖然Wishart方法的Low-Density Urban區(qū)域分類正確率高,但是High-Density Urban區(qū)域的分類正確率只有42.58%,明顯低于本文所提方法,而且在本文方法中這兩個(gè)區(qū)域總的分類正確率也要高于Wishart方法。而由表6可以看出當(dāng)標(biāo)記樣本數(shù)量不同時(shí),本文方法的分類正確率都要高于對(duì)比方法;對(duì)比本文方法的Kappa系數(shù)和對(duì)比方法的Kappa系數(shù),可以發(fā)現(xiàn)本文方法的Kappa系數(shù)要明顯高于對(duì)比方法的,而且通過對(duì)比圖8中本文方法和對(duì)比方法的分類結(jié)果圖,也可以看出本文方法的分類結(jié)果的區(qū)域一致性也比其它的對(duì)比方法要好。因此我們可以得出相同的結(jié)論,本文所提方法要明顯優(yōu)于傳統(tǒng)的分類方法,尤其是在標(biāo)記樣本較少的情況下。

表1 AIRSAR L波段的Felvoland地區(qū)不同分類算法的分類精度(%)Tab. 1 Classification accuracy of the Flevoland area acquired by AIRSAR L band (%)

表2 AIRSAR L波段的Felvoland 地區(qū)不同訓(xùn)練樣本的分類結(jié)果Tab. 2 Classification results of the Flevoland area acquired by AIRSAR L band with different number of training samples

表3 Radarsat-2 C波段的Felvoland地區(qū)不同分類算法的分類精度(%)Tab. 3 Classification accuracy of the Flevoland area acquired by Radarsat-2 C band (%)

表4 Radarsat-2 C波段的Felvoland 地區(qū)不同訓(xùn)練樣本的分類結(jié)果Tab. 4 Classification results of the Flevoland area acquired by Radarsat-2 C band with different number of training samples

表5 Radarsat-2 C波段的舊金山地區(qū)不同分類算法的分類結(jié)果(%)Tab. 5 Classification accuracy of the San Francisco area acquired by radarsat-2 C Band (%)

表6 Radarsat-2 C波段的舊金山地區(qū)不同訓(xùn)練樣本的分類結(jié)果Tab. 6 Classification results of the San Francisco area acquired by Radarsat-2 C band with different number of training samples
前面的實(shí)驗(yàn)已經(jīng)驗(yàn)證了本文方法的有效性,本節(jié)分析迭代次數(shù)(自訓(xùn)練次數(shù))對(duì)實(shí)驗(yàn)結(jié)果的影響。圖9(a)為迭代次數(shù)對(duì)分類正確率的影響,由圖9(a)可以看出隨著迭代次數(shù)的增加分類正確率逐漸增加,當(dāng)?shù)螖?shù)大于8次的時(shí)候分類正確率的增長(zhǎng)逐漸減小趨于平滑。圖9(b)為迭代次數(shù)所消耗的時(shí)間成本,由圖9(b)可以看出隨著迭代次數(shù)的增加所耗費(fèi)的時(shí)間迅速增加,這主要是因?yàn)殡S著迭代次數(shù)的增加,標(biāo)記樣本數(shù)量增加,最小生成樹的種子點(diǎn)數(shù)量增加,最小生成樹所需要的時(shí)間增加,自訓(xùn)練分類器的時(shí)間也增加。

圖9 迭代次數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響Fig. 9 The effects of number of iterations in the proposed method
本文提出了一種基于鄰域最小生成樹的半監(jiān)督極化SAR圖像分類方法。該方法能夠有效地利用標(biāo)記樣本和無標(biāo)記樣本,通過鄰域最小生成樹輔助學(xué)習(xí)的方式選擇高可靠性的樣本,添加到標(biāo)記樣本集中,通過自訓(xùn)練的方式不斷擴(kuò)大標(biāo)記樣本集,優(yōu)化分類器,使在只有少量標(biāo)記樣本時(shí)能夠獲得較高的分類正確率。并對(duì)3組真實(shí)極化SAR數(shù)據(jù)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明本文方法能夠獲得滿意的分類結(jié)果,尤其是在標(biāo)記樣本非常少的情況下。而且通過選擇不同比例的訓(xùn)練樣本實(shí)驗(yàn)表明相較于傳統(tǒng)的方法本文方法獲得的分類精度更高。此外,通過分析迭代次數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響實(shí)驗(yàn)表明,本文方法選擇的無標(biāo)記樣本是可靠的,通過添加被選擇的無標(biāo)記樣本擴(kuò)大標(biāo)記樣本集逐漸改善分類器的性能。