999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于未標簽信息主動學習算法的高光譜影像分類

2017-09-03 10:23:54羅祎敏馬洪超
計算機應用 2017年6期
關鍵詞:分類

張 良,羅祎敏,馬洪超,張 帆,胡 川

(1.湖北大學 資源環(huán)境學院,武漢 430062; 2.武漢大學 遙感信息工程學院,武漢 430079; 3.國網(wǎng)湖北省電力公司 檢修公司,武漢 430077)

基于未標簽信息主動學習算法的高光譜影像分類

張 良1*,羅祎敏2,馬洪超2,張 帆1,胡 川3

(1.湖北大學 資源環(huán)境學院,武漢 430062; 2.武漢大學 遙感信息工程學院,武漢 430079; 3.國網(wǎng)湖北省電力公司 檢修公司,武漢 430077)

(*通信作者電子郵箱zhangliang_hubeiU@hotmail.com)

針對高光譜遙感影像分類中,傳統(tǒng)的主動學習算法僅利用已標簽數(shù)據(jù)訓練樣本,大量未標簽數(shù)據(jù)被忽視的問題,提出一種結合未標簽信息的主動學習算法。首先,通過K近鄰一致性原則、前后預測一致性原則和主動學習算法信息量評估3重篩選得到預測標簽可信度高并具備一定信息量的未標簽樣本;然后,將其預測標簽當作真實標簽加入到標簽樣本集中; 最后,訓練得到更優(yōu)質的分類模型。實驗結果表明,與被動學習算法和傳統(tǒng)的主動學習算法相比,所提算法能夠在同等標記的代價下獲得更高的分類精度,同時具有更好的參數(shù)敏感性。

高光譜遙感;主動學習;圖像分類;未標簽信息。

0 引言

高光譜遙感圖像分類是圖像處理技術中重要的一類技術,其標簽樣本的獲取十分困難,所以如何利用有限的訓練樣本獲得更優(yōu)的分類模型是一個備受關注的問題[1]。近幾年,隨著機器學習的不斷發(fā)展,越來越多的機器學習算法,如深度學習[2]、遷移學習[3]、流行學習[4]和主動學習已經(jīng)被應用于高光譜遙感圖像分類問題中[5]。其中主動學習算法通過篩選高質量的訓練樣本,從而在有限數(shù)量的訓練樣本幫助下獲得更優(yōu)的分類模型[6],相比于被動學習的隨機選擇樣本進行標注,主動學習算法能通過優(yōu)化選擇訓練樣本,使得訓練集合的構成更有目的性,避免了盲目標注的弊病,提高了分類精度,受到了學界的廣泛關注。然而,能夠成為訓練樣本的標簽數(shù)據(jù)畢竟是少數(shù),在高光譜圖像數(shù)據(jù)中還有大量未標記信息沒有被利用。因此,如何利用未標記的數(shù)據(jù)來輔助標簽數(shù)據(jù),并設計出高效的半監(jiān)督的主動學習算法是一個重要方向[7]。實際上,部分未標注數(shù)據(jù)中可以被分類器預測正確,對于這種未標簽信息如果加入訓練樣本集,將其預測標簽當作真實標簽賦給它們,可能大大降低人工標記的成本[8]。

基于上述考慮,本文提出了一種結合未標簽信息的主動學習算法,通過可信度和信息量的雙重篩選,從未標簽數(shù)據(jù)中選出信息量大且預測標簽可信度高的未標簽數(shù)據(jù),將其預測標簽當作真實標簽使用,并組建新的訓練樣本集,從而訓練得到更優(yōu)質的分類模型。

1 主動學習算法

主動學習的目的就在于選擇出最具標注價值的樣本,獲得最優(yōu)的訓練樣本集,從而達到優(yōu)化分類模型的效果。這個概念最早由Angluin[9]在1988年提出,隨著對其研究的不斷深入,主動學習技術已被廣泛應用于各個領域。Tuia等[10-11]對多種經(jīng)典的主動學習算法在高光譜遙感影像分類上的應用作了歸納,其中包括邊緣取樣主動學習算法、基于支持向量的邊緣取樣算法、熵值裝袋查詢算法和基于后驗概率取樣算法BT(Breaking Ties)。另外,Di 等[12-13]在2012年提出多視圖的主動學習算法,通過不同的波段子集組合投票表示樣本點的分歧度從而得到其標注價值。Crawford 等[14]對以上文獻中經(jīng)典的多種主動學習算法進行了總結論述,并將它們作用于高光譜遙感影像數(shù)據(jù)進行實驗分析。實驗證明,主動學習算法的應用可以顯著地降低樣本標注成本。

就高光譜遙感圖像的分類問題而言,主動學習算法應用的基本流程如圖1所示,其中:C為一個或多個分類器;L為有標簽的訓練樣本集;Q為待標記樣本選擇策略,用于查找未標簽樣本中信息量大的能幫助提高分類精度的樣本;U為整個未標簽樣本集;S為標注專家,負責對Q中篩選出的候選樣本進行人工標記。由圖1可知,主動學習算法的核心是待標記樣本點的選擇策略。選擇策略的目的就是選出對分類器性能和分類效果提高有貢獻的信息量大的待標記樣本點。

圖1 主動學習流程

主動學習算法中,BT算法是建立后驗概率之上的算法,所以,所屬每類概率的獲得是算法實現(xiàn)的基礎。就每個樣本點xi屬于w類的概率p而言,對于支持向量機(Support Vector Machine, SVM)的決策函數(shù)輸出,可以使用sigmoid函數(shù)估計所得,如式(1)所示。

(1)

其中A和B都是估計值[14]。得到每個樣本點所屬每類的概率之后,根據(jù)BT算法的思想,首先通過訓練集構造SVM分類器,再按照式(1)得到將候選集C中每個樣本點屬于各個類別(分類器中N個分類類別)的概率,然后對樣本點最大概率和次大概率差值排序,最后根據(jù)式(2)選取部分差值最小的點作為待標記樣本點,標記后加入到訓練樣本集L中。

(2)

2 結合未標簽信息的主動學習算法

傳統(tǒng)的主動學習算法的每次迭代過程,都有大量不滿足選擇策略Q的未標簽樣本被重新放回至未標簽集U,并在下一次迭代中又重新參與計算,這樣大大增加了算法的時間復雜度和計算復雜度。另一方面,部分未標簽樣本同樣可以提供有效的信息,卻未能被有效利用。因此,本文提出結合未標簽信息的主動學習算法。在原主動學習算法流程之上,針對不滿足條件的未標簽樣本R,采用未標簽樣本選擇策略Q′進行未標簽樣本的篩選,將滿足條件的預測標簽作為真實標簽,使這些未標簽樣本成為標簽樣本,與人工標簽樣本一同加入訓練集L訓練,更新分類模型,算法流程如圖2所示。

由圖2可得,結合未標簽信息的主動學習算法的核心在于未標簽樣本選擇策略Q′。選出的未標簽樣本的預測標簽的可靠性會極大影響訓練樣本集的整體質量。另外,如果篩選出信息量小的未標簽樣本太多,也會削弱大信息量樣本的作用。更糟糕的是,那些信息量小的未標簽樣本一旦被預測錯誤,給分類器帶來嚴重錯誤的訓練信息。所以,為了優(yōu)化分類器,被選出的未標簽樣本及賦予它的預測標簽必須同時具有可靠性和較高的信息量。而其中信息量由不確定度來判斷,不確定度越高的像素點被錯分的概率就越大,就代表其越難被判斷為具體哪一類別,其信息量也就越大。

圖2 結合未標簽信息的主動學習算法流程

針對上述問題,為了篩選出高質量的未標簽樣本,本文設計了如下未標簽信息的選擇策略Q′,這個策略包括三個重要的過程:K近鄰一致性判斷,前后預測一致性判斷和信息量判斷。具體流程如圖3所示,前兩個篩選步驟保證了所選樣本預測標簽的可靠性,最后一個篩選步驟保證了所選樣本的具備較高的信息量,優(yōu)化分類模型。

圖3 未標簽樣本選擇流程

1)K近鄰一致性判斷策略:由K近鄰分類算法思想衍生而來[15],K近鄰分類算法是一種非常經(jīng)典的分類算法,該算法認為,兩個光譜角距離較小的像素相似度較高,被歸于同一類別的可能性也較高。故在這里K近鄰的思想可以被用于保證未標簽樣本預測標簽的可靠性。其方法是將待標記樣本的預測標簽和其相似度最高的K個近鄰的預測或者真實標簽進行比對,如果全部一致,就說明該未標記樣本的預測標簽可信度高,其運算式可表示為式(3)。這里相似度的度量也是采取光譜角距離。對未標簽樣本u來說,不一致系數(shù)的計算如式(1),其中k為所選近鄰個數(shù),fl(u)和fl(xi)為u和xi的預測或真實標簽。

(3)

2)前后預測一致性判斷策略:K近鄰一致性判斷是橫向比較,該一致性判斷是縱向比較,進一步確保未標簽樣本預測標簽的可靠性,通過比較未標簽樣本當前和上一次迭代過程中分類器對其標簽預測的結果進行判斷[8]。如果近鄰標簽和該未標簽樣本預測標簽全部表現(xiàn)一致,就說明這個未標簽樣本的預測標簽可靠。因為前后兩次所訓練出的分類器,對該點的類別判定一致,那么該點預測標簽的可靠性便可進一步得到保證。

3)信息量估計策略:雖然前兩步篩選所得的未標簽樣本的預測標簽正確性可以保證,但是這些點的信息量沒有被評估,如果其中信息量小的未標簽樣本太多,會削弱少數(shù)的信息量大的樣本的作用,而真正能為分類器的優(yōu)化和分類精度的提高做貢獻的是那些信息量大的樣本。所以,需要利用主動學習算法的思想對那些預測標簽正確性有保障的未標簽樣本進行信息量的篩選。利用式(1)和(2)對第1)、2)步已經(jīng)篩選出來未標簽樣本點進行信息量的評估和排序,取信息量較高的未標簽信息加入到訓練樣本集中。

3 實驗與結果分析

3.1 數(shù)據(jù)介紹

本文選用博茨瓦納數(shù)據(jù)(BOTswana,BOT)和美國波士頓數(shù)據(jù)(簡稱KSC)為實驗數(shù)據(jù)。BOT于2001年5月在OkavangoDelta、Botswana地區(qū)采集,該地區(qū)包括濕地和高地兩個生態(tài)系統(tǒng),光譜范圍是 357~2 576nm,光譜分辨率為10nm,空間分辨率為 30m×30m,共 145 個波段。KSC于1996年3月美國肯尼迪航天中心由可見光紅外成像光譜儀拍攝,該地區(qū)同樣包括濕地和高地兩個生態(tài)系統(tǒng),光譜范圍為400~2 500nm,光譜分辨率為10nm,空間分辨率為 18m×18m,共 176個波段。

兩組實驗研究區(qū)域高光譜影像的假彩色影像以及地面真實標記數(shù)據(jù)如圖4~5所示。

圖4 BOT數(shù)據(jù)

圖5 KSC數(shù)據(jù)

3.2 算法有效性分析

為了評價本文算法效果,分別對被動學習算法、主動學習算法和結合未標簽信息的主動學習算法對兩組高光譜影像數(shù)據(jù)的分類結果進行對比。每組實驗數(shù)據(jù)中的標簽數(shù)據(jù)依舊被分為三份:標簽樣本集、未標簽樣本集和測試樣本集。BOT、KSC實驗樣本數(shù)據(jù)分配如表1所示。

表1 實驗樣本數(shù)據(jù)分配

為驗證算法的有效性這里的總體分類精度為20次實驗結果的平均值,近鄰數(shù)K設置為7,取信息量較高的前50%,分類器選擇為支持向量機lib-SVM。對比結果如圖6所示。

圖6 不同數(shù)據(jù)分類精度實驗結果

從圖6中可以得到,結合未標簽信息的主動學習算法優(yōu)于主動學習算法和被動學習算法。其中BOT數(shù)據(jù)在同樣達到效果最為明顯,僅迭代兩次就達到了飽和,分類精度最高高出主動學習算法5.146 4%。對于KSC數(shù)據(jù)效果在前5次迭代時非常明顯,分類精度最高可高出主動學習算法2.796 3%。由此可見,在同等迭代次數(shù)(標記樣本數(shù))下,結合未標簽信息的主動學習算法能夠獲得更高的分類精度。

3.3 參數(shù)敏感性分析

結合未標簽信息的主動學習算法中有一個重要的參數(shù)K,K代表未標簽樣本選擇過程中近鄰一致性判斷的近鄰數(shù)。在不同K值下的對比結果如圖7所示。

圖7 不同數(shù)據(jù)參數(shù)敏感性分析結果

由圖7可知,不同K值下的分類精度曲線差異較小,幾條線基本可以重疊。說明本文算法穩(wěn)定性較好,對參數(shù)K取值敏感性較小。

4 結語

本文提出的結合未標簽信息的主動學習算法,通過可信度和信息量的雙重篩選,從未標簽數(shù)據(jù)中選出信息量大且預測標簽可信度高的未標簽數(shù)據(jù),將其預測標簽當作真實標簽使用,并組建新的訓練樣本集,從而訓練得到更優(yōu)質的分類模型。實驗證明,與被動學習算法和傳統(tǒng)的主動學習算法相比,在同等標記代價下,結合未標簽信息的主動學習算法能夠獲得更高的分類精度。另一方面,未標簽樣本的選擇過程過于繁瑣,計算量過于龐大,有待繼續(xù)探索更高效的解決方案。

)

[1] 郝澤東,余淞淞,關佶紅.基于主動學習的高光譜圖像分類方法[J].計算機應用,2013,33(12):3441-3443,3448.(HAOZD,YUSS,GUANJH.Hyperspectralimageclassificationbasedonactivelearning[J].JournalofComputerApplications, 2013, 33(12): 3441-3443, 3448.)

[2]CHENYC,LINZH,ZHAOX,etal.Deeplearning-basedclassificationofhyperspectraldata[J].IEEEJournalofSelectedTopicsinAppliedEarthObservationsandRemoteSensing, 2014, 7(6): 2094-2107.

[3]RAJANS,GHOSHJ.Exploitingclasshierarchiesforknowledgetransferinhyperspectraldata[J].IEEETransactionsonGeoscienceandRemoteSensing, 2006, 44(11): 3408-3417.

[4]KIMW,CRAWFORDMM.Adaptiveclassificationforhyperspectralimagedatausingmanifoldregularizationkernelmachines[J].IEEETransactiononGeoscienceandRemoteSensing, 2012, 48(11): 4110-4121.

[5] 陳進.高光譜圖像分類方法研究[D].長沙:國防科學技術大學,2010:11-12.(CHENJ.Onclassificationmethodofhyperspectralimages[D].Changsha:NationalUniversityofDefenseTechnology, 2010: 11-12.)

[6]TUIAD,RATLEF,PACIFICIF,etal.Activelearningmethodsforremotesensingimageclassification[J].IEEETransactionsonGeoscienceandRemoteSensing, 2009, 47(7): 2218-2232.

[7] 劉康.基于主動學習的高光譜圖像分類技術研究[D].北京:中國礦業(yè)大學(北京),2014:12-13.(LIUK.Hyperspectralsensingimageclassificationtechnologybasedonactivelearning[D].Beijing:ChinaUniversityofMiningandTechnology(Beijing), 2014: 12-13.)

[8]WANLJ,TANGK,LIMZ,etal.Collaborativeactiveandsemisupervisedlearningforhyperspectralremotesensingimageclassification[J].IEEETransactionsonGeoscienceandRemoteSensing, 2015. 53(5): 2384-2396.

[9]ANGLUIND.Queriesandconceptlearning[J].MachineLearning, 1988, 2(4): 319-342.

[10]TUIAD,RATLEF,PACIFICIF,etal.Activelearningmethodsforremotesensingimageclassification[J].IEEETransactionsonGeoscienceandRemoteSensing, 2009, 47(7): 2218-2232.

[11]TUIAD,PASOLLIE,EMERYWJ.Usingactivelearningtoadaptremotesensingimageclassifiers[J].RemoteSensingofEnvironment, 2011, 115(9): 2232-2242.

[12]DIW,CRAWFORDMM.Viewgenerationformultiviewmaximumdisagreementbasedactivelearningforhyperspectralimageclassification[J].IEEETransactionsonGeoscienceandRemoteSensing, 2012, 50(5): 1942-1954.

[13]DIW,CRAWFORDMM.Multi-viewadaptivedisagreementbasedactivelearningforhyperspectralimageclassification[C]//Proceedingsofthe2010IEEEInternationalGeoscienceandRemoteSensingSymposium.Piscataway,NJ:IEEE, 2010: 1374-1377.

[14]CRAWFORDMM,TUIAD,YANGHL.Activelearning:anyvalueforclassificationofremotelysenseddata[J].ProceedingsoftheIEEE, 2013, 101(3): 593-608.

[15]LIJ,BIOUCAS-DIASJM,PLAZAA.Semi-supervisedhyperspectralimagesegmentationusingmultinomiallogisticregressionwithactivelearning[J].IEEETransactionsonGeoscienceandRemoteSensing, 2010, 48(11): 4085-4098

ThisworkispartiallysupportedbytheNationalNaturalScienceFoundationofChina(41601504).

ZHANG Liang, born in 1986, Ph. D., lecturer. His research interests include machine learning, intelligent classification of remote sensing image, three-dimensional point cloud data processing.

LUO Yimin, born in 1993, M. S. candidate. Her research interests include intelligent classification of remote sensing image.

MA Hongchao, born in 1968, Ph. D., professor. His research interests include machine learning, intelligent classification of remote sensing image, three-dimensional point cloud data processing.

ZHANG Fan, born in 1981, Ph. D., lecturer. His research interests include machine learning, signal processing.

HU Chuan, born in 1985, M. S. candidate. His research interests include machine learning, smart grid.

Hyperspectral remote sensing image classification based on active learning algorithm with unlabeled information

ZHANG Liang1*, LUO Yimin2, MA Hongchao2, ZHANG Fan1, HU Chuan3

(1.FacultyofResourcesandEnvironmentalScience,HubeiUniversity,WuhanHubei430062,China; 2.SchoolofRemoteSensingandInformationEngineering,WuhanUniversity,WuhanHubei430079,China; 3.MaintenanceCompany,StateGridHubeiElectricPowerCompany,WuhanHubei430077,China)

In hyperspectral remote sensing image classification, the traditional active learning algorithms only use labeled data for training sample, massive unlabeled data is ignored. In order to solve the problem, a new active learning algorithm combined with unlabeled information was proposed. Firstly, by realizing triple screening ofKneighbor consistency principle,predict consistency principle, and information evaluation of active learning, the unlabeled sample with a certain amount of information and highly reliable prediction label was obtained. Then, the prediction label was added to the label sample set as real label. Finally, an optimized classification model was produced by training the sample. The experimental results show that, compared with the passive learning algorithms and the traditional active learning algorithms, the proposed algorithm can obtain higher classification accuracy under the precondition of the same manual labeling cost and get better parameter sensitivity.

hyperspectral remote sensing; active learning; image classification; unlabeled information

2016- 10- 31;

2017- 01- 12。 基金項目:國家自然科學基金資助項目(41601504)。

張良(1986—),男,浙江紹興人,講師,博士,主要研究方向:機器學習、遙感影像智能分類、三維點云數(shù)據(jù)處理;羅祎敏(1993—),女,湖北武漢人,碩士研究生,主要研究方向:遙感影像智能分類; 馬洪超(1968—),男,浙江紹興人,教授,博士,主要研究方向:機器學習、遙感影像智能分類、三維點云數(shù)據(jù)處理; 張帆(1981—),男,湖北武漢人,講師,博士,主要研究方向:機器學習、信號處理;胡川(1985—),男,湖北黃石人,碩士研究生,主要研究方向:機器學習、智能電網(wǎng)。

1001- 9081(2017)06- 1768- 04

10.11772/j.issn.1001- 9081.2017.06.1768

P407.8

A

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數(shù)據(jù)分析中的分類討論
按需分類
教你一招:數(shù)的分類
主站蜘蛛池模板: 99一级毛片| 麻豆国产精品视频| av一区二区三区在线观看| 亚洲品质国产精品无码| 国产va在线观看| 欧美视频二区| 无码国内精品人妻少妇蜜桃视频| 亚洲中文字幕国产av| 亚洲免费人成影院| 亚洲综合色吧| 永久在线播放| 草草线在成年免费视频2| 精品無碼一區在線觀看 | 无码AV动漫| 日韩成人免费网站| 99精品视频播放| 久久久成年黄色视频| a级毛片网| 亚洲精品国产成人7777| 国产特级毛片| 国产欧美视频一区二区三区| www亚洲精品| 亚洲精品欧美日韩在线| 免费在线看黄网址| 欧美激情网址| 婷婷亚洲视频| 色播五月婷婷| 热99re99首页精品亚洲五月天| 欧美一区二区丝袜高跟鞋| 亚洲第一视频免费在线| 久久久久无码国产精品不卡| 中文字幕久久精品波多野结| 国产精品成人免费视频99| 日本人又色又爽的视频| 日本午夜影院| 国产爽歪歪免费视频在线观看| 久久无码高潮喷水| 亚洲高清中文字幕| 亚洲日本中文字幕乱码中文| 欧美精品xx| 欧美一级特黄aaaaaa在线看片| 黑人巨大精品欧美一区二区区| igao国产精品| 亚洲首页在线观看| 日本妇乱子伦视频| 欧美精品色视频| 中文天堂在线视频| 欧美在线观看不卡| 人妻无码一区二区视频| 欧美综合区自拍亚洲综合天堂 | 欧美日韩在线亚洲国产人| 青青青国产视频| 国产精品女熟高潮视频| 婷婷色中文网| 成人精品午夜福利在线播放| 全部毛片免费看| 国产黄色免费看| 亚洲国产精品日韩av专区| 国产日本一区二区三区| 美女被操91视频| 欧美黑人欧美精品刺激| 91久久精品国产| 欧类av怡春院| 国产精品久久久久久久伊一| 人妻少妇乱子伦精品无码专区毛片| 在线欧美a| 精品午夜国产福利观看| 日本午夜精品一本在线观看| 国产白浆视频| 毛片免费在线视频| 白浆免费视频国产精品视频| 在线免费看黄的网站| 亚洲香蕉伊综合在人在线| 久热这里只有精品6| 最新日本中文字幕| 九九精品在线观看| 福利在线不卡| 国产91精品调教在线播放| 亚洲成A人V欧美综合天堂| 欧美日韩在线亚洲国产人| 久久久久亚洲Av片无码观看| 99无码中文字幕视频|