張海武, 陳曉云
(福州大學數學與計算機科學學院, 福建 福州 350116)
基于判別信息的近鄰保持嵌入降維方法
張海武, 陳曉云
(福州大學數學與計算機科學學院, 福建 福州 350116)
針對傳統近鄰保持嵌入算法(NPE)側重保持樣本的局部結構, 而沒有考慮樣本類別信息的不足, 提出判別局部近鄰保持嵌入算法DLNPE. 該算法利用樣本點的局部結構構造新定義下的類內類間散布矩陣, 并以此作為判別信息引入目標函數. 在6個真實數據上進行實驗, 證明了所提算法的有效性.
降維; 近鄰保持嵌入; 判別信息; 局部結構
在各種降維方法中, 線性降維方法如主成分分析(principal component analysis, PCA)[1]和線性判別分析(linear discriminant analysis, LDA)[2]因其簡單有效而被廣泛使用. 但這些線性方法具有難以保持原始數據非線性流形的缺點. 為此, 研究人員提出流形降維算法如等容特征映射(isometric feature mapping, ISOMAP)[3]、 拉普拉斯特征映射(laplacian eigenmap,LE)[4]、 局部線性嵌入(locally linear embedding,LLE)等[5]. 這些算法在處理非線性結構數據時可以獲得較好結果. 然而它們都有一個共同問題, 即在高維觀測空間和內在低維空間之間建立的隱式映射是定義在訓練集上, 無法處理新來樣本問題. 為克服上述缺點, He等[6]人提出近鄰保持嵌入算法(neighborhood preserving embedding,NPE). 盡管NPE的改進是有效的, 但它沒有考慮樣本的類別信息, 是一種無監督降維方法. 于是, 王國強等[7]受LDA方法啟發, 在NPE基礎上引入全局判別信息, 提出保持近鄰判別嵌入算法(neighborhood preserving discriminant embedding, NPDE). 但NPDE引入的全局判別信息具有對噪聲敏感, 易受樣本分布影響的缺點.
基于NPE和NPDE算法的不足, 提出……