陳永明, 林 萍, 何堅強, 姚志壘
(鹽城工學院電氣工程學院,江蘇 鹽城 224051)
中國是世界上濕地生物最豐富的國家之一,也是亞洲濕地類型最齊全、數量最多、面積最大的國家。中國擁有濕地面積6.6×107hm2,約占世界濕地面積的10%,居亞洲第1位,已有30處濕地被列入國際重要濕地名錄[1]。濕地生態系統保護的研究工作對于維持區域生態平衡和保護各種濕地物種有重要的意義。其中,濕地生態系統生境場景溯源的研究可以為分析濕地動植物種群生活環境變化,規劃生態保護區域范圍,約束人類濕地生態區域改造活動,了解濕地生態系統生境功能變化等提供科學分析手段和評判依據[2]。然而,濕地生態系統生境場景溯源研究一直相對滯后,國內外研究文獻也相對較少,主要原因是生態系統生境具有多樣性、復雜性,造成相關研究工作難度較大,要求研究人員具備豐富的多學科知識[3],但生態保護和研究工作關系人類的生產和生活,因此有必要開展此類研究工作。
研究結果表明,空間包絡特征可以用于表述自然場景的5種語義特征,即能反映自然場景具有的紋理區域和起伏輪廓的自然度,能反映自然場景具有的封閉性和廣闊性的開放度,能反映自然場景構建組分大小和組織結構關系的粗糙度,能反映自然場景空間梯度的膨脹度,能反映自然場景險峻環境下傾斜的輪廓險峻度[4]。因此,這5類特征可以被用于描述濕地生態系統生境影像中的植物、生物、水文、地理等因素的全局語義特征信息。傳統的空間網羅方法使用非正交多尺度2D-Gabor濾波器組,容易造成多尺度濾波器組在空間頻率域嚴重交疊,導致在多尺度空間觀測下的濕地生態系統生境場景影像之間產生較多冗余信息輸出,導致部分細節特征信息在濾波頻帶交疊處被覆蓋,進而降低后續算法的溯源精度[5]。本研究提出一種新的空頻域中最優分辨率配置下空間網羅方法抽取給定的濕地生態系統生境影像中語義特征屬性,空頻域中最優分辨率配置指多尺度2D-Gabor濾波器組是近似正交配置,即在空間頻率域的上半峰幅值相互接觸但又不互相重疊,在一定程度上消除原先非正交多尺度濾波器的頻帶交疊造成的冗余特征輸出和部分細節特征信息在濾波頻帶交疊處被覆蓋的影響,進而有助于提升濕地生態系統生境場景的溯源精度。
本研究用中國3類具有代表性的濕地:江蘇鹽城濱海灘涂濕地[6]、四川若爾蓋高原高寒濕地[7]和海南東寨港海岸紅樹林濕地[8]生態系統生境場景圖像對提出的方法進行驗證。
全局空間網羅法采用多分辨率濾波器提取濕地生態系統生境場景特征,其中濾波器采用正弦調制的二維帶通2D Gabor函數[5],其表達式為:

其中,σx和σy是在空間域中高斯函數的帶寬,u0是余弦函數的調制頻率,其傅里葉域表達式為:

其中,u和v為空間頻率變量,σu=1/2πσx,σv=1/2πσy和λ=2πσxσy。上述2D-Gabor函數是可容許小波,但它并不會產生正交分解,因此基于2DGabor函數的小波變換后的濕地生態系統生境場景圖像中會產生冗余信息。
本研究設計一種空間頻率域中最優多分辨率2D-Gabor濾波器,即指濾波器在空間頻率域的上半峰幅值可以相互接觸但又不互相重疊,使得多分辨率下的Gabor濾波器是近似正交的,從而保證濾波器的輸出冗余量最小。最優多分辨率2D-Gabor濾波器構建方法如下:把函數g(x,y)作為母小波,通過適當的尺度和旋轉變換構建自相似的濾波器組:

其中,x′=am(xcosθ+ysinθ),y′=am(-xsinθ+ ycosθ),a為尺度因子,θ=nπ/N,n∈[0,1,…,N],N為旋轉的方向總數。m∈[0,1,…,M],M為在同一旋轉方向上的尺度總數。
τ為尺度因子,可以通過如下公式計算:

其中,Umax和Umin分別為最大和最小徑向中心頻率。變換后的頻率坐標(u′,v′)=(ucosθ+vsinθ,-usinθ+vcosθ)。方程(2)中的傅里葉尺度參數σu和σv可以按如下公式計算:

將原始場景圖像I(x,y)與方程(3)中的最優分辨率配置下的二維Gabor小波函數h′mm(x,y)進行卷積運算,即可以獲得空間包絡法的金字塔式圖像輸出:

其中,?表示二維空間卷積算子。將金字塔式場景圖像按4×4的網格分成16塊,計算每一層金字塔函數圖像gmn(x,y)在不同方向不同尺度上響應的均值統計直方圖:

其中,濾波其方向數為N=8個,尺度數為M= 4個,最終將獲得描述濕地生態系統生境場景信息的自然度、開放度、粗糙度、膨脹度、險峻度等512維語義特征向量[4]。多分辨率濾波器下全局空間網羅法提取的金字塔式場景圖像和空間包絡語義特征向量描述子直方圖示意圖如圖1所示。

圖1 濕地場景,場景圖像金子塔和空間包絡語義特征描述子直方圖Fig.1 Wetland scene,scene image pyramid and histogram of spatial envelope semantic feature descriptors


接著計算其特征值ξ1≥ξ2≥…≥ξN與其對應的特征向量ψ=ψ1,ψ2,…ψN。利用累計方差達到95%來確定特征子空間的主成分數K:

式中P≤95%。其對應的特征向量為ψNK=(ψ1,ψ2,…ψN),由此可以計算出輸入特征在低維子空間中的投影:



其中,大間隔最鄰近算法第1個優化的目標是實現輸入樣本φ()與其目標近鄰的平均度量最小化:


由此該優化問題可以綜合表達為:

最后,根據每一個輸入樣本鄰近的Ω個目標的核空間間距來確定樣本的語義歸屬[10]。
數據庫中有900幅包含江蘇鹽城濱海灘涂濕地、四川若爾蓋高原高寒濕地和海南東寨港海岸紅樹林濕地場景影像樣本,其中每類實例各300個樣本,數據集被隨機劃分為建模集和溯源集兩部分,其中每類實例的建模集包含270個樣本,溯源集包含30個樣本。獲得的濕地生態系統生境場景影像主要由灘涂、土壤、河流、湖泊、樹木、草、苗林、花叢、山脈、道路、動物、天空、陽光、云等生態元素有機構成。如圖2所示,圖像a、圖像b、圖像c為江蘇鹽城濱海灘涂生態系統生境場景,圖像d、圖像e、圖像f為四川若爾蓋高原高寒生態系統生境場景,圖像g、圖像h、圖像i為海南東寨港海岸紅樹林生態系統生境場景。如果缺乏對上述濕地場景影像認知,一般都難于從局部的濕地生態系統生境場景影像中確定這些生態系統生境場景的起源。本研究通過建立濕地生態生境場景影像數據庫來建立場景認知,通過濕地生態場景中生態元素的結構和分布特征來溯源未知的濕地生態系統生境場景。

圖2 濕地生態系統生境場景Fig.2 The wetland ecological habitat scenes in Hainan province
2.2.1 圖像預處理 將獲得的濕地生態系統生境場景數據庫中所有真彩的RGB圖像尺寸大小調整到(250~600)×(250~600)像素之間,然后將這些場景圖像轉換成強度值為0~255的灰色尺度的圖像,轉換公式為:

其中:R表示紅光強度,G表示綠光強度,B表示藍光強度。雖然一些研究結果表明,使用顏色特征可以增強算法整體的性能[11],但本研究的研究重點是改進空間網羅法中2D-Gabor濾波器在空間頻率域中配置屬性來提高溯源算法的精度。
2.2.2 場景建模 濕地生態系統生境場景感知過程分為建模和溯源2個階段。其中,建模階段使用空間網羅特征法提取數據庫中濕地生態系統生境場景的自然度、開放度、粗糙度、膨脹度、險峻度等的語義特征,接著將這些特征用歸一化處理方法進行處理,消除空間網羅特征量綱影響,其次使用數據中心化處理方法來消除空間網羅特征均值漂移的影響,再使用主成分分析法將歸一化和中心化處理后的特征投影到低維特征子空間中提取主成分,消除原始空間網羅特征中無關語義特征分量的影響,其中子空間主成分數利用其相應的累計方差達到95%的置信率來確定[9],使用大間隔最鄰近算法將低維子空間中特征映射高維特征進行語義相似度計算,消除由于特征的非線性造成的影響,最后在高維特征空間中劃分濕地生態系統生境特征的語義歸屬[10]。濕地生態系統生境場景溯源方法如圖3所示。

圖3 濕地生態系統生境場景溯源方法示意圖Fig.3 Sketch map of the approaches for derivation of the wetland ecological habitat scenes
建模數據集的模型預測精度使用k-fold驗證法來估計。試驗同時計算了本研究提出的基于正交配置和現有的非正交配置下濕地生態系統生境場景溯源方法獲得的建模集精度,結果分別如表1和表2所示。
如表1所示,基于正交配置的溯源方法獲得的江蘇鹽城濱海灘涂濕地、四川若爾蓋高原高寒濕地和海南東寨港海岸紅樹林濕地的建模精度分別為61%、75%和79%,表2中基于非正交配置的溯源方法獲得的江蘇鹽城濱海灘涂濕地、四川若爾蓋高原高寒濕地和海南東寨港海岸紅樹林濕地的建模精度分別為61%、72%和79%,江蘇鹽城濱海灘涂濕地、四川若爾蓋高原高寒濕地和海南東寨港海岸紅樹林濕地在建模精度上正交配置的方法相對于非正交配置的方法分別提升了0個百分點,3個百分點和0個百分點。使用正交配置的溯源方法和非正交配置溯源方法獲得的總體建模集的建模精度分別為72%和71%。因此,使用正交配置的溯源方法獲得的總體建模精度提升了1個百分點。通過比較本研究提出的方法與現有的方法可以看出,利用空頻域中最優分辨率配置下可容許小波函數可以消除多分辨率空間中濾波頻帶交疊造成的輸出的冗余特征的影響,提升濕地生態系統生境場景的溯源模型的性能。
2.2.3 場景溯源 在溯源階段,首先使用空間網羅法提取待溯源的濕地生態系統生境場景影像512維空間網羅語義特征,接著將這些特征進行歸一化和中心化處理,其次用主成分分析法將預處理后的特征投影到低維特征子空間中提取主成分,再利用大間隔最鄰近算法將提取的特征主成分映射到高維特征空間中濕地生態系統生境場景數據庫特征類中,計算溯源場景特征與數據庫樣本特征的語義相似度,然后將場景語義相似度值進行排序,最后根據最大相似度值輸出已設定的前N個相應的濕地生態系統生境場景數據庫中影像,其中以樣本種類中次數出現最多的類型作為溯源樣本的參考類別。使用正交配置和非正交配置的溯源方法獲得的溯源集精度計算結果分別見表3和表4。
從表3、表4可以看出基于正交配置的溯源方法獲得的江蘇鹽城濱海灘涂濕地和四川若爾蓋高原高寒濕地的建模精度分別為58%和83%,基于非正交配置的溯源方法獲得的江蘇鹽城濱海灘涂濕地和四川若爾蓋高原高寒濕地的建模精度分別為50%和75%,通過比較可得基于正交配置的溯源方法相應的溯源精度都提升了8個百分點,而海南東寨港海岸紅樹林濕地溯源相應下降了8個百分點。使用正交配置和基于非正交配置的溯源方法獲得的建模集總的溯源精度分別為69%和67%。因此,使用基于正交配置的溯源方法獲得的總體溯源精度提升了2個百分點。試驗結果顯示,使用正交配置溯源方法利用空頻域中最優分辨率配置下的譜函數可以消除多分辨率空間中濾波頻帶交疊造成的輸出冗余特征的影響,在高維語義特征空間中定位濕地生態系統生境特征的歸屬,提升了濕地生態系統生境場景溯源模型的性能。

表1 使用正交配置溯源方法獲得的濕地生態系統生境場景建模精度Table 1 The modelling accuracy attained by using the orthogonal-based configuration methods for derivation of the wetland ecological habitat scenes

表2 使用非正交配置溯源方法獲得的濕地生態系統生境場景建模精度Table 2 The modelling accuracy attained by using the nonorthogonal-based configuration methods for derivation of the wetland ecological habitat scenes

表3 使用正交配置溯源方法獲得的濕地生態系統生境場景溯源精度Table 3 The derivation accuracy attained by using the orthogonal-based configuration methods for derivation of the wetland ecological habitat scenes

表4 使用非正交配置溯源方法獲得的濕地生態系統生境場景溯源精度Table 4 The derivation accuracy attained by using the nonorthogonal-based configuration methods for derivation of the wetland ecological habitat scenes
與前人相關研究結果[12]比較可以發現,部分文獻場景邏輯屬性的識別精度要優于本研究的試驗結果,這主要是因為在之前的文獻中,識別的場景受限于明顯不同的場景類別,如:區分室內和室外場景,城市和市郊場景,城市和鄉村場景等。然而,在本研究中識別的對象屬性僅僅涉及到濕地類型,不同類型的濕地場景圖像具有極為相似的紋理結構和地理空間分布屬性特征,因而造成了機器學習算法在特征認知上的困難。
本研究創新之處在于提出了利用最優分辨率配置下空間網羅方法來溯源中國典型濕地生態系統生境場景,利用空頻域中最優分辨率配置下譜函數可以消除多分辨率空間中濾波頻帶交疊造成的輸出冗余特征的影響,利用主成分分析法在子空間中消除了無關語義特征分量,利用大間隔最鄰近法在高維語義特征空間中定位濕地生態系統生境特征的歸屬,從而提高了濕地生態系統生境場景的溯源精度。本研究提出的方法可以被用于更精確的感知溯源濕地生態系統生境場景的生態因素、地理環境等信息,并且可以用于分析生物生存環境和感知濕地生態系統生境變化。
[1] 李玉鳳,劉紅玉.濕地分類和濕地景觀分類研究進展[J].濕地科學,2014,12(1):102-108.
[2] WARDLE D A,BARDGETT R D,CALLAWAY R M,et al.Terrestrial ecosystem responses to species gains and losses[J].Science,2011,332(6035):1273-1277.
[3] BAI J,CUI B,CHEN B,et al.Spatial distribution and ecological risk assessment of heavy metals in surface sediments from a typical plateau lake wetland,China[J].Ecological Modelling,2011,222(2):301-306.
[4] 楊 昭,高 雋,謝 昭,等.局部Gist特征匹配核的場景分類[J].中國圖象圖形學報,2013,18(3):264-270.
[5] WANG Q,ZHANG X,LI M,et al.Adaboost and multi-orientation 2D Gabor-based noisy iris recognition[J].Pattern Recognition Letters,2012,33(8):978-983.
[6] LIU C,JIANG H,HOU Y,et al.Habitat changes for breeding waterbirds in Yancheng National Nature Reserve,China:A remote sensing study[J].Wetlands,2010,30(5):879-888.
[7] XIAO D,TIAN B,TIAN K,et al.Landscape patterns and their changes in Sichuan Ruoergai wetland national nature reserve[J].Acta Ecologica Sinica,2010,30(1):27-32.
[8] XIN K,HUANG X,HU J,et al.Land use change impacts on heavy metal sedimentation in Mangrove wetlands—A case study in Dongzhai harbor of Hainan,China[J].Wetlands,2014,34(1): 1-8.
[9] ABDI H,WILLIAMS L J.Principal component analysis[J].Wiley Interdisciplinary Reviews:Computational Statistics,2010,2 (4):433-459.
[10]HU Q,ZHU P,YANG Y,et al.Large-margin nearest neighbor classifiers via sample weight learning[J].Neurocomputing,2011,74(4):656-660.
[11]VAN DE SANDE K E A,GEVERS T,SNOEK C G M.Evaluating color descriptors for object and scene recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(9):1582-1596.
[12]OLIVA A,TORRALBA A.Building the gist of a scene:the role of global image features in recognition[J].Progress in Brain Research,2006,155:23-36.