田靜國, 范磊*, 于峻川, 容俊, 黃非, 崔艷芳
(1.航天宏圖信息技術(shù)股份有限公司, 北京 100095; 2.中國自然資源航空物探遙感中心, 北京 100083)
高光譜光學(xué)影像成像過程易受到云的干擾,使得高光譜遙感數(shù)據(jù)中存在大量云覆蓋區(qū)域,影響了遙感影像的質(zhì)量,從而降低了影像的數(shù)據(jù)利用率。去云已成為影像預(yù)處理的一個重要步驟,而其中云檢測是高光譜影像預(yù)處理的首要前提[1-6]。
目前,遙感影像云檢測的方法大體可以分為紋理分析法、機(jī)器學(xué)習(xí)方法和閾值法。紋理分析法利用云的形狀紋理進(jìn)行云檢測,如利用灰度共生矩陣、分形維數(shù)[7-8]等,但該方法僅僅使用紋理特征,很少涉及云的物理遙感特征,其在高光譜數(shù)據(jù)應(yīng)用中的穩(wěn)定性較低、精度有限。機(jī)器學(xué)習(xí)方法主要利用聚類分析或者監(jiān)督分類的方法進(jìn)行云檢測,該方法通過已有的樣本數(shù)據(jù)綜合云的光譜、空間特征,構(gòu)建特定的分類器,如Liu等[9]利用隨機(jī)森林對葵花8號衛(wèi)星影像云檢測,提高了相對官方算法提高了5%的精度;Shao等[10]建立神經(jīng)網(wǎng)絡(luò)分類器,能夠?qū)崿F(xiàn)后厚云和薄云的識別;Cilli等[11]采用支持向量機(jī)(support vector machine,SVM)結(jié)合云樣本,生成云檢測模型實現(xiàn)云檢測;Li等[12]、Segal-Rozenhaimer等[13]基于深度學(xué)習(xí)的方法云檢測,并取得了較高的精度,但是該方法自動化程度較低,需要人為不斷更新樣本,進(jìn)行大量樣本訓(xùn)練用以提高檢測精度,且該算法計算復(fù)雜,不利于快速提取和工程化應(yīng)用。閾值法是利用云在可見光近紅外波段的高反射和熱紅外波段的低溫等物理特征,劃定閾值進(jìn)行云檢測,如Huang等[14]以林覆蓋區(qū)域為背景,通過簡單閾值條件提取出無云像素點作為真實地面參考,并構(gòu)建“光譜-溫度”空間,根據(jù)云層與森林覆蓋地表在該空間的差異,提出了一種適用于森林覆蓋區(qū)域的云檢測方法[14];Luo等[15]利用藍(lán)(blue)、紅(red)、近紅外(near infrared,NIR)以及短波紅外波段的簡單閾值,實現(xiàn)云檢測;Zhu等[16]提出掩碼函數(shù)(function of mask,Fmask)算法,針對云層不同的物理、光譜和溫度特征構(gòu)建云概率影像,實現(xiàn)云檢測,但是這些方法主要基于表觀反射率或地表反射率,需要對原始數(shù)字量化值(digital number,DN)數(shù)據(jù)先進(jìn)行輻射定標(biāo)、大氣校正等復(fù)雜的預(yù)處理步驟,不便工程化運用,且很少結(jié)合云的視覺色彩特征,云檢測精度相對較低。
目前,以上研究方法多是面向多光譜影像,而高光譜相對于多光譜擁有高光譜分辨率、圖譜合一等突出特點,上述方法在一定程度上不適用于高光譜影像。作為中國首顆全譜段高光譜衛(wèi)星的GF5[17],該衛(wèi)星的高光譜數(shù)據(jù)被應(yīng)用于農(nóng)業(yè)遙感、大環(huán)境監(jiān)測等多個領(lǐng)域,但是針對GF5的云檢測,特別是利用視覺特征結(jié)合光譜特征的云檢測較少,故現(xiàn)綜合利用云的視覺色彩特征和光譜特征,提出一種面向GF5原始高光譜影像處理簡單、準(zhǔn)確度高、便于工程化應(yīng)用的高光譜云檢測算法。
高分五號衛(wèi)星(GF5衛(wèi)星)于2018年5月9日發(fā)射成功,其上搭載的高光譜相機(jī)光譜分辨率為5 nm和10 nm,光譜范圍為400~2 500 nm,是世界上首顆實現(xiàn)對大氣和陸地綜合觀測的全譜段高光譜衛(wèi)星,可滿足環(huán)境綜合監(jiān)測等方面的迫切需求,是中國實現(xiàn)高光譜分辨率對地觀測能力的重要標(biāo)志[17]。GF5軌道標(biāo)稱技術(shù)指標(biāo)見表1,可見短波紅外高光譜相機(jī)(advanced hyperspectral imager,AHSI)技術(shù)指標(biāo)見表2。

表2 可見短波紅外高光譜相機(jī)指標(biāo)
首先獲得高光譜數(shù)字量化值(DN)影像,根據(jù)云的物理和視覺特性優(yōu)選紅綠藍(lán)近紅外等波段;根據(jù)優(yōu)選波段的DN影像構(gòu)建色調(diào)-飽和度-明度(hue-saturation-value,HSV)色彩空間,計算歸一化植被指數(shù)(NDVI)、歸一化水分指數(shù)(NDWI)、歸一化雪指數(shù)(NDSI)、歸一化建筑指數(shù)(NDBI)、霾優(yōu)化變換(HOT)等參量;基于HSV色彩空間,分析云的視覺色彩特征,劃定疑似云的色彩空間范圍,并提取疑似云,獲得疑似云影像和疑似非云影像;利用計算的NDVI、NDWI、NDSI等歸一化指數(shù)以及云的物理特征,排除植被、水體、土壤、雪等地物的干擾,并構(gòu)建概率影像;以視覺特征構(gòu)建的疑似非云掩膜影像為基礎(chǔ),結(jié)合概率影像,兩景影像取交集獲得疑似非云概率影像和疑似云概率影像;通過自適應(yīng)閾值劃定算法,判定云分割閾值,超過該閾值的像元為云像元,從而得到云影像;對云影像進(jìn)行云區(qū)域整合和優(yōu)化,通過形態(tài)學(xué)和過濾的方法,去除碎斑塊并填補(bǔ)細(xì)小空洞,最終得到云檢測成果。具體流程圖如圖1所示。
1.2.1 云檢測波段優(yōu)選
GF5高光譜影像共有330波段,波段數(shù)據(jù)眾多,需要對云的光譜特征進(jìn)行分析,優(yōu)選出對云敏感的波段析[18-24]。基于GF5高光譜的原始數(shù)字量值(DN)影像進(jìn)行云光譜特征分析。由表2可知,高光譜一級數(shù)據(jù)的量化位數(shù)為12 bit,所以DN的最大值為4 096,將典型地物DN除以4 096,對DN進(jìn)行歸一化處理,云與植被、水體、雪、裸土地物DN歸一化曲線分布如圖2所示。
由圖2可知,其中在400~900、1 200~1 300、1 500~1 700、2 100~2 200 nm云與其他地物對比最為明顯。在400~900 nm為可見光-近紅外波段,不同地物的反射特征不同,其中水體和植被DN值較低,裸土和雪其次,云的DN值最高,在此光譜范圍內(nèi),晴空下各個地物具有較低的DN,DN歸一化值在0~0.4,但云的DN值在400~700 nm都高于0.9,甚至接近與1,明顯高于其他地物的DN。在1 200~1 300 nm范圍內(nèi),水體的DN最低,接近為0,其次為植被、裸土、雪,DN在0.2左右,云的DN最高,在0.35以上。1 500~1 700 nm光譜范圍內(nèi),水體DN最低,接近0,其次為植被,在0.15左右,再次為裸土和雪,閾值范圍為0.2~0.3,雪的DN最高,在0.3以上。2 100~2 200 nm范圍內(nèi),水體最低,植被在0.1左右,裸土在0.2左右,雪在0.3左右,雪最高,在0.4左右。
根據(jù)云和地物的DN光譜曲線分析,優(yōu)選出480、560、660、860、1 250、1 600、2 200 nm 6個對云敏感的波段,用于云檢測。
1.2.2 HSV色彩空間
HSV是一種將RGB色彩模型中的點在圓柱坐標(biāo)系中進(jìn)行展示的方法,這種表示法比基于笛卡爾坐標(biāo)系的幾何結(jié)構(gòu)RGB更加直觀,更能量化視覺特征,有利于云的識別[25-26]。
在色調(diào)-飽和度-明度(HSV)中,色調(diào)(H)是色彩的基本屬性,用于量化顏色色彩的種類,取值范圍為0°~360°,飽和度(S)是指色彩的純度,越高色彩越純,低則逐漸變灰,取0~100%的數(shù)值,明度(V)取值0~100%。
HSV可由RGB(即高光譜影像的670、560、460 nm的歸一化DN)波段值轉(zhuǎn)化構(gòu)建,具體公式如下。

(1)

(2)
V=max
(3)
R=R′/212
(4)
G=G′/212
(5)
B=B′/212
(6)
式中:R′、G′、B′為高光譜影像中波長為670、560、460 nm處的DN;max為R、G、B中的最大值;min為R、G、B中的最小值。
云的高光譜影像的RGB真彩色合成和HSV假彩色合成如圖3所示。

圖3 GF5高光譜影像HSV合成影像以及云影像
由圖3可知,HSV色彩空間中云呈現(xiàn)紫色、藍(lán)色,薄云呈現(xiàn)為黃色、紅色。其他地物如植被、裸土、城鎮(zhèn)等呈現(xiàn)亮綠色、深綠色和淺藍(lán)色,云陰影呈現(xiàn)黑色。經(jīng)過大量的對比實驗,歸納GF5高光譜云的HSV閾值范圍為0° 1.2.3 云檢測遙感指數(shù) 選取6種遙感指數(shù),分別為NDVI、NDWI、NDSI、NDBI、HOT指數(shù)和SR。具體公式如表3所示。其中,NDVI是歸一化植被指數(shù),可用于檢測植被生長狀態(tài)、植被覆蓋度和消除部分輻射誤差等,云的NDVI多為負(fù)值,而植被的一半為正值,且隨覆蓋度增大而增大;NDWI為歸一化水指數(shù),主要用于提取水體,一般的水體的NDWI為正值,NDWI值越大代表是水體的可能性越高;NDSI為歸一化雪指數(shù),該指數(shù)基于積雪光譜特征提出的,主要應(yīng)用與積雪檢測和提取;NDBI為歸一化建筑指數(shù),用于建筑物提取;HOT指數(shù)用于表征霧霾的嚴(yán)重程度,值越大,霧霾相對越厚。 表3 云檢測遙感指數(shù) 1.2.4 云概率影像 根據(jù)NDVI、NDWI等歸一化參量以及云的光譜特征,排除植被、水體、建筑、土壤、雪等地物在云檢測過程中的干擾,排除植被、水體、土壤的云概率為P1,排除雪、冰、建筑物的云概率P2,并構(gòu)建面向云檢測的概率影像Pcloud。示例影像見圖4。 圖4 GF5高光譜云概率影像 圖5 基于數(shù)學(xué)形態(tài)學(xué)的云區(qū)優(yōu)化整合 當(dāng)NDVI<0.8且NDWI<0.8時,P1為 P1=ρ2 200ρ1 250 (7) 式(7)中:ρ2 200、ρ1 250分別為DN的歸一化值。NDVI和NDWI見表3。 當(dāng)HOT>0時,P2為 P2=HOT|(1-NDSI)|SR|(1-NDBI)| (8) 式(8)中:HOT、NDSI、NDBI、SR計算公式見表3,然后,根據(jù)每個像元的P1、P2值計算每個像元的云概率像元值,進(jìn)而得到整幅影像的云概率像元值,即云概率影像。具體計算公式為 Pcloud=P1P2 (9) 1.2.5 云檢測動態(tài)閾值分割 云概率閾值是基于影像本身的動態(tài)云概率閾值進(jìn)行云檢測,即將云概率影像中的大于某一個閾值的像元,判定為云。根據(jù)影像的HSV色彩空間獲取的疑似非云層區(qū)域M2,再疊加上Pcloud云概率影像分析,通過大量統(tǒng)計,得到云檢測閾值為非層云區(qū)域的云概率82.5%。 1.2.6 云區(qū)域優(yōu)化整合 通過云檢測閾值分割之后,會存在大量碎斑噪聲和云層間隙。需要在閾值分割的基礎(chǔ)上,盡可能消除云檢測噪聲、填補(bǔ)云間隙,并優(yōu)化云的輪廓,使云分布連通和分布合理。故采用過濾處理和數(shù)學(xué)形態(tài)算法。 過濾處理是解決分類圖像中出現(xiàn)的孤島問題。過濾處理使用斑點分組方法來消除這些被隔離的分類像元。類別篩選方法通過分析周圍的4個或8個像元,判定一個像元是否與周圍的像元同組。如果一類中被分析的像元數(shù)少于輸入的閾值,這些像元就會被從該類中刪除。 數(shù)學(xué)形態(tài)算法是指以形態(tài)為基礎(chǔ)的一種數(shù)學(xué)分析工具,可用于視覺圖像分析,常用于二值圖像的分析和處理。主要使用了腐蝕、膨脹2種數(shù)學(xué)形態(tài)算法[33]。 對GF5高光譜影像云檢測結(jié)果的優(yōu)化整合步驟如下。 步驟1在閾值分割的結(jié)果圖6(a)的基礎(chǔ)上,對按照3×3的尺度的腐蝕(對應(yīng)GF5的影像為9個像素),消除結(jié)果如圖6(b)所示。 圖6 高光譜影像云檢測結(jié)果 步驟2在上一步的基礎(chǔ),進(jìn)行5×5尺度(對的GF5的影像為25個像素)的膨脹,結(jié)果如圖6(c)所示。 步驟3在上一步基礎(chǔ)上,進(jìn)行過濾處理,過濾128個像素以下的碎斑,填補(bǔ)128個像素以下的空隙,結(jié)果如圖6(d)所示。 1.2.7 云區(qū)域優(yōu)化整合 采用查準(zhǔn)率(p)和查全率(r)兩個指標(biāo)對云檢查結(jié)果進(jìn)行評價[34]。公式如下。 (10) (11) 式中:Pt為實際是云,并且能夠被正確識別為云的像元數(shù)目;Pf為不是云,但被誤識別為云的像元數(shù)目;Pn為實際是云,但是沒有識別出來是云的像元數(shù)目。 選取典型地區(qū)、不同時期的多景GF5影像,按照本文算法進(jìn)行云檢測,結(jié)果如圖6和圖7所示。 圖7 判定無云的情況 由圖6可知,算法對森林、戈壁、農(nóng)田、冰山等場景下有很好的適用性,能夠很好地將云和冰/雪區(qū)別,但是在檢測薄云和碎云方面,有一定的漏檢,在一些高亮地物有個別錯檢的情況。如圖7所示為被判定為無云的案例。對于不含云的場景如水域、植被、冰雪等地區(qū)中,在無明顯云特征的情況下,算法可成功地將此類影像判定為無云。 選取5組數(shù)據(jù)對算法進(jìn)行定量評價,這5組數(shù)據(jù)包含了森林、高原、平原、沙漠、城鎮(zhèn)等多個場景,覆蓋西北地區(qū)、青藏地區(qū)、東北地區(qū)、華北地區(qū)、南方地區(qū)多個區(qū)域,每組數(shù)據(jù)約30景GF5影像,可以有效代表中國區(qū)的典型地貌,評價結(jié)果具有普遍代表性。 在評價過程中,使用查準(zhǔn)率和查全率兩個指標(biāo),云層分布的真實是由人工目視解譯后勾畫出來的。為了保證算法運行速度的客觀性,算法選取以每景數(shù)據(jù)的中心像元為中心的1 000×1 000的影像塊,進(jìn)行算法運行和定量評價。 算法的運行環(huán)境為一臺CPU為AMD 4800H (主頻2.9 GHz),運行內(nèi)存在16 GB, 512 GB固態(tài)的個人電腦,操作系統(tǒng)為Windows10 家庭版。算法程序由基于GDAL和numpy的python3.8開發(fā)而成。算法的輸入為GF5-AHSI的VN 和SW 原始DN 值tiff影像以及人工勾畫的云矢量文件,經(jīng)過波段篩選、無效值去除、構(gòu)建HSV色彩空間、構(gòu)建云概率影像、動態(tài)閾值分割、云區(qū)域形態(tài)學(xué)優(yōu)化整合、精度評價等步驟后,生成云掩膜文件,格式為geotiff,云檢測矢量文件,格式為shapefile。 定量評價統(tǒng)計表如表4所示。 表4 高光譜影像云檢測算法精度評價 通過對不同場景、不同地區(qū)、不同時間的云檢測結(jié)果進(jìn)行分析,如圖6和圖7以及表4所示,本文算法對于含云大多數(shù)場景,云檢測結(jié)果精度都比較高,云提取的輪廓準(zhǔn)確,云檢測查準(zhǔn)率在87.22%~98.17%,查全率在82.85%~98.34%;算法能夠有效排除雪/冰的影響,算法精度受云形態(tài)的影響較小;算法執(zhí)行效率高,對單景的高光譜運行速度約為25 s。但是該算法在云斑面積較小時會出現(xiàn)漏檢現(xiàn)象;在薄云區(qū)域,由于下墊面光譜信息占主導(dǎo)地位,云的光譜信息較少,會出現(xiàn)漏檢;對于少量高亮的區(qū)域,土壤、建筑有誤檢的情況。 綜合以上分析,得到以下結(jié)論。 (1)提出的色彩空間特征和光譜特征相結(jié)合的云檢測算法,能夠?qū)Σ煌瑘鼍跋翯F5高光譜影像實現(xiàn)云檢測,檢測準(zhǔn)確率在87%以上,可有效排除雪、冰、植被等地物的干擾。 (2)算法執(zhí)行速度快,且不需要對影像數(shù)據(jù)做復(fù)雜的預(yù)處理操作,便于工程化應(yīng)用。





2 結(jié)果與分析
2.1 云檢測結(jié)果展示

2.2 定量評價

2.3 結(jié)果分析
3 結(jié)論