潘荔君
(中鐵第一勘察設計院集團有限公司, 陜西 西安 710043)
西北航道全長約800海里,位于加拿大北部群島水域之中。隨著全球氣候變暖,冰川融化,西北航道的自然環境發生了相應的變化,作為大西洋與太平洋之間的最短航道,西北航道的經濟效益逐漸顯現。但是航道內海冰的存在對船舶的通行造成了一定的安全隱患,如何對航道內海冰的類型、海冰密度進行量化等問題逐漸成為人們研究的熱點。
現階段,針對海冰的監測手段主要為:目測法、器測法、遙測法。目測法主要是海冰觀測分析人員利用豐富的經驗對海冰的類型及分布進行監測[1];器測法是借助浮標、破冰船、飛機等工具對海冰實行監測[2-4];遙測法則是利用計算機視覺的各類模型對衛星遙感影像進行處理,對大范圍的海域進行實時的海冰監測。由于前兩種方法難以實時監測,因此,越來越多的科研人員采用第三種方法[5-13]。孔毅[14]利用遙感影像的灰度共生矩陣特征和小波特征,對空間域和頻域的紋理特征進行提取,實現對合成孔徑雷達(Synthetic Aperture Radar, SAR)影像的海冰分類;王常穎[15]通過構建屬性差決策樹分類分析方法,充分考慮了SAR影像中原始多極化屬性的特征,對屬性差特征進行有效利用,實現了SAR影像中的海冰分類。張明[16]選擇哨兵一號(Sentinel-1)影像,利用灰度共生矩陣(Grey-Level Co-occurrence Matrix, GLCM)的特征組合,選擇支持向量機(Support Vector Machine, SVM)完成訓練、分類;崔艷榮[17]利用卷積神經網絡應對非線性、網絡結構簡單、可并行運算的優勢,實現對SAR影像中的海冰分類。
越來越多的機器學習模型被應用于海冰分類問題中。支持向量機模型解決二分類、多分類問題上具有的優秀能力,在海冰分類問題中被廣泛地應用。本文選擇Sentinel-1的SAR影像進行海冰分類實驗。為了能夠提高分類模型的魯棒性,本文綜合利用亮度特征與紋理特征的優點,對灰度共生矩陣中的部分結果在不同角度參數下的特征值與灰度特征值進行加權融合,實現對研究區域影像樣本特征的提取;利用支持向量分類器對樣本進行訓練,選擇實驗區域進行分類,并與單獨特征進行精度比較,驗證加權組合特征的分類精度,證明本文方法的正確性。針對海冰分類結果,利用蟻群算法對實驗研究區域進行處理,完成航道的可通行性分析。實驗流程如圖1所示。

圖1 航道通行性分析流程圖
SAR影像中主要的特征包括灰度特征、紋理特征、尺度不變特征變換(Scale-invariant feature transform, SIFT)算子特征、光譜特征等。紋理特征在反映物體表面與周圍環境的關系上,具有非常顯著的優勢,灰度特征則針對場景內回波散射差異較大的地物具有很好地識別區分效果。為了能夠更加準確地區分開研究區域內的海水與海冰,本文構建了加權組合特征進行樣本訓練,比對與單一紋理特征、灰度特征的分類精度,選擇最佳樣本特征。
灰度特征表現在影像上為不同亮度的視覺效果,SAR影像上不同的亮度和紋理,是不同地物對雷達波束的散射差異導致的。海冰與海水物理形態不同,對雷達波束的散射作用有著明顯的差異。海冰能夠表現出更強的后向散射作用,在遙感影像中亮度更高。灰度特征也是采用目測法實現對遙感影像中的海冰分類問題主要的判別手段之一。
影像灰度值的大小不同主要是后向散射能力強弱不同導致的,而且不同的極化方式影像的灰度特征也是不同的。一般情況下,HH極化方式的影像中,自然地物的回波信號較強,因此,本文采用HH極化提取灰度特征。
紋理特征能夠反映SAR影像中物體表面與周圍環境的差異,而不依賴影像的視覺特征,常用來進行海冰分類[18]。
1973年,Haralick等首次提出灰度共生矩陣的概念,對灰度值影像中具有特定位置、灰度值、以及角度的像素對進行統計[19]。灰度共生矩陣P的定義為影像中的某區域R內,具有特定關系的像素對的集合,公式如式(1)所示:
P(i,j)=[p(i,j,d,θ)]
(1)
式中,p為特定關系像素對出現的頻率;i,j,d為R內灰度值為i,j且間隔為d的像素對;θ為兩像素之間的夾角。
Haralice提出由灰度共生矩陣共計14種特征,本文選擇對比度、能量、同質性、相關性4種參數在θ取值為0, 45, 90, 135下的特征值構建加權組合特征。
為了更加準確地區分SAR影像中的海水與海冰,鑒于灰度共生矩陣特征和灰度特征各自的優點,本文選擇對比度、能量、同質性、相關性4種參數在θ取值為0, 45, 90, 135下的16種灰度共生矩陣特征值與灰度特征構建加權組合特征進行樣本訓練,提高分類精度,為后期航道可通行性分析提供準確數據。加權組合特征表達式如式(2)所示:
F=[φ1*Ft,φ2*Fb]
(2)
式中,Ft、Fb分別表示為樣本影像中灰度共生矩陣特征值與灰度特征值的提取結果;φ1、φ2則為加權組合特征中GLCM特征值與灰度特征值的權;φ1/φ2取值不同,分類精度不同。經過多次試驗分析,獲得φ1/φ2的取值經驗值為1,分類精度最高。
為了更好地體現不同特征值的對比結果,本文選取實驗區域內的部分SAR影像多種特征提取結果,特征提取窗口大小為40,特征提取結果如表1所示。通過表1比較可以看出,灰度特征

以及選擇的16種GLCM特征都能直觀地區分研究區域內的海水、海冰。
針對三種不同的特征提取方法,選擇同一實驗研究區域如圖2(a)所示原始影像,分別以灰度特征、GLCM特征以及加權組合特征構建訓練樣本集,進行訓練;利用SVM分類器得到的分類模型對實驗區域進行處理。

圖2 不同特征分類結果
為了更直觀、準確地比較分類模型的精度,對原始影像進行逐像素標簽制作,確定類別,比對分類結果與標簽的異同。實驗結果如圖2(c)~(e)所示。其中,圖2(b)為人工解譯方式制作的標簽影像。將標簽圖像與圖2(c)~(e)進行比對可以看出圖2(e)在細節區域的分類精度要比圖2(d)與圖2(c)的分類精度高,如圖2(e)中框選所示。
為了比較加權組合特征與兩種單獨特征的分類精度,采用混淆矩陣的方式逐像素比對標簽影像與分類結果。由于所選研究區域內為海水、海冰,是二分類問題。假設海水為是(Positive),海冰為非(Negative)。則分類結果可以用PT(True Positive, 將結果為是的判斷為是)、NT(True Negative, 將結果為非的預測為非)、PF(False Positive, 將結果為非的判斷為是)、NF(False Negative, 將結果為是的判斷為非)表示,統計結果如表2~4所示。

表2 灰度特征混淆矩陣

表3 GLCM特征混淆矩陣

表4 加權組合特征混淆矩陣
混淆矩陣逐像素統計了研究區域內海水、海冰預測值與真實值之間的差異。分類結果與真實結果的誤差可以定義為三種類型:第Ⅰ類誤差(誤分類,將海水像素點分為海冰像素點)、第Ⅱ類誤差(錯分類,將海冰像素點分為海水像素點)、總誤差。公式如式(3)~(5)所示:

(3)

(4)

(5)
利用公式(3)~(5)對混淆矩陣進行計算結果如表5所示。

表5 分類結果精度 單位:%
通過表5可以看出,本文提出的加權組合特征在進行訓練樣本特征提取時,相比于單一的特征值在分類精度上有所提高。因此,采用該方式進行遙感影像的海冰分類,為可通行性分析提供數據基礎。
本文選擇的是Sentinel-1超寬幅模式(Extra Wide Swath, EW)獲取的遙感影像進行實驗,影像覆蓋范圍約為400 km,像素間距為40×40 m。為了能夠提高分類精度,采用人工選取樣本的方式構建訓練樣本集,樣本的分布如圖3所示。

圖3 原始影像訓練樣本空間分布
影像中,共選取52塊標志性區域作為樣本,主要包括海水、海冰以及陸地區域。鑒于上述實驗證明加權組合特征的分類精度較高。因此針對選擇的實驗研究區域,用加權組合特征進行特征提取,GLCM與灰度特征的權重比φ1/φ2取值為1。針對選擇的樣本特征利用SVM進行訓練,并利用得到的分類模型對原始影像進行分類。分類結果如圖4所示。

圖4 Sentinel-1影像分類結果
圖4分類結果中,黑色部分為海冰分類結果;灰色部分為分類結果中的海水,白色部分為陸地。通過比對分類結果與原始影像可以看出,分類結果基本正確。
為了能夠對實驗區域內航道的可通行性情況進行分析,本文借助蟻群算法對海冰分類的結果進行處理。選擇實驗區域內10 km×10 km的遙感影像,如圖5(a)所示。利用上述分類方法對研究區域進行分類。針對得到的分類結果進行可通行性分析,如圖5(b)所示。

圖5 研究區域通行性分析結果
研究區域內是否可通行與不同船舶需要的航道寬度有一定的關系。因此利用蟻群算法進行可通行性判斷前,需要設定窗口大小為1的地圖圖元。當窗口內海冰的密度超過60%時,認為當前窗口不可通行。
針對分類結果如圖5(b),以40 m為步距設置不同的窗口大小模擬不同航道寬度下的可通行性。實驗結果如圖5所示。圖5(c)~(h)分別表示窗口大小為80~280 m時,研究區域內左上到右下的可通行性情況。實驗結果證明,當實驗窗口大小為280 m的時候,即船舶要求航道寬度為280 m時可通行,為船舶航行的可行性提供依據。
本文利用Sentinel-1超寬幅模式獲取的遙感影像對研究區域內的海冰分類問題進行研究。實驗結果證明,本文提出的構建加權組合特征進行樣本特征提取,采用SVM完成訓練,獲得分類模型進行分類,相比于單一的GLCM與灰度特征具有更高的準確性。驗證了利用蟻群算法對分類結果進行處理,完成航道可通行性分析的可行性,為船舶的航行及航道的監測提供依據。
實驗中所選取樣本數量有限,為了增加分類模型的普適性,下一步將對樣本數據進行增廣,提升分類模型針對不同場景的識別能力,進一步提高分類結果的準確性。