999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聲吶圖像的水下目標識別研究綜述

2022-11-21 08:35:48檀盼龍吳小兵張曉宇
數字海洋與水下攻防 2022年4期
關鍵詞:方法模型

檀盼龍,吳小兵,張曉宇

(1. 南開大學 人工智能學院,天津 300350;2. 海軍研究院,北京 100161)

0 引言

隨著水下探測需求的日益增長,水下目標識別成為近年來非常活躍的研究領域之一,其在水環境測深與建模[1]、海床建模與繪圖[2]、海底管道探測[3]、海底目標定位與識別[4]以及水雷、潛艇等水下目標物的探測[5]等領域得到了廣泛的應用。無線電信號和視覺信號在水介質中的衰減較快,而聲波在水中可以傳播得更遠,因此聲探測是感知水下目標的有效方法[6],近年來,聲吶設備的使用也呈爆發式增長。與陸地和空中的圖像獲取方法相比,水下圖像的獲取更加困難,而且存在成本高、質量差等缺點,可用于分析和研究的聲吶數據往往數量和質量均有不足,這給水下目標的探測與識別帶來諸多挑戰。如何提高目標識別的準確率和快速性、降低計算和通信成本以及減小識別算法的復雜度,都是水下目標識別中面臨的關鍵問題。

水下目標的識別主要依靠聲吶設備,包括前視聲吶[7]、側掃聲吶[8]和合成孔徑聲吶[9]等,一般通過在航行中不斷發射和接收聲吶信號實現目標探測。探測聲吶基于目標物對入射聲波的反向散射原理探測水下目標形態,能夠直觀地提供水下目標物形態的聲成像[10]。隨著聲吶技術的發展,合成孔徑聲吶等新型聲吶設備可以得到更高的方位方向分辨力[11],且這種分辨力與水下探測距離無關,距離越大,合成孔徑長度越長,合成陣的角分辨率越高,從而抵消了距離的影響,保持分辨力不變。

水下目標識別過程一般包括特征提取和目標分類等[12],經過多年的發展,已經提出了多種基于聲吶圖像的水下目標識別算法。傳統的信號處理方法,如短時傅里葉變換(Short Time Fourier Transform,STFT)、希爾伯特–黃變換[13]、小波變換[14]等,都可以用來提取水下聲信號的特征。此外,常用的目標檢測算法有基于恒虛警率(Constant False Alarm Rate,CFAR)檢測算法[15]、單元平均恒虛警率(Cell Averaging-Constant False Alarm Rate,CA-CFAR)算法[16]和累積單元平均恒虛警率(Accumulated Cell Averaging-Constant False Alarm Rate,ACA-CFAR)算法[17]等,此類算法通過將設定閾值與聲吶圖像的像素灰度進行比較以實現水下目標的檢測與識別。然而,這些算法未能充分考慮結構特征,導致了如魯棒性差和識別率低等問題[18]。在選擇特征時,使用傳統的信號處理方法比較方便,但需要專家監督來保證特征選擇的有效性。聲吶系統和聲吶技術的發展為水下目標的探測識別提供了更加豐富的細節信息,尤其為對水雷等幾何外形較小的目標探測提供了可能,但傳統的信號處理算法和機器學習算法對這類非顯著目標存在較高的漏檢可能,而深度學習算法可以通過深度神經網絡實現更高的識別率。因此,研究人員正試圖用神經網絡和深度學習算法等智能系統取代人工特征提取或傳統的信號處理方法,以跟蹤、檢測和分類水下聲學信號。

針對聲吶圖像識別的相關問題和進展,本文給出了聲吶圖像預處理、聲吶圖像分割以及聲吶圖像智能識別方面的最新研究進展,總結了相關方向亟待解決的科學問題及未來發展趨勢。

1 水下目標識別預處理

水下目標識別預處理過程主要是指聲吶圖像去噪,目的是通過減弱或者消除干擾信號得到更清晰、質量更好的圖像。通過提高聲吶圖像的信噪比提高目標識別精度,是整個圖像處理過程中非常重要的一步。聲吶圖像去噪可以分為空間域方法和變換域方法2類,其中空間域方法直接通過對聲吶圖像本身的像素點灰度值進行處理實現降噪,而變換域方法則將聲吶圖像通過域轉換方式在新空間中對其特征進行分析。

1.1 空間域聲吶圖像去噪方法

空間域去噪方法實現過程相對簡單,主要包括中值濾波和均值濾波等[19-21]。均值濾波是典型的線性濾波算法,通過對像素點鄰域的數值進行平均,再將均值賦予當前像素實現去噪。均值濾波雖然實現簡單,但會使局部特征變模糊,不利于后續處理。相對而言,中值濾波是一種非線性濾波算法,實現方式是將像素點鄰域中各點值的中值代替該點的值,從而消除孤立的噪聲點。中值濾波可以較好保留聲吶圖像的邊緣信息,但也很容易產生邊緣抖動,因此進一步的研究轉向了自適應中值濾波、多級中值濾波等方法。在文獻[22]中,研究人員提出了基于極值等方法的中值濾波改進算法,對具有先驗知識的聲吶圖像噪聲進行濾波。然而,水下環境中存在的噪聲復雜多變,噪聲信息的模型很難獲取,導致上述方法存在著去噪與保持圖像細節的矛盾。因此,如何針對不同特性的噪聲選擇有效的聲吶圖像去噪方法,既能去除噪聲又能完整地保持圖像的特征信息,是水下聲吶圖像去噪的一個難點問題。

針對聲吶圖像去噪中的矛盾問題,目前最常用的解決思路是采樣基于偏微分方程(Partial Differential Equation,PDE)的方法,通過求解方程最優解實現去噪。目前已提出的偏微分方程模型有:TV(Total Variation)模型、ROF(Rudin-Osher- Fatemi)模型、PM(Perona-Malik)模型以及高階變分模型等[23-26]。高階變分模型在消除聲吶圖像中的階梯效應方面具有優勢,如利用拉普拉斯算子構造高階PDE模型實現濾波[27],但在實際應用中不能保持清晰的邊界形態。總體來說,空間域去噪方法具有較大的局限性,很難實現降噪性能的綜合提高。

1.2 變換域聲吶圖像去噪方法

變換域去噪方法是將聲吶圖像從空間域轉換到變換域,然后在變換域中對數據進行處理和分析,最后通過反變換回到空間域以實現去噪,盡可能多地保留了聲吶圖像在多尺度下的特征信息。經典的變換方法有傅里葉變換、小波變換等[28-29]。目前變換域去噪方法應用較多的是小波域HMT模型(Hidden Markov Tree Model),在去噪時,采用混合高斯模型刻畫各子帶系數的概率分布,并利用多個尺度之間的馬爾可夫依賴性描述小波系數隨尺度變化的持續性和尺度內的聚集性,從而對小波系數之間的關系進行分析[30]。為突破一維小波的局限性,DACUNHA等[31]提出了Contourlet變換法對聲吶圖像中存在的高斯噪聲和普通加性噪聲進行處理,雖然達到了較好的去噪效果,但Contourlet變換不具備平移不變性,因此會引入偽吉布斯現象,導致觀察效果和識別率的降低。針對該問題,研究人員舍棄Contourlet變換中的下采樣環節,通過非下采樣Contourlet變換實現了變換的平移不變性,與閾值法相結合有效抑制了聲吶圖像中的噪聲。文獻[32]更是通過將Contourlet變換與HMT模型相結合分析和描述聲吶圖像不同方向間系數相關性,同時再利用貝葉斯準則估計無噪聲吶圖像的Contourlet系數,對于對比度差、特征信息弱的聲吶圖像處理效果更佳。

2 圖像分割方法

在成像聲吶的實際應用中,聲吶圖像分割通常是一個基礎且重要的步驟。聲吶圖像分割的目的是將聲吶圖像劃分為不同的部分,從海底背景中提取目標和陰影并盡量保留圖像原始邊緣信息。相對于光學圖像,聲吶圖像具有低分辨率和高噪聲的特點,同時還受到海底混響的影響,導致聲吶圖像分割成為了該領域的難題,很多國家的研究人員都在聲吶圖像分割方法的研究方面做了大量工作。在聲吶圖像分割算法中,主要可以分為有監督和無監督2種。

2.1 監督分割算法

聲吶圖像的監督分割是基于實況分割訓練集進行分類器訓練的過程,常用方法是基于反向散射(Back Scatter,BS)強度模型進行分割。然而上述方法過于簡單,無法處理聲吶圖像中存在的紋理問題,而且反向散射的測量值與入射角和海底類型有關,實際應用效果不理想。針對入射角問題,研究人員提出了多種對聲吶圖像入射角變化進行建模的方法[33-34],但同樣因為不同海底類型的聲學特性差異而無法實現精確補償,而且大多只局限于一種海底背景類型。

近些年,有學者提出利用海底紋理提高分割精度的方法,在應用中考慮反向散射角度變化和紋理特征實現目標分割[35]。基于紋理的海底聲吶圖像分割通常依賴Haralick參數[36]和濾波器系數來建模紋理[37]。在紋理分析領域,作為局部濾波器響應的統計數據計算特征可以用于描述和鑒別紋理模型[38-39]。在這些研究的基礎上,KAROUI[40]根據一組不同濾波器的紋理響應對海底類型進行描述,在不同的聲吶紋理間引入相似性度量,并使用紋理特征作為過濾海底聲學影響的邊緣分布模型,以達到圖像分割的目的。基于貝葉斯框架的圖像分割方法是一種常用的監督圖像分割方法,其中研究最多的是最大后驗概率法(Maximum Posteriori,MAP)[38]和最大邊際概率法(Maximum Marginal Probability,MMP)[39],而且已發表的文獻表明MMP比MAP更適合圖像分割[39]。與貝葉斯方案不同,另一種監督圖像分割方法在區域層面上表示為約束能量準則的最小化[40],兩者都基于海底類型圖像之間的一種新的相似性度量,產生的加權因子一方面用于濾波器選擇,另一方面用于考慮海底紋理的入射角依賴性。目前對監督分割算法的研究應用較少,而對無監督分割算法研究更加充分。

2.2 無監督分割算法

無監督分割算法計算復雜度低,而且模型簡單,因此應用更廣泛,算法類型也更多。無監督分割算法一般需要通過學習來實現自動分割,目前已有的聲吶圖像分割有基于模糊c-均值(Fuzzy C-means,FCM)聚類的聲吶圖像分割方法[41]、基于馬爾可夫隨機場(Markov Random Field,MRF)模型的分割方法[42-43]、基于Snake模型和水平集的分割方法[44-46]、基于譜聚類的方法[47-48]、基于期望最大化的方法[49-50]以及基于小波變換的方法等。

在聲吶圖像分割方法中,基于小波分析實現的分割方法由于其良好的空間/頻率定位能力和多尺度(多分辨率)分析能力而適合于圖像分割[51-56]。GONZALEZ和WOODS認為基于小波的方法可以發現在一種分辨率下可能未被發現而在另一種分辨率下可能容易被發現的特征[57]。因此,基于小波的聲吶圖像分割方法對于解決聲吶目標識別問題具有突出優勢。

2.2.1 基于小波的聲吶圖像分割常用方法

一個給定的圖像可以通過小波變換在不同的分辨率水平上進行分析。對于聲吶圖像,由于不同的紋理是以不同的分辨率記錄的,不同的紋理在不同的細節子帶有不同的能量值,因此可以通過不同子帶的小波系數對紋理進行分析和分類。JAVIDAN[58]提出了通過子帶中小波系數的振幅來描述能量的方法,在對各層的小波子圖像進行粗略分割后,將粗略分割結果融合為精細分割圖像,粗略的分割結果與模糊邊緣檢測器的分割結果混合,得到最終的分割圖像。WILLIAMS[59]根據海底的實際情況,選擇2 m×2 m的海底區域作為小波變換的數據源,同樣采用計算能量值的方法進行分析,聲吶圖像的紋理信息通過五層小波系數計算的特征向量得到了完整準確的描述。譜系聚類算法[60]同樣被用來根據聲吶圖像特征進行識別,該方法使用了K–均值聚類算法,但K–均值聚類算法有一個固有的缺點,即會陷入局部最優,因此效果過度依賴于聚類中心的選擇。WILLIAMS和GROEN對上述方法進行了改進[61],將 K–均值聚類算法用無監督的變異貝葉斯高斯混合模型取代[62],實驗結果表明,改進后的方法達到了相對理想的分割結果。在COBB和PRINCIPE[63]的實驗中,同樣證明了小波系數在描述聲吶圖像的紋理信息方面的優異性能。每種海床類型都有其獨特的紋理特征,WILLIAMS[64]提出了使用獨特的高斯混合模型來表達建立在小波系數上的海底紋理類型的方法,原始聲吶圖像被基于小波的特征矢量取代,并通過貝葉斯理論對海床進行分類,同樣也可以應用于海底聲吶圖像的分割。

BAUSSARD[65]提出了一種基于小波變換和貝葉斯框架的海底聲吶圖像分割方法,基于二維可轉向Riesz小波的方法對聲吶圖像進行變換,然后得到低頻近似子帶系數和高頻詳細子帶系數,其中高頻子帶系數基于傳統的廣義高斯分布(Generalized Gaussian Distribution,GGD)建模[66],低頻子帶的系數則是基于高斯的有限混合模型來建模[67]。BAUSSARD保留了KARINE等人省略的低頻近似子帶[68],可以提高具有類似特征(如沙子和淤泥)的海床的分類精度。因此,海底聲吶圖像可以被更準確地分割。總的來說,WILLIAMS[69]和SONG[70]等的方法可以應用于具有明顯紋理特征的海底聲吶圖像的分割。KARINE等[71]用滑動窗口將聲吶圖像進行劃分,然后對每個窗口進行小波變換,對小波子帶系數進行統計建模,用GGD和α-stable分布參數作為聲吶圖像的特征。

小波變換有一些局限性,一個限制是對方向屬性的描述不夠充分,另一個限制是對小波參數敏感。鑒于此,夏平等[72]提出了雙樹復合小波變換(Dual-tree Complex Wavelet Transform,DTCWT),在一定程度上可以提高圖像分割的精度。吳濤[73]和夏平的方法可以充分利用聲吶圖像的先驗知識,達到了更準確的分割結果。然而,由于這些方法比較復雜,因此僅適用于低實時性要求的情況。在分割速度方面,KAROUI等[74]提出了一種基于紋理散射強度分割聲吶圖像的方法,利用多分辨率分析的優勢,通過直接測量小波變換得到的信息量最大的相似性來區分紋理,并將不同尺度的分割結果融合在一起,從而得到最終的分割結果。CELIK和TJAHJADI利用小波變換分辨率之間的數據提取每個像素的特征向量[75],通過主成分分析(Principal Component Analysis,PCA)降低了特征向量的維度,并通過 K–均值聚類算法將特征向量分為不同類型,從而實現對側掃聲吶圖像的分割,而且具有較強的抗干擾能力。此外,PCA降維也將算法的速度提高到一個可接受的范圍,還可以很好地保留圖像細節。夏平等[76]在提出的分割方法中使用了多尺度統計信息的FCM聚類和小波域的MRF,在建立小波子帶 MRF之前使用 FCM聚類算法進行預分割,提高了后續小波子帶MRF的收斂率,實現聲吶圖像的穩定和準確分割。

2.2.2 基于超小波的聲吶圖像分割

由于小波變換在一些方面比傅里葉變換更具有優勢,因此被廣泛用于圖像處理的各個領域[77],但小波變換不是圖像表示的最佳工具,只能表達奇異點的位置和特征,不能完全表征圖像中多方向的邊緣和紋理等幾何特征。DO和VETTERLI[78]提出,一個優秀的圖像表示工具應該滿足多分辨率、具有方向性以及各向異性等特征,而小波轉換只符合上述的一些性質。為了尋求更好的圖像表示工具,更有效地表示和處理圖像高維空間數據,研究人員提出了超小波變換,并迅速成為研究熱點。超小波變換是幾個具有幾何特征的“小波變換”的聯合體,是小波變換的延伸,可以滿足上述所有的圖像表示性質,并在圖像處理中取得了巨大的成功。超小波變換包括 ridgelet,curvelet,bandelet,contourlet,beamlet,surfacelet等多種不同的變換算法,引起了圖像分割領域研究者的關注[77]。由于小波變換的一些優良特性,小波變換非常適用于圖像處理,如去噪、壓縮和特征提取,超小波方法同樣在聲吶圖像分割中得到了應用。在過去的幾年里,小曲線變換(Curvelet Transform,CVT)在應用數學和信號處理界引起了越來越多的興趣[79]。小曲線變換是一種多尺度的方向性變換,可以對圖像邊緣進行幾乎最佳的非適應性稀疏表示,因此可以比小波變換更有效地表示邊緣特征和曲線奇異性。YOON和KIM提出了一種基于CVT的有效的邊緣增強方法[80],用于聲吶圖像中的物體識別,在該方法中,最大值是由每個角線的系數計算出來的,該系數來自CVT的子步驟,在找到該值的方位角后,通過局部最大值選擇來確定真正的邊緣方向。

非采樣小輪廓變換(Non-subsampled Contourlet Transfer,NSCT)可以實現多尺度、多方向和平移不變的靈活分解,具有更好的邊緣捕獲和表達能力[81]。王敏等[82]引用了基于 NSCT的光學圖像邊緣檢測的超小波模數最大值方法,以獲得各尺度方向子帶的模數最大值,在閾值處理之后,得到圖像在每個尺度方向子帶的邊緣圖像,最后將一個尺度內和尺度間的邊緣融合,得到單像素寬的邊緣圖像。該方法得到的邊緣是相對完整的,偽邊緣點的數量較少,但比較復雜,適合于低實時性要求。LI等人將 NSCT與區域分割的思想相結合[83],使用K–均值聚類算法分割陰影區域,并搜索高頻中的模數最大位置,以更準確地確定圖像邊緣,然后在一個標度和標度之間將圖像邊緣融合,最后通過區域增長法對圖像進行分割。HUO等人將NSCT與灰度共現矩陣(Gray-level Co-occurrence Matrix,GLCM)結合[76],在NSCT領域提取圖像特征,以彌補在提取 GLCM紋理特征時細節紋理表達不足的缺陷。將這2種紋理特征結合生成每個像素的多維特征向量,可以提高圖像分割的準確性。總的來說,基于超小波變換的聲吶圖像分割方法計算量大,適合于低實時性和高精度的分割要求。

3 基于深度學習的聲吶目標識別

聲吶目標識別是指從聲吶圖像中提取水下目標特性并對目標進行分類識別,主要過程為特征提取和目標分類。然而海水介質的非均勻性會造成聲信號的衰減和畸變,同時各種漂浮物和顆粒都會增大聲波傳輸過程中的多路徑效應,使得傳統的聲吶目標識別方法很難取得較好的識別效果[84-86]。深度學習以人工神經網絡為基礎,由多個處理層組成計算模型研究具有不同抽象級別的數據。深度學習結構可以處理非結構化和結構化數據,并且無需手動操作即可執行自動特征提取,極大地提升了包括自動聲吶目標識別在內的不同領域的最新技術[87-88]。

深度學習算法可以分為有監督、半監督和無監督等多種形式。有監督學習方法是建立在使用正確分類的數據或標簽訓練模型的基礎上的,當新數據輸入到體系結構時,訓練過的深度學習模型可以準確地估計輸出。無監督學習功能用于無監督數據集,可以在不提供損失信號的情況下研究和建立信息映射,評估可能的解決方案[89]。半監督學習方法僅使用一小部分標記數據[90],使用有監督學習方法對未標記數據進行最佳預測,通過使用反向傳播算法查找和學習輸入中的模式,克服了無監督和有監督方法的局限性。另外一種廣泛采用的深度學習技術是遷移學習,即除了標準的訓練數據外,還有 1個來自一個或多個相關任務知識的補充信息源。當數據量巨大時,深度學習方法能夠有效地實現目標識別,然而在現實世界中,大量有效聲吶圖像數據是不易獲得的,遷移學習則解決了訓練數據不足的問題[91]。

深度學習技術的上述優點吸引了研究人員在諸多領域廣泛使用該算法,包括圖像、語音和文本識別、目標檢測、模式識別、故障和異常診斷等。在基于聲吶圖像的目標識別應用中,深度學習模型顯示了其優越性,具有較高的精度和可靠性。接下來將對常用的深度學習模型及其在聲吶圖像識別中的應用進行介紹。

3.1 卷積神經網絡模型

LECUNN首先提出了用于圖像處理的卷積神經網絡(Convolutional Neural Networks,CNN)[92],隨著GPU和制造業的興起,卷積神經網絡極大地促進了計算機視覺、自然語言處理、文本和語音識別、目標檢測、醫療預測等領域的發展。其中,CNN在計算機視覺中得到了廣泛應用,在AlexNet之后,深度卷積神經網絡的發展階段在短時間內迅速取代了傳統的圖像分類和識別方法[93]。CNN的多層結構可以自動提取多個層次特征,通過卷積和池化操作以及參數共享使深度學習結構能在各種設備中運行,在圖像處理中提供了穩健而高效的性能,因此得到了廣泛應用[94]。文獻[95]提出了一種基于深度學習的目標和非目標合成聲吶孔徑圖像分類方法,融合異常檢測器用于縮小合成聲吶孔徑圖像中的像素范圍并提取目標大小的圖像塊。檢測器根據其周圍的鄰域計算所有像素的目標概率值后,生成與原始圖像大小相同的置信圖,置信圖僅允許相鄰的感興趣區域(Region of Interests,ROI)作為分類器要考慮的最期望像素。為了解決水下數據匱乏的問題,文獻[96]提出了一種在訓練圖像準備階段的端到端傳輸圖像合成生成方法,從UWSim中的模擬深度相機中為合成訓練數據集捕獲一幅基礎圖像,采用StyleBankNet對水下環境中采集的聲吶圖像進行噪聲特性綜合,生成用于訓練的數據集。在文獻[97]中,作者提出了一種有效的卷積網絡(ECNet)用于側掃聲吶圖像的語義分割。該網絡架構包括用于捕獲上下文的編碼器網絡和用于像素級特征映射的解碼器網絡,以增強邊緣分類效果。結果表明,與其他模型相比,該方法速度快、參數少,實現了效果與效率的最佳折衷。

在文獻[98]中,CNN在前視聲吶圖像的目標檢測中得到了應用。通過從實驗水箱捕獲不同形狀物體的前視聲吶圖像,使用 96×96大小的圖像作為CNN模型的輸入,所提的模型優于模板匹配方法,準確率達到99.2%,而且模型參數更少,速度提高了40%,更具有實時應用價值。在進一步工作中,Valdenegro[99]提出了用于在前視聲吶圖像中檢測和識別對象的模型,所提方法還可以用于任何聲吶圖像檢測未標記和未訓練的目標,具有良好的泛化性能。文獻[100]對三維點云激光雷達數據和水下聲吶圖像應用了2種聚類程序,在2個數據集上使用 CNN和完全卷積網絡(Fully Convolutional Networks,FCN)產生的輸出均采用K–均值聚類和基于密度的空間聚類(Density-based Spatial Clustering of Applications with Noise,DBSCAN)方法進行處理,消除了異常值,并對有意義的數據進行了識別和分組,改進了多目標檢測的結果。在該研究中,FCN用于訓練和測試水下聲吶圖像數據集,然后將該數據集轉換為像素數據矩陣,最高可獲得100%的準確度。

3.2 深層信念網絡模型

深度信念網絡(Deep Belief Networks,DBN)是由受限玻爾茲曼機器(Restricted Boltzmann Machine,RBM)的幾個中間層組成的網絡模型,其中所有RBM層與前一層和后一層連接,層之間沒有連接,且最后一層用于分類。與其他體系結構不同,DBN的所有層都學習整個輸入,更深層次的信念網絡通過分層表示輸入模式的幾個特征來解決這個問題。此外,DBN在學習中還優化了所有層中的權重,按順序在所有層中做出最優決策,最終獲得全局最優解[88]。除了第一層和最后一層之外,DBN的所有層都具有雙重角色,包括作為前面節點的隱藏層和下一個節點的可見層或輸入層。這種結構可以稱為由單層網絡構成的體系結構,它能夠解決深度學習中的過擬合現象等問題,成功應用于聲吶目標識別系統的檢測和分類[101]。

文獻[102]提出了一種基于多角度傳感、分數傅里葉變換特征和3層隱藏DBN的聲吶目標分類算法,利用具有三維高光分布的目標原型,基于光線跟蹤法合成了主動目標回波。特征提取過程產生了基于100階分數傅里葉變換的特征,這些特征充分表示形狀變化并具有識別能力。DBN的平均準確率為91.40%,而100–24–4結構BPNN模型的準確率為87.57%。與之類似,KE[103]提出了基于深度競爭信念網絡的算法,通過從標記和未標記對象中學習具有附加鑒別信息的特征來解決水聲目標檢測的小樣本維數問題。結果表明,該系統實現了90.89%的分類準確率。

3.3 生成對抗網絡模型

生成對抗網絡(Generative Adversarial Networks,GAN)是由 2 個網絡組成的深度神經網絡體系結構,在使用任意輸入時,GAN會在輸出上創建對應的信息[104]。GOODFELLOW等在文獻[105]中首先介紹了GAN網絡,該網絡由鑒別器D和生成器G組成,生成器用于生成具有等效概率分布的樣本作為實際訓練數據集,鑒別器負責識別輸入是來自實際數據集還是生成器,并引導生成器通過反向傳播梯度創建更真實的樣本數據。鑒別器擅長最大化或優化類之間的距離,并區分來自訓練數據集的真實圖像和生成器的再現樣本,生成器應使生成的概率分布和真實數據分布盡可能接近,以使鑒別器無法在真實樣本和假樣本之間進行選擇。在這個對抗過程中,生成器改進了自身以學習真實的數據分布,鑒別器也提高了其特征學習能力。最后,訓練達到納什均衡,此時鑒別器不能分離 2個分布。使用 GAN的大量工作可用于各種水下聲吶目標的檢測和分類。

文獻[106]提出了一種基于條件生成對抗網絡(Conditional Generative Adversarial Network,CGAN)的真實感知圖像生成系統,其中模型學習光學圖像和聲吶圖像之間的圖像到圖像轉換關系。作者用人工噪聲穩定地使拍攝的相機圖像變暗,并將合成圖像和聲吶圖像作為輸入,從而生成夜間圖像,然后對模型進行訓練,根據輸入生成真實的日間圖像。SUNG等[107]提出了一種生成真實聲吶片段或圖像的算法,以更好地使用聲吶信號。該方法包括聲吶圖像模擬和基于GAN的圖像變換2個步驟。首先,通過計算聲波的透射和反射,采用基于射線跟蹤技術的聲吶圖像模擬器,模擬器通過簡單的計算模擬包含語義信息(如高亮顯示和陰影)的圖像。然后,基于GAN的風格轉換方法通過加上噪聲或通過去噪和分割將實際聲吶圖像轉換為簡單圖像,再將這些簡單圖像轉換為真實聲吶圖像。類似地,文獻[108]提出了一種生成全長任務真實側掃聲吶圖像的算法,稱為馬爾可夫條件 pix2pix(Markov Conditional pix2pix,MC-pix2pix),合成數據的生成速度比實際采集速度快18倍。對于專家來說,合成數據幾乎無法與實際數據區分開來。

為了提高聲吶目標識別程序在新環境中的可用性和適應性,文獻[109]中提出了一種基于GAN的方法,該方法用于將模擬接觸增強為實際聲吶圖像,合成觸點是在射線追蹤三維CAD模型上創建的,位于實際側掃海底的特定位置。通過計算海底的高程圖創建了真實的陰影。通過識別耦合陰影和高光(即連接到相鄰陰影的高程)來計算高程。然后,使用CycleGAN對合成接觸外觀進行細化。

3.4 遞歸神經網絡和長–短期記憶網絡模型

遞歸神經網絡(Recurrent Neural Networks,RNN)是一種允許以前的輸出作為輸入操作的神經網絡。這些網絡可以記憶以前的狀態,傾向于從早期階段學習。長–短期記憶(Long Short-Term Memory,LSTM)可以從早期和當前階段獲取輸入,引入長短時記憶網絡可以有效解決RNN引起的梯度爆炸或消失問題。RNN廣泛應用于語音和文本識別、自然語言處理和聲吶識別系統[110]。

PERRY和GUAN提出了一種在中段掃描聲吶圖像中識別微小人造物體的算法,該圖像由安裝在船舶下方的聲吶結構采樣而成[111],在距離移動船只200 m處進行目標檢測。作者首先在海底跟蹤物體的基礎上,對船只的運動進行了近似計算。在得到的圖像順序中,海底目標的外觀得到改善,雜波噪聲最小化。探測器的工作分2步進行,第1步,預先確定可能感興趣的對象;第2步,跟蹤第1步中識別的對象,并將特征向量序列提供給分類器,其中RNN為最終的檢測分類器。對使用RNN和使用非RNN得到的結果進行比較,可以看出所提出的方法實現了檢測成功率的提高。

3.5 基于遷移學習的聲吶自動目標識別方法

如前所述,基于深度學習的體系結構能夠熟練地處理大量數據。然而,在現實世界中,獲取大量數據并不總是可行的,遷移學習方法則是為了解決這一數據不足的問題而提出的,是解決機器學習中訓練數據不足的一種基本且被廣泛接受的方法[112],深度遷移學習方法也得到了廣泛的應用[113]。在文獻[114]中,研究人員開發了一個用于在散射和極化等噪聲中對多波束聲吶圖像進行分類的模型,用于檢測潛水員等人形目標。DYLAN EINSI在其論文文獻[115]中提出了一種基于深度學習的遷移學習方法,用于側掃聲吶圖像的目標檢測。在這項研究中,使用一個系統的遷移學習方法來檢測目標或異常聲吶圖像,利用預先訓練好的網絡學習聲吶圖像中基于像素強度的海底異常特征。使用基于遷移學習方法,作者可以通過一個小的訓練數據集訓練新生成的“You Only Look Once”(YOLO)模型,測試結果顯示識別結果的成功率提高到了95%。因此,通過遷移學習的方法來將可見光領域的檢測算法應用于聲吶圖像處理是一個高效有用的技術途徑。

4 結束語

隨著科學技術的進步,聲吶自動目標識別在短時間內得到了快速發展。然而,這些方法有許多需要克服的缺點。由于水下的數據采集或處理程序比在陸地上更加困難,實際應用中也存在更多的挑戰,因此將傳統的研究方法與深度學習方法相結合逐漸成為一種趨勢。水下目標的檢測與識別受到國內外越來越多學者的關注,取得了很多研究成果,但也存在一些亟待解決的問題。下面對該領域的關鍵問題及其發展趨勢加以展望。

1)水下環境復雜多變,在利用目標物的回波進行檢測時,增強回波強度、提高回波檢測算法的性能十分重要,需要進一步提高聲吶技術和硬件水平,尤其對于水下小目標,如何在復雜環境中獲得有效聲吶回波信號是極具挑戰性的課題。

2)聲吶圖像包含斑點噪聲,對其進行分割和目標識別是一個抗斑點噪聲的問題。去噪是小波變換的優勢,利用小波變換,可以將聲噪圖像的去噪和分割融合在一起,更有利于識別。因此,需要研究利用小波變換得到具有自適應能力的抗斑點噪聲方法。

3)水環境中的弱紋理目標特征提取一直是水下目標識別的難點問題,為了提高識別精度,可以考慮將更多基于深度學習的光學圖像識別技術引入到水下目標分類識別算法中,通過監督數據的遷移提高分類能力和復雜環境適應能力。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 欧美成人综合在线| 亚洲三级a| 麻豆国产在线观看一区二区| 国产午夜无码片在线观看网站| 欧美在线国产| 538国产在线| 四虎国产在线观看| 9cao视频精品| 国产又大又粗又猛又爽的视频| 免费一级无码在线网站| 亚洲第一视频网| 日韩高清一区 | 精品国产免费人成在线观看| 国产成人精品高清在线| 免费一级无码在线网站| 亚洲日韩久久综合中文字幕| 国产精品尹人在线观看| 91在线丝袜| 亚洲自偷自拍另类小说| 午夜久久影院| 国产电话自拍伊人| 成年人视频一区二区| 国产免费观看av大片的网站| 国产成a人片在线播放| 重口调教一区二区视频| 亚洲中文无码h在线观看 | 日本不卡在线| 超碰aⅴ人人做人人爽欧美| 国内视频精品| 伊人AV天堂| 亚洲 欧美 中文 AⅤ在线视频| 2021国产v亚洲v天堂无码| 日韩黄色精品| 99这里精品| 亚洲一本大道在线| 日韩在线视频网| 色香蕉网站| 亚洲精品在线影院| a毛片在线播放| 中文字幕色在线| 午夜高清国产拍精品| 一区二区自拍| 精品国产三级在线观看| 老司国产精品视频91| 无码aaa视频| 伊在人亚洲香蕉精品播放 | 精品综合久久久久久97| 亚洲精品欧美日本中文字幕| 国产精品色婷婷在线观看| 啪啪免费视频一区二区| 欧美日韩国产在线播放| 狼友视频一区二区三区| 国产无码网站在线观看| 色婷婷综合激情视频免费看| 国产一区二区精品福利| 久久黄色影院| 在线看免费无码av天堂的| 日韩国产无码一区| 国产一区二区三区精品久久呦| 久久免费视频播放| 国产成人精品无码一区二| 福利一区在线| 亚洲综合激情另类专区| 亚洲精品少妇熟女| 1024国产在线| 久久久久国产一级毛片高清板| 国产在线拍偷自揄拍精品| 2020国产精品视频| 精品国产免费观看| 国产色爱av资源综合区| a亚洲视频| 欧美三级自拍| 91视频精品| 国产免费人成视频网| 国产成人无码AV在线播放动漫| 国产永久在线观看| 久久精品中文字幕少妇| 亚洲视频影院| 日韩AV无码免费一二三区| 国产色婷婷视频在线观看| 91精品啪在线观看国产91九色| 日本日韩欧美|