摘 要:【目的】基于監督深度學習的遙感影像樹冠檢測逐漸成為森林資源清查和監測的重要技術手段。然而,已有方法需要大量標注樣例,導致了高昂的成本和較低的通用性。在該挑戰下,本研究設計了一種新的主動學習方法開展了UAVs光學影像下端到端的桉樹樹冠識別。【方法】采用“Teacher-student”交互學習模式,在每輪學習中通過Teacher模型生成候選偽樣本,基于偽樣本篩選策略得到高價值的目標偽樣本,再將其與已有樣本放入Student模型學習,之后將Student模型的參數遷移給Teacher模型。經過以上多輪交互學習,Teacher模型即為所求。特別地,該方法在模型中引入了梯度均衡機制損失以降低對易樣本的過度訓練,設計了新穎的空間交疊度以加強模型對樹冠遮擋嚴重和多樹種共存等難偽樣本的學習比重,采用了多尺寸網格掩碼等數據增強方法提升模型對桉樹空間分布模式、多光照場景和異常拍攝視角的適應性,顯著減少標注工作量并提高模型性能。【結果】利用大疆Phantom4 Pro V2.0無人機對廣西國有高峰林進行數據采集,形成了8 000張256 pixel×256 pixel影像構成的包含幼齡林和近成過熟林標注的樣本集。利用該樣本集對所提方法和其他監督學習方法及主動學習方法進行對比分析。結果表明,所提的主動學習方法在使用少量樣本的情況下具有比監督學習方法和最新主動學習方法更優異的性能:在使用26%的數據作為樣本時,該方法的F1值為0.8,滿足了樹冠識別實用性要求;而當樣本增加到34%時,該方法更是取得了0.9的F1值,與全監督學習性能相當。【結論】提出的主動學習方法在小樣本約束下能自動獲取準確的樹冠范圍信息,可節省大量數據處理和樣本制作時間,具有高效、便捷和低成本的優勢,對提升森林監測效率和自動化水平具有重要意義。
關鍵詞:樹冠識別;主動學習;偽樣本篩選;目標檢測
中圖分類號:S771.8;S792.39 文獻標志碼:A 文章編號:1673-923X(2025)03-0010-10
基金項目:廣西林業科技推廣示范項目(2023GXLK05);南寧市武鳴區科學研究與技術開發計劃項目(20220107);廣西大學生創新創業訓練計劃項目(S202410603111)。
UAVs optical image-based Eucalyptus canopy detection using active learning with spatial overlap indicator
DUAN Lian1, LIANG Bo2, LI Zhen3, LUO Tianxiao2, HUANG Chaoqun2, HUANG Guobin1
(1. School of Natural Resources and Surveying, Nanning Normal University, Nanning 530001, Guangxi, China; 2. Guangxi Forest Resources and Environment Monitoring Center, Nanning 530001, Guangxi, China; 3. Management Center of National Dagui Mountain Alligator Lizard Nature Reserve in Guangxi Province, Hezhou 542800, Guangxi, China)
Abstract:【Objective】Deep learning-based canopy detection from remote sensing imagery is gradually becoming an important technique for forest inventory and monitoring. However, existing methodologies usually require a large number of labeled examples, resulting in high costs for both annotation and sample acquisition, thus limiting their applicability. To address this challenge, a novel active learning method was designed for comprehensive Eucalyptus canopy recognition utilizing UAV optical imagery.【Method】The proposed method employs a “Teacher-student” interactive learning mode. In each learning stage, the Teacher model generates candidate pseudo-samples, and high-value target pseudo-samples are obtained based on a pseudo-sample selecting strategy, then combined with existing labeled samples and input into the Student model for training. Subsequently, the parameters of the Student model are transferred to the Teacher model. After multiple rounds of interactive learning, the teacher model becomes the final model for tree canopy detection applications. Specifically, the method introduces a gradient Harmonized mechanism loss (GHM loss) in the Student model to reduce over-training on easy samples. It also designs a novel spatial overlap indicator to strengthen the model’s learning emphasis on difficult pseudo-samples with severe canopy occlusions and coexistence of multiple tree species. Moreover, the method adopts multi-size grid mask and other data augmentation methods to enhance the model’s adaptability to the spatial distribution patterns of trees, diverse lighting conditions and unconventional photographic angles.These enhancements collectively lead to a significant decrease in labeling workload and a improvement in model performance.【Result】Data collection was conducted on Guangxi Gaofeng forests using the DJI Phantom 4 Pro V2.0 UAVs, resulting in a dataset consisting of 8 000 annotated samples with 256 pixel×256 pixel images of both young and nearly mature forests. This dataset was used to compare our proposed method with other supervised learning and active learning approaches. The results demonstrate that our proposed active learning method outperforms both supervised learning methods and the latest active learning methods when using a limited number of samples. Specifically, with only 26% of the data used as samples, our method achieved an F1 score of 0.8, meeting the practical requirements for tree crown recognition. Furthermore, when the sample size increased to 34%, our method achieved an F1 score of 0.9, which is comparable to the performance of fully supervised learning methods.【Conclusion】The proposed active learning approach enables automatic acquisition of accurate tree crown boundaries under the constraint of limited samples, resulting in significant savings in data processing and sample preparation time. It offers advantages in terms of efficiency, convenience, and cost-effectiveness, thereby playing a crucial role in enhancing forest monitoring efficiency and automation level.
Keywords: tree canopy recognition; active learning; pseudo sample filtering; object detection
基于遙感技術開展森林中特定種類樹冠的識別與統計,對于樹木健康管理、森林資產清查和碳儲量估算等應用具有重要價值[1-2]。傳統基于監督機器學習和特征工程從遙感影像提取樹冠的工作,往往需要豐富的專家知識和大量檢驗測試,通用性較差[3-4]。為此,利用深度學習強大的特征自學習能力開展樹冠檢測成為當前的流行方法。如Brandt等[5]利用全卷積網絡從亞米分辨率多光譜衛星影像中繪制了西非地區的樹冠地圖;Weinstein等[6]研究了不同林地環境下深度學習模型識別樹冠的泛化性能;Osco等[7]探討了不同波段組合對于卷積網絡識別果樹性能的差異;黃彥曉等[4]采用了集成FPN等骨干子網的Faster R-CNN以提升樹冠識別性能;Roslan等[8]使用GAN模型從低分辨率影像中生成高分辨率影像以提高樹冠檢測精度;奚祥書等[9]基于無人機多光譜影像利用YOLOv3等模型比較了不同波段組合及不同降維方法下對銀杏樹單木的識別效果;曹明蘭等[10]基于深度學習的實例分割代表性算法Mask R-CNN模型,對無人機遙感城市行道樹影像進行樹冠分割。然而,這些監督深度學習方法面臨依賴大量標注樣本的局限性,應用成本高,通用性仍然不強。最新的研究融合LiDAR與影像數據[11]或采用GAN方式[12]開展半監督學習下的樹冠提取,但依然存在噪聲、多源數據融合復雜、GAN超參數調優煩瑣和對大量樣本依賴的問題,難以體現深度學習“端到端”的學習優勢。
主動學習能在標注資源有限的情況下通過自主挑選高價值偽樣本以加強學習效率[13-14]。對此,本研究引入主動學習方法在小樣本量情況下開展無人機光學影像上的桉樹樹冠檢測。
1 材料與方法
1.1 研究區數據集構建
遙感數據集采集于2023年5月南寧市北部的廣西國有高峰林場。該林場擁有3.2萬hm2林地,該林區呈帶狀環繞南寧市北部的武鳴、賓陽、上林3縣及興寧、青秀、西鄉塘3城區,主要樹種為桉樹、馬尾松、杉木、濕地松和相思等。采集用的大疆Phantom4 Pro V2.0無人機配備2 000萬像素影像傳感器,拍攝的飛行速度為72 km/h,拍攝高度為200~300 m,設置的影像重疊率為90%。拍攝得到的無人機攝影數據(圖1)包含POS數據以及GPS坐標(WGS84),將這些數據導入Agisoft Photo Scan軟件進行處理生成分辨率為0.05~0.20 m無人機光學影像圖,通過分割形成了8 000張256 pixel×256 pixel的數據集。每張影像用LabelImg軟件標出了幼齡林和近成過熟林的桉樹冠邊界框。其中,幼齡林和近成過熟林樹冠的標注框比例各自為11.8%和88.2%。
1.2 主動學習基本流程
主動學習分為監督學習和交互學習兩大階段,具體流程如下(圖2)。
步驟1:借助初始已標注影像集利用Teacher網絡開展監督學習,學習完成后將其參數復制到Student網絡中,為后續的學習過程奠定基礎。

步驟2:在第k(k=1,2,…,K)輪交互學習中,抽取bk張未標注影像,對其實施弱數據增強后輸入Teacher網絡,以生成偽樣本,再基于偽樣本篩選策略(詳見1.4)選擇出高價值偽樣本。
步驟3:對樣本集(包括了初始樣本和高價值偽樣本)進行強數據增強(詳見1.5),以訓練Student網絡,從而完成本輪Student網絡參數的更新。
步驟4:通過指數移動平均方法(exponential moving average,EMA)將Student網絡的參數適量遷移到Teacher網絡。
步驟2~4為一輪交互學習,執行這樣的交互學習直到達到輪數閾值K或Teacher模型的性能不再發生較大變化。最終,得到一個泛化能力強的Teacher模型作為應用模型。
1.3 模型交互學習



1.6 性能評價指標
每次模型性能的檢驗包含3次測試,3次測試后的性能均值為該檢驗的最終結果。采用IoU閾值為50%時的平均精度(mAP)、平均召回率(AR)和F1值(F1)作為性能比較指標。
1.7 試驗軟硬件平臺和各超參數設置
試驗服務器采用Ubuntus 16.0操作系統,Intel(R) Xeon(R) Silver 4110 CPU@2.1 GHz(32核)處理器,128 GB內存,顯卡為4張兩兩“交火”的NVIDIA GeForce GTX 1080 Ti(11 GB顯存),編程環境為Python 3.8和Pytorch 2.0,安裝并配置了CUDA 11.1.0和cuDNN 8.1.0。
每次交互學習用于Teacher的輸入影像數bk= 600;兩個模型使用隨機梯度下降優化器(SGD),初始學習率設為0.005,動量參數設為0.9,權值衰減參數設為0.000 5,采用了warm up熱身策略。為了減少內存占用并加快運算速度,采用混合精度計算損失值。每輪訓練總共進行800~2 000個epochs,batch size設為16。使用g=2.5作為?sup和?semi之間權衡的超參數值,β=0.991作為EMA權重,置信度閾值ρ=0.65來提前濾除低質量偽樣本。
1.8 用于比較的方法
在監督學習方面,使用樹冠檢測普遍采用的FF-RCNN(FPN-Faster-RCNN)[4]、YOLOv3[9]和YOLOX[18]等先進模型作為比較方法;在主動學習方面,本研究所提方法TC-AT(Tree Canopy Active Teacher),將與Active Teacher(AT)[16]和Unbiased Teacher(UT)[13]等方法開展比較。
2 結果與分析
2.1 不同方法性能比較
2.1.1 不同樣本量下的性能比較
隨機選擇樣本總量85%作為數據集,15%作為測試集。由于需要觀察大量未標注數據對半監督學習模型的影響,數據集被進一步分割為標記集和未標記集,在數據集中分別選取其總量的2.5%、5%、10%、20%和30%作為標記集訓練,其余數據視為未標記集參與主動學習。使用測試集評估后的結果如表1所示。

分析可知,在不同標記數據量條件下,AT和UT與TC-AT這3個主動學習方法在準確率、召回率和F1上的性能都明顯優于FF-RCNN、YOLOV3和YOLOX這3個監督學習。在樣本量較小的情況下,例如當樣本量僅為總量的20%時,主動學習模型的F1值就已經接近0.7,顯示出良好的性能。相比之下,監督學習方法,如FFRCNN或YOLO系列模型,在相同樣本量下的F1值僅在0.35左右,僅為TC-AT方法性能的一半左右。這充分說明,在樣本量有限的情況下,主動學習模型具有更好的性能表現。當標記數量達到總量30%時,主動學習下的模型掌握了更多林區特征,3個主動學習方法的3個指標的性能都超過 0.76,其中,TC-AT方法準確率和F1值甚至都超過了0.81,已經達到了實用性能水平;但這時其他深度監督學習模型性能仍然非常低,3個性能指標值均在0.45以下,離實用性差距非常大。

相對于AT和UT,TC-AT性能更佳,在標記數據量超過總量5%的情況下,其準確率和F1值均優于AT和UT。隨著標記樣本量的逐步增加,AT和UT與TC-AT之間的性能差距逐漸擴大。具體來說,當樣本量從總數的5%增長到30%時,TC-AT的mAP高于AT 1%~3%,高于UT 1%~5%。這表明,TC-AT能隨著標記數據增加能掌握更多有效信息,證明了新的偽樣本篩選策略等改進在桉樹樹冠檢測任務上的優越性。
以上情況表明,主動學習適合于小樣本下的林區桉樹樹冠檢測,同時,TC-AT對已有主動學習方法的改進是有效的。
2.1.2 全監督性能和實用性性能下的樣本量比較
應用中非常受關注的是實現全監督性能和實用性性能所需的最小標記數據量。利用100%標記數據集采用FF-RCNN、YOLOv3、YOLOX監督學習得到的最高mAP分別為0.94、0.92和0.96,召回率分別為0.88、0.85和0.88,F1值分別為0.91、0.87、0.92。據此,TC-AT以F1≈0.8和F1≈0.9分別為實用性性能和全監督性能,測試了TC-AT和AT達到這兩個性能所需的最少標記數據量,同時也測試了這兩個主動學習方法的性能極限,結果如表2所示。

觀察可知,TC-AT方法達到全監督性能時使用樣本量最少,僅為用全數據的34%,比AT方法要少5%(400張樣本),比UT的少7%(560張樣本),更是要比深度監督模型使用的樣本少66%(5 480張樣本)。而達到實用性F1值時,TC-AT方法僅需26%的樣本量,比AT方法要少6%(480張樣本),比UT的少8%(640張樣本),比樣本使用量最少的監督學習模型YOLOv3少52%(4 160張)。需要說明的是,由于主動學習所生成的偽樣本質量總是低于全標注數據集,因此,主動學習的全監督性能很難達到監督深度學習模型的性能。但以上情況仍然凸顯了TC-AT在減少樣本標注成本和提升了樹冠的檢測效率方面的巨大潛力。
2.1.3 對不同年齡桉樹樹種檢測性能的比較
前述測試表明在保留有10%~30%左右樣本時,主動學習會明顯提升其識別效果并逐漸達到其最優性能,因此在這之后的試驗僅比較使用10%~30%樣本時各模型的性能情況。影像數據中,中齡林以上(含中齡林)樹冠較大且形狀相對規則,但容易相互遮擋,樣本量大;而幼齡林樹冠較小且形狀不規則,具有空間分隔空間較大的種植布局方式,但樣本量少,其總體樣例僅為中齡林以上(含中齡林)的1/8。該測試能反映各模型在數據不平衡時對桉樹樹冠的辨識性能。
由表3可知,TC-AT在幼齡林和中齡林以上(含中齡林)的檢測任務中均表現出最優的性能。例如,當樣本量為30%時候,TC-AT在幼齡林和近成過熟林的檢測上比AT分別高出了6%和2.5%,比UT分別高出了8%和5.5%。

進一步分析樣本量變化對模型性能的影響后發現,隨著樣本量從總數據量的10%增加到30%,TC-AT在幼齡林和近成過熟林檢測上的F1值差異相對較小,大致在10%~18%之間;相比之下,AT的差異量為13%~23%,UT的差異量為12%~29%。這一對比結果驗證了TC-AT方法在數據不平衡情況下能保持穩定且優異的性能,而AT和UT方法的性能波動則較大。
隨著樣本量從總數據量的10%增加到30%,TC-AT在幼齡林和中齡林以上(含中齡林)檢測上的F1值差異量較少,大致在10%~18%,而AT的差異量為13%~23%,UT的差異量為12%~29%。這驗證了對AT方法的改進有效緩解了數據不平衡情況,對于不同形態樹冠的檢測可行性更強。此外,監督方式下的FF-RCNN等模型在各樣本量下的F1性能與主動學習方法相差明顯,不具備與主動學習方法相抗衡的能力。
2.2 消融分析
2.2.1 不同數據增強方法對主動學習性能的影響
鑒于本研究受到Active Teacher的啟發,將在當前及后續小節中,將Active Teacher(AT)納入考量,一并進行消融分析。如表4所示,AT-T代表AT應用了本文提出的數據增強方法,TCAT-S則表示TC-AT采用了與AT相同的數據增強手段,而TC-AT-E則指的是TC-AT結合了旋轉(Rotation)、Cutout、光度增強(Color space)、噪聲注入(Noise injection)、錯切(Shearing)、 LocalAugment、Mixup等7種其他數據增強方式。表中傾斜字體標注的數字表示該列中排名第二的數據。

分析可知,在3種不同的樣本量情況下,所提出的數據增強方法取得了兩次最高F1值和一次次優F1值;同時,當AT采用本研究提出的數據增強方法后(即AT-T),其在各樣本量下的性能均超過了原有的AT方法,F1值大約提升了1%。值得一提的是,當TC-AT結合了其他數據增強方法(即TC-AT-E)后,其在樣本量為20%~30%時,性能甚至超越了AT方法。這一系列結果表明,與應用場景及樹冠空間布局相適應的數據增強方法對提升主動學習的性能至關重要。
2.2.2 不同損失函數對主動學習性能的影響
表5中,AT-C表示AT和TC-AT一樣使用GHM Loss,TC-AT-L表示TC-AT使用與AT一樣的Cross Entropy Loss。從表7可清晰看到,當AT采用與相同的GHM Loss(即AT-C)時,其在不同樣本量下的性能均有所提升。相比之下,當TC-AT使用與AT相同的Cross Entropy Loss(即TC-AT-L)時,F1值普遍下降了約1%。這一對比結果充分表明,GHM Loss在降低主動學習中的數據不平衡和異常樣本導致的偏差方面具有較好的效果。

2.2.3 不同偽樣本篩選指標對主動學習性能的影響
表6中,AT-N表示AT方法使用本文提出的偽樣本篩選策略,TC-AT-M表示TC-AT使用與AT一樣的偽樣本篩選指標;TC-AT-M1表示TC-AT僅使用信息豐度和平均難度兩個指標,TCAT-M2表示TC-AT僅使用空間交疊度1個指標。

根據表6可知,當TC-AT方法僅采用AT的偽樣本篩選策略(即TC-AT-M)時,其F1值在不同樣本量下均有所降低。這表明,直接套用AT的篩選策略并不非常適用于林區樹冠檢測,其可能導致篩選出的偽樣本質量不高,進而影響模型的性能。然而,當AT方法采用本文提出的偽樣本篩選策略后(即AT-N),其性能在各樣本量下均得到了一定的提升。這一結果證明了該偽樣本篩選策略在甄別高價值林區影像上更有效。進一步地,嘗試了僅使用空間交疊度作為偽樣本篩選策略的唯一指標(即TC-AT-M2)。在大部分情況下,這種策略的性能要優于僅使用信息豐度和平均難度兩個指標的情況(即TC-AT-M1)。這表明,空間交疊度能更好地衡量林區偽樣本的質量。綜上,本研究提出的空間交疊度偽樣本篩選指標不僅能夠提升偽樣本的多樣性,還能促使模型針對樹冠重疊的困難樣本進行更多學習。這一策略的應用增強了主動學習過程的魯棒性,并最終提高了結果的準確率。這些發現為在主動學習中優化偽樣本篩選策略提供了重要的啟示。
3 討 論
本研究首次采用了深度主動學習方法開展桉樹樹冠的檢測。實驗發現,深度主動學習方法在多種小樣本量下都取得了顯著的性能提升,在準確率、召回率和F1分數上超過了深度監督學習方法100%~300%,能夠在只使用30%左右的樣本量下達到100%的全監督性能。這表明,結合深度學習模型的強大特征提取能力和主動學習的偽樣本篩查策略,能夠以低成本和高效率的方式識別林區單木,驗證了深度主動學習方法在林區桉樹樹冠識別應用上的可行性和可推廣性。
目標檢測往往存在前景物體與背景物體的類別不平衡(class-imbalance)問題,容易導致主動學習中大量背景類(即帶有大量噪聲的)偽樣本用于訓練,影響了最終模型效果。為此,Unbaised teacher(UT)方法引入了監督學習環節以獲得具有一定學習能力的初始模型,并提出了一種交互學習方式聯合訓練一個Student模型和一個逐漸進步的Teacher模型。其中,Teacher模型生成偽標簽以訓練Student模型,Student模型通過EMA不斷更新Teacher模型,在以上兩個模型的生成和訓練中通過不同的數據增強方式以提升輸入數據的多樣性。Active teacher(AT)方法是在UT方法之上,創新性地引入了3個偽樣本價值量指標,包括難度、信息和多樣性,并利用AutoNorm的方式自動合并這3個指標,以最大限度地篩選出具有高質量偽樣本。
TC-AT借鑒了AT中的主動學習流程,包括引入了相同的監督學習環節和使用了同樣的AutoNorm方式以融合多個偽樣本價值量指標。但TC-AT針對UAVs林場影像中的多景觀、多尺度、多光照、多傾角和數據不平衡等復雜情況,在以下3個方面做出了改進:
1)采用了新的偽樣本價值量指標—空間交疊度,以替換其原來的多樣性(Diversity)指標。空間交疊度通過計算預測結果中邊界框的交疊平均數,量化了偽樣本上的樹冠郁閉程度,提高模型對樹冠遮擋嚴重和多樹種共存等難樣本的學習效率。之后,再通過精心比較,將其與其他兩種偽樣本篩選指標融合,增強了模型對此復雜林區場景的識別能力。
2)使用了梯度均衡機制損失(GHM loss),而非AT中的焦點損失(Focal loss)。GHM Loss通過調整不同樣本的梯度模長頻率,減少了對易樣本的過度訓練,降低了異常(光照和場景畸變)樣本對模型性能的破壞性。
3)在數據增強方面,本研究測試多種數據增強方法,并確定了顏色擾動(Color jitter)和核過濾(Kernel filters)方法作為弱數據增強方法,使用了多尺寸網格掩碼(Grid-mask)、圖縮略(Cut-thumbnail)和樣本混合(Mixed-example)作為強數據增強方法。而AT采用水平翻轉(Horizontal flip)作為弱數據增強方法,水平翻轉(Horizontal flip)、顏色擾動(Color jitter)、灰度變化、高斯噪聲(Gaussian blur)和剪裁(Cutout)方法作為強數據增強方法。相對來說,本研究的數據增強方法較AT的要更復雜和多樣,提升模型對桉樹空間分布模式的適應能力,增強模型對多光照場景和異常拍攝視角的魯棒性。
本研究方法能夠依據林區特征更智能地選擇最具信息量的樣本進行標注,從而極大減少對大量數據手工標注的依賴,降低樹冠檢測的成本和時間,最大限度地發揮了有限標簽信息的效果,提高了小樣本量下模型的泛化能力。采用真實數據的實驗表明,與現有最優秀的主動學習方法相比,該方法的準確率、召回率和F1分數在相同小樣本量條件下提高了5%~10%,在達到相同性能時,使用的樣本量也降低了10%左右。
本研究提出的主動學習方法在減少標注成本和提升檢測效率方面顯示出巨大應用價值,為開展高效和自動化的無人機光學影像樹冠檢測在模型學習策略和數據處理方法上提供了新思路,對森林資源的快速監測和管理具有重要意義。此外,隨著無人機技術的不斷發展和海量影像的不斷生成,該方法在林業資源調查、樹木健康管理、碳儲量估算等領域應用潛力巨大。
盡管本研究取得了優秀的實驗結果,但也存在一些局限性。首先,本研究的方法主要針對桉樹樹冠的檢測,對于其他樹種的適用性尚未驗證。其次,在實際應用中可能會遇到更多復雜的場景和挑戰,如更多種類樹冠的識別,以及病蟲害、不同季節、或受燃燒影響的樹冠識別等。此外,數據集主要來源于特定地理區域的無人機影像,可能存在地域性限制,影響模型在不同地區的樹種、氣候條件和林地結構區域的適用性。為了進一步提高方法的魯棒性和通用性,未來研究將探索將本方法擴展到更多樹種和不同地理環境的樹冠檢測任務中,并考慮多光譜影像數據引入以提高模型的識別能力。
主動深度學習模型的性能高度依賴于訓練數據的質量和數量。如果初始已標注樣本數據有限、場景類型單一或影像質量不高,或未標注數據中的異常數據比例較高,主動學習的效果會大打折扣。而且,主動學習策略的選擇也對結果產生重要影響,不同的樣本選擇策略可能導致模型性能的顯著差異。未來的工作將比較初始樣本、未標注數據質量及其多樣性對主動學習樹冠檢測性能的各方面影響,并進一步針對性地探索和優化主動學習策略,提高所選偽樣本的質量和代表性,自動優化不同質量數據集下的樹冠檢測要求,在更廣泛的實際應用場景中進行測試和驗證。
4 結 論
本研究提出了一種面向UAVs光學影像的桉樹樹冠檢測主動學習方法。該方法針對林區環境特征和各類場景數據不均衡的情況,引入梯度均衡機制損失,設計了新的空間交疊度作為偽樣本篩選指標,明確了樣本混合等數據增強方法,避免了大量數據的標注和煩瑣的特征工程。實驗結果表明,本研究提出的主動學習方法在小樣本量下表現出卓越的性能,超越了其他先進的監督學習和主動學習方法,為少樣本和低成本約束下快速探測大面積區域的樹冠分布提供了可借鑒的技術方案。
參考文獻:
[1] 戴鵬欽,丁麗霞,劉麗娟,等.基于FCN的無人機可見光影像樹種分類[J].激光與光電子學進展,2020,57(10):10. DAI P Q, DING L X, LIU L J, et al. Tree species identification based on FCN using the visible images obtained from an unmanned aerial vehicle[J]. Laser Optoelectronics Progress,2020,57(10):10.
[2] SCHIEFER F, KATTENBORN T, FRICK A, et al. Mapping forest tree species in high resolution UAV-based RGB-imagery by means of convolutional neural networks[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2020,170:205-215.
[3] MAIMAITIJIANG M, SAGANA V, SIDIKE P, et al. Soybean yield prediction from UAV using multimodal data fusion and deep learning[J]. Remote Sensing of Environment,2020,237:111599.
[4] 黃彥曉,方陸明,黃思琪,等.基于改進的Faster R-CNN模型的樹冠提取研究[J].林業資源管理,2021(1):173-179. HUANG Y X, FANG L M, HUANG S Q, et al. Research on crown extraction based on improved Faster R-CNN model[J]. Forest Resources Management,2021(1):173-179.
[5] BRANDT M, TUCKER C J, KARIRYAA A, et al. An unexpectedly large count of trees in the west African Sahara and Sahel[J]. Nature,2020,587:78-82.
[6] WEINSTEIN B G, MARCONI S, BOHLMAN S A, et al. Crosssite learning in deep learning RGB tree crown detection[J]. Ecological Informatics,2020,56:101061.
[7] OSCO L P, DOS SANTOS DE ARRUDA M, MARCATO JUNIOR J, et al. A convolutional neural network approach for counting and geolocating citrus-trees in UAV multispectral imagery[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2020,160:97-106.
[8] ROSLAN Z, LONG Z A, ISMAIL R. Individual tree crown detection using GAN and RetinaNet on tropical forest[C]// 2021 15th International Conference on Ubiquitous Information Management and Communication (IMCOM),2021:1-7.
[9] 奚祥書,夏凱,楊垠暉,等.結合多光譜影像降維與深度學習的城市單木樹冠檢測[J].遙感學報,2022,26(4):711-721. XI X S, XIA K, YANG Y H, et al. Urban individual tree crown detection research using multispectral image dimensionality reduction with deep learning[J]. National Remote Sensing Bulletin,2022,26(4):711-721.
[10] 曹明蘭,李亞昆,張力小,等.深度學習在無人機遙感城市行道樹提取中的應用[J].中南林業科技大學學報,2023,43(6):79-84,115. CAO M L, LI Y K, ZHANG L X, et al. Application of deep learning in the information extraction of urban street trees by remote sensing of UAV[J]. Journal of Central South University of Forestry Technology,2023,43(6):79-84,115.
[11] WEINSTEIN B G, MARCONI S, BOHLMAN S, et al. Individual tree-crown detection in RGB imagery using semi-supervised deep learning neural networks[J]. Remote Sensing,2019,11(11): 1309.
[12] GUO J H, XU Q S, ZENG Y, et al. Nationwide urban tree canopy mapping and coverage assessment in Brazil from high-resolution remote sensing images using deep learning[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2023,198:1-15.
[13] LIU Y C, MA C Y, HE Z J, et al. Unbiased teacher for semisupervised object detection[J]. arXiv preprint arXiv:2102.09480, 2021.
[14] YUAN T N, WAN F, FU M Y, et al. Multiple instance active learning for object detection[C]// Computer Vision and Pattern Recognition,2021.
[15] LI B Y, LIU Y, WANG X G. Gradient harmonized single-stage detector[C]// Association for the Advancement of Artificial Intelligence,2019:8577-8584.
[16] MI P, LIN J H, ZHOU Y Y, et al. Active teacher for semisupervised object detection[C]// 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),2022:14462-14471.
[17] CHO J W, KIM D, JUNG Y, et al. Mcdal: maximum classifier discrepancy for active learning[J]. arXiv preprint arXiv: 2107,11049,2021.
[18] GE Z, LIU S T, WANG F, et al. Yolox: exceeding yolo series in 2021[J]. arXiv preprint arXiv:2107.08430,2021.
[本文編校:吳 毅]