[摘 要]地物分析在城鄉規劃、土地利用管理及環境保護等領域具有重要意義。然而,傳統的人工方法在處理大規模遙感影像數據時存在效率低、成本高、精度不足等問題。隨著人工智能技術的快速發展,其在遙感影像分類中的應用為解決這些問題提供了新的可能性。文章針對村鎮地物分析任務,采用了7種經典的人工智能模型進行訓練,并提出了一種集成方法對多模型結果進行融合。試驗結果表明,該方法具有99.05%的分類準確率,顯著提高了分類精度,可為村鎮地物分析提供可靠的技術支持,也為城鄉規劃和土地管理等領域的決策提供了重要參考依據。
[關鍵詞]地物分析;人工智能;城鄉規劃;圖像分類
[中圖分類號]TG333 [文獻標志碼]A [文章編號]2095–6487(2024)06–0138–03
Research on Remote Sensing Image Land Feature Classification Based on Artificial Intelligence
FENG Yong,FENG Ming
[Abstract]Feature analysis is of great significance in areas such as urban and rural planning, land use management, and environmental protection. However, traditional manual methods have problems such as low efficiency, high cost, and insufficient accuracy when processing large-scale remote sensing image data. With the rapid development of artificial intelligence technology, its application in remote sensing image classification provides new possibilities for solving these problems. The article focuses on the task of analyzing rural land features, using 7 classic artificial intelligence models for training, and proposing an integrated method to fuse the results of multiple models. The experimental results show that this method has a classification accuracy of 99.05%, significantly improving the classification accuracy. It can provide reliable technical support for the analysis of rural land features and important reference basis for decision-making in the fields of urban and rural planning and land management.
[Keywords]feature analysis; artificial intelligence; urban and rural planning; image classification
在當今社會,隨著城市化進程的不斷推進,對于村鎮建設的規劃與管理日益重要[1]。其中,地物分析作為村鎮建設中的關鍵環節之一,其對于提高土地資源利用效率、規劃城鎮布局、推動鄉村振興等方面起著至關重要的作用。然而,地物識別在村鎮建設中的實現卻面臨著一系列的挑戰與難點。例如,由于村鎮地塊的復雜性和多樣性,傳統的地物識別方法通常難以滿足準確性和效率性的要求。傳統的基于規則或特征工程的方法在處理不同尺度、光照條件、遮擋等問題時表現欠佳,導致地物識別的精度難以達到實際需求。
為了應對這一挑戰,近年來,深度學習技術作為一種強大的人工智能工具被引入到地物識別領域,并取得了顯著的進展。深度學習技術以其優秀的特征學習能力和模式識別能力,為地物識別提供了全新的解決方案。通過深度學習模型,系統可以自動地學習和提取地物的抽象特征,從而實現對于不同地物類型的準確識別。這種數據驅動的方法不僅提高了地物識別的精度和魯棒性,同時也減輕了人工處理的負擔,極大地提升了地物分析的效率和可行性。文章針對人工智能模型在村鎮建設地物分析中的應用展開研究。
1 背景
1.1 卷積神經網絡
卷積神經網絡是專門用于處理圖像等網格結構數據的深度學習模型。通過卷積和池化操作,卷積神經網絡能夠逐步提取輸入數據的特征,具備優秀的特征學習和層級抽象能力,在計算機視覺任務中取得了較大成功。在地物識別領域,卷積神經網絡直接從原始數據中學習特征,避免了手工設計特征的繁瑣過程,為村鎮建設地塊識別提供了可行的解決方案。
1.2 視覺自注意力模型
視覺自注意力模型是一種深度學習模型,能夠處理圖像數據并捕捉全局上下文和長距離依賴關系。與傳統的卷積神經網絡不同,其采用自注意力機制進行計算,具有更好的并行性和可擴展性。在地物識別中,其已顯示出與卷積神經網絡相媲美甚至超越的性能,為村鎮建設地塊識別提供了有前景的解決方案。
1.3 卷積–注意力混合模型
近年來,研究者們將卷積神經網絡與視覺自注意力模型相結合,形成了卷積–注意力混合模型,以提高圖像處理任務性能。在這種混合模型中,卷積神經網絡負責提取局部特征,而視覺自注意力模型則捕捉全局信息和長距離依賴關系,使模型能更全面地理解圖像內容,提高識別任務的準確性和魯棒性。在地物識別領域,這種混合模型表現良好,有望進一步提高地塊識別的精度和效率。
2 方法
2.1 通用分類網絡
文章對現有分類模型進行了廣泛的調研,并最終選定了7種神經網絡模型用于村鎮建設地物分析任務。這些模型包括5種卷積神經網絡,即ResNet18、DenseNet121、InceptionV3、Xception和EfficientNet,以及一種視覺自注意力模型(Swin–Small)和一種卷積–注意力混合模型(ConvViT–Small)。
2.2 集成模型
在模型集成領域,常見的算法包括投票、堆疊、袋裝和提升等。投票算法通過組合多個模型的預測結果,通過投票來確定最終的預測結果;堆疊算法將多個模型的預測結果作為特征輸入到一個元模型中,進行再次預測;袋裝算法通過對訓練數據集進行有放回抽樣來訓練多個模型,并將它們的預測結果進行平均或投票;提升算法則通過迭代訓練多個弱學習器,逐步提高模型性能。
文章采用了投票集成算法中的一種簡單而有效的算法。具體來說,將每個模型對于每個樣本的預測概率進行平均,得到最終的集成預測概率。然后,根據集成預測概率確定最終的分類結果。相比于單模型,文章所提集成算法具有以下優勢:提高整體的穩健性和魯棒性及泛化能力,更好地適應未見過的數據。
3 試驗
3.1 數據集
文章使用了UCMercedLand–Use數據集,該數據集是一個常用于地物分類和土地利用分類的公開數據集之一。該數據集由21個地物類別組成,涵蓋了從城市到農村等不同地區的高分辨率航拍圖像。該數據集包括多種不同的地物類型,如棒球場、工業區、居民區、河流、森林等。每個類別都包含100張尺寸為256×256像素圖像樣本,總共包含了2 100張圖像。將數據集隨機劃分為訓練集、驗證集和測試集,樣本比例為60%∶20%∶20%。
3.2 評估指標
文章采用了準確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1分數(F1)、Kappa分數(Kappa)及馬修斯相關系數(MCC)等多種評估指標來全面評估地物分類模型的性能。這些評估指標能夠幫助文章深入了解模型在不同方面的表現,從而更準確地評估其在實際應用中的可靠性和有效性。
3.3 超參數設置
文章使用了PyTorch Lightning框架進行模型訓練,其版本為2.1.2,PyTorch版本為1.13.1。并將批大小設置為32,學習率為3×10–4。此外,還實施了一個停止策略,即如果模型在驗證集合上10個周期內的準確率沒有提升,則停止訓練。所有試驗均在一張英偉達3090Ti顯卡上完成。
3.4 結果分析
文章通過對7種不同模型進行訓練和評估,得到了它們在地物分類任務中的性能表現。模型性能評估見表1。

由表1可知,各個模型在不同的評估指標上表現出了一定的差異性。例如,DenseNet121和Xception模型在準確率和精確率上表現較好,而EfficientNetB0和ConvViT–Small模型在召回率和F1分數上表現更優。基于視覺自注意力的模型及卷積–自注意力混合模型相較于卷積模型在各個指標上沒有明顯提升。這表明不同的模型在地物分類任務中具有不同的優勢和特點。然而,更值得關注的是,文章基于這7種模型的集成模型的結果。由表1可知,集成模型在所有評估指標上都表現出了最佳的性能,均達到了較高水平。集成模型的準確率達到了99.05%,遠高于單個模型的表現。這說明通過多模型融合的方法,能夠顯著提升地物分類任務的性能。
8種不同的地物分類模型混淆矩陣如圖1所示。矩陣的對角線元素表示模型正確分類的樣本數量,非對角線元素則表示模型錯誤分類的樣本數量。從圖1可以看出,集成模型在每個類別上的分類準確性明顯優于其他7種單模型。

盡管在試驗中取得了一定的成果,但仍存在一些缺陷需要進一步解決;①訓練數據和實際鄉鎮遙感影像數據之間存在一定差別。雖然文章盡可能選擇了代表性的真實遙感影像數據集進行訓練,但由于地域和環境的不同,模型在實際應用中可能面臨新的挑戰。②基于圖像分類的方法可能存在分類不夠細致的問題。在實際應用中,地物的分類可能需要更細致的劃分,如像素級分類。
4 結束語
通過在實際遙感影像數據集上進行試驗,文章驗證了提出的集成模型相較于單模型具有明顯更高的有效性。這表明多模型融合是一種有效的策略,可顯著提升地物分類任務的性能。在當前社會發展和城鄉建設過程中,對地物分類技術的需求日益增加。文章所提模型不僅能夠提高地物分析的準確性,還能為村鎮建設規劃、資源管理和環境保護等方面提供重要支持。文章的成果不僅在地物分類領域取得了顯著進展,還對促進村鎮建設和社會發展具有重要意義。
參考文獻
[1] 王陽,郭開明,蘇練練.關于國土空間規劃中城鄉建設用地統籌的思考[J].西安建筑科技大學學報(自然科學版),2023,55(5):729-738.