999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

RPC模型影像校正并行算法設計及優化

2023-08-18 09:49:04張戰偉李增三
山西建筑 2023年17期
關鍵詞:優化模型

張戰偉,李增三,龐 坤

(山東明嘉勘察測繪有限公司,山東 淄博 255086)

0 引言

遙感大數據時代,衛星遙感數據量持續增長,數據來源呈多樣化發展趨勢且更新速度不斷加快。對這些大量遙感影像數據進行快速、準確的處理和分析變得越來越重要。幾何校正是對衛星影像進行位置精確度的修正,其目的是將影像中的每個像元與地球表面相應的地理位置對應,以消除地球曲率和地形變化等因素對影像位置精度的影響,為后續遙感數據的分析和應用提供準確的地理信息[1]。當前,來自不同傳感器的遙感數據不斷增加,快速幾何校正可以使不同傳感器獲取的影像具有一致的地理坐標系,從而為遙感數據的融合分析創造條件。在環境變化、資源管理和城市規劃等領域,研究者們需要對長時間序列的遙感數據進行分析,快速幾何校正可以消除不同時間和空間的遙感數據之間的位置誤差,使得時序數據具有可比性[2]。

RPC(Rational Polynomial Coefficients)模型是一種廣泛應用于衛星影像幾何校正的方法,通過多項式擬合實現像方坐標與物方坐標轉換[3]。無法獲得高精度數字正射影像等參考數據時,基于RPC模型對遙感影像進行校正能夠獲得可信的精度[4]。RPC模型具有較高的精度和通用性,在遙感領域的多種應用場景中發揮著重要作用。隨著遙感數據量的快速增長,傳統的串行處理方法已經難以滿足實時性和高效性的需求。因此,針對RPC校正模型開發并行算法具有重要意義。并行算法可以充分利用多核處理器和GPU等并行計算資源,顯著縮短遙感影像幾何校正的處理時間,提高數據處理效率[5-6]。采用并行算法可以克服單機內存和計算能力的限制,支持大規模遙感數據的快速幾何校正,為遙感大數據時代的應用需求提供技術支撐。

隨著GPU和多核CPU技術的發展,它們在遙感影像處理中的應用得到了廣泛的關注。研究人員在遙感影像分類[7]、正射校正[8]、特征匹配[9]、特征檢測[10]、影像融合[11]等多個方面開發了并行算法。在海量遙感影像處理及分析任務中,GPU及多核CPU的應用提供了更高的計算效率,確保了數據的實時性。為了提高處理效率,一些研究人員對RPC校正的并行算法進行了研究。比如,劉宇等人為縮短影像校正時間,使用GPU實現了寬幅遙感影像的并行RPC校正,在高分二號多光譜影像和全色影像上的計算上獲得了3.71及8.27的加速比[12]。

雖然GPU在RPC模型進行衛星影像校正并行算法方面具有優勢,但目前的并行算法仍存在一些不足之處,缺少對內存限制、通信開銷、負載均衡、資源利用率等方面的系統研究。因此,本文對GPU及多核CPU基于RPC模型衛星影像校正并行算法的設計及算法優化進行研究,以進一步提高并行算法的效率以及算法的適用性。

1 方法

1.1 RPC模型

基于 RPC(有理多項式系數)模型[13]的衛星影像校正是一種廣泛應用的方法。RPC模型通過有理多項式函數描述地面坐標和像素坐標之間的映射關系。RPC模型通常包括兩個有理多項式方程,一個用于計算像素的行坐標,另一個用于計算像素的列坐標。

假設地面坐標為(X,Y,Z),影像坐標為(x,y),RPC模型的基本形式如式(1)—式(6):

(1)

(2)

(3)

(4)

(5)

(6)

其中,Ox,Oy均為平移系數;Sx,Sy均為縮放系數;aijk,bijk,cijk,dijk均為PRC模型參數,i,j和k的取值范圍為0~3。這些系數通常由衛星影像供應商提供,使用這些系數可以通過上述公式將地面坐標(X,Y,Z)轉換為影像坐標(x,y)。然后,利用這些影像坐標進行影像校正。

1.2 GPU并行算法設計

CUDA(Compute Unified Device Architecture)是NVIDIA推出的一種并行計算框架,可以充分利用GPU的計算能力,加速影像處理過程。本文基于CUDA進行GPU并行算法及其優化研究,算法思路如圖1所示。

以下是算法關鍵步驟的具體細節。

1)RPC讀取:讀取由衛星影像數據提供商提供的RPC模型參數文件(如*.rpb),獲取平移系數、縮放系數及多項式參數數據。

2)CUDA核函數設計:核函數處理單元為單個像素,根據當前線程像素坐標和RPC模型參數計算地面坐標,然后將地面坐標轉換為輸出影像的像素坐標,最后將輸入影像的像素值復制到輸出影像的相應位置。

3)線程塊和網格大小確定:為了充分利用GPU的計算能力,需要合理地選擇線程塊和網格大小。線程塊大小通常為16×16或32×32,應確保每個線程塊中的線程數量是warp大小的整數倍。網格大小根據影像尺寸和線程塊大小來確定,以確保所有像素點都被處理。

4)GPU內存分配及數據拷貝:為輸入影像和輸出影像分配GPU內存,然后將輸入影像從主機內存復制到GPU內存。

5)核函數調用:調用核函數進行RPC變換,核函數在GPU上并行執行,每個線程處理一個像素點。

6)GPU內存數據輸出:核函數執行完成后,將輸出影像從GPU內存復制回主機內存并保存至磁盤。

7)優化:使用共享內存、常量內存來加速內存訪問,并進行多流優化、多線程多流優化、對邊界和異常值進行處理。具體優化策略包括:

a.將RPC模型參數存儲在常量內存中,以減少全局內存訪問。

b.使用CUDA多流技術實現任務并行執行,將影像分割成多個子區域,并為每個子區域創建一個CUDA流。

c.針對大影像,影像分割為大小相等的子區域,以確保每個線程處理的任務量相似。

d.根據GPU的計算能力動態調整線程塊和網格大小,充分利用GPU資源。

e.根據GPU內存容量采用拷貝數據最大化策略,在GPU上完成所有計算任務,再將輸出影像復制回主機內存。

f.異步數據傳輸與計算策略,使用cudaMemcpyAsync函數實現異步數據傳輸,在數據傳輸過程中同時執行其他任務。

1.3 CPUs并行算法設計

OpenMP(Open Multi-Processing)是一種支持多平臺共享內存并行編程API,它采用基于指令的方法簡化并行程序的開發。OpenMP使用編譯器指令(#pragma omp)來實現并行化,使得將串行代碼轉換為并行代碼變得相對簡單。通過在適當的位置添加指令,開發人員可以在不修改原始代碼結構的情況下實現并行處理。此外,OpenMP還具有可移植性、兼容性、可擴展性、支持多種并行模式以及自動化并行任務管理等特點和優勢,使得它成為多核CPU并行編程的理想選擇。

RPC模型遙感影像校正的最小處理單元為像素,可以將不同的像素分配給不同的CPU線程進行處理,這種任務分解方法便于使用OpenMP的并行計算能力。由于OpenMP并行實現相對簡單,以下通過偽代碼的形式來說明本文的并行算法設計及優化方法,如圖2所示。

在代碼中,對于并行算法的優化主要采用以下策略:

1)使用高效數學庫,提高數學運算性能。2)采用一維數組存儲影像數據,通過計算索引值來訪問像素,減少內存訪問開銷。3)設計RPC模型參數結構體來組織數據。4)使用OpenMP的“collapse”將嵌套循環合并為一個并行循環,以提高線程利用率。

2 實驗及分析

2.1 實驗數據及環境

采用高分一號衛星(GF-1)、高分6號衛星(GF-6)、高分7號衛星(GF-7)影像進行實驗,高分系列衛星遙感影像標準產品中提供了全色及多光譜影像數據及*.rpb文件(RPC參數)。本文總計開展了4組實驗,影像數據量介于0.69 GB~1.81 GB之間,如表1所示。

表1 實驗數據情況

實驗采用的計算機硬件如表2所示。

表2 實驗采用的計算機硬件配置

2.2 實驗結果

本文采用加速比評價并行算法的加速效果,加速比計算如式(7)所示。

(7)

其中,S為加速比;T1為單線程算法的執行時間;T為并行算法的執行時間。

表3為4組實驗分別采用CPU、多核CPU,GPU進行計算的時長統計,以及多核CPU,GPU與單線程CPU計算的加速比統計情況。

表3 加速比統計情況

由表3可以看出,本文提出的并行算法在計算效率上提升明顯,其中GPU的加速比介于22.9~71.5之間,多核CPU的加速比介于5.4~5.7之間;在綜合效率上,GPU的加速比介于2.4~32.4之間,多核CPU的加速比介于2.1~5.0之間。其中第4組加速效果最為明顯,主要原因是第4組數據為單波段數據,大幅縮短了數據I/O操作的時間,從而體現了并行算法在整體時間上的優勢。為了優化數據I/O操作,本文針對波段數多于1的情況,對算法進行了進一步優化,按照波段逐一進行處理,然后再將各波段寫入同一影像。表4是按照新的優化策略,GPU計算時間及總處理時間的統計情況。從表4可以看出,該策略取得了明顯的數據處理效率提升效果。

表4 I/O優化后加速比統計

相對GPU并行,基于OpenMP進行多核并行的開發十分簡單,僅用幾行代碼即可實現算法的并行,而且在讀寫密集型并行計算中,可以獲得與GPU并行相當的加速比。為了進一步了解多核CPU并行加速的效果,本文對使用不同線程數量對加速結果的影響進行了實驗,如圖3所示。

由圖3可以看出,線程數量較少時處理效率提升明顯,當線程數量接近處理器核心數時,處理效率提升趨于平緩。因此,選擇合適的線程數量十分重要,通常可以將線程數量設置為處理器核心數或者稍多于核心數以獲得相對理想的性能提升。

3 結論

本文針對衛星遙感影像RPC幾何校正問題,提出了基于GPU和多核CPU的并行算法并進行了優化。通過對比實驗,驗證了該算法計算性能的優勢。具體來說,本文的主要貢獻包括以下幾點:

1)提出了一種基于RPC模型衛星影像幾何校正的GPU并行優化算法,獲得了22.9~71.5的計算加速比及2.4~32.4的綜合加速比,加速效果明顯。

2)提出了一種基于RPC模型衛星影像幾何校正的多核CPU并行優化算法,獲得了5.4~5.7的計算加速比及2.1~5.0的綜合加速比。

3)針對多波段數據I/O操作壓力大的情況,提出分波段處理的優化策略,進一步獲得了1.8倍~2.0倍的加速效果。

提出的并行算法可大幅提升遙感影像計算速度,為諸如生態環境監測、城市應急、智慧農業、災害監測等領域提供更快的數據處理支持。盡管本文所提出的并行算法在遙感影像RPC幾何校正上取得了顯著效果,但是仍有以下幾個方面的改進空間:進一步優化負載均衡策略,提高多核CPU和GPU之間的協同效率;進一步研究遙感數據的I/O優化方法,降低I/O對整體處理效率的影響;針對特定應用場景和硬件配置進行算法定制,以滿足不同用戶的需求。

猜你喜歡
優化模型
一半模型
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
由“形”啟“數”優化運算——以2021年解析幾何高考題為例
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 欧美a级在线| 青青操视频免费观看| 欧美一级99在线观看国产| 久久五月天国产自| 国产成人综合亚洲欧美在| 精品人妻AV区| 精品一区国产精品| 一级毛片在线免费视频| 国产经典三级在线| 精品一区二区三区水蜜桃| 亚洲高清国产拍精品26u| 久久激情影院| 欧美一级高清视频在线播放| 91视频国产高清| 成人在线天堂| 国产亚洲高清在线精品99| 亚洲成人高清在线观看| 欧美亚洲国产一区| 色亚洲激情综合精品无码视频| 欧美69视频在线| 最新日本中文字幕| 精品国产美女福到在线直播| av一区二区人妻无码| 国产精品一区在线观看你懂的| 亚洲精品桃花岛av在线| 人妻免费无码不卡视频| 一级成人a做片免费| 午夜啪啪福利| 在线无码av一区二区三区| 色爽网免费视频| 污网站在线观看视频| 91亚洲视频下载| 2048国产精品原创综合在线| 久久夜色精品国产嚕嚕亚洲av| 97久久人人超碰国产精品| 亚洲精品爱草草视频在线| 国产内射一区亚洲| 9cao视频精品| 国产va免费精品观看| 热久久这里是精品6免费观看| 免费无码网站| 久精品色妇丰满人妻| 国产精品尤物铁牛tv| 毛片免费在线视频| 女人毛片a级大学毛片免费| 国产情侣一区二区三区| 精品欧美视频| 国产视频 第一页| 免费在线成人网| 亚洲成A人V欧美综合天堂| 久久超级碰| 国模私拍一区二区| 天天综合天天综合| 中文字幕无码电影| 中文字幕免费视频| 日韩激情成人| 午夜综合网| 色哟哟色院91精品网站| 亚洲天堂网2014| 色哟哟色院91精品网站| 婷婷伊人五月| 国产福利在线免费| 热99re99首页精品亚洲五月天| 国产二级毛片| 久久综合九九亚洲一区 | 欧美在线伊人| 欧美精品v欧洲精品| 色婷婷视频在线| 无套av在线| 久久午夜夜伦鲁鲁片不卡| 免费在线国产一区二区三区精品| 99精品视频九九精品| 久久精品嫩草研究院| 国产精品xxx| 欧美日韩精品在线播放| 毛片卡一卡二| 精品欧美日韩国产日漫一区不卡| 欧洲高清无码在线| 国产麻豆va精品视频| 免费无遮挡AV| 日韩第八页| 亚洲成网777777国产精品|