, ,
(南京電子技術研究所,南京 210039)
基于OpenCL的數字相控陣雷達干擾模擬
王開拓,白雪,郭曉宇
(南京電子技術研究所,南京210039)
針對現代戰爭復雜電磁環境以及數字相控陣雷達干擾信號生成數據量大、多波束等難點,利用圖形處理器(GPU)帶寬高,運算能力強的特點,使用OpenCL異構編程框架實現數據級并行策略,設計了基于OpenCL的五種典型數字干擾并行算法;算法根據GPU的讀寫機制進行優化設計,充分發掘了現有GPU的并行計算能力;實驗結果表明:基于GPU的數據并行計算程序與中央處理器(CPU)平臺相比較,加速比最大可達3.25,提高了相關雷達回波模擬設備的速度,基本滿足數字相控陣雷達信號處理的實時性要求。
數字相控陣雷達;OpenCL;數字干擾信號;GPU
現代戰爭條件下,電子戰是其中至關重要組成部分。敵方對我關鍵節點實施干擾的行為在復雜電磁環境下必然存在。數字相控陣雷達是一種接收和發射波束都以數字方式實現的相控陣雷達。其擁有許多傳統相控陣雷達所無法比擬的優越性。尤其具有大的動態范圍、容易實現多波束的優點[1]。因為數字相控陣雷達的如上優點使其在現代裝備體系中的比重日益增大,也增加了對抗敵方干擾的風險,這就需要模擬真實干擾回波來滿足數字相控陣雷達日常訓練的需求。同時數字相控陣雷達自身抗干擾的能力較強。這種處理干擾信號的優勢同時提高了雷達訓練設備模擬數字相控陣雷達干擾信號的難度,實現實時模擬尤為困難。在保證模擬速度的情況下必然會犧牲計算精度為代價。
OpenCL是一套由khronos國際標準組織發展并維護的為異構平臺編寫程序的標準框架,適用于多核心處理器(CPU)、圖形處理器(GPU)及數字信號處理器(DSP)等硬件。通過OpenCL相關技術可以最大化利用多核心設備的計算能力,大幅提升計算性能,在科研、國防等各種領域都有廣闊的發展前景[9]。
本文首先闡述數字相控陣雷達不同干擾信號的實現算法,然后在此基礎上提出基于OpenCL的異構并行干擾實現方法,運用OpenCL相關技術針對GPU 設計優化方案,并通過與基于CPU的串行實現算法數據比對,對并行優化的結果進行分析。
本文選取比較有代表性的6種干擾樣式進行研究。包括無源干擾和有源干擾,具體干擾樣式分別為切片干擾,移頻干擾,隨機脈沖干擾,密集假目標干擾,同頻異步干擾以及無源箔條干擾。模擬雷達發射信號均為線性調頻(LFM)信號,其表達式為:

切片干擾是一種欺騙式時域干擾。通過對目標信號做快時間脈內處理,使脈沖壓縮信號時域的相干性被破壞來實現對被干擾雷達的干擾。具體做法為在脈沖內對目標信號進行時域復制,使多目標信號在時域重疊,原理如圖1所示。使被干擾雷達對真正目標的檢測和跟蹤效果達不到預期。
設τ為一個切片脈沖串的脈寬,Ts為切片的重復周期。切片脈沖串可記為:
則頻域表達式為:
其中,
fs=1/Ts
雷達發射的脈沖信號為x(t),則經切片處理后的脈沖信號為:
xe(t)=x(t)p(t)
其頻譜為:
由此可知得到的切片干擾信號頻譜為對原始信號頻譜X(f)進行周期延拓后再加權求和,周期為fs,加權系數為αn。

圖1 切片干擾原理
移頻干擾是干擾線性調頻信號的一種有效手段。通過對偵收信號在頻域上進行移頻處理來破壞被干擾雷達對線性調頻信號進行脈沖壓縮的效果。對于不同的移頻條件,移頻干擾分別具有欺騙性和壓制性。
設LFM信號的單位增益復包絡為:
頻譜為:
式中,K為線性調頻斜率;T為脈寬;B=KT為帶寬;D=BT(Dgt;gt;1)為時寬帶寬積。
當移頻干擾輸入頻偏量為ξ時,對應的移頻干擾為:
s(t)exp(j2πξt)
密集假目標是一種空域干擾。在預設的距離-方位范圍內模擬多方向、多批次的空間目標信號,起到欺騙被干擾雷達,掩護真正目標的目的。根據脈間和幀間時序關系設計的不同,密集假目標干擾既具有欺騙性,也具有壓制性[5]。
設雷達和干擾機之間的距離為R,則干擾機偵察到的雷達信號可表示為:
式中,δ(t)為沖激函數,k為雷達發射信號的空間損耗。密集多假目標干擾按照一定的時間間隔和調制規律復制并處理偵察到的雷達信號,進行綜合疊加后實現密集性的干擾效果[5]。
密集假目標干擾的數學模型為:
F(t)=R(t)exp(jΔw1t)*[k1δ(t-Δt1)]+...+
R(t)exp(jΔwnt)*[knδ(t-Δt1-Δt2-...Δtn)]
當各干擾脈沖的延遲間距、幅度和相位調制系數互相相等,即為滿足Δti=Δt,ki=K′,exp(jΔwit)=exp(jΔwt)時,模型可以進一步簡化表示為:

根據密集假目標干擾的數學模型,可構建如下的信號生成流程圖:

圖2 密集假目標干擾原理
當同一區域有多部雷達同時工作時,會產生同頻干擾。當不同雷達的工作脈沖周期不相同或不存在整數倍關系時,互相之間就會產生比較嚴重的同頻異步干擾(如圖3所示)[7]。


圖3 同頻異步干擾示意圖
箔條干擾是一種無源欺騙干擾。通過在空中施放巨量的密集金屬箔條絲,在短時間內形成一個強雷達波反射體。通常用于針對進攻兵器制導雷達的干擾,使其判決目標失敗。
照射在箔條云上的雷達發射信號作為回波將被數字相控陣雷達接收后進行數字信號處理。箔條云的回波信號模型為:
sc(t)=Ac(t-τc)u(t-τc)exp{j2πfcd(t-τc)}
其中:τc是箔條回波的時延,fcd是箔條云相對雷達的多普勒頻率,Ac是目標雷達回波的幅度增益。箔條云運動模型與箔條發射速度、箔條發射方向、風速、風向、飛機狀態等多種因素有關,在此不做過多討論[8]。
OpenCL是一種開放的并行編程標準,相比于單純CPU為核心的串行模擬系統,由于GPU擁有遠高于CPU的浮點計算能力以及極大的吞吐帶寬,故而CPU-GPU異構并行系統就帶有巨大的計算優勢。OpenCL架構就提供了在多核CPU、GPU設備上進行異構并行編程的標準框架,使研發人員能夠發揮異構并行處理平臺的優勢。
對OpenCL模型的描述如圖4所示。主機平臺連接到多個支持OpenCL的設備上。主機平臺可以是通用計算機或專業工作站。OpenCL設備可以是 CPU、GPU或其它專用高速處理器,如DSP、FPGA等。每個OpenCL設備包含多個計算單元(Computing Unit,CU),每個計算單元又由若干處理單元(Processing Element,PE)組成[2]。在主機平臺運行主機程序,在所有OpenCL設備上運行內核函數。主機程序定義內核函數的上下文并管理內核的運行。

圖4 OpenCL模型
OpenCL模型中主機程序管理內核函數的運行是通過為該內核函數創建N維索引空間來實現的。該N維索引空間內的每一個節點被稱為工作項(Work Item),由多個工作項可以組成一個工作組(Work Group)。對于同一個工作組,其包含的所有工作項都將在同一個計算單元(CU)上由多個處理單元(PE)并發執行。對于GPU而言,計算單元即為SIMD(單指令多數據)引擎,處理單元即為線程處理器(Thread Processor),即一個工作組內的所有工作項都將在同一個SIMD引擎上由多個線程處理器同步并發執行,所有工作項都將執行相同的內核程序。但是傳入每個工作項用來計算的參數可以是不同的。
對于整個模擬過程,可以從功能實現上分為三個部分,分別為系統接口、參數計算和回波生成。對于雷達幀信號處理,這三部分在功能上是串行的邏輯關系。模擬程序首先讀取預設好的雷達、目標、干擾部分信息數據,這些數據在整個模擬過程中不變。然后將預設數據作為參數傳遞給回波參數計算程序,計算生成干擾回波所必須的參數。最后在回波生成部分利用已知計算參數得到多通道數字干擾回波,具體過程如圖5所示。

圖5 系統功能框圖
若針對如上功能進行模擬,在不使用GPU的情況下,即先利用CPU同構串行系統對整體功能進行模擬。在預設場景下(具體見3.1節),在回波預設長度增大時,生成干擾回波CPU計算時間占整體模擬時間的比例逐漸提高,即整個模擬過程運算性能的提高就在于改善干擾回波生成速度上。
OpenCL支持數據并行和任務并行兩種編程模型。數據并行模型是指在內存對象的不同元素上進行統一的運算利用工作項的全局索引和局部索引來映射其要處理的內存元素[9],實現的是一個較為寬松的數據并行模型,不要求每個工作項與其作用的內存數據之間一定有嚴格的一一對應的關系。對于第一部分提出的五種不同樣式的干擾計算公式。雖然具體實現的算法都不相同,但如果不考慮其實際物理意義,僅分析觀察干擾模型的數學表達式。就會發現雖然全部五種干擾的數學表達式看似復雜,實際上內部的運算法則只涉及基本運算,并沒有判斷、迭代或嵌套等邏輯相關過程的運算。對其進行干擾模擬運算量大,源于相同運算程序的大量反復執行。這種實現算法天然具有易數據并行的特征,并且對于回波生成部分,數字干擾回波各個數據之間是獨立的,因此可以采取數據并行的方式進行系統模擬,有利于OpenCL架構發揮其在大規模數據并行計算上的優勢。
數字相控陣雷達信號處理同時形成Nc個波束。對于每個波束,雷達發射脈沖數Np,單個脈沖接收波門內信號處理點數為Ns,則數字干擾回波總點數為Nc*Ns*Np。數據并行方式可以只定義工作項的數目,把工作組大小的確定工作交由GPU來實現。將每個單獨數字信號點上的運算定義為在GPU的工作項上執行的內核程序。由于各個波束的回波排布形式都是相同的,不同波束僅僅影響信號調制功率的不同,且對應波束的調制功率為標量,所以在GPU中計算的回波信號點數為Ns*Np,即所需GPU工作項為Ns*Np。
在工作項上執行的內核程序過程步驟如下所示:
1)將執行參數傳入內核函數。
2)for(干擾數量){
3)if (當前工作項上是否存在干擾或目標信號){
4)解算工作項相對回波出現點位的真實時間差。
5)計算真實時間差對應的信號相位。
6)for(接收波束數){
7)執行干擾生成計算。
}
}
}
8)對計算得到回波數據按接收波束進行組波輸出。
每種干擾生成計算不同。以移頻干擾為例,其核心計算過程(如上4~7)如下所示:
position←當前工作項ID;
len←已知回波信號寬度;
fd←信號多普勒頻率;
shiftF←信號單次移頻點數;
PRT←脈沖重復周期;
IDx←當前脈沖序號;
K←線性調頻信號調頻斜率;
AChannel←移頻干擾信號的波束調制復系數(實部、虛部分別為為r和i);
Temp←當前工作項上的移頻干擾回波復信號;
for(移頻總次數)
{
t←position - (len/2);
x←2π*(fd+shiftF)*(t+PRT*IDx)+πK*t*t;
cost +← cos(x);
sint +← sin(x);
}
cost ← cost/sqrt(cost*cost + sint*sint);
sint ← sint/sqrt(cost*cost + sint*sint);
for(接收波束數)
{
Temp.r ← Temp.r +cost*AChannel.r -sint
* AChannel.i;
Temp.i ←Temp.i + sint*AChannel.r + cost
* AChannel.i;
}
模擬使用硬件平臺為CPU:Intel i5-4700H;GPU: AMD Radeon E8860。
設置模擬的五種干擾均為伴隨干擾,將雷達實際檢測目標設在100公里處。以線性調頻信號為例設置雷達各項參數進行仿真。信號采樣率fs= 2.5 MHz,信號帶寬B=2 MHz,脈沖寬度T=0.15 ms。每種干擾數量分別設為1。在沒有設置任何干擾時,可以得到單目標回波如圖6所示。

圖6 單目標回波
選擇執行切片干擾,脈內切片寬度40微秒,接收波門內切片總次數以及脈內切片次數均為4。雷達接收機信號處理結果如圖7所示。

圖7 切片干擾回波
執行密集假目標干擾,在距雷達100-230公里范圍內每隔2公里設置一個假目標,結果如圖8所示。

圖8 密集假目標干擾回波
移頻干擾單次移頻寬度為500 KHz,移頻總次數為4次。結果如圖9所示。

圖9 移頻干擾回波
同頻異步干擾設置為單部同型雷達干擾,干擾(出現)距離為230公里。

圖10 同頻異步干擾回波
對于箔條干擾,設置覆蓋整個雷達回波距離范圍的箔條云,回波如圖11所示。

圖11 箔條干擾回波
對于以上五種干擾,由于計算量的不同,利用OpenCL異構計算其回波的時間也不相同。計算量最大的移頻回波平均計算時間為43.3微秒。若僅使用CPU進行回波模擬,移頻干擾回波平均計算時間為105微秒。相對于CPU同構計算平臺,OpenCL異構平臺計算速度提高了2.42倍。表1表示了OpenCL異構平臺下五種干擾各自的計算時間以及相對CPU速度提高的程度。

表1 干擾計算時間及速度提高程度 單位:微秒
數字相控陣雷達干擾模擬數據量大,要求較高的計算速度,對現有平臺計算性能提出了巨大的挑戰。對于數字相控陣雷達干擾回波模擬,本文使用OpenCL異構平臺進行回波數據計算,生成得到多種典型干擾回波,通過與CPU平臺對比,CPU-GPU異構平臺可以顯著提高回波計算速度。如能夠進一步提高平臺硬件性能,預計干擾回波生成速度將更加滿足實時性要求。
[1] 吳曼青.數字陣列雷達及其進展[J]. 中國電子科學研究院學報,2006, 1(1):11-16.
[2] 詹 云,趙新燦,譚同德.基于OpenCL的異構系統并行編程[J].計算機工程與設計,2012,33(11):4191-4195,4293.
[3] 姚 旺,胡 欣,劉 飛,等.基于GPU的高性能并行計算技術[J].計算機測量與控制,2014,22(12):4160-4162.
[4] 陳興國,劉建勇.數字陣列技術的研究[J]. 硅谷,12(9):98-100.
[5] 楊英科, 李 宏, 張宏偉. 雷達密集多假目標干擾及其壓制性能分析[J]. 電子信息對抗技術, 2013, 28(5):54-58.
[6] 張文祥, 李進華. 雷達同頻干擾現象分析研究[J].火控雷達技術, 2007,36(2):50-53.
[7] 袁建軍,趙玉麗.同頻干擾產生機理及特征分析[J].計算機與數字工程,2015, 43(5):812-816.
[8] 李 星,趙宏鐘.箔條云團擴散過程的建模仿真[J].現代電子技術,2011, 34(11):16-18.
[9] 劉文志,陳 軼,吳長江.OpenCL異構并行計算[M].北京:機械工業出版社,2016.
JammingSimulationofDigitalPhasedArrayRadarBasedonOpenCL
Wang Kaituo,Bai Xue,Guo Xiaoyu
(Nanjing Research Institute of Electronic Technology,Nanjing 210039, China)
For the modern war’s complex electromagnetic environment and digital phased array radar’s jamming signal to generate large amounts of data, multi-beam and other difficulties.Depend on the high bandwidth and strong computing power of the graphics processor (GPU), using OpenCL heterogeneous programming framework to achieve data-level parallel Strategy, designed five typical digital jamming parallel algorithm based on OpenCL.The algorithm is optimized according to the read and write mechanism of the GPU, which fully explores the parallel computing ability of GPU. The experimental results show that the GPU-based data parallel computing program compares with the central processing unit (CPU) platform with an acceleration ratio of up to 3.25, which enhances the speed of radar echo simulation equipment and basically satisfies the digital phased array radar’s Real-time signal processing simulation requirements.
digital phased array radar; OpenCL; digital jamming signal; GPU
2017-06-07;
2017-07-17。
王開拓(1993-),男,陜西寶雞人,碩士研究生,主要從事信號與信息系統方向的研究。
1671-4598(2017)09-0186-05
10.16526/j.cnki.11-4762/tp.2017.09.048
TP391.9
A