基于IRI的衛(wèi)星高度計電離層Keras神經(jīng)網(wǎng)絡模型研究

2020-06-12 04:37:44薛文文苗洪利苗翔鷹

海洋技術(shù)學報 2020年2期

關(guān)鍵詞：模型

薛文文，苗洪利，苗翔鷹

（中國海洋大學信息科學與工程學院，山東青島 266100）

電離層對微波的延遲是影響微波遙感對地面及海洋觀測的重要因素。特別是對于衛(wèi)星高度計對海表面高度的厘米級測量精度，電離層延遲會帶來較大的測高誤差。電離層延遲主要取決于電離層中的電子密度及總電子含量（Total Electron Content，TEC）。國際參考電離層（International Reference Ionosphere，IRI）構(gòu)建了分層模型，用以預報平靜電離層的平均狀態(tài)，能夠準確預測80%以上的微波路徑上的電子含量[1-2]。但是，IRI模型構(gòu)造復雜、參數(shù)較多，不利于模型的推廣使用[3]。近年來，國外學者通過IRI與高度計實測數(shù)據(jù)進行分析，認為IRI表示在電離層變化情況上具有較高的精確度。但是，用戶一般在其官網(wǎng)上通過輸入必要的時間、位置及高度參量而獲取總電子含量[4]，為在單頻衛(wèi)星高度計上應用該模型帶來困難。基于大數(shù)據(jù)的深度學習可以通過網(wǎng)站獲取大量數(shù)據(jù)，建立基于IRI的神經(jīng)網(wǎng)絡模型[5]。

Keras是基于Tensorflow后端，由Python語言編寫的一種高層神經(jīng)網(wǎng)絡結(jié)構(gòu)。Tensorflow是Google的開源框架，是當今大數(shù)據(jù)、人工智能、圖像識別及深度學習等領(lǐng)域的強大工具。Keras由于具備高效可擴展的序貫模型和函數(shù)式模型，其性能優(yōu)于傳統(tǒng)BP算法。

本文基于IRI電離層預測值，通過Keras網(wǎng)絡框架構(gòu)建一個神經(jīng)網(wǎng)絡模型，利用Jason-2衛(wèi)星高度計雙頻法測得的總電子含量值對神經(jīng)網(wǎng)絡模型進行檢驗，旨在將該模型應用于單頻高度計的電離層延遲校正。

1 數(shù)據(jù)及方法

1.1 IRI-2016模型數(shù)據(jù)獲取

IRI官網(wǎng)（http://irimodel.org/）給出 IRI-2016 在線運行界面，可以輸入時間及位置等信息獲取所需電離層電子含量。但是這種交互式操作，對于幾十萬甚至上千萬的數(shù)據(jù)量來說難以操作。本文采用Python編寫程序，通過程序獲取所需數(shù)據(jù)原理示意圖如圖1所示。

圖1 IRI數(shù)據(jù)獲取原理圖

在客戶端將所需要的請求數(shù)據(jù)進行POST編碼后發(fā)送請求到服務器，服務器會根據(jù)POST請求發(fā)送response響應給客戶端。客戶端收到服務器發(fā)來的數(shù)據(jù)后，使用Python解析庫將需要的信息提取并且保存在本地計算機。本文使用的爬蟲信息與IRI官網(wǎng)上信息一致，包括時間信息（year，month，day，time），位置信息（latitude，longitude，height），還有可選信息F10.7 radio flux（10.7 cm的太陽輻射通量是太陽活動的極好指標[6]。它通常被稱為F10.7指數(shù)，是太陽活動中運行時間最長的記錄之一）等，這樣得到的總電子含量TEC，記為TECIRI[7]。

1.2 Jason-2軌道匹配及數(shù)據(jù)提取

選取 Jason-2的 GDR（Geophysical Data Records）中2016年Cycle281數(shù)據(jù)，每個Cycle由近10 d、254個 Pas（s升降軌）、127圈構(gòu)成。

提取其中Ku波段的時間、經(jīng)度、緯度及對應的用雙頻法測得的電離層延遲值Δ，Δ與總電子含量TEC的關(guān)系如式（1）[8-9]所示:

根據(jù)式（1）可以算出總電子含量：

f為Ku波段的頻率，其值為13.575 GHz；總電子含量TEC的單位為TECU，1 TECU=1016el/m2。

1.3 IRI-2016與Jason-2觀測電子含量對比

在Jason-2的Cycle281中提取Pass11-Pass30(10圈，接近1 d)的時間、經(jīng)緯度、高度及Ku波段電離層延遲等信息，利用式（2）將電離層延遲換算為TEC值，記為TECJason-2。

對比Jason-2與IRI-2016的TEC值，必須首先進行時間和空間信息的匹配。將Jason-2數(shù)據(jù)中的時間，經(jīng)度、緯度、高度信息依次輸入到網(wǎng)絡獲取軟件的POST請求當中，這樣就可以得到時間和位置完全匹配的兩列TEC數(shù)據(jù)。按時間排序的兩列TEC數(shù)值分布見圖2所示。

圖2 電離層總電子含量分布

從圖2可以看出，Jason-2繞地球每一圈，其觀測到的與地面之間的總電子總量具有周期性，反映了地面固定位置電離層分布的日周期性，而IRI-2016模型值表現(xiàn)出與Jason-2觀測值較強的分布一致性。

Jason-2利用雙頻觀測法進行每秒一次的實時觀測，受實時環(huán)境因素影響，會產(chǎn)生較大波動，而IRI-2016模型值是由多層公式積分而得，其結(jié)果必為連續(xù)可微函數(shù)值，其分布為平滑曲線。

由于IRI-2016模型值與雙頻法測量值分布及量值基本一致，因此，基于IRI-2016模型值深度學習的Keras神經(jīng)網(wǎng)絡模型可以用于衛(wèi)星高度計的電離層延遲校正。

2 Keras神經(jīng)網(wǎng)絡模型的建立

深度學習的數(shù)據(jù)集來自IRI-2016模型中2016年將近300萬組數(shù)據(jù)，經(jīng)緯度的精度為0.01°，時間的精度為36 s。70%用于訓練模型，30%用于測試模型。深度學習對計算機性能要求極大，本文選取IRI模型適當?shù)臅r間及空間精度，同時兼顧學習時間和模型結(jié)果準確率[10]。

Keras神經(jīng)網(wǎng)絡模型的時間輸入分為兩個部分：一部分為年積日，即從每年的1月1日起開始累計的天數(shù)，另一部分為日積時，即每天的時刻數(shù)（以0.01小時單位）。同時輸入的參數(shù)還有空間位置信息，包括經(jīng)度（longitude）、緯度（latitude）、高度（height）及 F10.7信息。

圖3為Keras神經(jīng)網(wǎng)絡模型結(jié)構(gòu)示意圖，將前述輸入?yún)⒘孔鳛檩斎雽樱x擇合適的激活函數(shù)以及模型的優(yōu)化器將各層數(shù)據(jù)輸入訓練。模型的層數(shù)以及各層的節(jié)點數(shù)需要不斷地訓練調(diào)整，直到損失達到最小及梯度不再下降，進而固定各層參數(shù)，完成模型的建立。

圖3 Keras神經(jīng)網(wǎng)絡模型結(jié)構(gòu)

本文全鏈接采用6層網(wǎng)絡，前5層的激活函數(shù)均為“relu”，最后一層采用“l(fā)inear”。在隱含層選用“relu”是因為它具有如下優(yōu)點：克服梯度消失的問題與加快訓練速度。最后選用“l(fā)inear”線性激活函數(shù)，為了補償網(wǎng)絡輸出結(jié)果的線性偏置[11]。

對所建立的Keras網(wǎng)絡模型，只要將待測日期和時間分解為年積日和日積時，連同待測位置的經(jīng)緯度及高度輸入模型，即可輸出總電子含量TEC值，記為TECKeras。當然，本文所建模型固定高度為Jason-2的軌道高度（1 336 km），模型只針對于特定的高度計[9-10]。

3 模型測試

神經(jīng)網(wǎng)絡模型的建立均需要測試，一般采用數(shù)據(jù)集的20%用于模型測試[12]。圖4為模型輸出值TECKeras和數(shù)據(jù)集中的目標值TECIRI的擬合散點圖。

圖4 TECKeras和TECIRI擬合散點圖

由圖4可以看出，Keras模型輸出值與IRI-2016的模型值具有很好的一致性。統(tǒng)計結(jié)果表明，二者的均方根誤差為0.72 TECU，相關(guān)系數(shù)高達0.99。這說明Keras模型具有較高的有效性和可靠性。

4 模型應用與結(jié)果分析

將所建模型應用到Jason-2的Cycle281-290中的數(shù)據(jù)，從結(jié)果中選用兩個PASS做出細節(jié)描述。圖5為Pass17和pass18一圈的TEC分布。

圖5 單圈雙頻觀測值和Keras模型值分布

圖中，灰色線為Jason-2雙頻測量的TEC值，為了與Keras模型值（黑色線）進行有效對比，將其進行多項式擬合，其擬合線見圖5中的藍色線。從中可以看出，擬合后的TEC值分布整體與Keras模型值分布較為接近。但是也可以看出，在部分地區(qū)Jason-2的測量值與網(wǎng)絡模型輸出值存在偏差。圖6為單圈情況下兩者的誤差分布直方圖。

圖6 Jason-2與模型輸出值TEC誤差分布直方圖

如圖6所示，Jason-2與模型值兩者的偏差一般在-15～20 TECU之間，且分布集中區(qū)域為-5～10之間，這樣的誤差分布表現(xiàn)出兩者的一個系統(tǒng)性偏差，大約為 4～5 TECU。

圖7 Jason-2與Keras模型值對比

如圖7所示，選用Cycle281-290的高度計數(shù)據(jù)，TECJason-2為雙頻觀測數(shù)據(jù)，TECmodel為Keras模型輸出數(shù)據(jù)，模型輸出值在各Cycle的Jason-2數(shù)據(jù)上表現(xiàn)出良好的一致性，對于范圍更廣的測量區(qū)域做出兩者的數(shù)據(jù)分布圖[13]。統(tǒng)計10個Cycle的各自均方根差（RMSE）和相關(guān)系數(shù)及平均值，結(jié)果見表1所示。

從表1可以看出，二者在各個Cycle內(nèi)的均方根誤差比較穩(wěn)定，均值為4.46 TECU，換算為Ku波段的電離層延遲為8.5 mm，對于測高精度為厘米的衛(wèi)星高度計有良好的提升，毫米的電離層延遲誤差可以接受[14-15]。二者的相關(guān)系數(shù)均值為0.75，此結(jié)果為原始雙頻觀測數(shù)據(jù)與模型對比得到，而原始雙頻觀測數(shù)據(jù)相鄰點存在測量誤差，其值波動較大，如圖5所示，如果進行平滑處理，會提升其相關(guān)系數(shù)。盡管兩者的相對誤差達到0.25左右，但是TEC值當TECU達到較大值30 TECU時候，兩者的誤差也就為6 TECU左右，符合之前對模型的誤差分析。從圖7得到，在模型推廣到其他Cycle的時候，模型輸出值精度和各Cycle數(shù)據(jù)相同，具有較高的準確率。

表1 Jason-2雙頻觀測值與Keras模型值對比

5 總結(jié)

本文采用python編程在IRI網(wǎng)站獲取了與Jason-2衛(wèi)星高度計Cycle281-290同軌道信息的IRI-2016模型電離層總電子含量數(shù)據(jù)。通過將該數(shù)據(jù)與Jason-2利用雙頻法測得的總電子含量比較，二者均具有明顯一致性。

基于IRI-2016數(shù)據(jù)，通過深度學習建立了Keras神經(jīng)網(wǎng)絡模型。經(jīng)測試，模型輸出值與測試數(shù)據(jù)集中的目標值之間的相關(guān)系數(shù)高達0.99，均方根誤差為0.72 TECU，說明模型有效。

將所建Keras神經(jīng)網(wǎng)絡模型應用于Jason-2衛(wèi)星高度計，對比模型值與雙頻觀測值。結(jié)果表明，二者在10個cycle的平均電子含量均方根誤差為4.46 TECU，平均相關(guān)系數(shù)為0.75，對應的Ku波段傳輸延遲值為8.5 mm。

本文所建立的Keras神經(jīng)網(wǎng)絡模型只適用于Jason-2及與其同軌道高度的高度計，這是由于建模時選用Jason-2的軌道高度。IRI模型是從電離層以不同高度分層的數(shù)據(jù)獲得的經(jīng)驗模型，只要選取不同軌道高度的IRI數(shù)據(jù)建模，就可將模型應用于任意高度單頻高度計的電離層延遲誤差校正。