薛文文,苗洪利,苗翔鷹
(中國海洋大學 信息科學與工程學院,山東 青島 266100)
電離層對微波的延遲是影響微波遙感對地面及海洋觀測的重要因素。特別是對于衛(wèi)星高度計對海表面高度的厘米級測量精度,電離層延遲會帶來較大的測高誤差。電離層延遲主要取決于電離層中的電子密度及總電子含量(Total Electron Content,TEC)。國際參考電離層(International Reference Ionosphere,IRI)構(gòu)建了分層模型,用以預報平靜電離層的平均狀態(tài),能夠準確預測80%以上的微波路徑上的電子含量[1-2]。但是,IRI模型構(gòu)造復雜、參數(shù)較多,不利于模型的推廣使用[3]。近年來,國外學者通過IRI與高度計實測數(shù)據(jù)進行分析,認為IRI表示在電離層變化情況上具有較高的精確度。但是,用戶一般在其官網(wǎng)上通過輸入必要的時間、位置及高度參量而獲取總電子含量[4],為在單頻衛(wèi)星高度計上應用該模型帶來困難。基于大數(shù)據(jù)的深度學習可以通過網(wǎng)站獲取大量數(shù)據(jù),建立基于IRI的神經(jīng)網(wǎng)絡模型[5]。
Keras是基于Tensorflow后端,由Python語言編寫的一種高層神經(jīng)網(wǎng)絡結(jié)構(gòu)。Tensorflow是Google的開源框架,是當今大數(shù)據(jù)、人工智能、圖像識別及深度學習等領(lǐng)域的強大工具。Keras由于具備高效可擴展的序貫模型和函數(shù)式模型,其性能優(yōu)于傳統(tǒng)BP算法。
本文基于IRI電離層預測值,通過Keras網(wǎng)絡框架構(gòu)建一個神經(jīng)網(wǎng)絡模型,利用Jason-2衛(wèi)星高度計雙頻法測得的總電子含量值對神經(jīng)網(wǎng)絡模型進行檢驗,旨在將該模型應用于單頻高度計的電離層延遲校正。
IRI官網(wǎng)(http://irimodel.org/)給出 IRI-2016 在線運行界面,可以輸入時間及位置等信息獲取所需電離層電子含量。但是這種交互式操作,對于幾十萬甚至上千萬的數(shù)據(jù)量來說難以操作。本文采用Python編寫程序,通過程序獲取所需數(shù)據(jù)原理示意圖如圖1所示。

圖1 IRI數(shù)據(jù)獲取原理圖
在客戶端將所需要的請求數(shù)據(jù)進行POST編碼后發(fā)送請求到服務器,服務器會根據(jù)POST請求發(fā)送response響應給客戶端。客戶端收到服務器發(fā)來的數(shù)據(jù)后,使用Python解析庫將需要的信息提取并且保存在本地計算機。本文使用的爬蟲信息與IRI官網(wǎng)上信息一致,包括時間信息(year,month,day,time),位置信息(latitude,longitude,height),還有可選信息F10.7 radio flux(10.7 cm的太陽輻射通量是太陽活動的極好指標[6]。它通常被稱為F10.7指數(shù),是太陽活動中運行時間最長的記錄之一)等,這樣得到的總電子含量TEC,記為TECIRI[7]。
選 取 Jason-2的 GDR(Geophysical Data Records)中2016年Cycle281數(shù)據(jù),每個Cycle由近10 d、254個 Pas(s升降軌)、127圈構(gòu)成。
提取其中Ku波段的時間、經(jīng)度、緯度及對應的用雙頻法測得的電離層延遲值Δ,Δ與總電子含量TEC的關(guān)系如式(1)[8-9]所示:

根據(jù)式(1)可以算出總電子含量:

f為Ku波段的頻率,其值為13.575 GHz;總電子含量TEC的單位為TECU,1 TECU=1016el/m2。
在Jason-2的Cycle281中提取Pass11-Pass30(10圈,接近1 d)的時間、經(jīng)緯度、高度及Ku波段電離層延遲等信息,利用式(2)將電離層延遲換算為TEC值,記為TECJason-2。
對比Jason-2與IRI-2016的TEC值,必須首先進行時間和空間信息的匹配。將Jason-2數(shù)據(jù)中的時間,經(jīng)度、緯度、高度信息依次輸入到網(wǎng)絡獲取軟件的POST請求當中,這樣就可以得到時間和位置完全匹配的兩列TEC數(shù)據(jù)。按時間排序的兩列TEC數(shù)值分布見圖2所示。

圖2 電離層總電子含量分布
從圖2可以看出,Jason-2繞地球每一圈,其觀測到的與地面之間的總電子總量具有周期性,反映了地面固定位置電離層分布的日周期性,而IRI-2016模型值表現(xiàn)出與Jason-2觀測值較強的分布一致性。
Jason-2利用雙頻觀測法進行每秒一次的實時觀測,受實時環(huán)境因素影響,會產(chǎn)生較大波動,而IRI-2016模型值是由多層公式積分而得,其結(jié)果必為連續(xù)可微函數(shù)值,其分布為平滑曲線。
由于IRI-2016模型值與雙頻法測量值分布及量值基本一致,因此,基于IRI-2016模型值深度學習的Keras神經(jīng)網(wǎng)絡模型可以用于衛(wèi)星高度計的電離層延遲校正。
深度學習的數(shù)據(jù)集來自IRI-2016模型中2016年將近300萬組數(shù)據(jù),經(jīng)緯度的精度為0.01°,時間的精度為36 s。70%用于訓練模型,30%用于測試模型。深度學習對計算機性能要求極大,本文選取IRI模型適當?shù)臅r間及空間精度,同時兼顧學習時間和模型結(jié)果準確率[10]。
Keras神經(jīng)網(wǎng)絡模型的時間輸入分為兩個部分:一部分為年積日,即從每年的1月1日起開始累計的天數(shù),另一部分為日積時,即每天的時刻數(shù)(以0.01小時單位)。同時輸入的參數(shù)還有空間位置信息,包括經(jīng)度(longitude)、緯度(latitude)、高度(height)及 F10.7信息。
圖3為Keras神經(jīng)網(wǎng)絡模型結(jié)構(gòu)示意圖,將前述輸入?yún)⒘孔鳛檩斎雽樱x擇合適的激活函數(shù)以及模型的優(yōu)化器將各層數(shù)據(jù)輸入訓練。模型的層數(shù)以及各層的節(jié)點數(shù)需要不斷地訓練調(diào)整,直到損失達到最小及梯度不再下降,進而固定各層參數(shù),完成模型的建立。

圖3 Keras神經(jīng)網(wǎng)絡模型結(jié)構(gòu)
本文全鏈接采用6層網(wǎng)絡,前5層的激活函數(shù)均為“relu”,最后一層采用“l(fā)inear”。在隱含層選用“relu”是因為它具有如下優(yōu)點:克服梯度消失的問題與加快訓練速度。最后選用“l(fā)inear”線性激活函數(shù),為了補償網(wǎng)絡輸出結(jié)果的線性偏置[11]。
對所建立的Keras網(wǎng)絡模型,只要將待測日期和時間分解為年積日和日積時,連同待測位置的經(jīng)緯度及高度輸入模型,即可輸出總電子含量TEC值,記為TECKeras。當然,本文所建模型固定高度為Jason-2的軌道高度(1 336 km),模型只針對于特定的高度計[9-10]。
神經(jīng)網(wǎng)絡模型的建立均需要測試,一般采用數(shù)據(jù)集的20%用于模型測試[12]。圖4為模型輸出值TECKeras和數(shù)據(jù)集中的目標值TECIRI的擬合散點圖。

圖4 TECKeras和TECIRI擬合散點圖
由圖4可以看出,Keras模型輸出值與IRI-2016的模型值具有很好的一致性。統(tǒng)計結(jié)果表明,二者的均方根誤差為0.72 TECU,相關(guān)系數(shù)高達0.99。這說明Keras模型具有較高的有效性和可靠性。
將所建模型應用到Jason-2的Cycle281-290中的數(shù)據(jù),從結(jié)果中選用兩個PASS做出細節(jié)描述。圖5為Pass17和pass18一圈的TEC分布。

圖5 單圈雙頻觀測值和Keras模型值分布
圖中,灰色線為Jason-2雙頻測量的TEC值,為了與Keras模型值(黑色線)進行有效對比,將其進行多項式擬合,其擬合線見圖5中的藍色線。從中可以看出,擬合后的TEC值分布整體與Keras模型值分布較為接近。但是也可以看出,在部分地區(qū)Jason-2的測量值與網(wǎng)絡模型輸出值存在偏差。圖6為單圈情況下兩者的誤差分布直方圖。

圖6 Jason-2與模型輸出值TEC誤差分布直方圖
如圖6所示,Jason-2與模型值兩者的偏差一般在-15~20 TECU之間,且分布集中區(qū)域為-5~10之間,這樣的誤差分布表現(xiàn)出兩者的一個系統(tǒng)性偏差,大約為 4~5 TECU。

圖7 Jason-2與Keras模型值對比
如圖7所示,選用Cycle281-290的高度計數(shù)據(jù),TECJason-2為雙頻觀測數(shù)據(jù),TECmodel為Keras模型輸出數(shù)據(jù),模型輸出值在各Cycle的Jason-2數(shù)據(jù)上表現(xiàn)出良好的一致性,對于范圍更廣的測量區(qū)域做出兩者的數(shù)據(jù)分布圖[13]。統(tǒng)計10個Cycle的各自均方根差(RMSE)和相關(guān)系數(shù)及平均值,結(jié)果見表1所示。
從表1可以看出,二者在各個Cycle內(nèi)的均方根誤差比較穩(wěn)定,均值為4.46 TECU,換算為Ku波段的電離層延遲為8.5 mm,對于測高精度為厘米的衛(wèi)星高度計有良好的提升,毫米的電離層延遲誤差可以接受[14-15]。二者的相關(guān)系數(shù)均值為0.75,此結(jié)果為原始雙頻觀測數(shù)據(jù)與模型對比得到,而原始雙頻觀測數(shù)據(jù)相鄰點存在測量誤差,其值波動較大,如圖5所示,如果進行平滑處理,會提升其相關(guān)系數(shù)。盡管兩者的相對誤差達到0.25左右,但是TEC值當TECU達到較大值30 TECU時候,兩者的誤差也就為6 TECU左右,符合之前對模型的誤差分析。從圖7得到,在模型推廣到其他Cycle的時候,模型輸出值精度和各Cycle數(shù)據(jù)相同,具有較高的準確率。

表1 Jason-2雙頻觀測值與Keras模型值對比
本文采用python編程在IRI網(wǎng)站獲取了與Jason-2衛(wèi)星高度計Cycle281-290同軌道信息的IRI-2016模型電離層總電子含量數(shù)據(jù)。通過將該數(shù)據(jù)與Jason-2利用雙頻法測得的總電子含量比較,二者均具有明顯一致性。
基于IRI-2016數(shù)據(jù),通過深度學習建立了Keras神經(jīng)網(wǎng)絡模型。經(jīng)測試,模型輸出值與測試數(shù)據(jù)集中的目標值之間的相關(guān)系數(shù)高達0.99,均方根誤差為0.72 TECU,說明模型有效。
將所建Keras神經(jīng)網(wǎng)絡模型應用于Jason-2衛(wèi)星高度計,對比模型值與雙頻觀測值。結(jié)果表明,二者在10個cycle的平均電子含量均方根誤差為4.46 TECU,平均相關(guān)系數(shù)為0.75,對應的Ku波段傳輸延遲值為8.5 mm。
本文所建立的Keras神經(jīng)網(wǎng)絡模型只適用于Jason-2及與其同軌道高度的高度計,這是由于建模時選用Jason-2的軌道高度。IRI模型是從電離層以不同高度分層的數(shù)據(jù)獲得的經(jīng)驗模型,只要選取不同軌道高度的IRI數(shù)據(jù)建模,就可將模型應用于任意高度單頻高度計的電離層延遲誤差校正。