王平, 李潔, 韓冰*, 胡澤駿, 高新波, 劉建軍, 胡紅橋
1 西安電子科技大學電子工程學院, 西安 710071 2 中國極地研究中心自然資源部極地科學重點實驗室, 上海 200136 3 重慶郵電大學重慶市圖像認知重點實驗室, 重慶 400065
高緯電離層等離子體在太陽風-磁層-電離層(Solar wind-Magnetosphere-Ionosphere)耦合過程的驅動下始終保持運動狀態(Ruohoniemi and Greenwald, 2005),即電離層對流是行星際磁場(Interplanetary Magnetic Field, IMF)與地球磁層相互作用驅動的.全域電離層對流分布被稱為地球磁層-電離層耦合系統狀態的指示器(Cousins and Shepherd, 2010),獲取和分析全域電離層對流模式具有重大意義.現有的電離層對流的探測手段主要包括低空衛星(Heppner,1977; Hairston and Heelis,1990; Rich and Hairston,1994)、高空衛星(F?rster et al.,2009)和地面非相干、相干散射雷達等(Holt et al.,1987; Zhang et al.,2007; Greenwald et al., 1996; Ruohoniemi and Greenwald, 2005; Chisham et al., 2007; Cousins and Shepherd, 2010;Thomas and Shepherd, 2018; Lu et al., 2019).超級雙子極光雷達網(Super Dual Aurora Radar Network,SuperDARN)為電離層等離子體對流研究提供了重要的數據支撐,其共有35部高頻相干散射雷達分布在地球南北半球,探測視野范圍已經從極區電離層拓展至中低緯度電離層.SuperDARN高頻相干散射雷達通常由間隔約為15 m的16個對數周期天線組成主陣列,負責發射和接收高頻無線電信號,由4個天線組成副陣列負責測量回波的到達角(劉瓊瓊,2016).當高頻無線電信號與電離層場向不規則體發生正交時,且雷達波長與不規則體尺度相似時,產生相干后向散射回波(Bragg散射)(王勇,2019).地面雷達接收該回波,通過對回波信號的自相關函數譜分析,可以計算得到回波強度、視線速度以及多普勒譜寬等數據.我國于2010年建成南極中山站高頻雷達站(劉二小等,2012;楊升高等, 2016),且已加入SuperDARN國際合作組織,每年可以獲取大量電離層對流數據(Liu and Wan, 2020).由于SuperDARN高頻雷達覆蓋范圍廣,且在共同觀測區內雷達經常成對分布,能夠獲得二維電離層對流速度(Greenwald et al., 1995),因此基于SuperDARN高頻雷達數據的電離層對流研究受到越來越多學者的關注.
電離層對流統計模型通常被用于分析對流渦形狀、個數和跨極蓋電勢的大小等對流特征與IMF、時鐘角和偶極子傾角等空間環境參數的相關性(Chisham et al., 2007).Ruohoniemi和Greenwald(1996)利用單部雷達的視線速度構建RG96模型,發現IMF北向時全域對流呈復雜的三渦或四渦對流結構且伴隨著日側的向日對流出現,而在其他IMF條件下全域對流主要呈現雙渦結構,IMF的By分量則控制晨昏兩個單元的形狀變化.隨后,Ruohoniemi和Baker(1998)將多部雷達數據映射在全球網格中,利用RG96模型數據對觀測數據缺失區域進行補全,提出“Map potential”方法對速度數據進行擬合,進而獲得全域對流模式,這種方法后期被廣泛應用于對流模型統計分析工作中.Ruohoniemi和Greenwald(2005)改進了RG96模型的數據預處理方法,利用“Map potential”構建了RG05統計模型,統計結果表明季節和世界時(Universal Time, UT)對全域對流模式的影響均小于By分量對其的影響.Pettigrew等(2010)利用SuperDARN南北半球的高頻雷達數據構建了PSR10模型,發現偶極子傾角可以明顯地影響南北半球的對流模式,在偶極子傾角小于10°時南北半球的全域對流模式相似.同時統計結果顯示雖然偶極子傾角對全域對流模式存在一定的影響,但是IMF條件對全域對流模式的影響依舊占據主導地位.Cousins和Shepherd(2010)增加了太陽風速參數來構建統計模型CS10,提出考慮對流中太陽風速的依賴關系可以更好地獲取大尺度對流模式.Thomas和Shepherd(2018)利用北半球中緯度、高緯度和極區多部高頻雷達數據構建TS18模型,發現在太陽活動較弱時,TS18模型得到的對流模式與僅用高緯度雷達數據得到的模式相似,當太陽活動增強時,增加中緯度雷達數據會使得跨極蓋電勢出現增長.TS18模型同時給出Kp指數對全域對流模式的影響與By分量相似.總而言之,統計模型通常是分立的模型,分別表征不同空間環境條件下的電離層對流平均模式(Pettigrew,2010).由于雷達并沒有完全覆蓋待觀測區域且雷達并不能同時檢測到所有門距的回波信號,因此全域對流速度數據存在數據缺失問題.數據缺失問題會直接導致無法獲取足夠的瞬時對流速度數據用于分析動態的全域電離層對流模式.目前通用的解決方法是利用現有統計模型數據來補全空缺區域,即觀測對流速度和統計模型對流數據共同擬合得到全域對流模式(Ruohoniemi and Baker, 1998; Shepherd et al.,1999).
目前,神經網絡模型在空間物理建模和預測領域已經獲得了成功的應用,李志濤和薛炳森(2007)利用誤差反向傳播(Back Propagation,BP)神經網絡對AE指數進行預測,預測結果表明BP神經網絡能夠在AE指數的短期預測中取得較好的結果.韓冰等(2019)利用BP神經網絡和廣義回歸神經網絡(General Regression Neural Network,GRNN)分別對極光卵邊界進行建模.實驗結果表明兩種神經網絡模型都能夠有效地對極光卵邊界進行建模和預測,其中GRNN的建模誤差要低于BP神經網絡的誤差,且GRNN模型更容易訓練.胡澤駿等(2020)將GRNN應用于極光卵強度的建模,利用六個空間環境參數(Bx,By,Bz,Vp,Np,AE)預測極光卵的強度.Liu等(2019)利用BP神經網絡對北半球電離層的跨極蓋電勢進行預測,對比實驗說明BP神經網絡的效果要優于傳統的回歸模型.Liu等(2020)將長短期記憶網絡(Long Short-Term Memory, LSTM)引入跨極蓋電勢的預測,但是對比其利用BP神經網絡預測跨極蓋電勢的結果,LSTM模型的預測誤差更大.綜上所述,目前淺層的神經網絡如GRNN和BP神經網絡可以有效地解決空間物理建模問題.
基于以上分析,我們利用SuperDARN高頻雷達獲取的電離層對流數據對北極地區的電離層對流進行建模.基于韓冰等(2019)和胡澤駿等(2020)對極光數據的建模基礎,模型選擇了GRNN和BP神經網絡,模型輸入為IMF三分量(Bx,By,Bz),太陽風速(Vp),太陽風密度(Np)和地磁指數(AE)六個影響電離層對流的常見空間環境變量,輸出為二維電離層對流速度的方向角和幅值.其中,二維電離層對流速度由北半球23部雷達的觀測數據合成,合成方法選擇矢量合成(“Merge”)法.Provan等(2002)在對比“Merge”、“Map-potential”和“Beam-swinging”三種計算方法在合成二維對流速度任務上的優劣時,提到“Merge”是最準確的對流速度合成方法.因此,本文利用矢量合成的二維電離層對流速度來構建模型.訓練好的模型還可以用于不同空間環境條件下的對流速度預測,補全瞬時對流圖中空缺的對流速度,進而分析瞬時全域對流模式.
SuperDARN分布在地球北半球的23部高頻相干散射雷達的探測范圍覆蓋了大部分的低、中、高緯度電離層,可以對電離層實現全天候進行不間斷觀測.在常規模式下,所有高頻雷達都運行在相同的掃描模式下,每個波束的掃描時間約為7 s,完成視野內的16次完整掃描耗時約2 min,即雷達觀測數據的時間分辨率為2 min(劉瓊瓊,2016).視線速度表征雷達方向上的對流速度,其正負分別表示對流速度靠近和遠離雷達.Chisham和Pinnock(2002)實驗證明F層和地面回波對全域對流速度的計算存在較大的影響,因此需要對原始視線速度進行預處理.首先,利用SuperDARN RST v4.2軟件包(SuperDARN Data Analysis Working Group,2018)剔除較低門距(range<10)、較小多普勒速度(Vlos<30 m·s-1)和較高誤差(Verror>200 m·s-1)的視線速度.然后,將視線速度投影到全球網格(Ruohoniemi and Baker, 1998),并對相同網格處的多個視線速度進行矢量合成,得到瞬時二維對流速度.
雖然北半球SuperDARN高頻雷達的探測范圍已經覆蓋了大部分的極區電離層,但是瞬時二維對流速度數據并不能完全覆蓋極區電離層.例如2016年1月12日00∶37—00∶39視線速度覆蓋區域如圖1a所示,其中帶顏色矢量表示視線速度,矢量末端的點表示速度發生的位置,矢量前端的線段長度和指向表示速度的大小和方向.由于視線速度僅代表雷達波束方向上的速度分量,矢量方向表示遠離或者靠近雷達,為得到準確的二維對流速度,利用“Merge”方法將圖1a中相同位置的視線速度進行矢量合成,結果如圖1b所示.圖中二維速度同樣用矢量表示,矢量前端線段的方向代表對流速度的真實方向.對比圖1a和1b,瞬時二維速度的數量遠少于瞬時視線速度數量,且僅有部分雷達視野范圍內能夠獲取真實二維速度.

圖1 北半球視線速度圖和二維速度圖(2016年1月12日00∶37—00∶39)
基于此,我們選取第23和24太陽周期(1999—2017年)內,高頻雷達運行在常規模式下獲取的對流數據構建電離層對流速度建模數據庫.數據庫包含北緯60°至90°范圍內的二維對流速度數據,數據格式為二維對流速度矢量,有速度的幅值和方向角兩個維度,時間分辨率為2 min.
NASA的空間物理數據設備(Space Physics Data Facility,SPDF)提供了在線OMNI web標準化數據庫,包含32個行星際磁場、太陽風磁場和等離子體數據等空間環境變量.本文選取與等離子對流密切相關的行星際磁場三分量(Bx、By、Bz)、太陽風速度Vp、太陽風密度Np和地磁指數AE六個參數.其中,行星際磁場三分量參數和太陽風參數是描述地球磁層頂處的特征參數,其影響傳播至電離層有一定的時延.該時延近似為經過磁鞘的5 min和Alfven波到達電離層的2 min的時間和(Hu et al.,2017).因此,我們對行星際磁場三分量和太陽風速度和太陽風密度進行7 min的時延.由于電離層對流速度數據的時間分辨率是2 min,OMNI數據的時間分辨率是1 min,因此我們以電離層對流速度數據時間為基準對齊OMNI數據,構建第23和24太陽周期(1999—2017年)內空間物理參數數據庫.
由于SuperDARN獲取的瞬時電離層對流速度圖中存在大量的缺失數據,導致神經網絡無法同時對全域對流速度進行建模.因此,我們利用全球網格圖中的網格劃分,對每個網格分別訓練神經網絡模型.同時,由于數據的缺失問題也限制了訓練數據量,因此我們選擇適合小數據樣本的GRNN和淺層的BP神經網絡來對對流速度進行建模.



圖2 基于GRNN的電離層對流速度建模流程圖
誤差反向傳播(Back Propagation)算法常用于神經網絡的訓練過程,是目前最成功的神經網絡學習算法(周志華, 2016).通常我們將用BP算法訓練得到的多層前饋神經網絡稱為BP神經網絡.BP神經網絡通常包括一層輸入層,一層或多層中間隱層和一層輸出層.神經元之間只存在層間連接,且每個連接都有需要學習的連接權重和偏置.基于BP神經網絡的電離層對流速度建模流程圖如圖3所示.

圖3 基于BP神經網絡的電離層對流速度建模流程圖
相較于GRNN,BP神經網絡的參數更多也具有更加強大的表征能力,Hornik等(1989)證明當隱層神經元的個數足夠多時,多層前饋神經網絡能夠完成對任意復雜的連續函數的建模.但是過多的參數使得BP神經網絡在訓練過程需要更多的訓練數據,且BP神經網絡的訓練效果受模型參數初始化的影響較大.因此,針對電離層對流速度建模問題,我們將BP神經網絡的隱層數設置為兩層.
為了驗證基于神經網絡模型對電離層對流速度建模的有效性,我們選取1999—2017年的SuperDARN雷達數據進行訓練和測試.考慮到數據時間跨越兩個太陽周期,且太陽活動周期對建模的可能存在一定的影響,以及模型在不同太陽周期內的外推性.因此我們首先將1999—2011年(第23個太陽周期)的數據隨機分為訓練集和測試集,驗證模型在測試數據上的誤差.然后將2012—2017年(第24個太陽周期)的數據作為預測集,通過計算預測集上的誤差分析模型的外推性能.同時,我們利用第24個太陽活動周期上的預測數據進行主觀評價實驗,討論模型預測數據的有效性.
3.1.1 網絡參數設置
首先,通過實驗結果確定BP神經網絡中間隱含層的節點數,實驗結果如圖4所示.分別選取了10、20、30、40、50、60、70共七組隱層節點數,實驗結果表明隨著隱層節點數的增加,預測誤差隨之增加,因此我們分析最優節點在1~10范圍內.我們增加了節點數為1~10的實驗,在隱層節點數為6時速度的幅值和方向角的誤差都較小,因此,我們將BP神經網絡的隱層節點數設為6.

圖4 BP神經網絡預測對流速度誤差隨隱含層節點數的變化曲線
對于GRNN網絡,平滑因子σ越小,網絡輸出越逼近訓練數據分布,平滑因子越大,網絡輸出對訓練數據的逼近更平滑.通常平滑因子的取值范圍為0.1~1,實驗結果如圖5所示,當平滑因子取0.1時誤差最小,因此我們將GRNN的平滑因子設為0.1.

圖5 GRNN預測對流速度誤差隨平滑因子的變化曲線
3.1.2 輸入物理參數組合選取
在本實驗中,我們將六個物理參數(Bx,By,Bz,Vp,Np,AE)的不同組合作為模型輸入,分析不同參數組合輸入對模型預測準確性的影響(Ruohoniemi and Greenwald,1996; Cousins and Shepherd,2010; Thomas and Shepherd,2018).首先,計算六個物理參數與對流速度幅值和方向角的相關系數(Liu et al.,2019),如表1所示.從表中可以看出,六個物理參數與對流速度的幅值的相關性系數最高達到0.17,與對流速度方向角的相關性系數最大為0.09,說明物理參數與對流速度的線性相關并不強.

表1 六個物理參數與對流速度的相關系數
By、Bz和AE三個參數與對流速度的幅值和方向角的相關性系數較高,因此,構建物理參數的不同組合C1—C14作為模型的輸入,其中C1—C14分別表示為:C1(By)、C2(Bz)、C3(AE)、C4(By,Bz)、C5(Bz,AE)、C6(By,AE)、C7(By,Bz,AE)、C8(By,Bz,AE,Bx)、C9(By,Bz,AE,Vp)、C10(By,Bz,AE,Np)、C11(By,Bz,AE,Bx,Vp)、C12(By,Bz,AE,Bx,Np)、C13(By,Bz,AE,Vp,Np)、C14(By,Bz,AE,Bx,Vp,Np).將不同物理參數組合分別作為網絡輸入,得到BP神經網絡和GRNN的預測誤差如圖6所示.從圖中可以看出,當輸入為單變量時誤差最大,隨著輸入空間參數種類的增加誤差出現下降,當輸入全部六個參數即C14時誤差最小,說明物理參數與電離層對流速度之間的關系是復雜多變的,需要用多個物理參數進行建模.因此在后續的實驗中,我們將六個物理參數的組合作為模型的輸入.

圖6 不同物理參數組合模型的速度預測誤差
在本實驗中,對流速度幅值和方向角的均方根誤差(Root Mean Square Error,RMSE)被作為客觀評價指標用于驗證模型的準確性.首先,隨機選取1999—2011年數據的2/3作為訓練數據,剩余的1/3作為驗證集,計算模型在驗證集上的均方根誤差.為了分別討論神經網絡模型對不同區域的對流速度的預測準確性,我們將北極極區劃分為18個區域.其中磁緯度劃分為60°~70°MLAT、70°~80°MLAT和80°~90°MLAT三個區間,地磁時區間以4個地磁時為單元劃分為六個不同區間.不同區間的均方誤差結果如表2所示,其中每個單元格內“/”前后分別為基于GRNN的電離層對流速度模型的預測誤差和基于BP神經網絡的模型預測誤差,白色和灰色單元格內分別為預測的速度幅值(m·s-1)和方向角(°)誤差,由于地磁緯度60°~70°MLAT正午(10∶00—14∶00 MLT)區間內缺失數據,因此誤差為空(表中用NaN表示).黑色加粗的結果表示誤差最低.
GRNN模型在不同區間的速度幅值和方向角的平均預測誤差分別為174.96 m·s-1和62.30°,而BP模型的速度幅值和方向角的平均預測誤差分別為234.21 m·s-1和88.07°.雖然BP模型的預測誤差較高,但是由于真實對流速度的幅值最高達到2000 m·s-1左右,方向角范圍為360°,因此兩種神經網絡模型的速度幅值和方向角的預測誤差相對而言還是較低的,說明利用神經網絡來建模電離層對流速度模型是可行的.對比兩種模型,從表2能明顯看出基于GRNN的模型預測誤差在各個區間上都低于基于BP神經網絡的預測誤差,說明GRNN模型比BP模型更加有效地解決對流速度建模和預測問題.該結論也與韓冰和胡澤駿等提出的基于神經網絡的極光卵邊界和強度建模的實驗結果相似(韓冰等,2019; 胡澤駿等,2020).

表2 不同神經網絡模型預測的對流速度誤差
眾所周知,神經網絡需要大量的數據進行訓練.因此針對基于淺層神經網絡的對流速度建模問題,我們利用誤差曲線解釋訓練數據量對模型準確性的影響.我們對每個區間內的訓練數據量進行統計,同時將每個區間的速度誤差與統計直方圖進行疊加,得到數據量與誤差的統計結果如圖7所示,其中紅色曲線和綠色曲線分別代表GRNN模型和BP模型的預測誤差.從圖中看出GRNN的預測誤差曲線和BP的預測誤差曲線的整體趨勢相似.雖然地磁緯度60°~70°區間內的訓練數據量大部分不足20萬,但是預測對流速度幅值和方向角的預測誤差仍能保持在200 m·s-1和100°以下.分析60°~70°MLAT區間內對流數據,發現該范圍內對流模式單調,特別是晨側(02∶00—06∶00MLT)和昏側(14∶00—18∶00MLT)區間內,對流通常為向陽方向從夜側回流至日側,因此小規模訓練集也可以使得網絡學習到對流速度分布特征.

圖7 不同地磁緯度和地磁時區間的訓練數據直方圖與預測誤差曲線圖
同時,我們發現地磁緯度70°~80°和80°~90°區間,模型的預測誤差與訓練數據量之間并沒有明顯的相關性,例如70°~80°MLAT范圍內,雖然06∶00—10∶00MLT和14∶00—18∶00MLT區間內訓練數據量存在明顯差異,但是模型的預測誤差相似;80°~90°MLAT范圍內,雖然22∶00—02∶00MLT區間內的訓練數據量不足10萬,但是模型的預測誤差卻低于其他地磁時區間的模型預測誤差.綜上所述,不同地磁時-地磁緯度區域的模型預測誤差不會隨著訓練數據量的減少而增加,即淺層神經網絡模型可以解決數據量不足的空間物理建模和預測問題.
觀測發現不同太陽活動周期內的太陽黑子數明顯不同,說明太陽活動的強度存在差異.為了分析基于神經網絡的電離層對流速度模型在不同太陽活動周期的魯棒性,即模型的外推性,我們利用訓練好的GRNN模型和BP神經網絡模型計算第24個太陽周期(2012—2017年)內的預測誤差.GRNN模型在2012—2017年的速度幅值和方向角均方根誤差分別為305.35 m·s-1和82.01°.而BP模型在2012—2017年的速度幅值和方向角均方跟誤差分別為738.15 m·s-1和90.56°.我們將第24個太陽周期兩個模型在不同地磁時-地磁緯度區域內的均方根誤差與3.2節中訓練集和測試集屬于同一太陽周期時的預測誤差結果對比來分析不同太陽活動周期對預測結果的影響.
圖8給出了基于GRNN和BP神經網絡的模型分別在不同太陽周期的預測誤差曲線.圖8(a、b)分別為對流速度的幅值和方向角的預測誤差結果圖,其中藍色曲線和紅色曲線分別代表GRNN模型在1999—2011年和2012—2017年測試集上的誤差曲線,黃色曲線和紫色曲線分別代表BP神經網絡模型在1999—2011年和2012—2017年測試集上的誤差曲線.
從圖8可以看出BP神經網絡模型在對流速度幅值上的預測誤差增幅大于GRNN,在對流速度方向角的預測誤差增幅小于GRNN,但是由于GRNN的外推預測誤差與BP網絡的原始誤差相近,整體比較基于GRNN的模型針對不同太陽周期數據的外推性依舊優于BP神經網絡.因此,GRNN模型更適用于預測長時間段內的對流速度.

圖8 不同神經網絡在第24個太陽周期的預測誤差曲線
由于GRNN模型具有良好的外推性,本節中我們將利用GRNN模型預測四種典型空間環境條件下的對流結果,并進行統計分析驗證模型的有效性.本節利用預訓練好的GRNN模型預測第24個太陽周期(2012—2017年)的對流速度,然后利用八階球諧方程對預測對流速度進行擬合,并分析全域對流預測結果在不同行星際磁場條件下的變化規律.現有統計模型發現行星際磁場對全域對流的影響較大(徐良等, 2007),特別是By和Bz分量主要影響對流渦的形狀和大小,因此我們分別選取了行星際磁場南北分量(Bz±)占主導和東西分量(By±)占主導的四種典型條件下的預測結果進行驗證.
行星際磁場Bz分量與對流渦的個數具有較大的相關性,例如當行星際磁場條件為Bz北向主導時,全域對流模式表現為多個對流渦結構,且在日側出現向日對流,而當Bz保持南向時,全局對流模式則保持為兩個規則的對流渦結構.為了驗證Bz分量與預測對流結果也存在這種相關性,我們分別選取了2012年9月26日3時49分至5時3分和2014年2月19日3時48分至4時56分兩個時間段內的事件進行討論.
事件一:2012年9月26日行星際磁場北向
當行星際磁場北向(Bz+)時,磁重聯點發生在高緯度地區,電離層對流模式呈現復雜的多渦結構(Ruohoniemi and Greenwald,2005).行星際磁場三分量在2012年9月26日1時至6時的變化如圖9所示,虛線標出的時間間隔內,即03∶49—05∶03UT時間段內,Bz保持北向且幅度約為6 nT,Bx和By變化幅度較小近似為0 nT,是較為明顯的行星際磁場北向主導條件.

圖9 2012年9月26日1時至6時的行星際磁場三分量曲線圖
圖10展示了在3時49分至5時3分時間段內的原始視線速度利用TS18模型擬合的結果圖(圖10a)和預測對流速度擬合結果圖(圖10b),圖中矢量表示擬合對流速度,矢量的顏色和長度表示速度幅值的大小,線段指向表示速度的方向.圖10a顯示雷達探測的視線速度集中在夜側,圖中的空缺位置利用TS18模型數據進行補全,但是補全的數據比較稀疏.本文模型預測的對流速度圖與原始對流速度圖相比,不僅能夠模擬真實的對流速度,而且對每個空缺網格處都能夠得到預測對流速度.雖然預測對流速度能夠很好地模擬真實的對流模式,但是依舊會有一些偏差.例如圖10中04∶15—04∶17視線速度擬合圖中夜側70°MLAT—2h MLT附近存在夜側流向晨側的對流速度,與此同時預測對流速度圖中在相同位置處卻存在方向相反的對流速度.我們分析該現象可能的原因是視線速度和二維速度之間存在差異,我們的模型是對二維對流速度進行建模,因此預測的結果與視線速度的擬合結果相比有些不同.

圖10 2012年9月26日Bz北向主導時,視線速度擬合圖和預測對流速度圖
為了驗證預測對流速度的準確性,我們分析在Bz為正時不同時刻的對流速度圖的統計特征.在Bz為正時,預測對流速度圖中存在多個對流渦,且在日側高緯度地區出現明顯的小型逆轉對流渦.多位學者也對該現象進行了統計分析,Ruohoniemi和Greenwald (1996)提到當行星際磁場北向(Bz+)時,對流模式會變為復雜的四渦或多渦對流模式,且可能會在日側極蓋區出現逆轉對流單元.Hu等(2006)也提到在Bz為正占主導時,在極蓋區會出現持續時間較長的向陽對流.對比上述統計結果,GRNN模型預測的對流速度能夠有效地模擬Bz北向時復雜的全域對流分布.同時,我們也發現預測的HMB(Heppner-Maynard)邊界(Shepherd and Ruohoniemi,2000)與原始對流速度圖中的邊界相比存在赤道向膨脹,可能的原因是瞬時對流速度的缺失導致訓練集中無法定位邊界位置,因此模型無法對預測對流速度的邊界進行定位.
事件二:2014年2月19日行星際磁場南向
2014年2月19日2時至6時IMF三分量的變化曲線如圖11所示,雖然在2時至4時56分時間段內Bz分量始終為負,但是由于在2時至3時48分之間,By與Bz的絕對值相近,因此該時間段內行星際磁場滿足Bz-/By+的條件.由于本事件針對Bz-為主導的條件進行分析,因此選擇了3時48分至4時56分(圖11中虛線標出的時間間隔)時間段內的事件進行分析.該時間段內行星際磁場Bx分量的數值變化較小且保持在3 nT至7 nT之間,By分量的絕對值在絕大部分時刻小于3 nT,Bz分量保持南向且絕對值大于10 nT,說明在3時48分至4時56分時間段內行星際磁場為Bz-占據主導.已有的統計工作表明,當行星際磁場南向(Bz-)時,行星際磁力線與地球磁力線在日側發生磁場重聯,逆陽的太陽風運動將磁通量運輸至磁尾,在高緯極蓋區出現逆陽的對流從日側流向夜側,然后在低緯產生向陽回流(Ruohoniemi and Greenwald,1998),從而形成較為規則的雙渦對流結構.

圖11 2014年2月19日2時至6時的行星際磁場三分量曲線圖
圖12展示了在3時48分至4時56分時間段內的原始視線速度利用TS18模型擬合的結果圖(圖12a)和預測對流速度擬合結果圖(圖12b).當Bz為負時,預測的全域對流模式是較為規整的雙渦結構,晨側單元和昏側單元比較明顯,且大小和形狀相似.在分析對流的流向時,可以看出當Bz保持南向時,預測的對流從日側高緯度地區穿越極蓋區流向夜側磁午夜區域,在極蓋區形成明顯的逆陽對流,隨后對流在夜側低緯地區分別從晨側和昏側返回日側,在晨側和昏側形成向陽對流.同時,從圖12可以看出,當Bz南向主導時,晨昏兩側的對流單元的大小相近.這些觀測結果都符合現有的統計結果(Ruohoniemi and Greenwald,1996).對比預測速度圖和原始對流速度圖,HMB邊界出現向極向收縮,這是由于訓練集中瞬時對流速度存在大量缺失,難以確定對流速度的邊界位置,因此導致神經網絡模型在建模過程缺少對流速度發生范圍的定位.HMB邊界定位的誤差也導致預測對流速度圖中存在對流速度的位置偏移,例如在04∶01—04∶03時刻視線擬合速度都分布在昏側,并形成明顯的對流單元,其中70°MLAT—15h MLT附近存在一簇大于600 m·s-1的對流速度矢量,而在預測對流速度圖中,這部分對流速度矢量則出現在高緯度區域.

圖12 2014年2月19日Bz南向主導時,視線速度擬合圖和預測對流速度圖
行星際磁場By分量與雙渦對流中的晨側和昏側單元形狀具有較大的相關性,例如當行星際磁場條件由Bz主導轉變為By主導時,全域對流模式變化為兩個非對稱的雙渦對流單元(Pettigrew et al.,2010).為了驗證By分量與預測對流結果也存在這種相關性,我們分別選取了2012年6月3日2時11分至5時48分和2014年2月16日9時2分至11時47分兩個時間段內的事件進行討論.
事件三:2012年6月3日行星際磁場By分量為正
利用GRNN模型預測2012年6月3日2時11分至5時48分時間段內的對流圖來分析By為正時對流速度的變化情況.在該時間段內,行星際磁場三分量在2時至6時的變化曲線如圖13所示.Bx分量保持在-4 nT至-3 nT范圍內,Bz分量大部分趨近于0 nT,By分量則維持在8 nT處,說明該時間段內By為正占據主導.

圖13 2012年6月3日2時至6時的行星際磁場三分量曲線圖
Cousins和Shepherd(2010)總結了北半球的對流模式隨By的變化規律,提到當IMF的By分量為正時,晨側單元形狀為新月形,而昏側單元形狀近似于圓形.圖14展示了在2時11分至5時48分時間段內的原始視線速度利用TS18模型擬合的結果圖(圖14a)和預測對流速度擬合結果圖(圖14b).與原始對流速度圖相比,預測的對流速度擬合的HMB邊界與原始邊界接近,且預測對流速度的流向與原始流向相同.例如05∶43—05∶45時刻視線擬合速度圖中有三簇對流速度分別分布在70°MLAT—20h MLT附近、75°MLAT—21h MLT附近和80°MLAT—0h MLT附近,而預測對流速度圖中相同位置處也存在相同流向的對流速度,且速度幅值相似.另外,預測對流速度圖中增加了更多的對流速度數據,使得整個對流細節更完整.預測的對流速度圖示例具有相似的結構,都呈現出明顯的兩個對流單元,對流流向從日側跨極蓋到達夜側,然后分別在晨側和昏側形成向陽的回流.預測對流速度圖中晨側單元的形狀更趨于新月形,而昏側單元的占比較大形成圓形.這種晨側單元和昏側單元的不對稱性和對流形狀與前面提到的統計結果相似,因此可以說預測對流速度能夠模擬By分量為正時的對流模式.

圖14 2012年6月3日By東向主導時,視線速度擬合圖和預測對流速度圖
事件四:2014年2月16日行星際磁場By分量為負
Ruohoniemi和Greenwald(1996)提到當By為負時,昏側對流單元更趨于新月形,而晨側對流單元更趨于圓形,與By為正時的預測結果存在對稱性.為驗證當By為負時,預測的對流速度也具有該規律,我們選擇2014年2月16日By為負的事件.2014年2月16日8時至13時的行星際磁場三分量的變化曲線如圖15所示.其中,9時2分至11時47分時間段內,Bz分量分布在-5 nT至5 nT范圍內,同時Bx分量保持在-5 nT至0 nT范圍,而By分量始終近似于-15 nT,因此By分量為負且占據主導.

圖15 2014年2月16日8時至13時行星際磁場三分量曲線圖
圖16展示了2014年2月16日9時2分至11時47分時間段內原始視線速度利用TS18模型擬合的結果圖(圖16a)和預測對流速度擬合結果圖(圖16b).視線速度擬合圖呈現兩個對流單元,昏側單元的面積較小,但是晨昏兩個單元的差別不大.預測對流速度圖示例中,首先能夠明顯地看出晨側和昏側兩個對流單元,然后對比兩個單元的形狀,我們發現晨側單元形狀更接近圓形,同時昏側單元形狀更趨于新月形,這與現有的統計結果相符合.值得注意的是10∶41—10∶43和11∶19—11∶21時刻視線速度擬合圖中80°MLAT—1h MLT附近的一簇對流速度,其速度的幅值和方向與預測對流速度圖中相同位置處的對流速度相似.因此可以說預測模型能夠模擬By為負時的全域對流模式.

圖16 2014年2月16日By西向主導時,視線速度擬合圖和預測對流速度圖
綜上所述,分析四種典型空間環境條件下的模型預測效果,預測模型在By主導時的預測對流速度,不僅可以很好的模擬全域對流模式,而且預測對流圖中的HMB邊界與原始邊界接近.在Bz主導的條件下,雖然由于預測模型缺少對流速度邊界位置的定位,不能很好的定位HMB邊界,但是預測模型依舊可以獲得符合現有統計規律的Bz主導條件下的全域對流模式.因此,在四種典型行星際磁場條件(Bz+、Bz-、By+和By-)下,預測的對流速度很好地刻畫了不同的對流模式,說明預測模型的有效性.
本文利用GRNN和BP神經網絡對北極極區的電離層對流速度進行建模,對全球網格圖中60°MLAT至90°MLAT范圍內的所有網格構建物理參數與對流速度的關系模型.在預測階段,給定特定空間環境參數(Bx、By、Bz、Vp、Np和AE),利用模型預測每個網格處的對流速度矢量,從而獲得全域對流速度圖.客觀評價實驗結果表明GRNN和BP神經網絡都能有效地構建電離層對流速度模型,其中基于GRNN的電離層對流模型誤差更低且模型的外推性更好.我們將基于GRNN的電離層對流模型用于預測相鄰太陽周期的全域對流速度圖,并分析四個典型空間環境條件(Bz±,By±)下的速度擬合結果.主觀實驗結果展示了預測的全域對流模式符合現有的統計結果.但是由于訓練數據集中瞬時對流速度存在缺失導致預測模型很難定位對流邊界,在Bz北向主導時,預測的對流速度的HMB邊界存在偏差.未來工作中我們將增加對流速度的定位網絡,彌補現有算法的不足.總而言之,基于淺層神經網絡的對流速度模型對空間物理參數與對流速度之間的關系進行建模,模型既可以用于補全缺失的瞬時對流速度,還可以預測特定空間環境條件下的全域對流模式.
致謝OMNI數據來源于NASA提供的OMNI數據下載網站(http:∥omniweb.gsfc.nasa.gov).超級雙子極光雷達網(SuperDARN)項目由中國、澳大利亞、加拿大、法國、意大利、日本、挪威、南非、英國和美國的相關科研學術機構共同資助,中國極地研究中心在南極中山站的高頻雷達,是SuperDARN雷達網中的成員之一.本文中的SuperDARN數據由中國極地研究中心負責運行的國家極地數據中心提供.同時感謝“子午工程”對南極中山站高頻雷達的支持.