周浩,李毅,蘭勝威,劉海
中國空氣動力研究與發展中心 超高速空氣動力研究所,綿陽 621000
人類航天活動日趨頻繁,空間碎片數量急劇增加,對航天器構成了嚴重威脅。目前,以國際空間站為代表的長期在軌航天器一般采用Whipple 防護屏技術進行空間碎片防護,基本思想是在航天器艙壁前一定距離處設置一薄板,在空間碎片(下文統稱為彈丸)超高速碰撞(Hypervelocity Impact,HVI)下形成碎片云,使入射彈丸動能被高度分散,從而實現對航天器的有效保護。碎片云侵徹能力的影響因素包括碎片云形狀、質量分布以及速度等。因此,為了設計更加有效的防護結構,研究彈丸超高速碰撞薄板形成碎片云的質量分布及其隨時間變化規律具有重要意義。
對超高速碰撞碎片云進行理論研究非常困難,在二級輕氣炮上開展地面超高速碰撞試驗是更為有效的研究手段。與試驗相比,數值模擬在成本、效率、參數范圍以及數據獲取等方面存在優勢,越來越受到研究者重視,提出了多種工程模型來快速預測碎片云形狀、質量分布以及速度分布等特性,鄭建東、邸德寧等對此進行了較為系統的綜述。Sch?fer模型是較為典型的碎片云工程模型,它將碎片云簡化為1 個均勻橢球殼、1 個內切于該橢球殼的均勻球殼以及1 個位于碎片云前端的大碎片。黃潔、馬兆俠等從碎片云每個碎片的特征量(包括質量、速度和空間角度等)統計規律出發,構建了一個基于概率的碎片云工程模型。這些工程模型的計算效率非常高,但往往過度簡化、精度不高。近年來,研究者開始探索神經網絡技術在空間碎片防護領域的應用。Ryan 等利用人工神經網絡技術預測鋁球能否擊穿鋁板,并與經典彈道極限方程對比,結果表明人工神經網絡在訓練參數范圍內精度較高,主要缺點在于外推能力很差。Hosseini 等采用人工神經網絡技術擬合了靶板穿孔直徑與彈丸半徑、靶板厚度、彈丸質量、碰撞角度、彈丸和靶板材料等因素之間的關系。劉源等基于測量得到的超高速碰撞聲發射信號的時域特征、頻域特征以及小波能力分數,利用人工神經網絡技術自動識別損傷模式(成坑和穿孔等)。
給定一組輸入參數,生成一幅灰度圖,條件變分自編碼器(Conditional Variation Auto Encoder,CVAE)的功能與此類似。本文研究團隊前期對采用CVAE 模型預測碎片云形狀變化過程進行了初步研究,輸入參數為彈丸速度、彈丸半徑、靶板厚度和觀測時間,輸出結果為一個100×100 的矩陣,表征了碎片云的二維質量分布。初步研究結果表明CVAE 模型預測精度遠高于傳統工程模型,且計算效率遠高于數值模擬;但是CVAE 模型也存在一個嚴重問題,即模型幾乎沒有外推能力。為改善模型外推能力,本文將像素點的x 和y 坐標也視為輸入參數,則預測結果為一個空間點的灰度值(標量),通過采用多層感知機模型(Multi-Layer Perceptron,MLP),根據通用近似定理可以從理論上保證預測精度,從而有可能提高模型的外推能力。此外,對于數值模擬而言,同一組輸入參數生成的圖像是固定的,導致CVAE 模型中的編碼過程并非必要,可以直接對輸入參數進行解碼,從而得到反卷積模型(De-Convolutional Neural Networks,DCNN)。因此,本文通過系統比較MLP 模型和DCNN 模型,重點考察模型的外推能力。
本文采用光滑粒子流體動力學(Smoothed Particle Hydrodynamics,SPH)數值模擬結果作為訓練集,由PTS 軟件批量計算。以彈丸(鋁球)超高速正碰撞靶板(鋁板)作為算例。坐標原點為彈丸與鋁板的初始接觸點,以沿著速度方向–4~10 cm、垂直速度方向–7~7 cm 的方形區域(忽略反濺碎片云后部質量較少的區域)作為問題域,將該區域劃分為100×100 的網格,統計每個小網格中的總質量m,并以這1×10個數據表征碎片云質量分布。由于每個小網格中的質量相差很大,定義質量對數為(部分小網格中質量為0,則加上一個很小的實數):

對質量對數進行歸一化:

神經網絡的輸出層采用sigmoid 激活函數,因此模型預測結果是歸一化的。參考同樣的全局最小和最大網格質量對數,可將模型預測結果還原為真實質量m。
數值模擬中彈丸速度v 的范圍為3~8 km/s(間隔1 km/s),彈丸半徑r 范圍為2~8 mm(間隔1 mm),靶板厚度d 范圍為1~4 mm(間隔1 mm),觀測時間t 范圍為1 ~12 μs(間隔1 μs),共2 016 個數據作為訓練集。輸入數據同樣需要歸一化:

需要注意的是:當輸入參數在訓練集內時,歸一化輸入參數在0~1 之間;若輸入參數大于訓練集范圍(如測試模型外推能力時),歸一化輸入參數大于1。
Bhowmik 等采用CVAE 模型對蛋白質折疊進行了模擬,解碼器包括1 個全鏈接層和4 個的反卷積層。本文借鑒該結構設計了如圖1所示的反卷積模型。模型采用2 個全鏈接層升維,通過5 個反卷積層(filters=256,128,64,32,1)加批量歸一化層生成最后的質量分布圖像。

圖1 反卷積模型Fig.1 De-convolutional neural networks architecture
第i 行第j 列小網格中的歸一化質量對數是歸一化彈丸速度、彈丸半徑、靶板厚度以及觀測時間4 個變量的連續函數:

代表像素位置信息的下標i 和j 從離散值(1,2,···,100)擴展至連續值(0~1):



根據通用近似定理,只要神經元數量足夠,采用包含一個隱藏層的多層感知機即可以任意精度擬合上述函數。據此設計了如圖2所示的多層感知機模型,其中有2 個包含1 000 個神經元的隱藏層。第一層采用ReLU 激活函數,第二層采用sigmoid 激活函數。此外,為了防止過擬合,增加了2 個Dropout層[19]。

圖2 多層感知機模型Fig.2 Multi-layer perceptron architecture
兩種模型實現都采用Keras 函數庫,后臺使用TensorFlow 深度學習框架執行模型訓練。損失函數統一采用均方誤差(Mean Square Error,MSE),模型優化使用RMSProp 算法,兩種模型的參數數量都在10左右。對于DCNN 模型,在NVIDIA K6000 GPU 卡上訓練400 個epochs 大約需要5 h;而對于MLP 模型,訓練200 個epochs 大約需要11 h。加載已經訓練好的DCNN 模型和MLP 模型后,在i7-6700CPU、內存8G 的臺式計算機上生成1 個碎片云圖像的平均時間分別為毫秒量級和秒量級。
本節考察模型復現訓練集中數據的能力。取彈丸速度8 km/s、彈丸半徑2 mm、靶板厚度4 mm,此時彈丸半徑較小、靶板較厚,彈丸破碎比較嚴重。圖3為此參數條件下的數值模擬和模型預測結果對比。取彈丸速度8 km/s、彈丸半徑8 mm、靶板厚度1 mm,此時彈丸較大、靶板較薄,彈丸破碎不嚴重,形成了一個中心大碎片。圖4為在此參數下的數值模擬和模型預測結果對比。

圖3 數值模擬與模型預測結果對比(v=8 km/s,d=4 mm,r =2 mm)Fig.3 Comparison of numerical simulations and model predictions(v=8 km/s,d=4 mm,r =2 mm)

圖4 數值模擬與模型預測結果對比(v=8 km/s,d=1 mm,r =8 mm)Fig.4 Comparison of numerical simulations and model predictions(v=8 km/s,d=1 mm,r =8 mm)
從圖3和4 中可以看出,深度學習模型預測精度遠高于傳統工程模型。此外,DCNN 模型能夠捕捉到碎片云中質量分布的顆?;再|,而MLP 模型對碎片云中的質量分布進行了均質化處理。
考察模型在訓練參數范圍內的插值能力。取彈丸速度3.5、5.5 和7.5 km/s,靶板厚度1.5 mm,彈丸半徑7.5 mm 以及觀測時間7.5 μs,共3 個算例,模型預測與數值模擬結果的對比如圖5所示??梢钥吹剑逯到Y果連續且穩定,與數值模擬結果吻合。

圖5 模型內插能力(d=1.5 mm,r =7.5 mm,t =7.5 μs)Fig.5 Interpolation capability in the velocity direction(d=1.5 mm,r =7.5 mm,t =7.5 μs)
為了定量描述模型的預測精度,定義每個網格內的相對誤差。很多網格內的質量為0,而靶板內部網格質量為常數,可以選為基準。定義每個網格質量相對百分比誤差e和總體平均誤差分別為:

式中:m為模型預測網格內質量;m為對應網格內真實的物理質量(由數值模擬給出);m為靶板內部網格真實質量;n 為每幅圖片中的網格總數,本文中為10 000。對于上述3 個算例,DCNN 模型的總體平均誤差約為1.86%,而MLP 模型的總體平均誤差約為0.32%。
設計如表1所示的4 組算例,分別測試模型在彈丸速度、彈丸半徑、靶板厚度和觀測時間4 個變量方向的外推能力。表中加粗數據表示該數據在訓練參數范圍之外。4 組算例G1、G2、G3 和G4 的數值模擬結果與對應的模型預測結果對比如圖6~9 所示。

表1 外推算例參數設計Table 1 Input parameters design for model extrapolation

圖6 模型在彈丸速度上的外推能力Fig.6 Model extrapolation capability in the velocity direction
從圖6和7 可以看到,MLP 模型的外推能力明顯優于DCNN 模型。從圖7還可以看到,參數r 越大,預測圖片上的穿孔直徑(圖中碎片云與靶板重合區域的橫向寬度)也越大,這說明兩種模型都學習到了參數r 與靶板穿孔直徑之間的關系,但是MLP 模型的外推能力更強。

圖7 模型在彈丸半徑上的外推能力Fig.7 Model extrapolation capability in the impactor radius direction
從圖8可以看到,MLP 模型在d 為6 mm 和8 mm 時預測的靶板不再是標準的長方形,因為預測結果具有一定誤差。但從總的趨勢來看,參數d 越大,MLP 模型預測的靶板厚度也越大,表明MLP 模型通過學習知道了參數d 與板厚之間的關系,而DCNN 模型沒有學習到這一點。

圖8 模型在靶板厚度上的外推能力Fig.8 Model extrapolation capability in the target thickness direction
從圖9可以看到,DCNN 模型在時間方向上幾乎沒有外推能力,而MLP 模型能夠從1~12 μs 的圖像中學習規律,并且以一定精度預測24 μs 時刻的圖像。表1中16 個算例的誤差分布如圖10 所示,可以看到最大平均誤差約為4%。

圖9 模型在觀測時間上的外推能力Fig.9 Model extrapolation capability in the time direction

圖10 外推算例的誤差分布Fig.10 Error distribution for model extrapolation cases
總的來說,多層感知機模型的外推能力明顯優于反卷積模型。在圖像識別領域,大量研究結果表明,卷積網絡結構更傾向于關注圖像的紋路等細節特征,而忽略圖像的整體形狀,這和本文的反卷積模型的表現類似。多層感知機模型的精度有數學定理保證,外推能力也較強。
本文系統比較了反卷積模型和多層感知機模型在預測超高速碰撞碎片云二維質量分布時的優缺點,研究結果表明:
1)在訓練參數范圍內,反卷積模型和多層感知機兩種模型都具有較高精度。
2)反卷積模型能夠捕捉到碎片云的顆?;再|,但是外推能力較差。
3)通過將位置信息加入到標簽數據,使得多層感知機模型的精度具有數學理論保證。多層感知機模型對碎片云質量分布進行了局部均勻化處理,外推能力較好。