陳旭早 袁利軍



摘要: 用物理信息神經網絡方法數值求解間斷系數光波衍射問題. 結果表明: 用光滑函數近似間斷系數可大幅度提高物理信息神經網絡求解精度;? 用物理信息神經網絡求解散射場比直接求解總場效果更好. 最后通過數值實驗驗證理論結果的正確性.
關鍵詞: 物理信息神經網絡; 光波衍射; 間斷系數; 光滑函數
中圖分類號: O436文獻標志碼: A文章編號: 1671-5489(2024)02-0423-08
Solving Light Wave Diffraction Problem Based onPhysics-Informed Neural Networks
CHEN Xuzao, YUAN Lijun
(School of Mathematics and Statistics, Chongqing Technology and Business University, Chongqing 400067, China)
Abstract: We used the physics-informed neural networks method to numerically solve the problem of discontinuous coefficient light wave diffraction. The results show that approximating the discontinuous coefficient with a smooth function can significantly improve the accuracy of the physics-informed neural network solution. Using physics-informed neural networks to solve the scattered field is better than directly solving the total field. Finally, the correctness of the theoretical results is verified through numerical experiments.
Keywords: physics-informed neural network; light wave diffraction; discontinuous coefficient; smooth function
物理信息神經網絡(PINN)方法廣泛用于數值求解偏微分方程[1]: Mao等[2]用物理信息神經網絡解決了高速空氣動力學流動模型的正問題和反問題; Fang等[3]利用物理信息神經網絡解決了頻域Maxwell方程和超材料設計問題; 陸至彬等[4]基于軟邊界和硬邊界兩種設定方法構建了神經網絡求解傳熱方程; Lu等[5]提出了一個通用的深度學習框架DeepONet, 用于學習各種連續非線性算子.
與傳統偏微分方程數值求解方法相比, 物理信息神經網絡方法有如下優點: 1) 不需進行網格離散化[6], 傳統方法如有限差分法和有限元法均需進行網格離散化, 從而增加了計算復雜度和計算時間, 而物理信息神經網絡不需網格離散化過程, 且可并行處理, 從而提高了求解效率; 2) 物理信息神經網絡方法可處理高維問題[7], 有效避免了“維數災難”問題; 3) 物理信息神經網絡方法在求解非線性方程中具有優勢[8], 由于物理信息神經網絡通過引入物理約束條件學習數據中的非線性關系進行求解, 因此物理信息神經網絡可有效解決非線性方程的求解任務; 4) 損失函數結構簡單易于構造.
光波衍射在實際中應用較多[9-11], 可用一個具有間斷系數的Helmholtz方程的邊值問題描述. 由于方程解在間斷點不存在二階偏導數, 因此用物理信息神經網絡求解時, 損失函數在間斷點處無法定義, 效果較差. 當介質介電常數變化較大時, 物理信息神經網絡訓練效果極差. Jagtap等[12]提出了守恒性物理信息神經網絡cPINN, 該方法將原始求解區域劃分為多個子區域, 并在損失函數中強化相鄰子區域界面通量的守恒約束, 在模擬激波面等光滑性較差甚至間斷的情況下可提高精確度; Kharazmi等[13]對PINN方法進行了改進, 提出一種基于區域分解的變分物理信息神經網絡(hp-VPINNs)方法, 該方法采用變分原理描述偏微分方程問題, 使用域分解處理復雜的網格結構, 從而實現高效求解.
本文針對間斷系數邊值問題無法訓練的問題, 引入光滑函數近似間斷系數, 并將光波衍射問題分為總場和散射場的邊值問題分別進行求解. 結果表明: 該方法對損失函數的改動較小, 并提高了計算效果; 物理信息神經網絡方法求解散射場的邊值問題效果更好.
1 一維光柵衍射問題
1.1 理 論
將求解總場且不進行光滑化的解u(x;θ)記為方法1, 求解散射場且不進行光滑化的解u(s)(x;θ)記為方法2, 求解總場并進行光滑化的解uδ(x;θ)記為方法3, 求解散射場并進行光滑化的解u(s)δ(x;θ)記為方法4. 對4種方法進行比較, 取訓練集觀測點數為N=400, 選點方式為均勻選點, 光滑函數δ=10-4, 神經網絡結構為8層, 每層40個神經元, 迭代次數為3×105. 由于方法3和方法4所求結果為散射場, 因此需用u=u(s)+u(i)計算總場. 在傳播過程中沒有能量損耗, 若反射系數R2和透射系數T2之和越接近1, 則表示數值計算結果越精確. 各方法的數值結果與總場真解L2誤差、 數值計算的反射系數R2和透射系數T2之和、 數值計算的反射系數R2與真實解R2之差的絕對值以及數值計算的反射系數T2與真實解T2之差的絕對值列于表1, 損失函數以及數值解的實部分別如圖2和圖3所示.
由表1、 圖2和圖3可見: 方法2計算散射場的誤差比方法1計算總場小, 并且方法2損失函數曲線下降更快, 由于間斷系數不可導, 因此兩種方法的計算結果誤差較大; 進行光滑化后方法3和方法4的損失函數曲線下降更快, 振蕩更少, 訓練效果更好, 并且解的誤差更小; 方法4為所有方法中誤差最小且反射系數R2和透射系數T2之和最接近1, 并且R2誤差和T2誤差均最小, 因此在一維光柵衍射問題中, 用方法4求解散射場并進行光滑化的訓練方法最有效. 在僅改變神經網絡結構、 網絡層數和每層神經元數量的條件下, 利用方法4進行數值實驗, 結果列于表2.
由表2可見, 隨著網絡層數的增加, 模型的誤差越來越小, 由于神經網絡層數從8層增加到10層誤差變化較小, 因此本文選取神經網絡層數為8層.
3.1.2 選取δ
由于光滑函數中的δ是一個超參數, 因此需尋找最優的δ. 在10層介質的基礎上進行實驗, 選擇網絡結構為8個隱藏層, 每層神經元數量為40個, 其他條件不變, 僅改變δ, 利用方法4進行實驗, 結果列于表3.
引入光滑函數后的物理信息神經網絡方法與真解的誤差可表示為uδ-u≤uδ-uδ+uδ-u,(17)其中u為原方程的解, uδ為光滑后的真解, uδ為光滑后神經網絡求得的近似解. 由表3可見, δ越大函數越光滑, 但δ太大會導致光滑函數εδ(x)與原介電函數ε(x)差距過大, 導致uδ-u增大, 而δ太小會使光滑函數在間斷點處導數過大不夠光滑, 導致uδ-uδ增大, 因此為保證uδ-u和uδ-uδ都足夠小, 超參數δ應選取適中的值才能使誤差最小, 在該問題中δ=10-3誤差最小.
3.2 二維光柵衍射
用物理信息神經網絡對二維光柵問題進行求解, 取ω=0.55(2πc/L), ε0=1, ε1=10, L=1, a=0.3L, n=2, 介電函數ε(x)為ε(x,y)=ε0,/(x,y)ΩD,
二維與一維命名方法相同. 取訓練集觀測點數為N=3 200, Nbx=80, Nby=40, 選點方式為均勻選點, 光滑函數δ=10-3, 神經網絡結構為8層, 每層80個神經元, 迭代次數為2×105. 將有限元的解作為參考解, 各方法的數值結果與總場參考解L2誤差、 反射系數R2和透射系數T2之和、 數值計算的反射系數R2與參考解的R2之差的絕對值以及數值計算的反射系數T2與參考解T2之差的絕對值列于表4, 損失函數以及各方法解與參考解之差的模分別如圖4和圖5所示.
由表4、 圖4和圖5可見: 方法1和方法2的損失函數曲線下降較慢, 進行光滑后方法3和方法4[KG*6]的損失函數曲線下降更快; 方法1,2,3的誤差均較大, 計算效果較差, 其中方法2雖然R2+T2接近1, 但R2和T2的誤差均較大; 方法4[KG*6]為所有方法中誤差最小, 并且R2+T2最接近1, 因此在二維光柵衍射問題中, 用方法4求解散射場并進行光滑化的訓練方法同樣最有效.
與一維情形類似, 在僅改變神經網絡結構、 網絡層數和每層神經元數量的條件下, 利用方法4進行數值實驗, 結果列于表5.
由表5可見, 增加神經網絡層數和神經元數量即增加網絡結構的復雜程度均可降低誤差. 與一維問題的結果相比, 二維問題需更復雜的網絡結構才能達到較好的精度.
綜上, 本文將物理信息神經網絡方法用于求解光柵衍射問題. 結果表明, 將間斷系數近似為一個光滑函數可提升計算效果, 并且計算散射場比總場的結果更好. 通過一維和二維光柵衍射的數值實驗驗證了結論, 并在多組對照實驗中找到合適的超參數(神經網絡層數、 每層神經元數量和光滑函數δ值)以達到最小的誤差.
參考文獻
[1]李野, 陳松燦. 基于物理信息的神經網絡: 最新進展與展望 [J]. 計算機科學, 2022, 49(4): 254-262. (LI Y, CHEN S C. Physics-Informed Neural Networks: Recent Advances and Prospects [J]. Computer Science, 2022, 49(4): 254-262.)
[2]MAO Z P, JAGTAP A D, KARNIADAKIS G E. Physics-Informed Neural Networks for High-Speed Flows [J]. Computer Methods in Applied Mechanics and Engineering, 2020, 360: 112789-1-112789-26.
[3]FANG Z W, ZHAN J. Deep Physical Informed Neural Networks for Metamaterial Design [J]. IEEE Access, 2019, 8: 24506-24513.
[4]陸至彬, 瞿景輝, 劉樺, 等. 基于物理信息神經網絡的傳熱過程物理場代理模型的構建 [J]. 化工學報, 2021, 72(3): 1496-1503. (LU Z B, QU J H, LIU H, et al. Surrogate Modeling for Physical Fields of Heat Transfer Processes Based on Physics-Informed Neural Network [J]. CIESC Journal, 2021, 72(3): 1496-1503.)
[5]LU L, JIN P Z, PANG G F, et al. Learning Nonlinear Operators via DeepONet Based on the Universal Approximation Theorem of Operators [J]. Nature Machine Intelligence, 2021, 3(3): 218-229.
[6]RAISSI M, PERDIKARIS P, KARNIADAKIS G E. Physics-Informed Neural Networks: A Deep Learning Framework for Solving Forward and Inverse Problems Involving Nonlinear Partial Differential Equations [J]. Journal of Computational Physics, 2019, 378: 686-707.
[7]HAN J Q, JENTZEN A E W N. Solving High-Dimensional Partial Differential Equations Using Deep Learning [J]. Proceedings of the National Academy of Sciences, 2018, 115(34): 8505-8510.
[8]RAISSI M, KARNIADAKIS G E. Hidden Physics Models: Machine Learning of Nonlinear Partial Differential Equations [J]. Journal of Computational Physics, 2018, 357: 125-141.
[9]朱磊, 邵曉鵬. 散射成像技術的研究進展 [J]. 光學學報, 2020, 40(1): 77-91. (ZHU L, SHAO X P. Research Progress on Scattering Imaging Technology [J]. Acta Optica Sinica, 2020, 40(1): 77-91.)
[10]查顯昊, 胡真. 基于Dirichlet-to-Neumann映射計算太赫茲頻段旋電光子晶體帶隙結構 [J]. 吉林大學學報(理學版), 2023, 61(2): 400-406. (ZHA X H, HU Z. Computing Bandgap Structures of Gyroelectric Photonic Crystals in Terahertz Band Based on Dirichlet-to-Neumann Map [J]. Journal of Jilin University (Science Edition), 2023, 61(2): 400-406.)
[11]洪亮, 高尚, 李翔. 基于網絡特征的分層剪枝方法 [J].? 吉林大學學報(理學版), 2022, 60(6): 1407-1415. (HONG L, GAO S, LI X. Layer-Wise Pruning Method Based on Network Characteristics [J]. Journal of Jilin University (Science Edition), 2022, 60(6): 1407-1415.)
[12]JAGTAP A D, KHARAZMI E, KARNIADAKIS G E. Conservative Physics-Informed Neural Networks on Discrete Domains for Conservation Laws: Applications to Forward and Inverse Problems [J]. Computer Methods in Applied Mechanics and Engineering, 2020, 365: 113028-1-113028-27.
[13]KHARAZMI E, ZHANG Z Q, KARNIADAKIS G E M. hp-VPINNs: Variational Physics-Informed Neural Networks with Domain Decomposition [J]. Computer Methods in Applied Mechanics and Engineering, 2021, 374: 113547-1-113547-25.
[14]CHEW W C. Waves and Fields in Inhomogenous Media [M]. New York: John Wiley & Sons, 1999: 22-24.
[15]WANG Z F, BAO G, LI J Q, et al. An Adaptive Finite Element Method for the Diffraction Grating Problem with Transparent Boundary Condition [J]. SIAM Journal on Numerical Analysis, 2015, 53(3): 1585-1607.
(責任編輯: 王 健)
收稿日期: 2023-05-16.
第一作者簡介: 陳旭早(1997—), 男, 苗族, 碩士研究生, 從事深度學習的研究, E-mail: 407250764@qq.com.
通信作者簡介: 袁利軍(1982—), 男, 漢族, 博士, 教授, 從事深度學習和科學計算的研究, E-mail: ljyuan@ctbu.edu.cn.
基金項目: 重慶市自然科學基金(批準號: CSTB2022NSCQ-MSX0610).