唐志共,朱林陽,2,向星皓,2,何 磊,趙 暾,王岳青,錢煒祺,*,袁先旭,2,*
(1.中國空氣動力研究與發展中心,綿陽 621000;2.空天飛行空氣動力科學與技術全國重點實驗室,綿陽 621000)
空氣動力學是研究飛行器或其他物體在同空氣或其他氣體作相對運動情況下的力/熱特性、氣體的流動規律和伴隨發生的物理化學變化。它是在流體力學的基礎上,隨著航空工業和噴氣推進技術的發展而成長起來的一個學科?,F代空氣動力學的相關研究活動大約可追溯到1903 年萊特兄弟試飛成功。與此同時,風洞技術也逐漸開始步入快速發展期。在隨后的幾十年中,風洞的種類和數量不斷豐富,極大地推動了空氣動力學的發展。20 世紀末,隨著高速攝像技術的興起,粒子圖像測速儀(particle image velocimetry,PIV)被逐漸應用于流場測量,幫助研究者獲得分辨率更高的流場。根據Jim gray 提出的科學研究的四大范式(圖1),這種基于試驗/實驗的研究手段稱之為第一范式。在19 世紀末20 世紀初,空氣動力學從流體力學中分離出來成為一門獨立的學科,研究者開展了與該學科更為緊密相關的理論分析,例如,升力定理、激波關系式等?;谘菟惴治龅臍w納總結研究稱為第二范式。20 世紀70 年代,隨著計算機軟、硬件技術的快速發展,計算流體力學(Computational Fluid Dynamics,CFD)開始成為新的研究手段并廣泛應用到空氣動力學研究中。網格生成技術、數值格式、流場可視化技術等迅速發展?;跀抵涤嬎愕难芯糠妒椒Q為第三范式。經過百余年的發展,空氣動力學實現了從理論到應用等各個方面的巨大發展。然而,目前研究者仍面臨諸多問題。例如,轉捩的準確預測,大分離、非平衡湍流的準確計算,近壁區流場的準確測量,多源數據融合問題,以及湍流燃燒,氣固界面作用等。根據當前的研究進展,這些困難與挑戰是上述三種研究范式難以解決的。

圖1 現代空氣動力學研究范式Fig.1 Research paradigm of modern aerodynamics
2006 年,Hinton 提出了深度學習技術[1],隨著第三次人工智能革命的興起,人們實現了深度神經網絡的訓練和開發利用,數據驅動成為推動科學發展的第四范式。2012 年,谷歌的深度學習算法在ImageNet比賽中打敗了傳統的計算機視覺算法,推動了深度學習算法在圖像識別方面的快速發展。2016 年,谷歌的AlphaGo 計算機在圍棋比賽中擊敗世界冠軍李世石,引起全球關注[2]。機器學習方法也在人臉識別、語音識別以及自動駕駛等眾多領域廣泛應用。近年來,研究者在數據驅動的基礎上積極將科學知識與人工智能技術相融合,進而促進了“第四范式”的快速發展。Lu 等[3]提出DeepONet 算子學習方法,實現無限維函數空間之間的映射學習。華為公司通過對全球海量氣象歷史數據的學習,建立起了“盤古”氣象大模型,預測精度超過傳統數值方法,且速度提高了1 萬倍以上[4]。孫浩教授團隊與華為公司合作,基于昇思MindSpore AI 框架提出了物理編碼遞歸卷積神經網絡(physics-encoded recurrent convolutional neural network,PeRCNN),模型泛化性和抗噪性明顯提升,長期推理精度提升了10 倍以上,在航空航天、船舶制造、氣象預報等領域有廣闊應用前景[5]。此外,機器學習也正在快速推動實驗流體力學技術的發展[6]。在此背景下,空氣動力學與智能化技術的緊密結合衍生了一門新興交叉學科——智能空氣動力學。由風洞試驗、飛行試驗和CFD 計算生成的海量數據為空氣動力學的智能化相關研究提供了數據基礎,現有的空氣動力學理論提供了所需的物理知識約束,以及迅速崛起的人工智能技術提供了算法支撐,三者共同推動了智能空氣動力學的快速發展。
智能空氣動力學是指運用智能科學方法和研究范式研究空氣運動,尤其是物體與空氣相對運動時空氣對物體所施作用力規律、氣體的流動規律和伴隨發生的物理學變化,解決空氣動力學問題的新的交叉學科。在空氣動力學三大傳統研究手段的基礎上,智能空氣動力學引入第四研究范式(數據驅動),依托高性能計算、大數據、人工智能等技術,不僅實現傳統空氣動力學研究手段效率的有效提升,同時通過量變到質變,融合多源數據自主研究空氣動力學規律,輔助科學發現,完善空氣動力學理論體系,拓展理論邊界;解決空氣動力學基礎理論、試驗、評估與設計等方面問題,支撐飛行器氣動技術“基礎研究-設計研發-試驗評估-工程應用”全鏈路能力提升與創新發展。
智能空氣動力學涉及到空氣動力學、數學、計算機科學、數據科學等多學科。首先,基于實驗/試驗、理論和計算三大經典研究范式積累的空氣動力學現有知識體系是基礎。一方面為智能空氣動力學的發展提供了所必需的較為完備的物理約束和科學指導;另一方面,經典范式作為生成高可信度數據的手段為其提供了所依賴的數據基礎。數學是智能技術發展的原動力。萬能近似定理等理論證明,機器學習新方法、優化算法、參數初始化方法、批規范化等技術的開發和創新均離不開數學學科的嚴謹證明和推演。而智能化技術中算法的實現、函數庫的建立以及算法在軟硬件系統的集成等則需要計算機科學的支撐。數據科學本身就是一門涉及多學科交叉的學科,通過利用各種相關數據尋找解決問題的途徑。針對空氣動力學中復雜多樣的研究需求,數據科學幫助研究者根據問題特性確定最佳數據驅動方法和智能化技術。
相較于實驗空氣動力學、計算空氣動力學,智能空氣動力學的典型工程應用具有以下特征:一是通常是多研究手段和數據的綜合應用,有效提高了效率、精度和適用性;二是通過“端到端”建模等方法,彌合了機理不清、算力不足等“技術鴻溝”,能夠解決一些傳統手段難以解決的氣動問題;三是有效融入經驗和知識,并能在解決實際工程問題的過程中通過強化學習等手段實現自學習與自動尋優。目前,智能空氣動力學的應用領域主要包含以下4 個方面:一是湍流/轉捩/燃燒/界面動力學等復雜力學現象預測與機理分析研究,主要是通過AI 來實現非定常、跨尺度等復雜流動現象的建模,發現或辨識控制方程以及開展量綱分析、標度律構建等研究;二是流動主動控制,智能的引入主要采用兩種策略[7],一種是將流動控制問題轉化為控制律的參數或控制律的函數形式的優化問題,再采用智能優化算法對優化問題進行求解,另一種策略是基于強化學習的主動控制;三是氣動優化設計,人工智能(artificial intelligence,AI)可以輔助設計變量降維和氣動特性與幾何參數之間機器學習模型的構建,從而提高優化效率和優化結果精度;四是智能飛行,針對全階段自主飛行、應急情況自動處置、復雜環境規避與利用等需求,智能空氣動力學主要是在高精度氣流感知、實時氣動建模與智能控制、飛行器智能變體、氣動約束下的編隊優化與路徑規劃等方面發揮作用。除此之外,智能化方法在數值仿真和實驗開展等方面也將起到有力的促進和推動作用。
基于算力、模型、算法和數據這4 個技術基礎,智能空氣動力學的研究方法是空氣動力學三大傳統研究手段與高性能計算、大數據、人工智能研究方法的結合,是涉及多學科的交叉綜合研究方法,主要包括機器學習、數據挖掘、智能優化、數據融合方法等。
機器學習是指計算機模擬人類的學習行為,利用數據訓練模型,然后使用模型進行預測的方法。與預先編寫好、只能按照特定邏輯去執行指令的軟件不同,機器實際上是通過“自我訓練”學會如何完成一項任務。機器學習按學習策略可分為統計學習、符號學習和神經網絡學習。深度學習是機器學習的子集,是對深度神經網絡的構建和訓練。根據萬能近似定理,只要網絡的隱層有足夠多的神經元,它就可以以任意精度逼近L2(Rn)中的任意函數。在采用深度神經網絡對非線性映射進行逼近時,網絡的架構決定了逼近能力的上限。深度學習領域的主要網絡架構的發展脈絡如圖2 所示?;镜纳疃壬窠浘W絡是多層感知機(multilayer perceptron,MLP),通過誤差反向傳播算法進行網絡權值的訓練,與淺層網絡相比,由于層數的增加,深度神經網絡權值訓練會遇到梯度消失、易于陷入局部極值等問題,因此深度神經網絡采用ReLU、maxout 等激活函數代替sigmoid 函數,并對梯度優化算法進行改進,采用批量隨機梯度下降法B-SGD、動量法、Adam 等方法,較好地克服了這些問題。近年來,卷積神經網絡、循環神經網絡(recurrent neural network,RNN)、長短期記憶網絡(long shortterm memory,LSTM),生成對抗網絡(generative adversarial network,GAN)、Transformer 等網絡架構先后被提出并應用于不同的問題情境。
涪陵頁巖氣開發建設初期,正在海外開拓市場的張相權承擔重任,被任命為試油138隊隊長,領導第一支進駐涪陵工區的試氣隊伍。

圖2 深度學習主要網絡架構Fig.2 Main network architectures of deep learning
得益于人工智能技術的興起和海量流場數據的支撐,機器學習方法在旋渦提取問題中越來越受到關注,如基于三層BP 網絡[130]、自適應增強(adaptive boosting,AdaBoost)法[131]和多數投票法[132]的旋渦識別技術。這些方法通過預先訓練模型等方法有效減少假陽性和假陰性,但這些方法與流場的大小和形狀有關,通用性較差,可擴展性不強。隨著卷積神經網絡(CNN)技術的突破,一些研究工作直接運用計算機視覺領域中成熟的CNN 網絡模型來檢測流場旋渦結構,如CNNBased[133]、EddyNet[134]、Fluid RCNN[135]、RNNVortexNet[136]等。由于CNN 可以有效地抵抗平移、變形、縮放和旋轉等識別困難,基于CNN 的旋渦提取模型能在類似的其他流場中取得較好的性能,一定程度上解決了通用性較差的問題。Str?fer 等[135]提出了一種基于RCNN 的流場特征識別方法。通過流場特征標簽數據集訓練該網絡模型,在二維回流區域、二維邊界層和三維馬蹄形旋渦的識別上得到了成功的應用。這種數據驅動的流場特征識別方法為多種不同流場特征提供了一種通用的識別方法,利用CNN 網絡強大的非線性映射能力,無須進行復雜且顯式的物理控制方程的計算,且能夠很好地快速檢測出流場中未知特征結構。但是,該方法的計算復雜度很高,因為它需要計算流場中每個網格點的十個伽利略不變的衍生變量,并將其作為網絡模型的輸入。Liu 等[137]提出了DEDNet,一種基于高頻雷達數據像素分割框架的近海旋渦檢了基于不同的深度學習模型(CNN、Resnet 和Unet)的旋渦邊界識別方法。具體來說,首先通過一個參數化流動模型生成大量的旋渦標簽數據,之后使用小塊速度場數據訓練不同網絡模型,最后推廣至二維真實的公開模擬數據集Cylinder[138-139]。實驗結果表明,這些網絡模型可擴展性較強,具有閾值無關性,并都能較好地識別出旋渦邊界,且UNet 網絡模型性能表現最佳。基于局部Q準則標記的旋渦樣本數據集,Kashir 等[140]提出了一種面向網格單元的全卷積對稱旋渦提取網絡。該模型采用速度場和渦量場作為輸入,研究了網絡結構中卷積和反卷積塊數量對提取精度的影響,以獲取最高的精度,同時避免模型退化問題,并成功應用于不同速度邊界值和雷諾數的二維方腔流場數據。該方法的實驗數據是笛卡爾網格流場數據,本質上與圖像數據類似,從而可以直接運用計算機視覺領域中的深度學習模型,并取得較好的精度。然而,未考慮常用的不規則結構網格或非結構網格二維和三維流場數據,該方法的應用范圍有限。Abras 等[141]基于卷積神經網絡,設計了一種流動物理特征識別的智能化方法,并在懸停旋翼尾跡渦識別與破裂分析中得到成功的應用。該方法通過將三維流場體數據轉換成二維圖像數據,從而可以直接遷移圖像領域中的成熟模型。但是,這種處理方式會造成大量流場信息的丟失,同時未考慮流場數據本身的特性,該模型的泛化能力較弱,僅僅適用于某些特定流動狀態的旋渦分析。Li 等[51]基于XGBoost[142]實現了圓柱繞流中的湍流區域識別。該方法不僅與閾值無關,且能融合多個流場屬性變量,有利于發現湍流中多尺度的物理過程。但是,多個流場屬性變量中可能存在冗余,同時該方法是逐點進行識別的,大大增加了計算成本。Fan 等[143]設計了SymmetricNet 網絡,使用海面高度、海面溫度和流動速度等融合多變量信息的特征作為該網絡的輸入,海洋中尺度旋渦識別精度達97.06%。Ye 等[144]使用一種基于分割卷積網絡的旋渦識別方法,提高了旋渦識別效率和精度。Luo 等[145]采用一種基于YOLOv3 網絡[146]的葉尖旋渦檢測方法,較快且準確地識別出流場旋渦結構。這三項研究都是將流場數據像素化后,直接遷移相關成熟的目標檢測模型進行旋渦提取,未考慮復雜流場數據的本身特性,普適性較差。上述方法存在兩個主要問題:第一,大多方法將流場直接轉化為圖形圖像處理,丟失網格拓撲信息;第二,僅能處理單塊網格或者規則網格,無法處理多塊網格和不規則網格的流場。這兩個問題影響了流場特征智能提取的精度和應用場景。
智能優化算法是通過模擬揭示某些自然現象或過程發展而來的優化算法,具有全局、并行、高效的優化性能,魯棒性和通用性強,為解決大規模非線性問題提供了新的思路和手段。智能優化算法不僅在氣動優化設計領域得到廣泛應用,近年來還逐步擴展到非線性氣動微分方程求解等領域。但在實際應用中也存在以下問題:一是算法的理論性有待完善,用傳統優化算法求解優化問題擁有完善的理論依據,而智能優化算法的理論研究一直滯后于它的應用,如何證明智能算法解的存在性、收斂性還需要進一步深入研究。二是算法普遍存在早熟收斂,易陷入局部最優,收斂速度慢的問題,其核心是如何有效平衡算法局部搜索和全局探索能力的問題。對于算法理論性不足的問題,研究者主要從馬爾可夫鏈模型和統計力學逼近模型等角度對算法的收斂性開展研究[20]。對于早熟易陷入局部最優問題,則一是采用多種群協同進化策略,增加樣本的多樣性,提升發現全局最優的能力;二是設計新型搜索策略,如采用Lévy 策略協助算法跳出局部最優;以及在搜索過程中不將適應值作為唯一標準,而是將搜索結果進行分類,類與類之間通過設定的規則進行信息的交換,可較好地兼顧局部和全局搜索能力;三是對進化策略進行改進完善,將動物和人類的一些生物特性思想引入傳統群智能算法,如人口種群自適應和人體自身免疫機制、狼群算法中引入游走行為、召喚行為和圍攻行為,分別提升算法的搜索能力、收斂性和局部尋優能力[21]。
從圖中可以看到,低可信度數據中的噪聲對融合結果影響不大(圖25(a)),當高可信度數據較少(9 個點)時,高可信度數據中的噪聲會對融合結果造成較大影響(圖25(b));而當高可信度數據量較大(101 個點)時,噪聲的影響反而下降(圖25(c))。這是由于深度網絡會優先學習數據中的低頻部分。具體來說,當訓練數據量較少時,原始數據和噪聲數據具有相似的頻率,這導致融合網絡將兩者特征一并學習;而當訓練數據量較大時,原始數據和噪聲數據可以明顯得分為低頻和高頻部分,從而根據深度學習的頻率原則,所構建的融合網絡會優先學習低頻原始數據,使其預測輸出具有更強的魯棒性。
(2) 內側仿形陰極板的形狀與導流裝置橫截面的形狀相似,且材質完全相同,避免了出現尖端效應,消除了內腔氧化膜厚度不均、電解著色存在色差等缺陷。

表1 智能空氣動力學研究方法與傳統手段研究方法的主要差異Table 1 Main difference of research methods between artificial and classical aerodynamics
空氣動力學問題的智能化求解過程包含多個環節。首先是獲取并處理數據。一般而言,研究者需要根據研究問題收集已有的數據或者生成新的數據。數據空間在本質上決定了模型所能學習到的內容,因而也間接地影響模型最終性能。模型性能不及預期的原因之一可能是數據量不足導致的。數據處理包含標準化/歸一化、樣本選擇以及特征構建/選擇等諸多環節。標準化/歸一化一般是為了避免不同輸入特征之間的數值量級差異,保證數據不失一般性。樣本選擇的主要目的一是為了簡化數據集,提高訓練效率;二是為了實現樣本均衡,避免局部樣本稀少或缺失造成的模型性能失衡。例如,簡單構型的直接數值模擬(direct numerical simulation,DNS)算例在某一時刻的二維切片數據就可達十萬量級以上,龐大的數據集造成的訓練困難迫使研究者進行樣本選擇;對于實驗而言,由于測量手段或技術的局限性,局部流場很難獲得測量數據,容易出現樣本不均衡的問題,一般可通過上采樣或下采樣等方法緩解。輸入特征對模型性能的影響十分關鍵,特征構建相當于確定與模型輸出相關的自變量,而特征選擇的目的就是選出相關有用的特征進而提高模型性能。特征構建和選擇過程一般依靠研究者自身的物理直覺確定,同時也需考慮滿足不變量特性等約束。此外,該過程也可通過特定的算法進一步完善。
然后是確定并訓練智能化模型。智能化模型的構建可基于具體的研究問題選擇神經網絡、隨機森林、符號回歸以及強化學習等架構甚至不同架構的組合形式。模型架構的復雜度可通過模型參數調節,例如神經網絡的深度和寬度。在數據集和采用的模型架構確定后,按一定比例將數據集劃分為訓練集/驗證集并導入模型開展訓練。模型訓練過程主要包含損失函數的定義,參數初始化方法和優化算法的選擇等環節。此外,交叉驗證有助于研究者選擇最佳模型,避免過擬合問題。
最后是模型后處理。實際工程應用中,往往需要對模型預測的輸出進行一定的后處理,避免出現非物理解,例如雷諾應力的可實現約束、渦黏非負、量綱一致性等約束。當預測樣本相對訓練樣本外插較大時,容易因為位于模型性能邊際或之外而導致異值的出現,可設置閾值予以剔除或限制。此外,通過概率分析還可以對模型預測結果進行不確定度分析,幫助研究者更好地評估結果的可信度。
近些年經過國內外專家學者的努力,目前智能空氣動力學已在研究方法、流場預測、模型構建等諸多方面取得相當進展。就國外而言,科羅拉多大學Raissi 團隊在物理嵌入的神經網絡(physics-informed neural networks,PINNs)方法、普林斯頓大學Brunton團隊在AI 與CFD 的交叉領域、斯圖加特大學肖恒團隊在湍流建模方面以及其他團隊在諸多領域均開展了開拓性的研究。與此同時,國內專家也開展了豐富的研究工作,例如北京大學鄂維南、香港科技大學徐輝等研究團隊開展了機器學習理論和方法研究;西北工業大學張偉偉、中科院力學所楊曉雷、南方科技大學王建春、清華大學張宇飛、浙江大學夏振華等研究團隊開展了湍流模型構建及數據處理等研究;上海交通大學劉應征等團隊開展了數據驅動與實驗的融合研究;華為公司聯合中國商飛和西北工業大學開發了面向大型客機翼型流場預測和設計優化的AI 大模型;其他更多相關工作可參見文獻[23-26]。本團隊結合自身研究基礎,主要開展了流場預測、轉捩/湍流建模、數據融合、氣動力/熱建模以及流場信息提取等方面研究工作。
流場仿真是飛行器設計領域十分重要且耗時的一個環節,如何高效準確地獲取機翼或者翼型的流場信息成為一個重要的研究課題。深度學習方法作為高維空間中一種高效的函數逼近技術,能夠從大數據中自動尋找隱藏特征信息,并且可以直接處理原始形態數據獲得經驗或知識,從而可以預測復雜非線性系統的未來行為,為求解復雜耗時的N-S 方程提供了一種快速的可替代的解決方案。采用機器學習的代理模型可以減少試驗成本、CFD 計算的內存消耗以及時間成本。通過從大量積累的流場數據中進行學習,至少在翼型設計初始階段,可以使用機器學習方法減少CFD 模型的大量重復計算工作。利用人工智能技術對流場信息進行快速預測目前仍然處于探索階段,但也取得了一定的研究進展。從深度學習模型的角度出發,主要分為如下幾種研究方法。
第四個領域是數據驅動的線性穩定性預測方法。eN方法是基于線性穩定性理論的一種轉捩預測方法,基本理念是邊界層內各種頻率和空間波數的擾動波進入不穩定區域后,以擾動波幅值放大倍數的N值曲線分布判斷轉捩[61]。人工智能研究則主要通過采用神經網絡等智能算法對N值進行預測從而判斷轉捩位置。AI 在eN方法的首次應用是Crouch等[62]使用流場標量參數和層流速度剖面作為神經網絡輸入來預測最大不穩定性增長率,如圖13 所示。近期研究主要有Zafar 和肖恒等[63-64]利用卷積神經網絡和循環神經網絡,以層流邊界層輪廓特征和其他標量特征為輸入,實現對二維翼型繞流不穩定放大因子N以及轉捩位置的預測,如圖14 所示。綜合預測誤差小于0.7%,預測效率比LST 提升了3~4 個量級,同時方法展現出強大的適用性。

圖3 基于U-Net 深度神經網絡的流場預測模型[27]Fig.3 Flow field prediction model based on U-Net deep neural network[27]
2)基于生成式對抗網絡的流場預測。在流場預測研究中還有一類使用較多的深度神經網絡模型是生成式對抗網絡[40]。該網絡模型一般包括一個生成器與判別器,通過博弈的方式來對深度神經網絡模型進行訓練,從而得到預測效果較好的生成器模型。Wu 等[41]基于GANs 提出了ffsGAN 網絡框架,構建了參數化的超臨界翼型與翼型流場之間的一對一映射關系。后又提出了基于預訓練模型與微調模型的條件生成式對抗網絡用于流場的預測任務[42],其中預訓練模型利用條件生成對抗網絡對訓練數據的分布進行初步估計;其次微調模型采用兩個生成器,其中一個生成器用于數據增強。這類生成式模型本質上講在擬合流場數據分布時依然是將流場輸入信息當做像素值進行處理,缺乏較強的物理約束,從結果上來看,通過該方法得到的流場數據特別是氣動力參數曲線存在嚴重的不光滑性。因此關于該方法對流場預測的有效性仍需要做進一步的探索。
3)基于點云的流場預測。為了利用神經網絡替代CFD 求解器獲取流場信息,有效的數據表達是關鍵。對于廣泛使用的卷積神經網絡而言,其將均勻笛卡爾網格中的每個頂點當做一個像素值進行處理,但是在真實世界中存在復雜的幾何構型,該方法對非結構化的網格數據是無效的。針對該問題,Ali 等[43]發展了一種基于點云網絡架構的深度學習模型用于非結構化流場的預測。該方法將CFD 的求解域表示為一個點云,構建了每個點的坐標值與速度值以及壓力值之間的映射關系。點云網絡學習空間位置與物理參數之間的端到端的映射關系,繼承了非結構化網絡的良好特性,減小了網絡的訓練成本,保證了邊界的光滑性以及數據的準確性。但是Ali 等僅對較為稀疏的網格流場進行了測試,并且從結果來看,在面對不同迎角的點云流場數據時,其預測結果與真實值之間存在較大誤差。點云模型的構建策略依然是沿用了生成式模型的思想,深度學習模型映射關系的構造較為簡單,不具有很強的物理約束效應,導致在面對不同工況下的流場預測問題時其泛化性存在很大問題。
4)基于圖神經網絡的流場預測。類似點云的數據表達手段,圖神經網絡在面對非結構的數據時存在先天的優勢,如社交網絡、交通網絡、非結構化的流場等。圖神經網絡由部分節點以及連接不同節點的鄰接矩陣組成,在圖神經網絡訓練過程中,通過鄰居聚合的方式來更新不同節點的數值。由N-S 偏微分方程描述的非定常流動具有高度非線性以及多尺度特性,特別是具有流動分離、渦脫落、剪切層等特征的流動現象表現出復雜的時空特性[44]。Pfaff 等[45]利用圖神經網絡對復雜物理仿真系統進行了模擬,實驗結果展示了該方法與卷積神經網絡相比能夠有效捕捉近壁區的流場信息,且針對不同復雜工況以及幾何的流場都能實現較為精確的流場仿真效果。Li 等[46]提出了一種對偶圖神經網絡用于發動機葉片的流場預測,所提出的方法不僅能夠準確地預測葉片的性能參數,同時在流場重建中也具有出色的性能。該方法與上述其他方法而言,在構建深度學習模型訓練數據時就考慮到了網格點的鄰居信息以及當前節點與鄰接節點之間的聯結關系,摒棄了端到端建模以及像素化建模有效信息不足的缺點,極大提升了建模精度。
綜合而言研究人員利用各類神經網絡去預測不同幾何的流場信息,但是目前的研究工作大多是對神經網絡用于流場預測的有效性進行了驗證。特別是在構建神經網絡的輸入以及輸出的映射時,大多是采用將符號距離場函數以及迎角、馬赫數等狀態信息作為網絡的輸入去映射待預測的速度場以及壓力場,而針對幾何外形特征提取問題的研究較少。本團隊使用在計算機視覺領域廣泛應用的Transformer 網絡架構替換了傳統的CNN 網絡架構去提取翼型的幾何參數,并進一步建立了幾何參數、雷諾數、迎角、流場坐標、壁面距離與翼型速度場以及壓力場之間的映射關系[47]。訓練得到的深度網絡模型能夠在一定程度上實現對不同雷諾數、迎角以及幾何外形的泛化能力,且流場的預測速度與CFD 的計算速度相比提升了27 倍??傮w網絡架構如圖4 所示。為了有效表征不同翼型的幾何特征,首先將輸入網絡的翼型灰度圖像做了切片處理并嵌入相應的位置信息;其次,將融合位置信息的翼型幾何向量輸入到Transformer 編碼器中去提取翼型的幾何注意力表達特征;最后,將Transformer 編碼器提取的翼型幾何特征與雷諾數、迎角、流場坐標以及壁面距離等進行融合后輸入到深度學習模型去預測翼型的速度場和壓力場。

圖4 基于Transformer 網絡架構的幾何編碼與流場預測網絡模型Fig.4 Overall network architecture of airfoil geometry encoder and flow field prediction based on Transformer
將訓練得到的深度學習模型用于對翼型測試數據集中的RAE2822 翼型(雷諾數:2 500,迎角:3°)流場進行預測。如圖5 所示,訓練得到的深度神經網絡能夠獲得與CFD 相似的流場仿真結果,預測值與真實值之間的最小絕對誤差為0.2%,最大絕對誤差僅為4%。從圖6 中可以發現,網絡的預測值與真實值之間的相關性系數約為99.9%,說明深度學習模型能夠準確捕捉翼型流場信息。

圖5 RAE2822 翼型流場預測結果云圖[47]Fig.5 Contours of the predicted RAE2822 airfoil flow field[47]

圖6 翼型氣動參數的預測值與真實值之間的相關性曲線[47]Fig.6 Correlation coefficients between the real and predicted variables in the RAE2822 flow field under Re=2 500,AOA=3° [47]
邊界層轉捩通常是指邊界層流動由層流狀態發展為湍流狀態的過程,是一個多因素耦合影響的強非線性復雜流動物理現象[48]。根據美國國家高超聲速基礎研究計劃(national hypersonic fundamental research program,NHFRP),邊界層轉捩是該計劃的重要基礎研究內容[49],而基于雷諾平均模擬的轉捩模型是實現飛行器全機基于物理現象(非校準)轉捩預測最為有效的方法。近年來,隨著算法、算力的發展以及轉捩數據的積累,機器學習方法在邊界層轉捩建模領域的研究正獲得越來越多的關注。機器學習轉捩研究通過人工智能方法建立或完善流體力學理論、模型和方法,推動流體力學的智能化應用,以彌補研究者對理論基礎和經驗的不足。將機器學習應用于轉捩建模的最終目的是實現機器學習算法下的轉捩模式特征的識別與轉捩流場的模擬[50]。即通過對轉捩相關的各種來流信息、流場當地信息以及轉捩判據等作為輸入,進行人工智能處理和分析,以期對轉捩現象進行預測模擬、模態辨識乃至于機理分析。轉捩建模的機器學習方法可參照其預測對象與應用目的進行劃分,如圖7 所示。數據驅動的機器學習轉捩模型研究,大致可以劃分為以下4 個研究領域:一是轉捩判據與轉捩智能識別;二是對基于雷諾平均的Navier-Stokes(Reynolds-averaged Navier-Stokes,RANS)方程的經典轉捩模型的改善;三是數據驅動的轉捩替代模型;四是基于人工智能的穩定性預測方法。

圖7 人工智能轉捩研究分類Fig.7 Research classification of transition with artificial intelligence
第一個研究領域主要是采用機器學習方法基于已有流場數據識別、判定層/湍流交界面,或針對未知流場預測轉捩位置。Li 等[51]基于機器學習XGBoost 分類算法建立了不需要設置臨界判據的DNS、大渦模擬(large eddy simulation,LES)流場層/湍流界面識別方法,實現了圓柱繞流層/湍流交界面的精確判定,如圖8 所示。李昌林等[52]基于類似方法建立了針對發動機葉型繞流大渦模擬的轉捩位置智能識別方法。在轉捩位置的智能預判領域,孟德穎等[53]采用單層神經網絡,基于風洞實測數據,實現了變迎角變雷諾數的高超聲速轉捩位置的全周向角辨識與判別,如圖9 所示。該領域研究旨在對傳統的基于實驗數據的經驗型轉捩判據進行替代,能夠在復雜的流場信息當中快速高效地進行轉捩位置的識別與判定。

圖8 Re=3 900 圓柱繞流脈動強度云圖及智能識別層/湍流分界面[51]Fig.8 Fluctuation intensity of a Re=3 900 cylinder flow and the AI detected laminar/turbulence interface[51]

圖9 單層神經網絡示意圖及高超聲速尖錐周向轉捩位置預測[53]Fig.9 Sketch of the neural network (NN) and the predicted transition front for a hypersonic sharp cone[53]
第二個領域研究較為廣泛,主要是采用人工智能研究方法,針對現有模型的局限與不足,著眼于雷諾平均模擬的經典轉捩模型預測性能的改善與提升:通過特定的實驗數據和高精度數值計算結果進行訓練,并對模型控制方程進行系數修正或源項修正,以期提升模型對于一定工況下的預測精度或拓寬模型適用范圍。例如,楊沐臣等[54]針對不同迎角翼型的轉捩流動,使用正則集合卡爾曼濾波獲得k-ω-γ-Ar 模型時間尺度修正項后驗分布,并建立從流場平均量到修正項的智能映射關系,實現了轉捩模型對翼型預測性能的提升,如圖10 所示;Duraisamy 等[55]基于γ一方程轉捩模型,利用神經網絡和高斯過程重構了γ 輸運方程源項,改善了模型對于T3 系列平板的預測精度,如圖11 所示。張天鑫等[56]基于流場反演和機器學習方法拓展了原始γ-Reθ轉捩模型對高超聲速邊界層轉捩的預測能力,采用卡爾曼濾波及隨機森林方法完成了模型啟動項及參數修正,并在變雷諾數、來流溫度及鈍度的鈍錐算例中進行了充分驗證。在符號主義的智能建模方面,趙耀民等[57]對基因表達式編程的湍流智能建模進行了詳細全面的整理歸納,亦提及Akolekar 等[58]在轉捩建模中的工作,對層流動能轉捩模型中的層流黏性系數進行了修正,實現了葉柵分離誘導轉捩的準確模擬。上述智能轉捩研究仍以數據驅動為主,即采用修正目標的典型工況數據為驅動,對轉捩模型控制方程的源項或系數進行智能修正或重構,與經典模型的修正方法類似。

圖10 NACA0012 轉捩Cf 智能預測[54]Fig.10 Distributions of Cf for NACA0012[54]

圖11 T3C1 平板的反演及預測結果[55]Fig.11 Skin friction prediction for T3C1[55]
圖21 為三種計算方式得到的壓力系數及摩擦阻力系數分布對比。可以看出,引入神經網絡模型修正后,激波位置后移,與DNS 計算結果基本吻合。表5對比了不同計算方法的分離泡信息發現,神經網絡輔助的BSL 模型預測的分離泡大小將BSL 模型的計算結果從5 .49δ 減小為4 .84δ,精度提高了15%左右。圖22和圖23 分別表示神經網絡修正后的不同站位點處和不同壁面距離處的速度型對比。從灰色虛線框中可以看出,近壁處分離區內的速度型在一定程度上得以改善。

表2 模型訓練、測試算例[60]Table 2 Training and test cases[60]

圖12 殘差神經網絡轉捩建??蚣躘59]Fig.12 The residual neural network (ResNet) transition modeling framework[59]
1)基于卷積神經網絡的流場預測。在計算機視覺等相關領域,卷積神經網絡是組成深度學習模型的基礎組件。在早期的流場預測問題研究中,一般將流場數據等同于圖像數據進行處理,如Thuerey 等[27]采用U-Net 神經網絡模型作為基礎網絡架構,以UIUC 翼型來流的速度場圖像以及翼型幾何的Mask圖像作為網絡的輸入,以翼型的速度場以及壓力場作為輸出來構建相關的映射關系。結果表明在GPU 架構下,U-Net 網絡(如圖3 所示)僅花費5.53 ms 就可獲得翼型周圍的流場,而采用OpenFOAM 求解器去求解翼型的流場需要花費40.4 s。Guo 等[28]較早地將機器學習方法引入到空氣動力學領域執行多幾何的流場預測任務,提出了一種基于卷積神經網絡的針對二維以及三維流場的非均勻定常層流流場的代理模型,進一步構建了符號距離場SDF 與待預測的速度場以及壓力場的映射關系。測試結果表明該代理模型可以以較低的預測誤差為代價,實現預測流場速度比基于GPU 加速的CFD 求解器快2 個數量級,比基于中央處理器(central processing unit,CPU)的CFD 求解器快4 個數量級。類似的工作還有Ribeiro 等[29]提出的DeepCFD,Duru 等[30-31]提出的CNNFOIL 等。結合空氣動力學相關領域知識對卷積網絡架構做了進一步的改進與研究[32-34],如:Wang 等[35]以及Omata等[36]使用深度卷積自編碼器的數據驅動非線性降維表示方法對非定常流場進行了降維;Fukami 等[37]通過卷積神經網絡(convolution neural network,CNN)和混合降采樣跳躍連接多尺度模型從低維湍流數據中去重建高分辨率流場。上述研究大多數基于符號距離場,采用將流場數據映射到非均勻笛卡爾網格的處理方式[38]。這種數據處理手段僅能預測固定維度的流場數據且在面對包含深度幾何特征的流場預測任務時,像素化勢必會導致流場信息的缺失,難以表征近壁區的流場特征,甚至可能會產生非物理解[39]。為獲取高精度的流場仿真結果,構建相應的深度學習模型過程中應考慮以下幾個重要因素:(1)構建有效表征物理邊界條件、流動信息與待預測流場之間的強映射關系;(2)高效的深度學習流場特征提取器;(3)有效的優化目標即損失函數;(4)精細化的深度學習模型訓練策略。

圖13 計算流程圖[62]Fig.13 Flow diagram for estimating transition location[62]

圖14 神經網絡轉捩建模計算方法[64]Fig.14 Proposed neural network for transition modeling[64]
本團隊主要在第二、第三領域開展了智能轉捩建模研究,即轉捩模型性能的智能提升以及基于人工智能算法的智能替代模型。在團隊前期開發的適用于高速邊界層轉捩模擬的C-γ-Reθ模型[65-66]基礎之上,著眼于模型性能在特定工況、模態的提升以及轉捩模型的智能高效替代兩個方面。C-γ-Reθ模型基于穩定性理論、實驗與 DNS 數據和轉捩準則多層級融合的建模思想,建立充分考慮可壓縮、橫流、粗糙度等因素的高超轉捩準則與預測模型,對于三維復雜外形高速轉捩具有良好的模擬能力[67]。模型在升力體[61,68]、圓錐[69-70]、橢錐[65]等系列工況中得到了全面驗證。
在轉捩模型的高超聲速修正以及模型性能的智能提升方面,主要以特定工況與模態下原模型預測能力的不足進行針對性地改善。本研究團隊[71]針對C-γ-Reθ模型在尖錐高超聲速飛行試驗工況下的迎風面中心線區域Mack 模態預測能力不足的問題,建立了轉捩預測與飛行試驗實測數據偏差深度神經網絡映射,完成了飛行試驗工況轉捩熱流修正,并推廣至全彈道及其他外形飛行試驗,使轉捩模型在多模態共同影響下的預測能力更加精準,如圖15 所示。

圖15 人工智能算法對C-γ-Reθ 模型飛行試驗工況的修正[71]Fig.15 AI modified C-γ-Reθ model under a flight test condition[71]
在智能替代模型研究領域,同樣以C-γ-Reθ轉捩模型為方法、數據基礎,旨在采用機器學習方法建立更加高效的替代模型。本研究團隊針對三維邊界層轉捩預測需求,建立了基于深度神經網絡的“層流-轉捩-湍流”三維預測模型,并與SST 湍流模型耦合,對CFD 求解平臺中的轉捩模塊進行了智能替代,實現了亞跨聲速條件下多種外形狀態的三維邊界層轉捩高效預測,展示出智能轉捩模型廣闊的工程應用前景,如圖16、圖17 所示[50]。

圖16 智能替代模型預測平板轉捩及翼型轉捩[50]Fig.16 Intelligent substitution model for predicting 3Dboundary layer transition of plate and airfoil[50]

圖17 智能替代模型預測后掠翼和橢球標模三維邊界層轉捩[50]Fig.17 Intelligent substitution model for predicting 3D boundary layer transition of swept wings and ellipsoidal[50]
根據NASA 報告《CFD Vision 2030 Study》,RANS方法直到2030 年仍然將是湍流計算依賴的主要手段[72]。然而,被廣泛應用的線性渦黏模型(S-A 模型、k-ω模型、SST 模型等)對于大分離、非穩態等復雜流動仍難以實現較好的預測精度??v觀過去近二十年的發展可以發現,盡管傳統湍流模型取得一些進展,但對于大分離等經典難題仍難以實現質的突破和提升。湍流建模亟需從新視角借助新手段打破現有研究模式的局限性。隨著人工智能技術的迅速崛起,在過去不足十年的發展過程中,基于機器學習方法的湍流建模研究工作和相關成果幾乎成指數形式的爆發,成為當前流體力學、空氣動力學研究的熱點之一。綜合而言,這些工作包含了二維、三維幾何外形在不同速域條件下的附著和分離流動,主要可分為以下兩個方面:1)對傳統湍流模型的改善。研究者基于高可信度CFD 或實驗數據通過機器學習方法提升傳統模型對分離流等算例的預測精度,如圖18 所示。其研究思路大致有兩種:一種是通過改變模型的控制方程形式,如乘以修正系數或給方程增加源項。例如,Duraisamy 和Singh 等[73-75]將反演模型和機器學習結合起來重構更好的湍流及轉捩模型的函數表達式;另一種是在RANS 模型基礎上構造偏差函數,然后將RANS 模型和偏差函數的計算結果疊加作為最終的雷諾應力值。清華大學張宇飛團隊基于不同建模方法也開展了相關研究[76-78]。例如,Xiao 等[79-83]提出了物理嵌入的機器學習(physics-informed machine learning,PIML)概念,強調了機器學習中包含物理知識的重要性。2)直接構建雷諾應力或亞格子應力的替代模型。例如,Ling 等[84]提出張量基神經網絡學習非線性湍流模型。Novati 等[85]基于多智能體強化學習獲得亞格子應力的封閉方法;西北工業大學張偉偉團隊開展了高雷諾數湍流的渦黏封閉建模研究[86-89];南方科技大學王建春團隊基于神經網絡研究了亞格子應力及相關變量的建模方法及在可壓縮湍流模擬中的應用[90-92];Weatheritt 等[93-94]和北京大學趙耀民團隊[95]基于符號回歸學習顯式表達的非線性模型。更多數據驅動湍流建模的研究工作可參考綜述文獻[96-99]。

圖18 基于機器學習的湍流建模研究Fig.18 Research on turbulence modeling based on machine learning
目前,現有的研究工作針對簡單構型的中/低雷諾數湍流或低速流動已取得令人鼓舞的成果,但面向含激波/湍流邊界層干擾等復雜流動現象的高速可壓縮湍流的智能化建模研究還相對較少。Wang 等[80]基于凍結假設預測了高超聲速平板湍流邊界層中雷諾應力。本團隊近期初步開展了針對雷諾應力偏差量的隱式表達形式-渦黏修正量的機器學習建模工作,嘗試改善經典湍流模型對壓縮拐角算例的預測結果,目的主要是探索建模策略的有效性和收斂性。本工作采用24°偏折角的壓縮拐角標準算例作為研究對象,Ma=2.89,Re∞=5 581.4 mm-1,平板邊界層厚度為6.7 mm。所采用的網格大小為2 160×160,其中物面第一層網格高度為1×10-5mm,對應的y+約為0.64,計算域如圖19 所示??紤]到SST 模型預測的分離區明顯偏大,本工作采用BSL 模型,其控制方程形式為:

圖19 壓縮拐角計算網格Fig.19 Grid for compression corner
模型的相關參數可參考文獻[100]。
根據Wu 等的研究,如果顯式表達形式的雷諾剪切應力存在誤差,那么在N-S 方程迭代過程中時均場誤差迅速增大[101],最終造成求解失敗。目前主流的解決方法是構建湍流相關量的機器學習模型,然后基于凍結假設采用單向傳值的方式直接將模型預測結果賦值到方程右端。然而,這種方法在工程應用中的局限性較大。由于DNS 計算的雷諾應力、時均速度場與RANS 求解器不自洽,因此無法直接基于DNS 數據構建機器學習模型,必須采用恰當的數據融合方法。本工作通過基于最小二乘法的線性渦黏反 算和加權平均實現DNS 雷諾應力與RANS時均場的融合。
傳輸方式:以D5000作為傳輸始端,D5000接收原始報文后,經規約轉換,將遙信變位及全數據發至五防系統,五防系統將遙控許可信息通過上行通道發至D5000。
通過上述基于最小二乘的渦黏反算方法實現了DNS 數據與RANS 求解器的相容性處理,保證了數據的自洽性,因此獲得了具有建??尚行缘臄祿颖?。基于這些樣本采用神經網絡構建RANS 湍流模型的修正模型。采用的機器學習模型架構為(16,16,16,16,1)的全連接神經網絡。構建模型所采用的輸入為流場時均變量的組合形式,如表3 所示,其中p、ρ、u、μ分 別表示壓力、密度、速度矢量和動力黏性,k、ε、ω分 別表示湍動能、耗散率和比耗散率,S和R分別表示應變率張量和旋轉率張量,‖·‖2表示二范數,abs 表示取絕對值,tr 表示求跡。模型的輸出為反算優化后的渦黏與基礎模型(baseline model,BSL)模型計算的渦黏之間的偏差Δμt。模型訓練過程采用的損失函數為考慮正則化、L1 范數和近壁區雷諾應力約束的均方誤差。
財政支農更精準 監督資金不手軟——貴州省丹寨縣財政推進“鄉村振興”戰略側記陳貴旭 劉世會 黃立祥6-66

表3 采用的輸入特征Table 3 The adopted input features
模型訓練前將數據隨意打亂,選取其中的4/5 作為訓練數據,剩余的1/5 作為驗證集。訓練過程在Pytorch[102]上實現,所采用的學習率及優化算法等參數如表4 所示。

表4 模型訓練的參數設置Table 4 Parameters of model training
模型訓練后將其集成至風雷求解器,實現機器學習模型與RANS 求解器的雙向耦合迭代。圖20 表示耦合機器學習模型的RANS 求解器的收斂過程演化圖。從圖中可以看出,經過大約44 000 步迭代后BSL 模型的阻力系數已基本收斂,殘差在 4×10-6和5×10-6之間小幅震蕩。引入神經網絡模型開始修正后,阻力系數經過大約20 000 步迭代后實現再次收斂。值得一提的是,N-S 方程的殘差基本保持不變,說明神經網絡模型的嵌入并未破壞求解器的收斂性,從而驗證了所提出建模策略具有雙向耦合可行性。
常州科技人才原創性研發能力不強,技術成果缺乏,高水平重大科技創新平臺和研發機構不多,高水平科技人才隊伍和團隊偏少,具有自主核心知識產權的原創性成果較少。常州缺乏產業特色鮮明、國內水平領先的園區。部分科技園區產業定位不明夠確、服務功能建設不完善;常州高校對區域科技創新體系建設推動作用有待加強。

圖20 耦合機器學習模型的RANS 求解器的收斂過程Fig.20 Convergence of RANS solver coupled with machinelearning model
第三個領域是采用人工智能相關方法,直接構建數據驅動的轉捩替代模型。由于大多數替代模型是直接基于大量轉捩相關數據驅動的,并且模型并不顯含描述轉捩過程的相關物理機理,因此該類人工智能轉捩模型被稱為黑箱模型。該類模型通常采用神經網絡算法構建復雜代數模型,用以替代現有轉捩模型,并耦合至現代CFD 中,實現傳統轉捩模型預測水平的高效轉捩流場模擬。例如,鄭天韻等[59]以SSTγ-Reθ模型的大量零壓力梯度自然轉捩平板的計算結果作為訓練數據,利用深度殘差網絡重構了當地平均量與間歇因子γ之間的映射,發展了一種較為高效的人工智能轉捩替代模型,如圖12 所示。吳磊等[60]以SST-γ轉捩模型的數值模擬結果為訓練測試集,建立從平均流場信息到轉捩間歇因子γ的人工神經網絡映射,并與RANS 求解器耦合,實現了多種翼型下轉捩位置的預測與轉捩流場的模擬,取得了較好的泛化效果,如表2 所示。數據驅動的黑箱替代模型的泛化性能,很大程度上受訓練數據的轉捩主導模態、輸入判據形式、來流工況等系列因素限制,難以做到普適。同時由于轉捩物理過程的高度復雜性,基于物理約束的灰箱、白箱智能轉捩建模,目前還在研究當中,未廣泛見諸文獻。

表5 不同計算方法的結果匯總Table 5 Results of different computation methods

圖21 神經網絡修正前后的壓力系數及摩擦阻力系數對比Fig.21 Comparison of pressure coefficient and skin friction coefficient

圖22 神經網絡修正后的不同站位點處的速度型對比Fig.22 Comparison of velocity profiles at different monitoring points

圖23 神經網絡修正后的不同壁面距離處的速度沿流向分布對比Fig.23 Comparison of horizontal velocity along the x-axis at the same wall distance
高精度的氣動數據是飛行器總體設計的依據,是確保飛行器研制成功的基本前提和重要保障。獲取氣動數據的空氣動力學研究三大手段(數值計算、風洞試驗和飛行試驗)各有優缺點,單一研究手段難以準確預測飛行器氣動特性,在工程上需要融合多手段多來源的數據,以得到對氣動特性較為準確和完善的描述[103]。但是,氣動數據的融合與傳統信息領域的數據融合存在一定差異,主要體現在傳統信息領域的數據融合隱含了“多源數據都源于同一對象,對應的理論真值相同”這一條件。而在空氣動力學研究中,不同研究手段所研究的物理對象通常是不同的,如風洞試驗采用的是縮比模型,CFD 數值計算對象通常是剛體模型,飛行試驗的對象則是真實飛行器,這三種情況下的氣動力真值理論上是不相同的,因而此時的數據融合還需考慮不同來源數據之間的數據關聯與同化問題,如圖24 所示,可采用的方法主要包括:選取關聯參數的方法(亦稱為Scaling 方法)[104-105],對差量或比值建立模型進行融合的方法[106],Cokriging 方法[107]和基于深度神經網絡的融合方法?;谏疃壬窠浘W絡的融合方法又主要包括基于遷移學習的融合方法[108]和基于多可信度神經網絡(multifidelity neural network,MFNN)的融合方法[109],其中遷移學習方法是針對具有大量數據樣本的數據來源(通常認為是易于獲取的低可信度數據)進行神經網絡模型訓練,然后將訓練好的模型遷移至目標任務,即針對另一來源的數據(通常采用獲取成本較高的高可信度數據)進行模型系數的微調,從而將低可信度數據的規律蘊含在神經網絡模型中且又融入高可信度數據的信息,從而實現了兩種來源數據的融合。

圖24 氣動數據關聯融合示意圖Fig.24 Illustration of aerodynamic data correlation and fusion
除了上述融合分類方法,按照融合對象數據抽象層次的不同,又可將數據融合分為數據級、特征級和決策級的數據融合,詳細論述可參考文獻[110-111]。在氣動研究中,直接針對不同來源氣動數據的融合屬于數據級的融合,而對數據進行本征正交分解(proper orthogonal decomposition,POD)、動力學模態分解(dynamic mode decomposition,DMD)等特征提取后,在模態特征層次進行融合,則屬于特征級融合[112-113]。文獻[114]針對2.4 m 暫沖型跨聲速風洞的高精度流場控制問題,提出了一種基于已有工況模型與新工況模型融合的方法,使馬赫數精度達到0.001 的水平,這屬于決策級的融合?;陔S機森林、集成學習的氣動建模方法在一定程度上也可以視為決策級的融合問題[115]。
數據融合的核心是融合準則,目前常用的融合準則包括基于數據方差的加權融合準則、貝葉斯融合準則、基于模型相關度的融合準則、基于D-S 證據理論的融合準則、基于高斯過程的融合準則、基于卡爾曼濾波的融合準則等。近年來,基于神經網絡的數據融合方法發展較快,其核心是將數據融合視為一種復雜的非線性映射機制,通過神經網絡的方法來對這種機制和內蘊融合原則進行學習和模擬,例如上面提到的MFNN 已在工程上已得到了應用驗證[116]。近期Meng 等進一步提出了一種新的貝葉斯神經網絡框架,可訓練帶噪聲的多精度數據,并證明該方法可以自適應地捕捉多種保真度之間的線性和非線性關系,進一步減少數據的不確定性[117]。
我們結合如下典型算例對MFNN 進行了實現,并分析了高可信度數據噪聲和低可信度數據噪聲(σ=0.1)對融合結果的影響,如圖25。

圖25 MFNN 中數據噪聲對融合結果的影響Fig.25 Effect of data noise on fusion result in MFNN
除上述方法外,數據融合方法可具體參見本文3.4 小節。表1 列出了智能空氣動力學的研究方法與空氣動力學傳統研究方法的差異。就理論分析手段而言,傳統研究方法依靠的是公式推導、數據統計分析與歸納演繹,而智能空氣動力學則可借助大數據中的數據挖掘、專家系統的知識表示與推理等方法來輔助知識發現;就CFD 計算手段而言,傳統方法主要基于有限差分或有限體積法對N-S 方程進行數值求解,智能空氣動力學則可采用神經網絡求解微分方程的方法;就風洞實驗手段而言,傳統研究方法主要遵循的是實驗設計、風洞運行、數據采集與對比分析的串行流程,而智能空氣動力學的風洞實驗可開展基于數字孿生的平行試驗和自主試驗;就模型飛行試驗手段而言,傳統研究方法通過氣動建模與參數辨識獲取飛行狀態下的氣動系數,而智能空氣動力學可將氣動建模與強化學習進一步結合,實現學習飛行和“端到端”的智能控制。更多研究方法及其在航空航天工業中的應用可參見文獻[22]。
拓展MFNN 使其適應非定常氣動數據的多輸入和多輸出數據結構,然后利用該網絡對某翼型的非定常CFD 和風洞試驗氣動數據進行融合。具體而言,將CFD 數據作為低保真度數據,而將風洞試驗數據作為高保真度數據進行融合。選取縮減頻率為0.02、0.04、0.08 的非定常氣動數據集作為訓練集,并將縮減頻率0.06 的數據集作為測試集,結果如圖26 和表6 所示。同時,我們利用LSTM 直接對風洞試驗數據進行非定常氣動建模,并將其結果與MFNN 融合結果進行了對比??梢钥吹?,基于MFNN 的非定常氣動數據融合精度顯著優于LSTM 方法的預測精度。

表6 基于MFNN 的非定常氣動數據融合結果與LSTM 預測結果對比Table 6 Fusion result comparison of unsteady aerodynamic data based on MFNN and LSTM

圖26 基于MFNN 的非定常氣動數據融合結果Fig.26 Fusion results of unsteady aerodynamic data based on MFNN
人工智能求解氣動性能的方法主要分為兩類:一類是數據驅動的有監督神經網絡方法;另一類是物理驅動的無監督學習方法。數據驅動方面,Ladicky等[118]采用回歸森林(regression forests,RF)方法成功對非定常流場氣動性能進行預測,大大提高了數值計算效率。Guo 等[28]采用卷積神經網絡(CNN)方法對二維和三維層流建模并進行流場預測,在保證較低錯誤率的前提下,其計算效率分別比基于GPU 加速和傳統CPU 的CFD 解算器提升了2~4 個數量級。Wang 等[119]采用生成對抗網絡對翼型壓力系數進行了智能預測,計算效率提升3 個數量級,同時誤差控制在3%以內。Sekar 等[120]提出一種快速預測翼型流場的深度神經網絡方法,在二維定常層流流場預測中取得了較好的效果。Fukami 等[37]提出了基于機器學習的湍流場超分辨率重建方法。物理驅動方面,以Raissi 等[121-123]引入物理嵌入的神經網絡(PINN)為代表,PINN 求解偏微分方程,通過特定流場的若干觀測值對神經網絡進行訓練,以控制方程作為約束,并不需要引入邊界條件就可實現對特定區域的流場預測,其通過在損失函數中引入偏微分方程作為約束條件,僅用少量數據就可以完成模型訓練。Zhu[124]和Geneva[125]等采用卷積編碼-解碼神經網絡模型對偏微分方程進行了數值求解,利用CNN 卷積核表示高維流場數據,大幅降低求解難度,同時在代價函數中融合邊界條件與控制方程,從而減少了對于數據的依賴程度。更多關于數據驅動方法賦能氣動力和氣動熱建模的工作可參見文獻[126-127]。
目前已有多種氣動智能建模方法在不同應用中取得了較好的效果。但是這些方法仍然存在一些問題:1)各類方法預測得到的不同氣動參數精度差異較大;2)已有方法的研究基本聚焦于特定外形和特定場景,對于外形和應用場景的泛化能力不夠;3)大多數工作僅采用均方誤差作為代價函數,忽略物理約束。產生這些問題的原因主要包括以下幾個方面:1)大多數方法采用相同的網絡結構直接預測不同的氣動參數,缺乏對不同氣動參數差異性的刻畫和表示;2)用于訓練模型的氣動數據庫通常較小,通常僅在特定外形的不同飛行狀態進行數值模擬獲得訓練樣本;3)對于物理機理的凝練和抽象不夠,導致方法無法滿足某些顯而易見的物理規律。
3.5.1 氣動力智能建模
為解決這些問題,實現飛行器氣動特性的快速精確預測,本團隊近期開展了一種多任務氣動性能智能建模方法,設計了基于多任務學習的神經網絡(multitask learning neural network,MTLNN)模型,在MTLNN模型基礎上,提出了內嵌物理知識的PIMTLNN 模型,并面向戰術導彈開展了模型驗證。由于PIMTLNN模型引入了氣動特性參數之間的物理機理,模型對訓練樣本數量的依賴程度降低,可以進一步節約數據獲取成本,為氣動優化設計提供有力工具。
LocalGeoNet 用于捕獲需要預測的指定點周圍的局部形狀變化。它的輸入是一個 14 維向量,由一個坐標部分和一個局部形狀部分組成。坐標部分反映拓撲結構,包括笛卡爾坐標、球坐標以及x-y平面上的投影點與坐標系原點之間的距離。局部形狀部分反映指定點附近局部形狀的變化,由法向量、最大主曲率、最小主曲率、高斯曲率和平均曲率組成。法向量和曲率由相鄰點擬合的局部曲面得到。

圖27 內嵌物理機理神經網絡模型的結構框圖[128]Fig.27 Framework of physics-embedded neural network[128]
圖28 展示了本團隊提出的兩種模型性能,從軸向力系數、法向力系數、俯仰力矩和壓心位置的預測結果與CFD 計算結果的對比來看,MTLNN 和PIMTLNN 模型的氣動性能隨迎角變化的趨勢與CFD 計算結果相吻合,但細節圖可以看出,PIMTLNN模型預測結果更接近真實值,表明其在相同數量樣本下具有更強的學習能力。

圖28 內插情況下軸向力系數、法向力系數、俯仰力矩系數和壓心位置的預測結果[128]Fig.28 Prediction of axial force coefficient,normal force coefficient,pitching momentum coefficient and pressure center location of interpolation cases[128]
基于數據驅動的模型預測精度受測試樣本集取值范圍的影響。測試集在訓練集包絡范圍內,預測精度會較高;測試集在訓練集包絡外,預測精度會有所降低。為驗證模型泛化能力,本團隊對外插情況下的4 種氣動系數進行了預測并與真值比較,如圖29 所示。PIMTLNN 模型的預測精度較 MTLNN 模型的預測精度更高。物理機理信息的引入,使模型具有更強的外插泛化能力。
基于 PINN 模型的預測誤差值相對較小,CA、CN、Cmz及Xp預測結果的均方根誤差(root mean square error,RMSE) 分別為 0.003 360、0.031 943、0.056 021、0.003 208,MRE 分別為0.995 6%、0.241 5%、0.639 2%、0.590 4%,如圖30 所示。可以看出,兩類模型的軸向力系數CA的預測精度基本相近,MTLNN模型的平均相對誤差(Mean Relative Error,MRE)指標比基于PINN 的模型略低,主要是因為PINN 模型中未考慮CA的物理機理,其他3 個氣動特性參數的訓練過程可能影響到模型共享層的部分網絡參數,導致CA的預測精度受到一定的影響。
軒轅明從信封里拿出一張小紙條,展開一看,不禁眉頭緊鎖。黑火兒、奇巧生、翼小飛都湊了過來?!袄蠋?,校長又給您寫了些什么?”黑火兒問道。

圖30 外插情況下 CA、CN、Cmz、Xp 的預測值與真實值的RMSE 和 MRE[128]Fig.30 RMSE and MRE of predicted and label values of CA,CN,Cmz,and Xp of extrapolation cases[128]
3.5.2 氣動熱智能建模
受企業傳統管理結構模式所影響,信息的傳遞時間較長,而且傳遞的速度較慢,這就在無形中降低了工作的效率,同時違背了信息化的特點,這種模式不利于企業的長遠發展,對企業的發展有一定的阻礙。所以,企業應該根據信息化發展的特點,改變組織結構,提高信息的傳遞速度,實現企業中各部門的信息互通有無,保證信息的準確性和安全性,提高企業的信息化管理水平,所以扁平化組織結構的出現,正好實現了該內容,它不僅能夠保證信息之間的連貫性和有效性,同時也提高了管理水平。
為提升高超聲速飛行器氣動熱預測效率,設計了自適應外形的氣動熱智能預測模型SA_HFNet。該模型采用點對點的方法預測飛行器壁面熱流。給定飛行器形狀、飛行條件和飛行器表面指定點的坐標,可以高效地預測相應的熱流值。預測模型由4 部分組成:用于捕捉全局形狀變化的神經網絡GlobalGeoNet,用于捕捉指定點周圍局部形狀變化的網絡LocalGeoNet,用于獲取飛行條件特征編碼的網絡FlightCondNet 和用于預測壁面熱流的解碼器HeatDecoder[129]。SA_HFNet 框架如圖31 所示。

圖31 自適應外形的氣動熱智能預測模型框架[129]Fig.31 Model framework of intelligent aerothermal prediction for adaptive configuration[129]
為了捕捉全局形狀的變化,本團隊將三維飛行器從上下左右前后6 個方向投影到二維圖像上,并使用GlobalGeoNet 提取這些投影圖像的特征。GlobalGeoNet由編碼器和解碼器組成。編碼器提取投影圖像的特征,并獲得固定長度的全局形狀編碼。解碼器根據全局形狀編碼重建投影圖像。通過計算重建圖像和投影圖像之間的殘差來調整 GlobalGeoNet 的參數,見圖32。

圖32 全局形狀特征提取網絡[129]Fig.32 Network of feature selection for global shape[129]
模型分為兩個模塊:用于提取共享參數的共享層和預測各個任務的特定任務層。由于氣動特性參數之間滿足一定的物理約束,即法向力系數CN、俯仰力矩系數Cmz和壓心位置Xp滿足函數f(CN,Cmz,Xp)=0。將這一公式嵌入神經網絡模型中,作為模型訓練過程中損失函數中的Jp(w,b)部分,具體的PIMTLNN 模型的結構如圖27 所示[128]。所涉及的戰術導彈采用了X-X 型結構,正常式氣動布局,CN、Cmz和Xp的物理關系為:CN·Xp+Cmz=0。物理約束的引入,能夠減少特定任務層訓練的難度,減少訓練對數據量的依賴程度,增強模型的泛化能力。
特殊情況下,擬合曲面不能代表正確的特征,如圖33 所示??梢杂^察到,錯誤擬合的曲面直觀地對應于曲率的奇異值。在 SA-HFNet 中,校正階段旨在獲得正確的局部形狀特征。在校正階段,沿著流線遍歷所有點,以定位曲率突然變化的位置,通過在異常位置附近添加點,可以更精確地表示局部曲面。
鄉村旅游是展示江城縣美麗鄉村建設成果的最好舞臺,采摘旅游是人民群眾青睞的休閑方式,不僅讓客人體驗了農家生活的樂趣,還拉近了游客和果農的距離,創造了一個新的銷售模式,實現了游客滿意消費,種植戶收入增加的雙贏。

圖33 擬合曲面在糾正前(左)和修正后(右)Fig.33 Fitting surface before (left) and after (right) modification
為探索SA_HFNet 的可靠性,評估了4 類典型高超聲速外形中平均相對誤差最大(MREall)的測試樣本的表現效果,并在圖34 中可視化樣本的壁面熱流。由圖可以看出,即使這些最壞情況的樣本,預測熱流的極值和變化趨勢與真實值也幾乎是一致的。左列顯示了 CFD 模擬的熱流結果,中間一列顯示了SA-HFNet 獲得的熱流,右列顯示了左側和中間兩列中用黃色線標記的流線上的熱流。

圖34 最大M REall 樣本預測結果可視化[129]Fig.34 Visualization of prediction results for maximum MREall samples[129]
為了測試 SA-HFNet 結構是否適用于訓練集以外的形狀,我們使用 4 種基本形狀(鈍錐、雙橢球、雙鈍錐、升力體)訓練了 BasicModel 模型,并在不同飛行條件下對航天飛機外形進行測試。200 個測試樣本的MREall如圖35 所示。可以看出,約 75% 的測試樣本的 MREmax值低于3%,約 98% 的測試樣本的 MREw值低于50%,表明使用 BasicModel 模型對航天器的預測結果具有參考價值。本文還對壁面機翼流線上的熱流的 CFD 結果與 BasicModel 模型的預測結果進行了比較,如圖36 所示??梢钥闯?,BasicModel 模型能夠準確預測航天器頭部的熱流,但難以捕捉機翼上的高熱流。

圖35 測試用例 MREall、MREw、MREmax 分布(橫軸表示樣本編號)[126]Fig.35 MREall,MREw,and MREmax distributions of test cases(Horizontal axis represents sample number)[126]

圖36 航天器最大M REall 樣本預測結果可視化[129]Fig.36 Visualization of prediction results for maximum MREall samples of space craft[129]
3.6.1 渦特征智能提取技術
渦特征被認為是流場中比較重要的空間結構,是流體運動的肌腱,在工程中發揮重要的作用,因此渦特征的準確提取對于研究流場的規律和機理具有重要意義。隨著計算能力的提升,數值模擬產生的流場越來越大,流場結構越來越復雜,研究人員從海量流場數據中提取空間特征難度不斷增大。
目前,常用的旋渦提取方法大致分為三類:局部方法、全局方法和基于機器學習的方法。局部旋渦特征提取算法是逐網格點或單元進行識別,且計算時僅需要在各流場網格點或單元的局部鄰域內進行操作,通常與流體在局部的旋轉特性相關;而全局方法則需要對多網格點或單元進行檢查以識別是否屬于旋渦結構,一般是依據一些流場粒子運動軌跡的連貫性。旋渦結構本質上是具有全局性的,利用全局方法來識別旋渦結構是很合適的,但是它的計算代價要比局部方法高,故流場中常用旋渦特征提取方法都是基于速度梯度張量的局部方法,必要時為了核實旋渦結構識別結果的精確性,才會采用全局方法?;跈C器學習的方法分為有監督學習方法和無監督聚類方法,有監督學習方法通過訓練模型利用局部和全局方法的優點,以實現準確率和計算成本的折中,對傳統方法誤檢、漏檢、計算復雜度較高等缺陷均有一定的改進。而無監督聚類方法是利用從幾何信息(位置、軸向長度、徑向長度、形狀、體積等)、動力學參數(渦量、速度等)和物理屬性(壓力、壓力梯度)等角度構建的旋渦特征向量,聚類分析該特征向量從而自動檢測出流場中旋渦結構。
數據挖掘技術是基于統計理論、機器學習、人工智能等算法從大量的數據集中獲取有用隱含信息,并通過規則和可視化等方式予以展現,形成知識發現的過程。近年來,數據挖掘技術在空氣動力學研究領域已得到了初步應用,如流場結構特征提取[8]、機翼翼型設計知識挖掘[9]、飛行器氣動布局設計知識挖掘[10]、基于飛行試驗數據的氣動建模和氣動參數辨識結果可信度確認等應用[11]。和通常的數據挖掘相比,氣動數據規律挖掘具有兩個特點:一是數據種類較為單一,且樣本相對較少;二是挖掘希望得到的是因果關系,而不僅是關聯關系。對于數據種類和樣本數較少的問題,主要采用仿真方法擴充、遷移學習等方法來克服;而對于因果關系的挖掘,符號回歸是目前主要采用的方法,即“在符號空間中尋找合適的公式,以使得它能夠描述指定的數據集”[12-13]。解決符號回歸問題的主要算法有基于蒙特卡洛樹搜索的強化學習算法[14]、遺傳程序設計(genetic programming,GP)[15]和基因表達式編程(gene expression programming,GEP)[16]。目前,GP 和GEP 等進化計算方法已廣泛應用于工程應用和科學研究各領域,如氣動減阻主動控制的控制律設計[17]、基于張量不變量函數組合的湍流雷諾應力模型構建[18-19]等工作,均取得了比較好的應用效果。但是,算法也存在函數發現過程中由于單節點算力不足造成的進化速度較慢、傳統算子選擇和操作固有的隨機性帶來的進化效率不高、收斂速度較慢;分布式計算超參數較多、對問題、數據噪聲和種群規模較為敏感,算子選擇、超參設置的嚴重經驗依賴導致進化結果得到解析表達式可解釋性低等挑戰性問題。針對隨機突變和重組等簡單算子進化效率較低的問題,研究者們提出了基于分布的數學方法或增強基因表達能力的表達方式;針對搜索效率的優化,提出了基于分布概率的算子、增強基因表達能力的個體表達、自適應調整小生境半徑的多樣性策略、定期增加預測錯誤的樣本權重和更新加權適應度、使用基因符-染色體序列頻數表實現基因空間均勻分布初始化等改進策略。此外,通過將算法移植到Spark 框架的分布式架構,采用圖形處理器(graphics processing unit,GPU)來進行并行加速,也可顯著提高計算效率。
為提升空間特征提取效率與精度,本團隊設計了一系列渦特征智能提取算法,團隊主要貢獻包括:第一,提出一種基于U-Net 結構的渦特征提取網絡,如圖37 所示,由收縮路徑和擴張路徑組成,收縮路徑用于獲取上下文信息,擴張路徑用于精確定位,并將上下文信息向更高分辨率傳播,使得輸入與輸出分辨率一致[147];第二,采用分塊策略,將局部塊作為網絡輸入,通過這種思路,一個標記流場就可以生成許多的訓練樣本,更多的訓練數據將帶來更好的網絡性能,故分塊策略可以有效避免性能下降;第三,為考慮流場網格點間的拓撲信息,采用渦量場局部塊作為Vortex-U-Net 網絡的輸入,渦量場是通過速度場和物理網格拓撲信息相結合的方法計算出來的,它保留了流場的網格信息;第四,為區分不同網格點的重要程度,設計了一種融合物理先驗知識的加權交叉熵損失函數,以指導網絡的學習過程,使得模型的預測結果合乎物理規律。在此基礎上,團隊進一步針對多物理量提出了多視圖渦特征提取網絡,進一步整合速度場、壓力場、渦量場等多種流場屬性,增加流場特征智能預測的準確性。

圖37 基于U 型網絡結構的流場渦特征提取方法示意圖Fig.37 Schematic diagram of vortex feature extraction method field based on U-net structure
圖38 展示了Vortex-U-Net 在二維翼型算例的渦特征提取可視化效果,圖中比較了三種方法,可以看出,Vortex-U-Net 方法與真實情況最為接近,渦的數量、完整程度、位置、大小均與真值相似。不同行表示不同迎角的結果,隨迎角的增加,Vortex-U-Net 能夠持續表現出較好的性能,說明其穩定性較高。通過量化分析,Vortex-U-Net 網絡的漏檢率和誤檢率都更低。

圖38 不同預測方法在二維翼型繞流流場的預測結果比較Fig.38 Comparison of the prediction results of 2D airfoil flow field with different methods
圖39 展示了Vortex-U-Net 在三維算例的渦特征提取可視化效果,圖中比較了三種方法,三種方法對于翼尖渦和邊條渦都能準確提取,但前兩種方法的誤檢區域明顯更大,圖中紅色虛線框表示誤檢區域。

圖39 不同預測方法在三維流場的預測結果比較[147]Fig.39 Comparison of the prediction results of 3D flow field with different methods[147]
3.6.2 非定常流場關鍵幀智能選取
未實行相關護理干預前兩組血糖、血壓情況對比差異無統計學意義(P>0.05),實行相關護理干預后觀察組空腹血糖、餐后2 h血糖、收縮壓、舒張壓明顯優于對照組,兩組對比差異有統計學意義(P<0.05),見表1。
關鍵時間步選取方法是非定常模擬數據在時間維度上的一種數據縮減技術,選取的關鍵時間步能夠完整反映流場的流動模式及演化規律。目前,對非定常流場關鍵時間步選取方法大致分為局部最優和全局最優兩類方法。局部最優方法主要是基于貪婪法則將相似的時間步聚類分組,然后從每組中選取一個時間步作為關鍵時間步,計算開銷較低。但是,這些方法只考慮局部時間范圍內的流場數據,選取的關鍵時間步容易陷入局部最優,無法準確反映流場演化過程。全局最優方法是從整體最優角度考慮,主要采用基于聚類或動態規劃等方法,實現關鍵時間步序列與原始整個時間步序列間流場信息差最小化,但計算成本較高。
互聯網教育的第三個特點是就是在于學習對象的轉變,在互聯上你不僅僅是一個學生,你還可以搖身一變成為別人的老師,為他們答疑解惑。俗話說得好“三人行必有我師焉”一個人不可能永遠是一個學生,有的平臺可以把自己拍的視頻發到網上供大家欣賞,還可以將自己的學習方法技巧,總結的知識點發到網上讓別人來學習。這種交流式學習平臺已經有很多網站開始建設了。
從局部最優角度考慮,Akiba 等[148]基于數據分布對相似的時間步結果進行分組,并從每組中選取出變化較大的時間步作為關鍵時間步流場。Wang 等[149]通過計算重要性曲線,以選擇那些與其前一個最不相似的時間步作為關鍵時間步流場。Woodring 等[150]提出時間活動曲線技術來發現和突出顯示非定常流場數據中的關鍵時間步。最近,Myers 等[151]設計了一種原位選取關鍵時間步的方法,基于分段線性模型假設來原位選取分段模型中的斷點,并將該位置的時間步保存為關鍵時間步。Ling 等[152]基于特征重要性度量原位自動選取出非定常流場中關鍵時間步。Porter 等[153]使用深度學習框架進行關鍵時間步的選擇,其具體過程如圖40 所示,采用自編碼器(autoencoder,AE)架構將流場編碼為1024 維特征向量;然后使用tSNE 算法將2024 維特征向量降成2 維,形成整個非定常流場序列的二維圖布局,最后,在二維圖布局上使用基于弧長、基于角度或者兩者混合的局部最優算法進行關鍵時間步選取。面向二維非定常流場,Liu 等[154]基于Siamese 網絡[155]以有監督學習的方式從非定常流場數據集中準確獲取時間步間的相似性度量,在此基礎上,使用該度量對不同時間步進行比較分析,從而選取出關鍵時間步。
《自然》近日發表的一項研究稱,全球變暖可能會導致“海洋熱浪”(即海洋表面長時間的反常高溫)的發生頻次更高、襲擊范圍更廣、強度更大。研究人員指出,1982年至2016年期間,海洋熱浪天數增加了1倍。

圖40 文獻[153]的關鍵時間步選取流程圖Fig.40 Key time step selection flowchart in Ref.[153]
從全局最優角度考慮,Tong 等[156]將關鍵時間步選取問題轉化成整個時間步序列和關鍵時間步序列間相似性度量問題,采用基于動態規劃的動態時間扭曲方法,使整個時間步序列和關鍵時間步序列之間的全局信息損失達到最小。Frey 等[157]提出了一種基于流的度量來計算時間步流場之間的距離,應用最小流方法捕獲非定常流場數據中關鍵時間步。Da Silva等[158]將視頻摘要方法應用于CFD 流場中關鍵時間步的選取問題。Lu 等[159]基于塊匹配技術(Block Match)構建非定常流場的雙向相似性度量矩陣(Bidirectional Similarity Metric),然后采用Kmedoids聚類方法來獲取關鍵時間步。Liu 等[160]提出了一個基于事件的分析系統,用戶可以交互式地在該系統的時間軸視圖上為每個非定常流場選取關鍵時間步。
關鍵時間步選取是非定常流場可視化的研究熱點,現有方法大多依賴于手工選定的數據特征,沒有有效考慮流場潛在物理特性,選取結果無法準確表達流場中的流動模式。為解決上述問題,提出了一種基于深度學習框架的關鍵時間步選取方法KTSS+Net,如圖41 所示。其具體流程為:1)采用融合流場物理特性的深度卷積自編碼器(deep convolutional autoencoder,DCAE),以無監督學習方式來獲取每個時間步流場數據的有效編碼;2)借助流形學習的思想對整個流場序列的編碼進行降維,并在低維映射空間上實現流場數據可視化;3)在該可視化圖布局上使用DBSCAN 和Kmeans 混合聚類算法自動選取關鍵時間步。

圖41 基于深度學習框架的關鍵時間步選取框架Fig.41 Framework of key time step selection based on deep learning
為驗證關鍵時間步選取框架的性能,團隊選擇了4 種已有方法,并通過定常算例進行驗證,如圖42所示。觀察發現,TimeCurve 選擇的時間步更偏向于中間,前后均沒有記錄;ManifoldCurve 方法則更偏向于后面的時間步,對于前面的時間步記錄較少;AE+K-medoid 方法記錄較為均勻,無法反映其變化情況;MI+DP 與本團隊方法KTSS+Net 對關鍵時間步的提取能更準確反映流場的變化情況。

圖42 二維平板數據集中不同方法選取的關鍵時間步Fig.42 Selected key time step of 2D flat plane dataset with different methods
為了驗證重構中間時間步流場數據的可用性,使用局部和全局兩類可視化方法對線性插值重構和非線性重構的流場序列進行定性對比分析。從圖43 觀察到,基于關鍵時間步線性插值獲取中間時間步流場數據丟失了大量的流場信息,容易對流場數據的后續可視化處理產生誤差?;谧跃幋a器非線性重構中間時間步流場數據能有效地代表流場的主要內容,保持流場信息的完整性,對后續的流場可視分析影響較小。這意味著KTSS+Net 方法既可以準確高效地選取出非定常流場中關鍵時間步,又可以有效地重構出中間時間步流場。更重要的是,該方法能在保證數據可探索性的基礎上,只需保存關鍵時間步流場、訓練好的自編碼器和中間時間步流場數據的特征表示,大大減少了非定常流場數據的存儲量,這對大規模多變量非定常流場數據可視分析與利用具有重要的意義和實用價值。

圖43 線性插值和非線性重構的結果比較Fig.43 Comparison of the results of linear interpolation and nonlinear reconstruction
目前,智能空氣動力學在流場快速預測、轉捩預測、湍流建模、多源數據融合等領域得到了日益廣泛的應用,取得了令人矚目的研究成果,預示了該研究方向的積極前景。但與此同時,現有研究也面臨著一定的挑戰:一是領域數據的小樣本問題。由于獲取成本較高,空氣動力學數據通常是小樣本數據,這給神經網絡建模和學習都帶來了困難;二是模型存在通用性、可解釋性、可靠性以及泛化性不足等局限性,難以實質性地解決轉捩、湍流等經典難題,并且在應用到工程實踐過程中存在較大困難。對于普通用戶而言機器學習模型尤其是深度神經網絡模型如同黑盒一般,不能確切地知道其運行機理及決策結果是否可靠,這給模型的有效使用和泛化帶來了威脅;此外,研究者大多依賴現有開源算法庫(如TensorFlow、PyTorch、Keras 等)構建和訓練基于相對少量算例的小規模模型,缺乏面向大模型的訓練算法和經驗。為此,我們認為智能空氣動力學的后續研究工作可從以下方面開展:
1)領域大模型的構建和應用。
ChatGPT 的出現標志著智能化步入大模型時代。雖然它主要是針對自然語言處理構建的,但其“基礎大模型+行業數據二次訓練+場景微調”的架構同樣適用于科學研究領域。目前,華為公司聯合中國商飛和西北工業大學開發的AI 大模型參數量達到1 億以上,能在超臨界翼型的幾何形狀、來流參數發生變化時,實現大型客機翼型流場的高效高精度預測;除流場預測外,領域大模型的應用場景還包括根據輸入條件快速預測氣動特性的預示型大模型、根據設計目標和約束自動生成飛行器幾何外形的設計大模型,以及將這些大模型耦合智能控制、任務規劃等環節,替代基于專家系統的傳統設計方法,快速高效地獲取工況的力/熱/流場等信息,縮短研制周期、減少研發代價,實現真正意義上的“智慧飛行”。
《法制晚報》在刊發這條消息時,配了一幅漫畫。畫面中的兩個人,正舉著手機飛跑。其中一個一邊跑一邊說:“快點,還有5公里,走訪還沒有完成!”這真是可笑,在大街上跑步,就算是走訪嗎?而某些上邊的考核者,看的只是行走的里程數字。至于你在哪里走,去干什么,全憑“指下生花”。
左達把鋼筋扔掉,道:“干什么?我還要問你呢,我以為你是要債的,差點把你殺了。嗯,怎么是你?我約的可是張仲平,他人呢?”
2)大數據、大樣本的數據庫建立。
目前空氣動力學領域的數據數量和質量有限。人工智能尤其是深度學習技術首先在計算機視覺領域取得了巨大成功,這主要是因為大數據時代的到來,使得圖片和視頻數量呈幾何級數增長,各種超大規模圖像和視頻數據集層出不窮。反觀空氣動力學領域,目前仍沒有公開的且大家都能認可的數據集用于科學研究。究其原因主要有兩個:一是數據產生困難,空氣動力學領域產生的數據有多種模態,不同模態的數據存在工況不足、覆蓋面不夠、數據污染、確定性與完整性差等問題;二是難以標注,深度學習系統需要大量有標簽數據,而流場等數據對于某些問題的研究尚不存在客觀方法,只能通過主觀判斷打標簽,因此產生的標注數據存在一定的主觀性,從而導致公信力不足等問題。文獻[161]中給出了4 種解決方案,即基于模型微調、基于數據增強、基于度量學習和基于元學習的方法。針對氣動領域數據的特點,可重點考慮基于數據增強和基于元學習的方法。基于數據增強的方法旨在獲得與小樣本數據相同分布規律的擴充數據,而基于元學習的思想則是使用少量樣本數據,習得適應多種學習任務的共性特征表達,從而使得元學習模型在經過不同任務的訓練后,能很好地適應和泛化到一個新任務[162-163],也就是學會了“如何學習的學習方法論”(Learning to Learn)。這一問題也是文獻[164]中列出的人工智能10 個重大數理基礎問題之一。除上述4 種方法,還可以借助主動學習方法,主動選擇最有價值的樣本向專家查詢標記,從而顯著降低模型提升性能所需要的樣本數。此外,從領域大模型的角度出發,后續工作可加強構建智能空氣動力學研究所需的大規模、超大規模數據庫,利用大量數值模擬數據作為基礎數據,并使用高精度的風洞試驗和飛行試驗數據進行補充。采用盡量客觀準確的方法獲得相關研究的標簽,形成準確性高、客觀性強、覆蓋面廣的智能空氣動力學數據庫。
3)自主研究算法的開發以及與硬件的深度融合。
盡管目前已有Keras、TensorFlow、PyTorch 等開源算法平臺,但是針對大模型訓練的開源技術和方法相對稀少。國內更是缺乏面向大模型的具備自主知識產權的智能化算法,亟需數學、計算機等領域研究人員創新性地提出新算法,實現軟、硬件平臺的開發,形成新的空氣動力學計算架構,為大模型的開發和構建提供技術支撐和堅實保障。例如DeepMind 發布的AlphaTensor 為矩陣乘法等基本計算任務設計更高效的經典算法,有望大幅提高CFD 計算效率[165];而更進一步,采用神經網絡求解流動微分方程,結合GPU、TPU、NPU 等專用芯片[166],可構建無需生成網格,無需差分格式離散的全新CFD 求解架構,在求解效率和使用便利性等方面全面超越傳統CFD 計算方法。
致謝:在本文撰寫過程中,中國空氣動力研究與發展中心的藺佳哲、孫國鵬、楊志供、鄧亮、王天、西北工業大學的左奎軍,分別整理了氣動力智能建模、氣動熱建模、非定常流場關鍵幀提取、流場預測的相關文獻,在此表示感謝!