













關鍵詞:綜掘工作面;粉塵防治;風流場預測;粉塵濃度場預測;本征正交分解;機器學習;支持向量機
中圖分類號:TD714.4 文獻標志碼:A
0引言
據統計,我國塵肺病人數約占職業病總人數的90%,其中煤礦工人占比達50% 以上[1-2]。目前,綜掘工作面主要采用混合式通風方式降低粉塵濃度,易導致粉塵局部聚集嚴重[3]。因此,綜掘工作面粉塵防治對于保障煤礦生產作業環境的安全和工人健康具有重要意義[4]。為了保證粉塵防治措施的有效實施,提高防降塵效果,需要快速、準確預測工作面流場變化。
通過計算流體力學(Computational FluidDynamics,CFD)技術與綜掘工作面現場監測數據可有效模擬出綜掘工作面整體的風流場與粉塵濃度場,但由于CFD 技術計算時間長,難以進行快速預測。采用降階模型(Reduced Order Modeling, ROM)對高維流場數據進行降維是實現流場快速預測的主要途徑[5-6]。在眾多ROM 中,本征正交分解(ProperOrthogonal Decomposition, POD)方法被廣泛應用于汽車和飛行器流場分析[7-9]、航空工程[10]、流體機械[11]等領域, 取得了較好的應用效果。因此, 本文將POD 方法引入綜掘工作面流場預測中,基于少數已知的工況, 使用全階CFD 模型進行計算, 采用POD 方法提取流場系統的核心模態。通過少量的模態和模態系數有效描述流場系統的主要動態特性,在保證模型準確性和可靠性的同時,大幅降低計算時間成本,提高綜掘工作面流場預測效率。
1算法流程
基于POD 與機器學習的綜掘工作面流場快速預測算法流程如圖1 所示。首先,利用CFD 技術對多種工況下的綜掘工作面風流場和粉塵濃度場進行模擬,獲得高維度的流場數據。其次,使用POD 方法對高維流場數據進行降維,提取出能夠反映流場主要特性的核心模態,并將其分解為基函數模態和模態系數。然后,以各工況的參數為特征,以流場的模態系數為目標,構建并訓練機器學習模型。最后,通過訓練好的機器學習模型和基函數模態,基于輸入的工況參數,實現對目標工況下綜掘工作面流場的快速預測。
2綜掘工作面數值模擬
2.1數值計算模型
礦井綜掘工作面粉塵顆粒在風流作用下的擴散是一個典型的氣固兩相流動過程,其中風流為連續相,粉塵為離散相。兩相流中粉塵顆粒的體積比例遠小于10%,粉塵顆粒間碰撞對數值模擬的影響較小[12-13],因此,進行數值模擬時不考慮粉塵顆粒間碰撞帶來的影響,此時的風流連續方程為
數值模擬參數的設置主要分為離散相與邊界條件2種,分別見表1和表2。
為了獲得后續機器學習所需的樣本,對表1和表2中質量流率的最大和最小顆粒直徑、壓風筒和抽風筒的風速設定不同值,通過組合不同參數,總計得到300種綜掘工作面降塵措施的工作狀態,并進行數值模擬。
為了確保數值模擬的準確性,選取綜掘工作面回風側行人呼吸帶的粉塵濃度作為判斷網格獨立性的標準。在最大顆粒直徑為2×10?4 m、最小顆粒直徑為1×10?6 m、壓風筒風速為8 m/s、抽風筒風速為10 m/s 的工況下,比較不同網格數量對數值模擬結果的影響,結果如圖3 所示。
根據圖3數據,12萬個網格雖然能夠保證基本的模擬結果,但由于粉塵濃度分布存在較大波動,且局部區域的模擬結果與其他網格數量模擬的結果不一致,顯示出其難以確保結果的精確性。隨著網格個數從24萬增加至34 萬和44萬,粉塵濃度分布的波動逐漸減小,不同網格條件下的濃度曲線更加平滑,顯示出模擬精度有所提升,特別是在細節區域的結果更為一致。此外,34 萬和44 萬個網格的模擬結果與24 萬個網格相比差異不顯著,表明從24 萬個網格開始,模擬精度已達到較為理想的水平。考慮到進一步增加網格數量會顯著提高計算成本,因此,選擇24 萬個網格作為最終計算基礎,在確保精度的同時,提高計算效率。
2.3數值模擬效果驗證
選取回風側行人呼吸帶中心距工作面5 m 處的實測風速及粉塵濃度,與數值模擬得到的對應值進行比較分析,驗證數值模擬結果的準確性,結果見表3。可看出模擬值與實測值的相對誤差均在3% 以內,滿足模擬值與實測值的相對誤差不超過5% 的精度要求,說明數值模擬能夠準確反映實際的風流和粉塵分布狀況。
3POD重構
3.1POD應用方法
POD方法能夠通過CFD軟件所獲得的大量計算數據,精選出反映流場主要特征的優化基向量模態[19]。針對綜掘工作面流場與粉塵濃度場,建立POD模型的步驟如下。
1) 構建樣本數據集矩陣。通過綜掘工作面CFD模型的數值模擬結果生成樣本數據集矩陣。本研究中,風流場或粉塵濃度場不同工況的數據集共同構成一個大小為L×N 的矩陣V,L 為模型網格數量,N 為綜掘工作面樣本中不同工況的數量。
風流場和粉塵濃度場系統各階模態能量貢獻率及模態能量累計貢獻率如圖4 所示。第1 階模態在能量分布中占據主導地位,遠超過其他模態,尤其在風流場中,第1 階模態能量占比更為突出。隨著模態階數增加,其包含的能量迅速降低并逐步趨于穩定。當累計模態能量達到總能量的90% 時,繼續增加模態對能量累計貢獻率的影響相對較小。
為選取合適的基函數模態階數,對不同階基函數模態重構的風流場與粉塵濃度場及原流場進行差異評估,評估指標選取平均絕對誤差(Mean AbsoluteError,MAE)。
使用不同模態階數進行重構的風流場與粉塵濃度場及原流場MAE如圖5 所示。風流場的前5 階模態已將MAE 降至0.028,若進一步增加模態,誤差減小幅度較小,提升效果不明顯,因此選擇前5 階模態即可保證精度與效率平衡。粉塵濃度場的前7 階模態將MAE 降至0.134 8,7 階之后誤差減小幅度較小,因此選擇前7 階模態即可兼顧精度與計算成本。
3.3模態重構效果驗證
選取以下工況進行模態重構效果驗證:質量流率為0.008 kg/s,最大顆粒直徑為1×10?4 m,最小顆粒直徑為1×10?6 m,壓風筒、抽風筒風速為10 m/s。取行人呼吸帶高度(1.5 m)處平面作為展示平面1,抽風筒抽出口距工作面5 m 處平面作為展示平面2,如圖6 所示。
將平面1、平面2 的風流場與粉塵濃度場數值模擬結果與使用含90% 以上能量的基函數模態進行POD 重構的結果進行對比,結果如圖7 所示。可看出,在綜掘工作面風流場與粉塵濃度場中,前幾階含能量較高的模態已經涵蓋了流場系統的主要特性信息,利用這些模態能夠以較高的準確度對樣本數據集進行重構。
4基于POD與機器學習的綜掘工作面流場快速預測
使用機器學習模型預測風流場前5 階模態和粉塵濃度場前7 階模態,得到目標工況下的模態系數后,可結合對應模態快速重構不同工況下的流場數據。
4.1數據準備與機器學習模型選擇
通過POD方法對不同參數組合下的數值模擬結果進行降維,得到各個工況下的模態系數,并形成數據集。該數據集共包含300個工況,其中240個工況用于模型訓練,其余60 個工況用于模型測試。模型的輸入參數為工況參數組合,具有4個維度,輸出數據為相應的模態系數。為了降低模型對數據規模的敏感性,采用離差標準化方法將數據范圍調整至[0,1],以增強模型的泛化能力。
基于不同機器學習模型的泛化能力與預測能力, 選取支持向量機(Support Vector Machine,SVM) 、隨機森林(Random Forest, RF) 及神經網絡(Neural Network,NN)進行對比分析[20-23]。為確保這3 種模型能夠達到最佳性能,采用貝葉斯優化方法調整參數。由于深度學習模型的參數復雜、訓練時間長,尤其在流場預測任務中效率較低,所以本文未選用深度學習模型。
分別采用均方根誤差(Root Mean Squared Error,RMSE)和決定系數R2 評價模型的預測精度和預測能力。
3種機器學習模型性能評估指標見表4。在不同流場類型下,各模型訓練后的RMSE 數量級相同,其中SVM 的RMSE 相對較小;各模型的R2值相差較大,其中SVM的R2 值明顯高于其他模型。因此本文選取SVM 作為模態系數預測模型。
4.2模型預測結果分析
將待預測流場的工況參數輸入訓練好的SVM 模型中,通過SVM模型預測模態系數,將模態系數與模態進行組合重構,獲得綜掘工作面風流場或粉塵濃度場預測結果。
選取與模態重構相同的工況(非訓練集中工況)進行數值模擬和預測,平面1 與平面2 的風流場與粉塵濃度場數值模擬與預測結果如圖8 所示。可看出,2 種結果具有較高的一致性。
針對60種不同工況,計算得到模型各網格預測的風流速度、粉塵濃度與數值模擬結果之間的相對誤差分別為0.36 m/s,86.24 mg/m3,表明本文構建的預測模型具有較高的準確性,能夠實現對礦井綜掘工作面風流場和粉塵濃度場的高精度預測。
4.3模型泛化能力驗證
通過交叉驗證能夠更全面地評估模型在不同數據集上的表現,避免過擬合。采用5 折交叉驗證對模型的泛化能力進行驗證。將60種不同工況的數據集劃分為5 個子集,每次使用其中1 個子集作為驗證集,剩余子集作為訓練集,重復5次后計算模型的平均RMSE 及標準差,結果見表5。
從表5可看出,SVM在風流場和粉塵濃度場的預測中表現最佳,平均RMSE 均為最低。雖然在風流場中的標準差較高,但由于其較高的準確性,整體誤差仍然低于其他模型。RF 的預測性能略遜于SVM,但在風流場中的標準差較小,表明其在不同工況下的預測結果較為穩定。而NN 在2 種流場預測中的RMSE 均為最高,且粉塵濃度場的95% 置信區間較寬,說明其預測結果存在較大的不確定性,難以在不同條件下提供一致的表現。
通過數值模擬軟件獲得綜掘工作面風流場和粉塵濃度場的平均耗時為48 951.6 s,利用本文算法獲得綜掘工作面風流場及粉塵濃度場的平均耗時為73 s,顯著降低了計算所需的時間成本。
5結論
1) 建立了POD重構模型,該模型能夠識別綜掘工作面風流場與粉塵濃度場的主導特征,使用較少模態進行流場信息重構,且當模態累計能量達到流場系統總能量的90% 以上時,重構結果具備較高準確性,能夠滿足精度要求。
2) 對于實時變化的工況參數,基于POD與機器學習的綜掘工作面流場快速預測算法能夠快速準確地預測綜掘工作面的風流場和粉塵濃度場。風流場預測結果與數值模擬結果中各網格風流速度的相對誤差為0.36 m/s;粉塵濃度流場預測結果與數值模擬結果中各網格的相對誤差為86.24 mg/m3。
3) 基于POD與機器學習的綜掘工作面流場快速預測算法具有優越的通用性和較低的時間成本,預測綜掘工作面風流場及粉塵濃度場的平均耗時為73s,實現了綜掘工作面流場快速預測,能夠滿足綜掘工作面降塵設施運行及優化調控的時效性要求。
4) 盡管該算法在綜掘工作面流場預測中表現良好,但在更復雜的工況或大規模工業流程中,可能面臨工況復雜度增加帶來的不確定性。尤其是在具有更復雜邊界條件、動態變化更為頻繁的大規模流場中,算法的精度和計算效率可能會受到影響。因此,未來研究可考慮如何在更復雜工況下進一步優化該算法,以提升其適用性和擴展性。