柴森霖,劉光偉,2,白潤才,曹 博,2
(1.遼寧工程技術大學 礦業學院,遼寧 阜新 123000; 2.遼寧工程技術大學 煤炭資源安全開采與潔凈利用工程研究中心,遼寧 阜新 123000; 3.遼寧工程技術大學 遼寧省高等學校礦產資源開發利用技術及裝備研究院,遼寧 阜新 123000)
礦巖運距是衡量露天礦山卡車運輸經濟性的重要指標之一[1-3],同時也是優化開拓運輸系統運營成本的重要基礎,對礦山開拓運輸系統優化建模、最佳調運方案配置以及優化運輸成本等研究均具有重要意義。
目前,有關礦巖運距計算方法的研究可大致分為兩類:第1類是利用階段性道路網絡設計,結合重心算法對物料進行分巖種、分水平、分塊段的幾何量測[2,4-12];此類方法被廣泛應用在進度計劃方案優選、礦山運輸系統優化以及物料流規劃建模等相關研究領域,如張幼蒂教授針對礦巖流向、流量優化模型,提出的階段性運輸網絡中運距計算方法[2];又如趙景昌等為建立以運輸功最小化為優化目標的物料流規劃模型,以年為時間單位劃分階段,并結合階段性運輸道路網絡圖進行運距量測[4]。第2類是采用奇偶點法計算有向圖多邊形面積,通過多邊形面積變化率映射排土場排棄量與運距之間動態關系(S=F(v)曲線)[1,13-14];此類方法被應用于排土場運距推估等相關研究領域,如張瑞新教授等根據累計物料量變化率受形狀約束的特性,提出一種利用排棄物料量動態推估運距的方法[13];劉光等利用計算機模擬技術,總結出推估并繪制S=F(v)曲線的基本流程[14]。
筆者在前人研究成果的基礎上,根據外排土場出入口服務周期長、年度計劃階段內運輸線路具有相對穩定等特點,針對階段性道路網絡無法描述逐條帶的路線波動、直接逐條帶推估離散塊體運距困難且在物料規劃場景中不現實等問題展開研究,提出外排土場計劃階段內離散塊體過程運距動態賦值的新方法,其基本思想即利用關鍵的運距影響因素,建立一組動態的非線性預測模型,并利用年末排土計劃位置上路網提取運距屬性信息,訓練預測模型、優化確定非線性模型參數。最終,應用運距的非線性表達對年度排土計劃階段內的離散塊體物料進行運距賦值。經仿真對比實驗驗證,所述算法模型對解決計劃階段內的逐條帶塊體運距賦值問題具有現實有效性。
支持向量機(Square Vector Machines,SVM)是數據挖掘算法中一種新穎的小樣本統計學習方法,由Corinna和Vapnik等于1995年提出,主要用于解決小樣本、非線性及高維模式識別中,后被推廣應用到函數擬合等其他機器學習問題中。加權最小二乘支持向量機(Weighted Least Square Vector Machines,WLS-SVM)是在SVM及LS-SVM(Least Square Vector Machines,LS-SVM)基礎發展起來的,保留了算法模型中的平方誤差損失以及等式約束等特性,消除了異方差性,具有更好的學習能力、泛化能力,預測準確率更高[15]。
對于給定運距預測模型的訓練集合{(xk,yk)|k=1,2,…,N},其中xk為p維的參數樣本,yk為樣本輸出集,則該問題的凸二次優化模型[16]可表述為
(1)
約束條件為
s.t.yi=ωTφ(xi)+b+ei
(2)
式中,ω為權系數向量;e為誤差集;φ(xi)為輸入參數到希爾伯特空間的映射;C為懲罰因子;b為模型閥值;ei為樣本誤差;λi為誤差權值。
根據式(1),(2)中優化模型采用拉格朗日算子法進行求解,建立二次凸優化對偶模型如下:

(3)

對式(3)采用偏導極值法求解,消除偏導方程組中的無關變量ω,ei,化簡為如式(4)的線性方程組,等價問題即為求解方程組中的未知變量a*和b,矩陣求解形式如式(5)所示:
(4)

(5)
根據優化條件引入徑向基核函數,最終獲得的回歸估計函數如式(6)所示,其模型基本結構如圖1所示。
(6)

圖1 WLS-SVM 基本結構示意Fig.1 Structure of WLS-SVM
露天礦外排土運距主要由采場運距、運輸干線長度以及外排土場內部運距3部分組成,其中因排土干線長度相對固定,而采場運距和排土場內部運距則易受道路網絡在條帶間的動態變化,而產生較為明顯的波動效應。從運輸道路設計角度分析此種波動效應可發現,采場道路設計因受煤層起伏、臺階并段等因素限制,特別是當工作幫線路采用移動坑線設計時,運輸線路靈活,易造成計劃階段內運輸線路存在差別于計劃工程位置上的結構性變化,導致階段內線路的動態發展趨勢不可控,無法實現預測性動態推估。但區別于采場運輸線路,外排土場內部運輸線路則通常設有特定入口或特定干線,道路多為固定或半固定線路,服務周期長于采場內部的采場線路,階段內干線動態演變趨勢仍保持計劃工程位置上運輸線路的結構特性。因此,采用特定模型即可實現近似預測性的動態推演。
露天礦外排土場運輸網絡是一種非線性動態系統,其運距預測精度則明顯受道路運輸系統的關鍵組成要素的影響,即受到文中非線性模型的輸入參數控制,但通常這些因素之間存在內在的聯系,即使我們采用特定的降維策略,其輸入參數維度依然會對擬合造成一定的影響。故為進一步從眾多存在特定內在聯系的影響因素中確定外排土場運距的關鍵影響因素,降低模型輸入參數維度,本文采用主成分分析中壓縮冗余成分的策略來處理和優化上述輸入參數維度,以消除冗余因素來提高預測模型精度。基于此,我們首先建立運距影響因子的內部依賴關系分析模型,初步選取塊體質心至排土場入口的歐氏距離(D如式(7)所示)、物料提升高度(H)、階段累加工程量(M)、坡道長度(L)、緩沖段長度(L′)、臺階高度(HT)以及道路坡度(β)、塊體長(l)、塊體寬(b)、塊體高(h)、排土工作線長度(R)、排土平盤寬度(B)等12個影響因子建立因子分析模型,將上述12組影響因子作為12種分析成分,按照1~12編號代入SPSS軟件內置的因子分析模型,計算相關系數矩陣的特征根及方差貢獻率,并按照特征值排序后統計見表1。

表1 因子及貢獻率Table 1 Factors and contribution rates
(7)
為避免維度過高且有效保留因素中樣本數據的內在特征,文中以因子特征值大于1和累計貢獻率范圍在70%~85%為降維標準,最終選取前7個指標參數作為運距預測模型的輸入參數:D(km)、H(m),M(萬Mm3),L(m),L′(m),HT(m),β(°)。
運距預測模型的誤差水平是評價整個預測模型精度的重要指標,為綜合評價算法模型中參數優化和運距預測效果,文中在傳統的均方誤差、擬合優度、絕對誤差期望、相對誤差期望等誤差評價指標基礎之上,引入無量綱的錯估計系數,利用此系數評價絕對誤差大于推估塊體最小邊長的規模程度,其誤差評價判據如式(8)所示。評價體系中認為這種誤差會直接影響推估塊體的運距計算精度,其參數計算方法如式(9)所示:
eME=y′-y>lmin
(8)

(9)
式中,eME為絕對誤差;l為塊體模型邊長;y′為運距的估計值;y為運距訓練值;nM滿足錯誤估計判據的塊體模型數量;n為總體塊體數量。
2.4.1WLS-SVM模型的權值改進
對最小二乘回歸估計模型引入權向量是為有效削弱異常數據造成的離群誤差波動,增強回歸模型整體穩健性[17]。因此,權向量的優化選擇對于提高運距預測模型精度意義重大。通常,權向量的確定多采用權函數賦值方法,其中常見的權函數如線性權函數[17]或改進的正態分布權函數[18]等。此類方法應用簡單、方便,但均為主觀修正,會受到過濾條件等因素的影響,造成一定程度的精度損失。因此,為保證運距預測模型具有更好的離群誤差控制能力,筆者在自適應正態分布權函數[18](圖2中曲線BDFGH、曲線BDEGH)的基礎上,提出一種改進的區間自適應權函數,其權函數如式(10)所示,函數形態如如圖2中曲線ACEGH所示。
(10)

(11)
圖2中ζr,m,ζd分別為由點D,E,G切分而成的權向量配重區間節點,區間1,4分別為低誤差和高誤差區域,自適應函數會對此部分進行調節,保證改造后的權值模型能有效改善誤差集內的權重分配,將較大權重自適應的賦值給區間1;而區間2,3為區域中值分布區域,區間2相對誤差更小,因此曲線保持反比例正態特性,而區間3誤差是偏離中值,隨偏離程度加大,正態特性則會壓縮中值,賦予較低權重。

圖2 權值函數形態示意Fig.2 Weight function diagram
在上述曲線模型定義的基礎上,為進一步說明權重修正過程,文中給出權重自適應動態修正的流程如圖3所示。其中u1,u2分別用來控制正態分布函數形態,權重配比空間被分割后,隨著迭代進行誤差較大的樣本會因為權重影響而被濾除,故隨算法迭代軸線EF會不斷向AB側移動,實現動態的自適應調節配權,進一步提高預測模型精度。

圖3 權函數動態修正流程Fig.3 Weight function dynamic correction flow chart
2.4.2基于改進粒子群算法的模型優化調參
應用支持向量機進行回歸估計是基于傳統求解不適定問題的思想,通過引入核函數以實現標準算子方程向正則化泛函的轉化,并完成對高維空間算子方程的求解,其核函數的質量直接關系到非線性預測模型訓練速度及泛化能力[19-20]。因此,為提高非線性運距預測模型的擬合精度及收斂速度,筆者采用粒子群算法(PSO)進行核參數優化,以參數c,σ為平面粒子位置坐標,建立線性優化模型如式(11)所示,將式(12)作為優化粒子群算法的適應值函數。
(11)

(12)
另一方面,考慮模型易受訓練數據規模局限性以及其他多種綜合因素限制,且上述影響對粒子群算法極為敏感,嚴重制約粒子群算法種群的搜索范圍,導致隨著迭代進行會促進種群喪失多樣性,極易造成迭代初期算法便出現早熟現象。為使算法在迭代初期具有較強的空間搜索能力,在迭代后期具有較強的尋優能力,對粒子群狀態轉移模型中的慣性因子(w)、學習因子(c1,c2)進行了如式(13)的修正。此種修正的作用在于能有效的保證算法在迭代初期以較大的范圍搜索最優解,保持種群多樣性;在迭代后期能實現更精細的局部搜索,以提高整體優化建模精度。
(13)
式中,ws,we分別為慣性權重w的初始值和上一期迭代結果值;c1s,c1e分別為學習因子c1的初始值和上一期迭代結果值;k為迭代次數;G為總的迭代次數。
最后,為進一步擴大粒子搜索空間,減少個體尋優過程中易陷入局部最優狀態的可能,在每次迭代產生的搜索空間內,算法會采用輪盤賭法隨機調整部分粒子位置,其位置更新模型如式(14)所示:

(14)
式中,r為[-1,1]區間上的隨機數;xmax,xmin為粒子位置的區間邊界。
其輪盤賭概率事件模型如式(15)所示。
(15)
基于MPSO-WLS-SVM的運距預測算法基本流程如圖4所示,其核心作用是將WLS-SVM模型、權向量修正以及MPSO有機的結合起來,通過相互之間的動態調配,最終實現運距的理想輸出。

圖4 運距預測算法流程Fig.4 Flow chart of haul distance prediction algorithm
其算法具體實現步驟如下:
(1)因各影響因子的量綱和取值范圍不一致,為進一步提高算法的收斂速度,對影響因子進行線性歸一化處理,利用式(16)將影響因子統一映射到[0,1]區間內;
(16)
(2)擬合普通最小二乘支持向量機回歸估計模型殘差;
(3)根據殘差值和權值函數反求加權最小二乘模型權重初值;
(4)引入核參數初值,用以構建基礎核參數優化修正迭代模型;
(5)利用步驟(3)中求得的權重以及核參數初值,建立待優化參數的初始WLS-SVM模型;
(6)擬合WLS-SVM模型殘差,建立參數優化質量評價指標;
(7)評價體系指標,如果小于閥值向量即得到動態理想輸出,否則修正WLS-SVM模型權值向量,開始迭代反向修正核參數;
(8)利用MPSO模型修正核參數,保證當前權重模型下訓練模型的核參數動態最優解;
(9)將MPSO修正結果代入步驟(4)進行動態迭代,直至步驟(7)中獲得理想的運距輸出,算法結束。
研究以構建黑山露天礦物料流規劃模型為背景,并為解決物料流能耗模型中無法實現逐塊體運距推估問題展開。選取該礦2018—2019年南部卡車外排土場年末計劃位置圖為基礎數據采集模型,收集了計劃工程 位置上的300組塊體模型的設計數據進行建模分析和預測,塊體模型標準尺寸85×50×20,塊體具有次級結構尺寸;采用隨機抽樣選取100組數據作為預測模型的訓練樣本集,其中50組來自于2018年排土計劃工程位置,其余50組來自于2019年排土計劃工程位置;并選取剩余中的50組作為測試樣本集。設置WLS-SVM和MPSO模型初值如下:c0=3.5,σ0=0.5;種群規模N=30,最大迭代次數G=300,c1=2.5,c2=0.5,w=1。
3.1.1算法模型擬合精度評價
為驗證改進的參數優化算法對模型擬合精度和收斂性的優化效果,分別建立MPSO-WLS-SVM,PSO-WLS-SVM,WLS-SVM和MPSO-LS-SVM四組模型擬合訓練數據,受篇幅影響僅提供100組訓練集的部分數據見表2。為突出參數優化效果,對4組模型的絕對誤差進行統計,其統計結果如圖5所示。

表2 MPSO-WLS-SVM模型輸入輸出訓練數據集(部分)Table 2 Input and output training data set on MPSO-WLS-SVM
注:s-x-x第1位表示年份,第2位表示所處臺階,第3位表示塊體位置,s代表2017年,w代表2018年。
由圖5可知,100訓練樣本中MPSO-WLS-SVM模型(紅色曲線)擬合精度最高。較之MPSO-LS-SVM模型,引進的動態權值能有效的控制離群誤差規模,提高了預測模型精度。而較之PSO-WLS-SVM、WLS-SVM模型,基于MPSO模型的核參數優化具有更高的擬合精度和收斂速度。
對于實際物料流規劃問題,其絕對誤差小于錯估計指標即認為對規劃問題能耗沒有本質上的影響。因此,為進一步驗證MPSO-WLS-SVM模型預測算法穩健性采用測試集數據設計了5組重復試驗,并統計錯估計系數如圖6所示。對比圖中結果,當樣本規模較小時,預測錯估率較高,且隨樣本規模增大誤差趨于穩定。自樣本規模N>90開始算法模型擬合精度隨樣本規模趨于平穩,最終錯估系數穩定在0.8%~1.2%,算法具有良好的穩健性。

圖5 訓練集絕對誤差對比Fig.5 Training set absolute error comparison diagram
3.1.2測試集運距預測效果評價
將50組測試集數據代入優化調參后的預測模型中,其運距預測仿真對比數據見表3(受篇幅限制僅提供部分數據),詳細的預測數據輸出結果如圖7所示,其中左側主軸為預測結果與真值對比,右側次軸為預測模型絕對誤差統計。

圖6 5組重復試驗錯估系數統計Fig.6 Miscalculation coefficient of line chart on Repeat 5 times

表3 仿真測試數據模型輸入輸出層參數樣本(部分)Table 3 Simulation model input and output layer parameter test data samples(the part)

圖7 MPSO-WLS-SVM測試集仿真預測結果Fig.7 Test set simulation results to MPSO-WLS-SVM
由圖7中測試集預測結果與真值對比可知,算法仿真測試具有較好的擬合精度,50組預測估計中僅第5組測試數據絕對誤差大于20 m,存在錯估現象,其余擬合精度均控制在錯估計誤差以下,且誤差限變化平穩,收斂速度較快,具有較強的泛化能力,其預測效果能滿足運距預測建模需求。
3.1.3算法預測效果對比評價
為進一步驗證MPSO-WLS-SVM模型在運距預測方面的優勢,本文從參數優化對算法執行效率的改善以及同類算法預測效果對比等2個方面對算法的實際應用效果進行綜合評價。其中針對算法執行效率的評價設計了4組不同樣本規模的仿真實驗,即M1模型—普通正態權重的WLS-SVM模型、M2模型—改進權重WLS-SVM模型、M3模型—PSO改進M2模型(PSO算法采用經典模型中的固定參數c1=2.5,c2=0.5,w=1.3)以及M4模型—MPSO改進M2模型,統計各組模型在不同樣本規模下多次重復實驗的平均收斂時間如圖8所示。

圖8 參數優化后執行效率對比Fig.8 Performance comparison after parameter optimization
對比圖8中M1和M2模型可發現,文中引入的自適應權重修正策略,能在一定程度上提高算法執行效率,但并不明顯,隨著樣本規模逐漸變大,收斂時間呈指數增長;當引入群智能算法后,能大幅度提高算法的收斂效率,且圖8中隨迭代進行,后期效率能得到成倍提升;通過對比M3與M4模型收斂效率,可以看出在不同時期調節慣性因子和學習因子對于提高種群多樣性的確有促進作用,能有效提高算法的執行效率。
另一方面,為體現文中算法在處理此類問題中的優越性,文中分別選取BP模型、SVR模型、GA-BP模型以及GA-ELM模型進行算法對比,并統計絕對誤差以及整體預測效果見表3。
由表4中5組評價因子對比可知,兩組GA模型執行效率分別為1.41 s和1.24 s,執行效率明顯優于文中模型;MPSO-WLS-SVM模型精度評價指標分別為:均方誤差為 0.008 8;相關系數為 0.99;平均相對誤差為 0.047%;平均絕對誤差期望為0.84,對比其他模型具有更高的擬合精度和預測效果。對比表4中預測效果,MPSO-WLS-SVM模型預測效果均優于其他4組對比模型,(a),(c)兩組次之。(a)~(d) 4組預測模型誤差波動較大,其主要原因在于受離群數據的影響較為嚴重,4組算法均無法有效的過濾離群數據提高擬合精度,(c),(d)模型中應用的遺傳算法優化反而增加了離群誤差的波動,造成預測結果進一步惡化。鑒于此,文中方法具有更強的離群誤差處理和學習能力,預測效果更好。

表4 不同算法模型預測效果測試樣本結果比較Table 4 Comparison of different model effects
外排土場時變運距預測模型擬解決的本質問題即為提高堆置次序優化模型中運輸功能耗表達的精度。因此,為進一步說明運距預測算法對于改善能耗模型的有效性,研究以黑山露天礦2018—2019年期間南部卡車排土場六組排土條帶為研究對象,并逐條帶建立物料塊體的運輸聯系,最終以上述六組條帶內塊體計算出的總運輸功為精度評價標準,對比分析采用階段內分水平、分區段運距幾何量測方法以及文中算法所建立的物料流能耗模型,對比結果如圖9所示。由圖9可知,采用文中算法建立的運輸功能耗模型更接近逐條帶運輸系統設計方案,較之基于階段間分水平、分區段的年度物料量運輸推估方法,總運輸功計算精度更高。

圖9 運輸功能耗對比Fig.9 Comparison diagram of transport work
(1)在采用加權最小二乘模型建立多元非線性運距預測模型的基礎上,論證了預測模型對于推估外排土場物料塊體運距的現實有效性,并進一步通過引進加權最小二乘模型權向量修正、核參數動態調參等優化手段,改善了運距模型自身的穩健性,有效的提高了運距預測準確率。
(2)通過不同參數優化策略的對比實驗分析,驗證了文中提出的權向量動態修正算法、基于改進粒子群算法的核參數優化方法,對于改進算法自身缺陷具有顯著效果。
(3)對比其他智能優化算法,驗證了文中算法模型預測精度更高,受訓練樣本規模干擾小,且當N>90時,錯估計系數期望值即可穩定在0.8%~1.2%,具有良好的穩健性,可為建立精準的運輸功能耗模型提供有力的基礎數據支撐。
(4)預測算法為保證多種優化手段間達到全局最優效果,通過適應值函數建立了權向量修正與徑向基核函數調參的動態聯系,此法有效的提高了模型精度,但其迭代過程時間成本較高,訓練周期長,連續的多階段預測效率相對較低。因此,筆者下一步將引入一定的啟發式策略改進算法,加快迭代過程。