張童康,師 蕓,童 鋒,劉麗霞,閆倩倩
(1.中國煤炭地質(zhì)總局航測遙感局,陜西 西安 710199;2.西安科技大學(xué)測繪科學(xué)與技術(shù)學(xué)院,陜西 西安 710054;3.自然資源部煤炭資源勘查與綜合利用重點實驗室,陜西 西安 710021)
長期以來,由于煤礦開采造成的地表塌陷、地裂縫等災(zāi)害,是煤礦采后環(huán)境治理急需解決的問題。地下煤層開采會破壞周圍覆巖的應(yīng)力平衡,使巖層產(chǎn)生滑移,引起地表變形,隨著工作面的推進巖層的變形情況越發(fā)嚴(yán)重[1]。為了更好地保護地表建筑物和基礎(chǔ)設(shè)施,有必要對開采造成的地表移動進行預(yù)計和保護。目前,概率積分法是應(yīng)用最廣泛的開采沉陷預(yù)計方法[2-4],其預(yù)計結(jié)果的好壞主要由預(yù)計參數(shù)的準(zhǔn)確性決定[5-7]。由于概率積分法預(yù)計參數(shù)受到復(fù)雜的地質(zhì)因素和采礦條件的影響,用簡單的數(shù)學(xué)方法難以表達[8],通過建立地表移動觀測站進行實測求參數(shù)也容易受到多種條件的限制,難以滿足礦區(qū)安全生產(chǎn)的要求。 隨著計算機技術(shù)的發(fā)展,各種機器學(xué)習(xí)法被人們熟知并應(yīng)用,主要以神經(jīng)網(wǎng)絡(luò)模型[9]、支持向量機[10]為代表,已有大量實驗證明,利用機器學(xué)習(xí)方法求取概率積分法參數(shù),具有精度高、易操作、實效性強等優(yōu)勢[11-13]。 目前,較為常用的機器學(xué)習(xí)參數(shù)預(yù)測法為BP(back propagation)神經(jīng)網(wǎng)絡(luò)算法,但BP神經(jīng)網(wǎng)絡(luò)易受到初始權(quán)值和閾值的不穩(wěn)定性影響,預(yù)測結(jié)果不夠精確,很多學(xué)者通過遺傳算法[14-15]、粒子群算法[16]對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進行優(yōu)化,這些方法可以在一定程度上提高BP神經(jīng)網(wǎng)絡(luò)的預(yù)測精度,但仍然無法避免BP算法自身的缺陷。 灰狼優(yōu)化算法[17](grey wolf optimization,GWO)是一種種群智能優(yōu)化算法,主要有操作簡單、參數(shù)少、易實現(xiàn)的特點,但由于狼群在尋優(yōu)的過程中受到收斂因子和搜索方式的影響,導(dǎo)致灰狼優(yōu)化算法的收斂速度慢,且容易陷入局部最優(yōu)。因此,本文提出了一種改進的灰狼優(yōu)化算法,該算法主要對收斂因子a和對灰狼位置更新方式進行了改進,并利用改進后的灰狼優(yōu)化算法對BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值和閾值進行優(yōu)化,構(gòu)建改進的GWO-BP預(yù)測模型,對概率積分法的預(yù)計參數(shù)進行預(yù)測。為了驗證所提出算法的精度,將該算法的參數(shù)預(yù)測結(jié)果與支持向量機回歸算法(support vector regression,SVR)的預(yù)測結(jié)果以及偏最小二乘[18](partial least-square,PLS)算法的預(yù)測精度進行對比驗證和結(jié)果分析。
GWO優(yōu)化算法[19]是根據(jù)狼群搜索捕獵活動所得到的一種種群智能優(yōu)化算法。狼群存在著嚴(yán)格的等級分配關(guān)系,一般將適應(yīng)度值最高的三個灰狼個體作為α狼、β狼和δ狼[20],在進行狩獵時主要由這3只狼負責(zé),狩獵行為公式見式(1)和式(2)。

(1)
C=2r1
(2)

位置更新公式見式(3)~式(5)。

(3)
A=2ar2-a
(4)
a=2-2×t/T
(5)
式中:r2為均勻隨機數(shù);A為系數(shù)向量;a為從2到0線性遞減的收斂因子;t為當(dāng)前迭代次數(shù);T為最大迭代次數(shù)。
尋優(yōu)具體步驟見式(6)~式(12)。

(6)

(7)

(8)

(9)

(10)

(11)

(12)
式中,Dα、Dβ、Dδ分別為狼群個體的位置到α、β和δ狼所在位置的距離。
由于GWO優(yōu)化算法在尋優(yōu)過程中往往存在著收斂速度較慢且易陷入局部最優(yōu)的缺點,造成這些缺點的主要原因有:①收斂因子a是線性遞減的,不能滿足算法的開發(fā)能力;②根據(jù)適應(yīng)度值最優(yōu)的3個灰狼的平均位置得到最優(yōu)解時,更新策略不靈活,搜索不能滿足全局最優(yōu),在一些優(yōu)化算法中不能得到最優(yōu)解。
針對這些問題,本文對灰狼優(yōu)化算法進行了改進,改進策略及分析如下所述。
1) 收斂因子a的改進。從式(9)~式(11)可以看出,灰狼算法的搜索方式主要是由系數(shù)向量A所決定的。從式(4)可以看出,A的取值主要取決于收斂因子a的大小,在傳統(tǒng)的灰狼算法中,a值是隨著迭代次數(shù)的增加從2線性遞減到0,但是真正的灰狼在搜索過程中是一個非線性的變化過程,傳統(tǒng)的收斂因子計算方式存在一定缺陷,基于此,本文提出了一種非線性的收斂因子計算公式,見式(13)。

(13)
為了進一步對比本文提出的收斂因子公式和傳統(tǒng)灰狼算法收斂因子公式的差異,繪制了收斂因子隨迭代次數(shù)增加的變化圖,如圖1所示。原始的灰狼算法采用的是線性收斂方式,收斂因子在前期和后期的變化率一致,因此不能滿足搜索過程要求先慢后快的變化方式。而改進后的a曲線在前期的收斂速度較慢,可以滿足全局搜索的要求,在迭代后期收斂速度明顯加快,可以滿足局部精確搜索的要求。因此本文提出的收斂因子a的改進方法更適用于狼群在尋優(yōu)中的搜索過程。

圖1 收斂曲線對比圖Fig.1 Contrast graph of convergence curve
2) 位置更新方法的改進。粒子群算法具有良好的全局尋優(yōu)能力,將速度矢量考慮到粒子的更新過程中,可以得到最優(yōu)的位置信息。本文結(jié)合PSO算法中位置的更新公式[21]對灰狼的位置進行更新,具體公式見式(14)。

(14)
式中:t為迭代次數(shù);Xi和Vi分別為第i個灰狼的位置和速度矢量。
Vi可用式(15)計算得到。

(15)


(16)

BP神經(jīng)網(wǎng)絡(luò)是一種信號前向傳遞、誤差反向傳遞的神經(jīng)網(wǎng)絡(luò)模型。模型能夠在非線性映射上取得很好的效果,并且還具備良好的自學(xué)習(xí)和自適應(yīng)能力[22]。圖3為BP神經(jīng)網(wǎng)絡(luò)的圖形結(jié)構(gòu),主要由數(shù)據(jù)層、隱含層和輸出層3層前饋網(wǎng)組成。

圖2 收斂速度對比圖Fig.2 Contrast graph of convergence speed

圖3 BP神經(jīng)三層網(wǎng)絡(luò)模型Fig.3 Back-propagation network three-layernetwork mode
網(wǎng)絡(luò)選用S型傳遞函數(shù)見式(17)。

(17)
通過整體擬合目標(biāo)誤差函數(shù),見式(18)。

(18)

BP神經(jīng)網(wǎng)絡(luò)主要通過有監(jiān)督學(xué)習(xí)的方式訓(xùn)練網(wǎng)絡(luò)模型,當(dāng)一對學(xué)習(xí)命令輸入到網(wǎng)絡(luò)后,可以將數(shù)據(jù)層的神經(jīng)元激活,然后向各隱含層傳播,最后經(jīng)過輸出層輸出對應(yīng)于輸入模式的網(wǎng)絡(luò)映射。 為了使期望的輸出結(jié)果和實際輸出結(jié)果的誤差最小,在訓(xùn)練的過程中從輸出層反向傳播到數(shù)據(jù)層時不斷對權(quán)值進行改正,這種誤差修正主要依據(jù)誤差反向傳播算法。
概率積分法的預(yù)計參數(shù)主要有5個,分別為下沉系數(shù)q、水平移動系數(shù)b、主要影響正切角tanU、拐點偏移距s/H和開采傳播角θ。這些參數(shù)都受到了復(fù)雜地質(zhì)采礦條件的影響,主要的影響因素有覆巖巖性、松散層厚度、煤層采厚和采深等因素。文獻[23]給出了全國208個典型工作面的地質(zhì)采礦實測數(shù)據(jù),本文選取了其中40個工作面的實測數(shù)據(jù)作為訓(xùn)練樣本和測試樣本,其中,訓(xùn)練集為1~35號樣本數(shù)據(jù),測試集為36~40號樣本數(shù)據(jù),用于驗證模型訓(xùn)練結(jié)果的精度。根據(jù)可定量原則,選取6種地質(zhì)采礦因素作為輸入層,分別為覆巖平均堅固系數(shù)f、采厚M、采深H、松散層厚度W、煤層傾角∝和采動程度n,具體數(shù)據(jù)見表1。
本文將采用多輸入層對應(yīng)單一輸出層,以6個地質(zhì)采礦因子作為輸入層,分別對應(yīng)五個單一的概率積分法參數(shù),建立五個獨立的網(wǎng)絡(luò)模型結(jié)構(gòu),每個網(wǎng)絡(luò)模型結(jié)構(gòu)中有6個輸入節(jié)點和1個輸出節(jié)點,隱含層神經(jīng)元個數(shù)一般通過多次訓(xùn)練和結(jié)果對比得到。本文選取的各個模型隱含層神經(jīng)元節(jié)點數(shù)分別為:下沉系數(shù)15個、水平移動系數(shù)13個、主要影響角正切21個、拐點偏移距19個、開采影響傳播角7個。

表1 學(xué)習(xí)訓(xùn)練和測試樣本Table 1 Training and testing samples

續(xù)表1
改進的GWO-BP算法流程圖見圖4,具體實施步驟如下所述。

圖4 改進的GWO-BP算法流程圖Fig.4 Improved GWO-BP algorithm flow chart
1) 輸入數(shù)據(jù),劃分訓(xùn)練集和測試集。并對數(shù)據(jù)進行歸一化處理,見式(19)。

(19)
式中:x為輸入數(shù)據(jù);y為歸一化后數(shù)據(jù)。
2) 確定灰狼的種群規(guī)模為20頭狼、最大迭代次數(shù)為100次和參數(shù)取值上下界(ub,lb)。
3) 確定神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),對狼群進行隨機初始化,初始化公式見式(20)。
Xi=r0(ub-lb)+lb
(20)
式中:Xi為初始種群;r0為[0,1]間的隨機數(shù)。
4) 計算灰狼個體的適應(yīng)度值,并將最優(yōu)的3個適應(yīng)度值的灰狼的位置記為Xα、Xβ和Xδ。
5) 根據(jù)式(2)、式(4)、式(13)更新參數(shù)C、A、a,根據(jù)更新的參數(shù)和式(14)和式(15)對灰狼的位置進行更新,根據(jù)式(16)得到獵物的最終位置。
6) 判斷是否達到最大迭代次數(shù),若達到則輸出最優(yōu)的權(quán)值和閾值,否則返回步驟4)繼續(xù)迭代。
7) 設(shè)置BP神經(jīng)網(wǎng)絡(luò)的最大迭代次數(shù)為500次、學(xué)習(xí)率為0.1和目標(biāo)誤差為5~10,將步驟6)得到的最優(yōu)權(quán)值和閾值作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進行訓(xùn)練和預(yù)測。
8) 輸出概率積分法預(yù)計參數(shù)。
9) 利用平均絕對百分比誤差(MAPE)作為評價計算結(jié)果的指標(biāo)。利用Willmott的一致性指數(shù)(WIA)對模型的泛化性能進行評價。MAPE是相對誤差的一個指標(biāo),WIA在0~1之間變化,WIA值是各種回歸模型誤差程度的標(biāo)準(zhǔn)化度量,其定義見式(21)和式(22)。

(21)

(22)

本文提出的改進GWO-BP算法擁有良好的全局尋優(yōu)能力可以使模型采用最優(yōu)的初始權(quán)值和閾值進行訓(xùn)練和預(yù)測,從而使模型更快收斂,預(yù)測精度更高。為了驗證IGWO-BP算法對概率積分法參數(shù)預(yù)測的準(zhǔn)確性,將其與支持向量機回歸法的預(yù)測結(jié)果以及偏最小二乘法采用RBF核函數(shù)進行訓(xùn)練,采用交叉驗證進行參數(shù)尋優(yōu)。結(jié)果見表2~表4。
將3種方法的預(yù)測值分別與地表移動觀測實測值的計算結(jié)果進行對比,分析其平均絕對百分比誤差和一致性指數(shù),見表5。
由表5可知,分別用最大相對誤差、平均絕對百分比誤和一致性指數(shù)作為評價指標(biāo)對3種預(yù)測方法的預(yù)測精度進行分析。從結(jié)果可以看出,IGWO-BP的最大相對誤差和平均絕對百分比誤差整體都小于PLS算法和SVR算法的預(yù)測精度。從一致性指數(shù)來分析,一致性指數(shù)接近于1代表預(yù)測模型的泛化性能越好,從表5中可以看出,IGWO-BP模型的一致性指數(shù)最高,其次是SVR模型,PLS模型的一致性指數(shù)最低, 這與其模型的尺度單一有關(guān)[19], 說明IGWO-BP模型的泛化性能要優(yōu)于SVR模型和PLS模型。為了能更清晰地對比3種預(yù)測模型的精度,特用3種模型的預(yù)測結(jié)果對實測結(jié)果進行擬合,擬合結(jié)果如圖5所示。

表2 PLS預(yù)測結(jié)果分析Table 2 Analysis of prediction results of PLS

表3 SVR預(yù)測結(jié)果分析Table 3 Analysis of prediction results of SVR

表4 IGWO-BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果分析Table 4 Analysis of prediction results of improvedGWO-BP neural network

表5 三種預(yù)測算法精度對比分析Table 5 Comparison and analysis of the accuracy ofthree prediction algorithms

圖5 三種預(yù)測方法與實測值擬合對比圖Fig.5 Comparison between three prediction methods and actual measured values
從圖5的擬合效果來看,IGWO-BP模型的整體擬合效果最好,進一步說明利用改進后GWO-BP模型預(yù)測結(jié)果明顯優(yōu)于一致性指數(shù)模型預(yù)測結(jié)果和PLS模型預(yù)測結(jié)果,可以在求取概率積分法預(yù)計參數(shù)的實際工程中得以應(yīng)用。
針對概率積分法預(yù)計參數(shù)難以求取的現(xiàn)狀,本文提出了一種改進的灰狼優(yōu)化算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,從而對概率積分法預(yù)計參數(shù)進行求取的方法,并得到了以下結(jié)論。
1) 通過對灰狼優(yōu)化算法的收斂因子a的改進,發(fā)現(xiàn)在收斂性能上,本文提出的收斂因子計算方法更符合算法的局部開發(fā)和全局搜索能力。
2) 通過對灰狼位置更新方式的改進,使得狼群在尋優(yōu)的過程中可以保持頭狼的全局最優(yōu)位置,從而更好帶領(lǐng)群狼搜索到獵物,收斂速度更快。
3) 對PLS模型、SVR模型和IGWO-BP模型的預(yù)測結(jié)果進行對比分析發(fā)現(xiàn),IGWO-BP模型的預(yù)測結(jié)果精度最高,其次是SVR模型,PLS模型的預(yù)測精度最差。
4) 本文提出的IGWO-BP預(yù)測算法在回歸和預(yù)測上都有較好的性能,該算法所得到的預(yù)測結(jié)果與實測結(jié)果的誤差較小,符合工程要求,也能為缺少地表實測數(shù)據(jù)的礦區(qū)提供新的概率積分法預(yù)計參數(shù)求取方法,對該類礦區(qū)的開采沉陷預(yù)計以及防災(zāi)減災(zāi)工作都有重要的指導(dǎo)意義。