鄧智中,田浩帆,包太
(貴州大學 土木工程學院, 貴州 貴陽 550025)
近年來,隨著山區礦山開采程度的越來越大,形成的陡峭的礦山邊坡也越來越多。為降低礦山邊坡失穩破壞的風險,對邊坡穩定性的預測也顯示出其必要性和重要性[1-2]。在邊坡穩定性確定性分析方法中有定量分析法和定性分析法[3]。定量分析法包括有限單元法、極限平衡條分法等;定性分析法包括范例推理法和專家系統法等。非確定性分析方法中有灰色系統評價法、模糊綜合評價法等[4]。
由于礦山邊坡的穩定性受多重因素影響,且因素間有較強的相關性,因而對預測模型的要求更為苛刻。結合近年來興起的人工智能算法,國內外專家學者們針對邊坡的穩定性預測研究提出了許多較為實用的模型[5-10],并且取得了不錯的效果。如Gu Q等[11]利用PCA-GEP算法對邊坡穩定性預測分析,并取得了良好的結果。陳建宏[12-14]等基于PCA和BP神經網絡對不同類型的邊坡穩定性作了預測分析,所得的模型結果都比較理想。卜娜蕊等[15]采用差異演化算法(Differential Evolution,DE),提出了實數編碼的DE-BP神經網絡預測模型,并取得較高的預測精度。
綜合前人的研究,本文利用 PCA方法和遺傳算法對BP神經網絡進行優化,以國內外部分露天邊坡穩定性的實測數據為樣本,建立了一種基于PCA-GA-BP神經網絡的露天礦邊坡穩定性預測模型,為邊坡穩定性的預測提供了一種新思路。
PCA(Principal Component Analysis),即主成分分析方法[16],是一種使用最廣泛的樣本數據降維算法,在減少矩陣維數的同時盡可能地保留原矩陣的信息。
基本BP神經網絡[17-18]是一種多層前饋神經網絡,網絡是由輸入層、隱含層(可以有一層或多層)和輸出層組成基本拓撲結構。算法包括2個方面:信號的前向傳播和誤差的反向傳播。其作用是通過反復訓練一定數量的樣本,找出樣本間的隱含關系,從而達到對目標值進行期望輸出的目的。輸出結果的誤差若不滿足相應精度,則從輸出層反向傳播該誤差,從而在每層間進行權值和閾值的調整,如此反復迭代使得網絡的輸出和期望輸出間的誤差逐漸減小,直至滿足精度要求。
BP神經網絡由于其自身算法的局限性通常有許多弊端不易解決,如學習效率不高,且極易陷入局部最優,初始權閾值對預測結果影響很大等。這些問題都不利于正確預測模型的建立。同時,隱含層的層數和節點數也直接影響網絡模型的學習效果,學習過程中難以找到合適的層數和節點數。綜上,BP神經網絡的諸多局限性影響計算的精度和效率,筆者采用PCA方法和遺傳算法對其進行優化。
遺傳算法[19-20]通過模擬自然進化法則,以選擇、交叉和變異3種自然界的進化方法,建立起一種僅采用適應度函數就能自動搜索全局最優解的智能算法。采用遺傳算法可以克服BP神經網絡在固定區間隨機選取權值閾值造成的預測結果不穩定性,進而優化預測模型的精度。
PCA方法通過對高維數據進行降維處理,保留數據中最重要的一些特征,同時去除噪聲點和不重要的特征。使用PCA方法對BP神經網絡的輸入數據, 即露天礦邊坡的穩定性影響因素指標進行降維處理并提取主成分,使得數據集更易使用,也使得結果更容易理解,同時去除了噪聲點,成功減少了BP神經網絡的輸入節點數,提升了網絡模型的學習效率。
以文獻[2]中選取的國內外露天礦邊坡穩定性實測40組樣本為例。選取重度(kN·m-3)、黏聚力(MPa)、摩擦角(°)、邊坡角(°)、邊坡高度(m)、孔隙水壓力(MPa)這6個主要影響因素作為露天礦邊坡穩定性的評價指標。評價邊坡是否穩定,其表征指標為邊坡的安全系數(Fs)。Fs大于1.2即視為穩定狀態, 小于1.2即視為失穩狀態。將40組樣本數據經標準化和歸一化處理后,按照BP神經網絡訓練組和測試組8∶2的比例,從中隨機選出32組數據設為訓練組,其部分樣本見表1,其余的8組數據設為測試組見表 2。表中“1”表示邊坡穩定,“0”表示邊坡失穩。

表1 訓練組樣本

表2 測試組樣本
對表1和表2中的6個邊坡穩定性評價指標進行主成分分析,得到的相關系數矩陣見表 3。由表3可知,重度與坡高、坡度都有較強的相關性;黏聚力和重度、孔隙水壓也有較強的相關性;坡高和孔隙水壓也有較強的相關性[21]。主成分分析法也能避免這些有較強相關性的因素可能會帶來的多重共線性問題,從而優化后續的 GA-BP神經網絡模型,提升預測的精度和效率。
表4為對6個評價指標進行主成分分析得到的各主成分的特征值、特征向量和各成分的貢獻率。由表4可知,所有特征向量的標準差都小于19%,且前 4個主成分的累計貢獻率達到了 85.87%>85%,后面2個主成分的特征值較低,對邊坡穩定性的影響較小,因此取前4個主成分代替初始的露天礦邊坡穩定性的6個評價指標作為GA-BP神經網絡模型的輸入量。

表3 相關系數矩陣

表4 主成分特征值和貢獻率
表5為通過PCA方法得到的主成分因子載荷矩陣,模型提取的4個主成分是原始6個評價指標通過載荷矩陣重新線性組合的結果,式(1)為 4個主成分的表達式。

表5 因子載荷矩陣

式中,F1、F2、F3、F4分別為 1~4主成分;a1、a2、a3、a4、a5、a6分別代表重度、黏聚力、摩擦角、邊坡角、邊坡高度、孔隙水壓力這6個評價指標。
由主成分分析法對訓練樣本和測試樣本進行分析,將原始的6個評價指標降低至4個主成分F1、F2、F3、F4,并將其作為GA-BP神經網絡模型的輸入變量,既解決了評價指標間的多重共線性問題,又提高了BP神經網絡的預測效率。
本文采用 GA-BP神經網絡方法來構建露天礦邊坡穩定性預測模型,選擇 MATLABR軟件編寫GA算法優化BP神經網絡程序。GA算法的參數設置為:種群大小為 40,最大遺傳代數為 50,交叉概率為0.7,變異概率為0.01,概率為0.7,采用10位二進制編碼。通過反復的數值試驗得到,3層網絡拓撲結構(輸入、隱含、輸出各1層)可達到預測精度。通過主成分分析后,初始的露天礦邊坡穩定性的6個評價指標用4個主成分取代,即輸入層節點為 4;輸出變量為露天礦邊坡的安全系數,故輸出節點為 1;隱含層節點數的確定可采用經驗公式(式中,xi為輸入層節點數,yi為輸出層節點數,a為1~10之間的常數)確定。經過計算機模擬反復的測試,最終得出當隱含層節點數為4時,預測結果較為準確且平緩,故確定隱含層節點數為 4。綜上,最終選取的 BP神經網絡結構如圖 1所示,網絡的參數設置為:訓練次數為1000,訓練目標為0.001,學習速率為0.1。

圖1 BP神經網絡結構

圖2 模型MSE變化

圖3 模型擬合優度
將主成分分析得到的4個主成分F1、F2、F3、F4作為模型輸入變量,用 GA-BP神經網絡對訓練樣本進行反復訓練。由圖2可知,訓練樣本在經過1000次誤差反饋后模型的均方誤差(MSE)已經降低到0.0012左右。然后對測試樣本進行回歸仿真分析,由圖 3可見模型的擬合優度較高,達到了0.9911 6,結合后續的誤差分析可知并沒有出現過度擬合現象,因而預測精度滿足實際工程要求。
基于PCA-GA-BP神經網絡模型對表2中的8組測試數據進行預測,定義預測值與實際值絕對誤差的二范數為仿真誤差,模型的仿真誤差隨遺傳迭代的變化見圖4。由圖4可知,迭代終止時仿真誤差降到了0.2526,但誤差并未收斂,隨著遺傳的代數增加誤差還有較大可能減小。圖 5中將PCA-GA-BP神經網絡模型得到的結果與GA-BP神經網絡模型結果和傳統BP神經網絡模型結果進行對比,3種模型的誤差對比見表6。

圖4 模型仿真誤差

圖5 3種模型預測對比
結合圖5和表6可以得出,在露天礦邊坡穩定性的預測模型中,PCA-GA-BP神經網絡模型得到的結果最貼近邊坡實際安全系數,其次是 GA-BP神經網絡模型,最后是傳統BP神經網絡模型。其中,PCA-GA-BP模型的最大相對誤差為15.74%,仿真誤差為 25.26%;GA-BP模型的最大相對誤差為31.40%,仿真誤差為35.73%;而傳統BP模型的最大相對誤差為37.43%,仿真誤差為67.00%。對比3種模型,PCA-GA-BP模型在露天礦邊坡穩定性預測中的精度和效率都要優于 GA-BP模型和傳統BP模型。

表6 3種模型誤差對比
本文利用了PCA方法在40組樣本數據中對影響露天礦邊坡穩定性的6個評價指標處理分析,從中提取出4個主成分,并將其作為GA-BP神經網絡的輸入變量,進而建立起露天礦邊坡穩定性的PCA-GA-BP預測模型。通過模型預測結果和誤差分析得到以下結論。
(1)PCA方法可以較好地解決露天礦邊坡穩定性影響因素間的多重共線性問題,并減少了神經網絡的輸入變量,提高了網絡仿真效率。
(2)采取遺傳算法對BP神經網絡的權閾值處理優化,經反復迭代,得到較為合適的權值和閾值,大大提高了預測模型的精度。這為解決傳統BP網絡的諸多弊端提供了一種思路。
(3)基于PCA-GA-BP神經網絡的露天礦邊坡穩定性預測模型的結果顯示,在8組預測數據中邊坡狀態穩定的為4組,失穩的也為4組,與實測結果完全相符。所得的安全系數誤差也在工程允許范圍內,因而該模型在工程上具有一定的可行性和適用性。