耿元玲,黃德鏞,杜志錦,楊 洋,郭 琦
(昆明理工大學(xué) 國土資源工程學(xué)院,昆明 650093)
對(duì)于地下巖石工程,圍巖的穩(wěn)定非常重要,甚至是地下巖石工程好壞的決定性因素。圍巖穩(wěn)定性評(píng)價(jià)是地下工程設(shè)計(jì)、施工以及維護(hù)中的重要環(huán)節(jié),評(píng)價(jià)結(jié)果直接影響著工程的安全性和經(jīng)濟(jì)合理性,所以圍巖穩(wěn)定性評(píng)價(jià)是一項(xiàng)值得研究的課題。針對(duì)圍巖穩(wěn)定性的研究有很多分類方法,XIE等[1]提出了一種基于QGA(支持遺傳算法)-SVM的巖石分類方法,建立了基于QGA-SVM的巖石分類模型,該模型提高了支持向量機(jī)在巖石分類中的分類精度。ZHANG等[2]使用數(shù)值模擬方法,對(duì)七個(gè)不同傾斜度的節(jié)理走向圍巖進(jìn)行分析。李如杰等[3]提出了EW-UCA模型,對(duì)四條煤巷圍巖穩(wěn)定性進(jìn)行了分析研究。趙婷等[4]選取影響圍巖穩(wěn)定性的因素,將其輸入到支持向量機(jī)模型中,對(duì)圍巖進(jìn)行分類。李杰等[5]使用強(qiáng)度折減法對(duì)圍巖穩(wěn)定性進(jìn)行理論研究,可以得到不同圍巖條件下的安全狀況。圍巖穩(wěn)定性評(píng)價(jià)方法還有PCA-PNN模型[6]、模糊綜合評(píng)價(jià)[7]、加速度方法[8]和SαS-PNN模型[9]等。影響圍巖穩(wěn)定性的指標(biāo)很多,在一定程度上各指標(biāo)之間有信息重疊的問題,因此先利用因子分析(Factor Analysis,F(xiàn)A)[10-11]去除指標(biāo)之間的相關(guān)性,得到能夠代表原始變量的公共因子;再使用鄰近算法(K-Nearest Neighbor,KNN)[12-13]對(duì)圍巖公共因子進(jìn)行評(píng)價(jià)。相對(duì)于傳統(tǒng)評(píng)價(jià)方法,因子分析-鄰近算法模型思路結(jié)構(gòu)簡單,易于實(shí)現(xiàn),對(duì)有代表性的樣本處理,在分類的問題上可以得到比較理想的結(jié)果。
因子分析是多元統(tǒng)計(jì)分析中常用的一種降維、簡化數(shù)據(jù)的技術(shù),是從數(shù)據(jù)中提取對(duì)原始變量起解釋作用的少數(shù)公共因子和僅對(duì)某一個(gè)變量有作用的特殊因子線性組合而成。
設(shè)p維總體x1=(x1,x2,…,xp)′的均值為μ=(μ1,μ2,…,μp)′,協(xié)方差矩陣為∑=(σij)p×p,相關(guān)系數(shù)矩陣為R=(ρij)p×p,因子分析的一般模型為:
(1)
式中,f1,f2,…,fm為m個(gè)公共因子,εi是變量xi(i=1,2,…,p)所獨(dú)有的特殊因子,兩者皆為不可觀測的隱變量,aij(i=1,2,…,p;j=1,2,…,m)為變量xi在公共因子fi上的載荷,反映公共因子對(duì)變量的重要程度。因子分析的求解因子載荷矩陣的方法是主成分法。


因子分析的主要目的是對(duì)公共因子給出符合實(shí)際意義的合理的解釋。因子分析中因子載荷矩陣某一列各元素的絕對(duì)值越大,公共因子就更易解釋,故需要對(duì)因子和因子載荷矩陣進(jìn)行旋轉(zhuǎn),本文中因子旋轉(zhuǎn)的方法是最大方差旋轉(zhuǎn)法。
鄰近算法主要是通過周圍有限相鄰樣本的不同特征值之間的距離進(jìn)行分類。其分類原理:對(duì)于一個(gè)需要預(yù)測的輸入向量x,只需要在訓(xùn)練數(shù)據(jù)集中尋找k個(gè)與向量x最近的向量的集合,然后把x的類別預(yù)測為這k個(gè)樣本中類別數(shù)最多的那一類。

因子分析-鄰近算法模型對(duì)圍巖穩(wěn)定性評(píng)價(jià)的主要步驟:1)將原始變量輸入因子分析模型中,可以得到公共因子的得分;2)將公共因子的得分矩陣輸入到鄰近算法中,建立圍巖穩(wěn)定性評(píng)價(jià)的KNN模型;3)利用鄰近算法對(duì)未知的圍巖穩(wěn)定性類別的樣本進(jìn)行判斷;4)得到圍巖穩(wěn)定性的評(píng)價(jià)結(jié)果。
本文使用因子分析-鄰近算法模型對(duì)圍巖穩(wěn)定性評(píng)價(jià),選取文獻(xiàn)[14]提供的數(shù)據(jù),如表1所示。本文選取20個(gè)樣本進(jìn)行模型評(píng)價(jià),10個(gè)待測樣本進(jìn)行檢測。圍巖穩(wěn)定性的影響指標(biāo)有圍巖強(qiáng)度X1,巷道跨度X2,直接頂與煤層厚度之比X3,巷道埋深X4,節(jié)理發(fā)育程度X5,松動(dòng)圈尺度X6,圍巖分類Ⅰ為極穩(wěn)定、Ⅱ?yàn)榉€(wěn)定、Ⅲ為中等穩(wěn)定、Ⅳ為不穩(wěn)定、Ⅴ為極不穩(wěn)定類。

表1 圍巖穩(wěn)定性的學(xué)習(xí)樣本
因子分析是通過SPSS 19.0分析軟件進(jìn)行的,公共因子個(gè)數(shù)的選擇依據(jù):公共因子的累計(jì)貢獻(xiàn)率達(dá)到80%。其特征值及貢獻(xiàn)率見表2,經(jīng)過主成分法對(duì)載荷矩陣進(jìn)行估計(jì)并且使用最大方差法旋轉(zhuǎn)坐標(biāo)軸,前3個(gè)主因子的累計(jì)貢獻(xiàn)率為83.704%,意味著前3個(gè)主因子包含原有信息的83.704%,符合選取公共因子個(gè)數(shù)的要求。

表2 特征值及其貢獻(xiàn)率
因子分析的旋轉(zhuǎn)后因子載荷矩陣見表3,可以從旋轉(zhuǎn)后因子載荷矩陣得到原始變量與公共因子之間的相關(guān)程度。節(jié)理發(fā)育程度X5、松動(dòng)圈尺度X6在第1個(gè)公共因子F1上載荷比較大,說明第1個(gè)公共因子反映的是圍巖受工程擾動(dòng)程度,巷道跨度X2、巷道埋深X4在第2個(gè)公共因子F2上載荷比較大,說明第2個(gè)公共因子反映的是工程的特征,圍巖強(qiáng)度X1在第三公共因子F3上載荷比較大,說明第3個(gè)公共因子反映的是圍巖強(qiáng)度。
因子得分系數(shù)矩陣見表4。

表4 因子得分系數(shù)矩陣
由表4因子得分系數(shù)矩陣可得出公共因子的得分函數(shù)表達(dá)式:
F1=0.200X1+0.059X2-0.461X3-0.333X4+
0.398X5+0.395X6
(2)
F2=-0.041X1+0.400X2+0.252X3+
0.877X4-0.097X5-0.084X6
(3)
F3=1.055X1+0.076X2-0.138X3-0.082X4+
0.026X5+0.062X6
(4)
將數(shù)據(jù)帶入式(2)~(4)中對(duì)主因子得分進(jìn)行計(jì)算,其計(jì)算結(jié)果見表5,第1個(gè)公共因子F1與第2個(gè)公共因子F2的得分散點(diǎn)圖見圖1。由圖1可知,在第一象限內(nèi)(右上角處),F(xiàn)1與F2值越大,圍巖受工程擾動(dòng)程度和工程特征的取值就越大,第一象限內(nèi)10個(gè)樣本(4、12、13、16、17、22、23、26、27、28)相對(duì)應(yīng)的圍巖等級(jí)比較高。對(duì)于第1個(gè)公共因子F1與第3個(gè)公共因子F3、第2個(gè)公共因子F2與第3個(gè)公共因子F3之間的比較,由于篇幅過大,故不再具體分析。

表5 公共因子得分?jǐn)?shù)據(jù)

圖1 公共因子F1和F2得分散點(diǎn)圖Fig.1 The scatter plot of common factors F1 and F2
鄰近算法對(duì)因子分析得到的主因子得分?jǐn)?shù)據(jù)進(jìn)行評(píng)價(jià),鄰近算法的輸入值是3個(gè)主因子得分矩陣,在30組樣本中取后10組為測試樣本,用于驗(yàn)證本模型的有效性。鄰近算法的輸出值是Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ,分別表示圍巖極穩(wěn)定、穩(wěn)定、中等穩(wěn)定、不穩(wěn)定、極不穩(wěn)定。經(jīng)過交叉驗(yàn)證,鄰近算法的k值取2;點(diǎn)之間的距離是歐氏距離(Euclidean Distance);測試樣本的分類規(guī)則是最近鄰分類(Nearest)。鄰近算法判別過程的數(shù)據(jù)見表6。

表6 鄰近算法的判別數(shù)據(jù)
對(duì)23號(hào)測試樣本分類過程中,2個(gè)鄰近訓(xùn)練樣本類別不同,KNN的分類規(guī)則是最近鄰分類,23號(hào)測試樣本與13號(hào)訓(xùn)練樣本的距離比與7號(hào)訓(xùn)練樣本距離更小,即0.900 6<1.869 5,故23號(hào)樣本類別與13號(hào)樣本類別一致,屬于Ⅳ類。28號(hào)測試樣本與4號(hào)訓(xùn)練樣本的距離比與16號(hào)訓(xùn)練樣本的距離更小,即0.415 6<0.699 3,故28號(hào)樣本類別與4號(hào)樣本類別一致,屬于V類。
影響圍巖的各個(gè)指標(biāo)經(jīng)過因子分析處理后,將結(jié)果輸入鄰近算法可以得到圍巖類別。圍巖分類評(píng)價(jià)結(jié)果見圖2,21~30號(hào)測試樣本類別與實(shí)際情況吻合,準(zhǔn)確率為100%;其它模型評(píng)價(jià)結(jié)果見表7及圖3,KNN模型的評(píng)價(jià)結(jié)果中有5個(gè)誤判樣本,分別為21、22、26、27和29號(hào),準(zhǔn)確率為50%;BP神經(jīng)網(wǎng)絡(luò)和PCA-RF模型測試數(shù)據(jù)取自文獻(xiàn)[15],BP神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)結(jié)果中有3個(gè)誤判樣本,分別為23、26和29號(hào),準(zhǔn)確率為70%,誤判率為28.1%;PCA-RF模型的評(píng)價(jià)結(jié)果中有1個(gè)誤判樣本,即29號(hào)樣本,其準(zhǔn)確率為90%。

圖2 FA-KNN模型對(duì)圍巖穩(wěn)定性的評(píng)價(jià)類別Fig.2 FA-KNN model for evaluation categories of surrounding rock stability

圖3 不同評(píng)價(jià)方法的預(yù)測準(zhǔn)確率Fig.3 Forecast accuracy of different evaluation methods

表7 不同評(píng)價(jià)方法對(duì)圍巖穩(wěn)定性的評(píng)價(jià)結(jié)果
1)影響圍巖穩(wěn)定性的各個(gè)指標(biāo)經(jīng)過因子分析得到3個(gè)公共因子,包含原有數(shù)據(jù)83.704%的信息;公共因子去除了原有指標(biāo)之間信息重疊的問題,在一定程度上提高了鄰近算法評(píng)價(jià)的準(zhǔn)確度。
2)在驗(yàn)證因子分析-鄰近算法模型的有效性和合理性之外,還應(yīng)用其他評(píng)價(jià)方法對(duì)本文實(shí)例進(jìn)行運(yùn)算,F(xiàn)A-KNN、KNN、BP神經(jīng)網(wǎng)絡(luò)、PCA-RF的評(píng)價(jià)準(zhǔn)確率分別為100%、50%、70%、90%,說明在圍巖穩(wěn)定性判別中因子分析-鄰近算法模型具有高效、準(zhǔn)確的優(yōu)點(diǎn),對(duì)圍巖穩(wěn)定性的評(píng)價(jià)判別有一定的指導(dǎo)意義。