謝靜峰 譚 飛 焦玉勇 鄒俊鵬 毛仲敏
(中國地質大學(武漢)工程學院, 武漢 430074, 中國)
在巖溶發育地區,巖溶孔隙、洞穴等提供土顆粒運移通道和(或)儲存空間,外部誘發因素直接或間接地產生的作用力將導致土體“黏粒團”坍塌、砂顆粒漏失或軟弱土流失,從而引起的地面沉降變形現象,即發生巖溶地面塌陷(羅小杰等, 2018)。經調查發現,我國可溶性碳酸鹽巖分布范圍十分廣泛,分布面積占國土面積1/3以上(蔣忠誠等, 2012),這為巖溶地面塌陷發育提供了必要的條件,加上人類工程活動的加劇,使我國成為存在嚴重巖溶地面塌陷問題的國家之一。我國絕大部分省市都存在巖溶地面塌陷災害,其中桂、黔、湘、川、滇、鄂等省份尤為發育(李海濤等, 2015)。例如, 2012年5月10日上午,廣西壯族自治區柳州市柳南區帽合村上木照屯發生巖溶地面塌陷災害,此次災害的受災面積約100畝,造成多棟房屋倒塌(圖1~圖2)。

圖1 5.10廣西柳州巖溶地面塌陷災害

圖2 受災現場
巖溶地面塌陷災害頻發,使各種工民建、水利水電、交通等基礎工程設施受到破壞,甚至威脅人類的生命安全,帶來了大量的財產損失及人員傷亡。另外,巖溶地面塌陷受各種地質因素、自然因素以及人類活動的影響,是多種因素共同作用的結果,具有突發性和隱蔽性的特點(黃強兵等, 2019),能否對其進行準確預測,將在塌陷防治中起著至關重要的作用。
巖溶地面塌陷的研究由來已久(張壽越等, 2018),各位專家學者們分別采用了理論分析(王飛等, 2017)、模型實驗(張少波等, 2019)以及數值模擬(肖堯等, 2019)的方法對其進行研究,獲得了較多研究成果。隨著對巖溶地面塌陷形成條件、影響因素、成因機理等認識的加深,各種巖溶地面塌陷預測定性模型被提出(曾玉瑩等, 2007; 高宗軍等, 2009; 王濱等, 2011; 羅小杰, 2015; 羅小杰等, 2017)。隨著統計學、運籌學、系統學以及計算機科學的發展,逐漸建立了巖溶地面塌陷的半定量、定量方法,如判別分析法(姜春露等, 2012)、層次分析法(王恒恒等, 2016; 蘇生瑞等, 2019)、模糊分析法(陳學軍等, 2017)、灰色系統理論法(蒙彥等, 2009; Ding et al.,2019)、BP神經網絡法(包惠明等, 2002)、熵權云模型(陳學軍等, 2019)等。這些方法都能在一定范圍內對巖溶地面塌陷預測獲得不錯的效果,但也存在一定的不足。例如層次分析法當指標過多時,數據統計量較大,各指標權重難以確定,且具有較強的主觀性; 模糊綜合評判法計算較復雜,對指標權重矢量的確定主觀性較強; 灰色系統理論法對歷史數據有很強的依賴性,沒有考慮各個指標之間的聯系,誤差偏大; BP神經網絡結構和參數的選擇復雜,同時算法收斂速度較慢。
本文綜合利用因子分析、遺傳算法(GA)和極限學習機(ELM)三者優勢,構建基于因子分析的GA-ELM巖溶地面塌陷預測模型。首先,對選取的8個巖溶地面塌陷影響因素進行因子分析,提取出5個公因子,達到數據簡化、降維的目的; 然后,將提取的5個公因子作為輸入參數,構建ELM巖溶地面塌陷預測模型; 由于ELM模型的權值矩陣和偏置矩陣的隨機性會對預測結果產生偏差,采用GA對ELM中的權值矩陣和偏置矩陣進行優化,構建GA-ELM巖溶地面塌陷預測模型; 最后,以實際案例進行訓練及測試,證明該方法在巖溶地面塌陷預測的有效性。
因子分析通過研究數據內部關系,對原始數據所包含的信息進行重新組合,以盡量少的公因子表征原始多變量數據的絕大部分信息,達到數據簡化、“降維”的效果。每個公因子都是由原有變量線性組合而成,其相關系數由各自因子得分所決定,能有效地避免人為賦值的主觀隨意性。
因子分析的數學模型表達如下(張堯庭等, 2013):
xi=ci+ai1fi1+ai2fi2+…+ailfil+ei
(1)
式中:xi為樣本原始數據標準化后的變量,滿足零均值、單位方差的條件;ci為常數;aij稱為因子荷載,是第i個變量與第j因子的相關系數,荷載越大則表示相關性越強;fi為不可觀測的隨機變量,表示出現在各個變量中的共同因子,即公因子;ei為殘差。
極限學習機是一種前饋神經網絡學習算法,具有單一隱含層(Huang et al.,2006)。其核心思想是隨機地選取輸入層權值矩陣和隱含層偏置矩陣,并在訓練過程中保持不變,僅需優化隱含層神經元節點數來提高學習預測能力。傳統的前饋神經網絡學習算法(如BP神經網絡),常因學習步長設置不當,導致算法收斂速度較慢,容易產生局部最小值,精度不夠,相比之下ELM模型具有實現簡單、學習速度極快、泛化能力極強和人為干預較少等顯著特點(徐睿等, 2019; Huang et al.,2011)。
Hβ=T
(2)
式中:
(3)


(4)
式中:H?表示隱含層輸出矩陣H的Moore-Penrose廣義逆。

表1 樣本原始數據
遺傳算法是模擬自然界生物進化過程中的基因交叉、組合、變異等過程(Holland, 1992),以適者生存、不適者淘汰的思想來實現對最優解的搜索,具有魯棒性優良、全局索引能力強等優點。鑒于權值矩陣和偏置矩陣對ELM模型的預測精度影響較大,本文用遺傳算法對權值矩陣和偏置矩陣進行優化,使其預測效果達到最佳。具體步驟如下:
(1)遺傳算法參數的確定:種群大小、染色體長度、交叉概率、變異概率等會對GA的性能產生很大的影響,例如種群大小將影響計算速率,染色體長度影響著最優解的精度,交叉概率影響著收斂速率,變異概率決定了GA的局部搜索能力。合理的參數組合是挖掘遺傳算法潛能的關鍵,可提高遺傳算法運行效率、克服“早熟”以及盡量減小模型參數分散性(金群等, 2006)。目前常用的最優參數范圍是種群大小為20~200,交叉概率為0.5~1.0,變異概率為0~0.05。
(2)初始種群的產生:在網絡結構確定之后,隨機產生輸入層權值矩陣和隱含層偏置矩陣,作為GA的初始種群。
(3)適應度函數的計算:將隨機產生的初始種群帶入樣本數據中,創建ELM網絡,然后進行仿真測試,計算得到預測正確率,并將預測正確率的倒數作為個體適應度函數。
(4)遺傳優化:以適應度函數最小為標準選擇最優解,然后對初始種群進行選擇、交叉、變異等操作來產生下一代種群,重復上一步驟,以此迭代直至精度達到要求或達到最大遺傳代數,最后得到最優的權值矩陣和偏置矩陣。
(5)ELM模型的確定:當網絡結構、權值矩陣和偏置矩陣都確定之后,ELM模型也就唯一確定。
基于因子分析的GA-ELM巖溶地面塌陷預測模型的分析流程如圖3所示。

圖3 預測模型流程圖
根據文獻(姜春露等, 2012),桂林市巖溶地面塌陷主要影響因素有8個,包括塑性指數X1、液性指數X2、天然孔隙比X3、黏聚力X4、內摩擦角X5、覆蓋層厚度X6、覆蓋層厚度減高水位埋深X7、覆蓋層厚度減低水位埋深X8,本文選取文獻(姜春露等, 2012)中20組數據作為訓練測試樣本(表1)。首先對原始數據進行KMO和Bartlett檢驗,若KMO值大于0.6,則滿足因子分析的前提條件; 若Bartlett檢驗對應顯著性P小于0.05,則說明適合進行因子分析。通過SPSS軟件計算得到原始數據KMO為0.682,P為0.000,故適合因子分析。
為了消除原始數據各變量之間不同量綱的影響,需要將數據進行標準化,使其滿足零均值、單位方差的條件。將原始數據導入SPSS,對數據標準化,進行因子分析,得到各變量相關系數矩陣(表2)、各公因子方差貢獻率(表3)以及表征協方差矩陣特征值隨公因子變化的碎石圖(圖4)。由圖4可知當公因子數從1~5時,特征值從3.458減小到0.341,當公因子數達到5之后,隨著公因子數增加,特征值減小趨于平緩,即公因子數為5時,為特征值變化拐點,表明5個公因子已經能夠反映初始變量絕大部分信息。同時,由表3可知,當公因子個數為5時,特征值累計方差貢獻率達92.498%,反映出初始變量的絕大部分信息。為了以盡量少的公因子描述原始變量的絕大部分信息,所以本文將公因子個數定為5,分別定義為Y1、Y2、Y3、Y4、Y5。

表2 各變量相關系數矩陣

表3 各因子的總方差貢獻

圖4 碎石圖

表4 公因子得分系數矩陣
將公因子個數設為5,利用SPSS軟件計算可得公因子得分系數矩陣(表4)。各公因子是各原始變量的線性組合,由公因子得分系數可計算每個公因子的因子得分,其因子得分函數見式(5)~式(9)。
由因子得分函數可求出20個樣本的因子得分情況(表5),使原本擁有8個變量的原始數據由5個公因子表征出來,以相對較小的數據維度表征了原始數據絕大部分信息,達到數據降維的效果。

表5 因子分析降維后數據
Y1=0.499X1+0.095X2+0.626X3-0.136X4+
0.010X5+0.065X6-0.001X7-0.056X8
(5)
Y2=0.049X1+0.425X2-0.118X3+0.108X4+
0.195X5-0.025X6+0.759X7+0.490X8
(6)
Y3=-0.089X1-0.750X2-0.185X3+0.488X4+
0.041X5-0.045X6-0.254X7+0.048X8
(7)
Y4=0.065X1-0.093X2-0.027X3-0.039X4+
1.004X5+0.022X6+0.213X7-0.075X8
(8)
Y5=-0.113X1-0.550X2+0.412X3-0.526X4
-0.049X5+1.164X6-0.336X7-0.453X8
(9)
將因子分析后的樣本中前12組數據作為訓練集,后8組數據作為測試集,利用ELM模型進行巖溶地面塌陷預測。
在ELM算法中,隱含層神經元節點數會影響模型學習和預測效率,節點數過少會導致“欠擬合”,過多則會產生“過擬合”,從而對預測精度有顯著影響,所以隱含層神經元節點數的確定十分重要。另外,輸入層權值矩陣和隱含層偏置矩陣隨機產生,故模型的單次預測結果具有一定的偶然性,較難反映真實預測精度。考慮上述兩方面原因,分別以因子分析后Y1~Y55組數據、原始數據X1~X88組數據、X1~X55組數據、X2~X65組數據、X3~X75組數據、X4~X85組數據為輸入層,進行了6組預測實驗。每組實驗中分別設置了隱含層神經元節點數從5~1000的獨立實驗。另外,對每次實驗又獨立重復進行了1000次,以消除隨機性影響。分別得到訓練集和測試集平均預測正確率,如圖5、圖6所示。

圖5 訓練集預測正確率

圖6 測試集預測正確率
由圖5可知在ELM預測模型中隨著隱含層神經元節點數的增加,訓練集預測正確率逐漸增加。在因子分析后,當隱含層神經元節點數為22時,訓練集預測正確率即達到100%。而用原始8組變量數據和5組變量數據進行ELM預測,訓練集預測正確率達到100%時需要隱含層神經元節點數分別為37和42。另外,在相同的隱含層神經元節點數的情況下,因子分析后的訓練集預測正確率最大,說明因子分析不僅能使數據降維,減少輸入層神經元個數,還能減少所需隱含層神經元個數,使得網絡結構簡化,同時在相同的情況下提高訓練集預測正確率。
由圖6也可以看出隨著隱含層神經元節點數的增加,測試集預測正確率整體呈現增加的趨勢。且在相同的隱含層神經元個數的情況下,因子分析后的測試集預測正確率明顯最大,說明因子分析顯著提高了測試集預測正確率。另外,當隱含層神經元節點數達到600左右,測試集正確率基本穩定,其中因子分析后的測試集預測正確率最大,達到87.5%,即基于因子分析的ELM模型測試集預測正確率最高只能到87.5%,未達到期望的100%預測正確率。通過分析認為,主要是因為權值矩陣和偏置矩陣隨機性的影響,另外,訓練集樣本數目較少也是其中一個重要原因。
為了消除權值矩陣和偏置矩陣的隨機性對測試集預測正確率的影響,基于因子分析后的數據,采用遺傳算法(GA)對權值矩陣和偏置矩陣進行優化,以達到提高測試集預測正確率的目的。
遺傳算法參數的選擇對GA性能影響很大,結合前人論文經驗以及實際情況,考慮計算收斂速率以及最優解精度等問題,經過多次試驗,參數設置為:種群大小20,最大遺傳代數100,染色體長度100,遺傳代溝0.85,交叉概率0.7,變異概率0.01。另外,由前面分析可知當隱含層神經元節點數為22時,在ELM模型下訓練集預測正確率達到100%,而測試集正確率約60%??紤]到網絡模型的復雜程度和計算速率問題,將GA-ELM模型中的隱含層神經元節點數也設置為22。
隨機產生輸入層權值矩陣和隱含層偏置矩陣,作為GA的初始種群。然后創建ELM網絡,以因子分析后的數據進行訓練測試,計算得到預測正確率,并將預測正確率的倒數作為個體適應度函數。以適應度函數最小為標準選擇最優解,然后對初始種群進行選擇、交叉、變異等操作來產生下一代種群,重復上一步驟,以此迭代直至預測正確率達到要求或達到最大遺傳代數,最后得到最優的權值矩陣和偏置矩陣。通過計算每次迭代預測正確率,得到其遺傳進化圖(圖7)。由圖可知,在第1代的時候,隨機生成的權值矩陣和偏置矩陣,其測試集預測正確率為62.5%,與ELM模型下60%相近,隨著遺傳代數的增加,測試集預測正確率逐漸增加至75%、87.5%,最終在第22代之后正確率一直穩定在100%,此時的權值矩陣和偏置矩陣達到最優。

圖7 遺傳進化圖
將最優權值矩陣和偏置矩陣代入GA-ELM模型進行巖溶地面塌陷預測,訓練集預測正確率達到100%。測試集預測結果如圖8所示。從圖中可以看出,測試集共8個樣本,ELM模型預測正確5個,正確率62.5%,GA-ELM模型預測正確8個,正確率100%,說明遺傳算法優化的GA-ELM模型預測精度和泛化能力都優于單一的ELM模型,并能在樣本數據較少、初始權值矩陣和偏置矩陣隨機產生的情況下得到非常好的預測結果。

圖8 ELM和GA-ELM測試集預測對比圖
綜上所述,基于因子分析的GA-ELM模型綜合了因子分析、遺傳算法和極限學習機模型這3種方法的優勢,具有不受人為主觀影響、網絡結構簡單、學習速度極快、泛化能力強、預測精度極高的特點,是對巖溶地面塌陷預測的一種行之有效的方法,具有一定的工程價值和推廣意義。
本文提出了一個基于因子分析的GA-ELM巖溶地面塌陷預測模型,通過數據測試證明其是一種簡單、準確、高效的預測方法,并得到以下結論:
(1)因子分析數據降維后,使得ELM網絡結構簡化、計算速度提高,而且在相同的隱含層神經元節點數的情況下預測正確率能顯著提高。
(2)在一定范圍內,隨著隱含層神經元節點數的增加,ELM模型預測正確率整體呈增加的趨勢,訓練集正確率最高能達到100%,而測試集正確率最高只能達到87.5%。在訓練集樣本數較少的情況下,可以適當提高隱含層神經元節點數來提高測試集預測正確率,但這也將會造成結構復雜、計算緩慢以及“過擬合”的問題。
(3)用遺傳算法對ELM模型的權值矩陣和偏置矩陣進行優化,可以在較小的隱含層神經元節點數的情況下獲得較高的測試集預測正確率。相對于ELM模型,GA-ELM模型的擬合效果和泛化能力更好,預測正確率更高。