唐小微, 白 旭, 胡記磊
(1.大連理工大學 海岸與近海工程國家重點實驗室,遼寧 大連 116023;2. 華中科技大學 土木工程與力學學院,武漢 430074)
地震液化引起地基沉降導致的地下或地上結構物的破壞是液化災害的一種表現形式。在地震液化后,隨著液化土層的超孔隙水壓力消散,土顆粒的重新排列會導致地基土排水再固結,出現地基土下沉現象,從而引發地基承載力失效,導致地下或地上結構物破壞,如1964年日本新瀉Mw7.5級地震中因地基液化導致的沉降災害嚴重,最大沉降量高達約3.8 m,導致大量房屋損壞、傾斜,甚至倒塌[1];1999年中國臺灣集集Mw7.6級地震中彰化濱海工業園鹿港西二區發生嚴重液化,導致地表沉降達0.33~0.45 m[2];2011年日本東北地區太平洋近海岸Mw9.0級地震,導致東京地區的液化沉降均在0.3~0.5 m,最嚴重的液化沉降量高達約1 m,造成大量房屋、橋梁和地下工程設施破壞,帶來了巨大經濟損失[3]。
地基沉降通常分為軟土塑性變形、非飽和砂土震密引起的沉降和飽和砂土液化后再固結引起的沉降,本文只考慮飽和砂土液化發生后沉降評估的相關研究。液化后的沉降評估方法大致可以分為三類:①基于室內試驗或現場數據建立的簡化評估法;②考慮地震液化沉降的不同影響因素及其非線性和不確定性的機器學習方法;③數值模擬方法。其中,簡化算法以Tokimatsu & Seed法[4]和I & Y(Ishihara & Yoshimine)法[5]為代表的兩種方法都是基于地基土沉降與砂土的密實度和地震的最大剪切應變的關聯為基礎,建立的經驗模型,其計算簡單快捷,但計算粗略,容易導致計算結果的精度較低,且無法考慮液化噴砂冒水引起的水土流失、土骨架破壞和土體介質不連續等因素影響,適用范圍較窄。葉斌等[6]對這兩種經驗模型進行了對比分析,發現分層計算的沉降趨勢基本一致,但最終的沉降計算結果存在較大差異,造成這種差異的原因是兩種模型的基礎試驗數據不同。數值模擬方法的準確性主要依賴于精確的場地參數和地震參數以及本構模型的優劣,而且其計算成本較大,一般用于一些重大工程問題。而機器學習方法可以綜合考慮砂土液化和地基沉降的眾多影響因素及其不確定性、較準確地評估地震液化后地基的沉降量,但該方法是一種單純的數學方法,很難從地基液化沉降的誘發機理上解釋評估結果。具有代表性的研究成果有:Cetin等[7]基于大量循環三軸試驗結果、簡單剪切試驗結果和扭剪試驗結果采用線性回歸和最大似然方法,建立了評估液化后排水的殘余體變和殘余剪應變的概率經驗模型;陳國興等[8]基于我國海城地震、唐山地震和日本新瀉地震的液化震害數據采用神經網絡建立液化沉降預測模型;郭小東等[9]基于遺傳算法和回歸型支持向量機方法考慮了液化震陷的9個主要影響因素建立了評估模型。這些方法因選取的影響因素不統一和不全面,未考慮不同土類和場地特性的影響,故預測結果不理想,仍需要進一步提高其綜合泛化能力。
貝葉斯網絡方法適用于表達和分析不確定性和概率性的事件,可以從不完全、不精確或不確定的知識或信息中做出準確的推理,特別適用于像地基液化沉降這樣有條件地依賴于多種控制因素的高度非線性復雜問題。貝葉斯網絡已被廣泛地應用于醫學、軍事、信息和災害風險等領域,也逐漸應用在地震液化預測等問題中,如Bayraktarli[10]將改進的Seed簡化法應用到貝葉斯網絡中對1999年Kocaeli地震液化進行了預測;Huang等[11]利用貝葉斯網絡考慮液化參數不確定性討論了模型不確定性對液化預測結果的影響;Hu等[12]綜合考慮了地震參數、土體參數和場地條件,建立了地震液化的貝葉斯網絡模型,并與神經網絡方法對比,驗證了該模型的正確有效性。本文在Hu等建立的地震液化貝葉斯網絡預測模型的基礎上,引入地基沉降參數及其影響因素,擴展該模型,從而建立地震液化后地基沉降的貝葉斯網絡評估模型,并與傳統的簡化計算方法(如I & Y法)和徑向基函數(Radial Basis Function, RBF)人工神經網絡模型進行對比,利用多個評估指標驗證該貝葉斯網絡評估模型的精確有效性。
貝葉斯網絡(Bayesian Network, BN)是一種用于描述變量之間不確定性因果關系的概率圖推理模型,是目前不確定知識表達和推理領域最有效的理論模型之一[13]。它由節點(表示變量)、有向連線(表示變量因果關系)和概率表(表示不確定性)組成,其可以將先驗知識和歷史數據巧妙地結合起來,對數據進行量化評價。貝葉斯網絡是基于貝葉斯理論發展起來的一種圖概論方法,其推理準則包括[14]
(1)
P(x1,…,xn)=P(x1)P(x2|x1)…P(xn|x1,x2,…,xn-1)
(2)
(3)
式中:P(Y)為先驗概率;P(X|Y)為Y發生時X發生的概率;π(xi)為變量Xi的父親節點集合。
圖1為地震液化引起沉降的一個貝葉斯網絡通用模型,包括:①輸入節點,如土體參數(SP)、地震參數(EP)和場地條件(FC);②狀態節點,如液化勢(LP)和液化潛能指數(LP);③輸出節點,如沉降量(S)。

圖1 地震液化引起的沉降災害通用貝葉斯網絡模型Fig. 1 A generic BN model of seismic liquefaction-induced settlement
當已知某場地是否發生液化,且能確定土體參數、地震參數、場地條件,則可以根據該模型進行推理,得到液化引起的沉降量,例如沉降量為嚴重(30~70 cm)的概率可由式(1)~式(3)計算得
式中:模型的所有變量的聯合概率為
P(LH,LP,LPI,SP,EP,FC)=
P(SP)·P(FC)·P(EP|SP,FC)·P(LP|SP,EP,FC)×
P(LPI|LP,FC)·P(LH|SP,EP,FC,LP,LPI)
同時,該模型也可以根據場地的土體參數、地震參數和場地條件來預測液化發生的概率,可以表示為
Hu等通過融合專家知識(解釋結構模型)和數據學習(K2算法)的混合貝葉斯網絡建模方法,建立了12個影響因素的地震液化貝葉斯網絡預測模型,如圖2所示。
本文基于該模型,考慮地基沉降的影響因素,如地震峰值加速度、可液化土層的埋深和厚度以及土質類別等[15],另外加入Iwasaki等[16]提出的液化潛能指數,用來描述場地液化的程度,采用Hu等的建模方法:首先基于領域知識,利用解釋結構模型方法建立一個具有結構層次的初始貝葉斯網絡模型,然后結合K2結構學習算法,使其能融合初始模型中的領域知識(變量之間的關系和排序及其父節點的最大個數)和結構學習中的數據信息,進行混合學習,從而建立地震液化沉降的貝葉斯網絡評估模型,如圖3所示。

圖2 地震液化的貝葉斯網絡預測模型Fig.2 A Bayesian network for predicting seismic liquefaction

圖3 地震液化沉降的貝葉斯網絡評估模型Fig.3 A Bayesian network for assessing seismic liquefaction-induced settlement
人工神經網絡是由大量神經元以某種鏈接方式形成的映射模型,一般可分為輸入層、隱含層和輸出層。常見的人工神經網絡模型是采用RBF和多層感知器(Multi-layer Perceptron, MLP)進行信息的處理,其中MLP模型通常采用BP(Back Propagation)算法,其收斂速度、逼近能力和分類能力都比RBF神經網絡模型的要差,因此本文采用RBF神經網絡模型進行學習并建立地震液化沉降的評估模型,如圖4所示。該模型采用人工多次調整隱含層數來進行模型的訓練學習,最終確定模型學習精度最大所對應的隱含層數為20層。
此外,在地基沉降的簡化計算法中,I & Y法進行地震液化沉降風險評估比Tokimatsu & Seed法要偏于安全。因此,本文將采用I & Y法對收集的液化地基沉降數據進行評估。I & Y法的基本原理是將場地條件和地震強度信息結合土體的標準貫入錘擊數轉化為土層液化安全系數,建立砂質土的相對密度-液化安全系數-土層體積應變之間的關系,然后分別計算每層土的體積應變,進而得出地基的總沉降量。其具體計算過程可以參考Ishihara等的研究。

圖4 地震液化沉降的神經網絡評估模型Fig.4 A neural network for assessing seismic liquefaction-induced settlement
本文收集了442組現場標貫試驗(Standard Penetration Test, SPT)點的地震液化沉降數據,包括245個液化場地和197個未液化場地。隨機抽取332組沉降數據(184組液化樣本和148組未液化樣本)作為訓練樣本,剩余的110組作為驗證樣本。由于液化災害數據中存在部分數據缺失現象,如平均粒徑的缺失比例為15.2%,上覆有效應力的缺失比例為29.4%,數據缺失比例最大的變量是可液化層厚度,高達38.9%,因此采用適合缺失數據學習的期望值最大化算法(Expectation Maximization, EM)進行參數學習,獲得貝葉斯網絡模型中變量的條件概率。所有地震液化沉降災害數據分別來源于1999年我國里氏7.6級臺灣集集地震[17](http:∥cecas.clemson.edu/chichi/TW-LIQ/Homepage.html),1957年美國5.3級California Daly地震以及1987年5.9級Whittier Narrows地震[18],2011年日本東北地區太平洋近海岸9.0級地震。液化的12個影響因素的等級劃分說明可參見Hu等的研究,剩余的兩個影響參數,液化潛能指數和地基沉降是根據已有的研究成果劃分等級標準,如表1所示。例如,液化后潛能指數根據Iwasaki等的建議分為4個等級來反映場地的不同液化程度。由于大多時候,工程師們只需要對液化場地的地基沉降進行大致評估,因此地基沉降量可以根據Ishihara等的研究劃分為4個等級來反映其災害的不同嚴重程度,其中將0.3

表1 部分參數的等級劃分
模型性能的評估指標中最常用的是總體精度(OA)它反映了模型的整體預測性能,是預測準確的樣本量占總樣本量的比例。除這個指標外,作為信息檢索分類中常用的兩個指標,準確率(Pre)和召回率(Rec)被用來反映模型預測時某一分類中預測正確的概率,其中準確率也叫做查準率,表示模型預測正確的某一類樣本量占模型預測為該類樣本的總數的比例,召回率也叫做查全率,是模型預測正確的某一類樣本量占該類真實樣本量的比例。在地震液化預測中,理想情況下是希望模型的準確率和召回率都高,既能完美地區分哪些是液化樣本,哪些是非液化樣本,又能做出百分之百對的預測,但是Pre和Rec是相互制約的,一般情況下準確率高時,召回率就相對較低,因此需要找到一個融合準確率和召回率的指標。F1就是一個準確率和召回率的平均調和指標,用來綜合反映模型的分類預測效果,當F1較高時,說明準確率和召回率都相對較高,則模型的預測效果很好。F1的計算公式為
F1=2·Pre·Rec/(Pre+Rec)
(4)
此外,一個性能好的模型除了要有較高的預測準確率外,還需要有較好的可靠性或有效性。受試者工作特征曲線(OC)曲線下面積(AUC)和Brier評分可以很好地反映模型的可靠性,其中ROC是以假陽性率(模型預測假樣本的錯誤數量占假樣本量的比例)為橫軸,真陽性率(也就是召回率)為縱軸所繪制的曲線圖,其曲線下面積AUC的值一般介于0.5~1.0,AUC的值越大,模型的預測性能越好。而Brier評分用于評估模型的預測均方概率誤差,由Brier[19]在1950年提出,其表達式為
(5)

基于貝葉斯網絡、RBF神經網絡和I & Y法的110組地基沉降的評估結果,如表2所示。

表2 不同液化沉降模型的評估結果對比
其中I & Y法計算的液化沉降為一個具體值,圖5為該方法計算得到的某一個場地地基液化沉降量,而貝葉斯網絡方法和神經網絡方法計算的液化沉降是其某一個分類范圍的概率值。首先對比預測精度(OA)和Brier評分值(B)兩個指標,BN模型的預測精度最好,Brier評分值最小,而I & Y法的預測精度最差,且I & Y法沒有Brier評分值,這是因為I & Y法是確定性評估方法,無法計算Brier評分值。因此,從模型的整體評估性能上來看,BN模型的評估結果最可靠。進一步分析沉降各分類中的評估指標F1和AUC,可以發現BN模型的各沉降類別的F1值和AUC值幾乎都是比其他兩種方法要大。因此,綜合各評估指標的計算結果,BN模型無論是模型的整體評估可靠性還是各分類沉降量的預測性能都最好,說明了本文液化沉降的貝葉斯網絡評估模型是準確有效的。此外,在I & Y法的評估結果,可知,該方法在評估中大沉降量和無沉降發生這兩種情況時,其計算準確性較好,但對小沉降量的評估能力較差。

圖5 日本東北地區太平洋近海岸地震中場地編號CH022勘測點的地震液化沉降計算結果Fig. 5 Calculation result of seismic liquefaction-induced settlement of a site No. CH022 in the Pacific coast of Tohoku earthquake
為了進一步說明貝葉斯網絡模型在液化沉降評估中的優勢,下面對液化沉降的發生進行因果推理和診斷推理。表3為液化沉降的貝葉斯網絡模型中變量在不同先驗已知情況下的后驗概率,用來表示貝葉斯網絡的因果推理過程。從表3可知,地震參數、土體參數和場地條件未知的情況下,“概率1”中液化的發生、LPI和沉降量的4種類別之間的概率值都相差不大,無法對場地的沉降災害進行評估,而當已知地震參數、土體參數和場地條件時,可根據該模型進行推理知道場地發生液化的概率是多少。如果預測為液化,則可以將液化的等級“是”可改變該概率值為100%,那么LPI和沉降量的4種類別之間的概率值都會發生變化,從“概率2”中可知場地最可能出現中等程度液化,沉降量大。如果進一步將LPI的中等液化概率值改為100%,則最后推理出場地發生嚴重沉降量的可能性最大。在整個貝葉斯網絡推理過程中,已知的場地地基液化相關的信息量越多,各變量的先驗概率的準確性越高,推理的結果越準確,且推理過程中的因果關系越符合液化沉降的發生機制。
該貝葉斯網絡模型處理上述推理分析能力外,還有逆向推理功能,如圖6所示(采用Netica軟件計算http:∥www.norsys.com/download.html)。如果知道某個場地發生了嚴重的沉降災害,那么什么樣的場地條件在什么樣的地震作用下最可能導致該結果,這個就是概率論中的“最大可能解釋”。從圖6可知,地震等級“超大”、震中距“適中”、持續時間“適中”、地表峰值加速度“很高”、含“適當”細粒含量的“松散”砂土且其粒徑“適中”、場地中土層“薄”且埋深“淺”、水位埋藏“淺”等,這樣的情況下場地更容易發生液化,且液化后引起的沉降量會很大,這一結論符合目前對液化沉降的規律認知。模型的逆向推理能力有助于工程師們根據場地的抗震設防要求,預先評估能造成該場地某種程度災害的最可能條件,為抗震設計提供科學依據。

表3 貝葉斯網絡模型中部分變量的后驗概率

圖6 地震液化引起沉降的最大可能解釋Fig. 6 The most probable explanation of seismic liquefaction-induced settlement
盡管貝葉斯網絡和人工神經網絡都是監督式學習方法,但貝葉斯網絡是一種生成學習模型,模型中的每個節點代表一個隨機變量,都具有其實際含義,節點和節點之間的連線表示因果關系,可以通過概率理論公式進行計算,從而對推理結果進行解釋,而神經網絡是一種判別式模型,模型中的每個節點不是隨機變量,難以解釋其實際含義,特別是其沒有完備的理論基礎,隱含層像一個“黑匣子”,節點之間是通過權重連接。更值得注意的是,貝葉斯網絡方法可以向前、向后推理,例如可以通過輸入地震相關參數、土體參數和場地條件預測場地是否液化,并進一步再評估場地的沉降量范圍(見表3),也可以通過已知場地的地基液化沉降量大小,反向推斷什么樣的地震、土體和場地條件最可能導致該沉降量(見圖6),而神經網絡模型無法進行反向推理。另外,I & Y法是采用單元體試樣的最大剪應變作為試樣液化后排水體變的表征指標,建立了基于液化潛能指數的粗略估算方法。在液化潛能指數的計算中,該方法是根據地震強度的相關信息,如PGA(Peak Ground Acceleration)結合標準貫入錘擊數進行轉換計算,在這個轉換計算中會使用一些經驗系數和經驗公式,這必然會造成估算結果上的差異。而且,對于長時間的地震作用下的地基液化沉降問題中,飽和砂土的沉降會持續增長,并不會受最大剪應力的明顯限制[20],這說明I & Y法會顯著低估液化后土體的排水體變。而本文采用的貝葉斯網絡方法綜合考慮了地震液化沉降的多個影響因素,將這些因素以因果關系連接到場地的最終沉降值(包括液化后排水引起的沉降)上,通過概率計算進行沉降災害評估。雖然本文的貝葉斯網絡方法中也有液化潛能指數這一指標,但貝葉斯網絡方法并不是像I & Y法那樣單一采用“相對密度-液化安全系數-土層體積應變”一一對應的關系,而是綜合考慮了地震強度參數、場地條件和土體性質來進行概率推理評估。

表4 地震液化沉降的因素敏感性分析
地基發生液化沉降的原因相當復雜,影響因素也很多。表4給出了貝葉斯網絡模型和神經網絡模型的地震液化沉降影響因素的敏感性分析結果,為了便于對比分析,將兩個模型的敏感性計算結果進行了標準化。在兩個模型的沉降敏感分析結果中,貢獻率(相對重要性)較大的前3個因素一致,分別為PGA、地震持續時間和標準貫入錘擊數,這和沉降的簡化算法中通過標準貫入錘擊數結合地震強度信息估算土層豎向應變的原理中考慮的參數一樣,不同的是本文的機器學習模型還綜合考慮了其他一些重要的因素,如上浮有效應力、土層的埋深和厚度等,可對高度非線性和不確定性的液化沉降評估進行概率推理分析,因此機器學習模型的評估可靠性更強。本文的貝葉斯網絡模型可先通過綜合考慮地震強度相關參數、場地條件和土體的性質參數進行場地液化的概率預測,然后再結合場地是否液化和液化潛能指數及沉降的重要影響參數(如PGA、持續時間和標準貫入錘擊數等)進行進一步概率推理,并評估沉降量,但該模型無法反映地震液化土因排水固結引起的地基沉降這一機制。這有待進一步進行研究,探討數學模型與物理機理的融合問題,從而使模型可以反映液化沉降的機制。
本文綜合考慮了多個地震參數、場地條件和土體參數,分別基于貝葉斯網絡方法和徑向基神經網絡方法建立了地震液化沉降的評估模型,并與傳統的I & Y簡化計算方法進行了對比,其中地震液化沉降的貝葉斯網絡模型的評估性能最好,而I & Y簡化方法評估性能最差。所建立地震液化沉降的貝葉斯網絡模型能很好地處理地基沉降的影響因素間的非線性關系和不確定性問題,其不僅可以預測液化的發生概率,還可以進一步評估場地的沉降災害大小,而且該模型能進行逆向因果推理,評估場地和土體條件已知的情況下什么樣的地震條件最可能導致該沉降災害結果。此外,通過機器學習模型的敏感分析發現PGA、地震持續時間和標準貫入錘擊數為較敏感因素,和簡化算法考慮的參數基本一致。