王秀振, 錢永久, 宋 帥
(1. 西南交通大學 土木工程學院,成都 610031; 2. 太原理工大學 建筑與土木工程學院,太原 030024)
在工程抗震計算中,結構地震需求分析是地震易損性分析的重要基礎,近些年結構地震需求分析的研究成果較多。陳亮等[1]進行了非線性動力分析,發現在高頻區段的大跨徑橋梁中,反應譜對其結構地震需求的影響很大。劉驍驍等[2]計算了框架結構基于概率地震需求分析的多維的地震易損性,描述了對多個輸入隨機參數敏感的結構的破壞現象。周世軍等[3]以概率地震需求模型,基于已有數據,分析了預應力簡支箱梁橋的地震需求,研究發現兩次非線性回歸方法的概率需求模型比線性回歸分析方法的概率需求模型更可靠。
局部敏感性分析是不確定性分析領域傳統的研究方法,通過研究輸入隨機變量在指定的名義值變化時,輸出反應量的變化來研究輸入隨機變量對輸出反應量的影響程度[4]。除此之外,還有一種不確定分析領域的研究方法:重要性度量分析,這是一種全局敏感性分析方法,可以研究輸入隨機變量在所有可能的取值處變化時,輸出反應量的變化情況[5]。重要性分析常用方法有點估計法[6]、態相關參數法[7]和Monte-Carlo數值模擬法[8]等。
宋帥等[9]為了分析橋梁中的輸入隨機變量對地震需求的影響,提出用全局敏感性分析方法對輸入隨機變量進行了重要性排序。尹犟等[10]對鋼筋混凝土框架進行了局部敏感性分析,采用3種方法研究了地震動強度和結構中的輸入隨機變量對4種結構地震需求的影響程度。發現地震動強度對結構地震需求的影響最為顯著,結構質量、混凝土的抗壓強度以及結構阻尼的影響也較大,其他輸入隨機變量的影響比較小。董現等[11]針對蒙特卡羅方法出現的計算速度慢和未考慮輸入隨機變量之間的相關性問題,采用混沌粒子群算法,考慮了輸入隨機變量的相關性,通過等效變換的隨機序列進行了隨機性分析,提出了靈敏性測度方法,發現所提出的方法是很好地反映靈敏性的方法。
本文提出將隨機森林算法和最小角回歸算法應用到輸入隨機變量對輸出反應量的重要性度量分析中,以帶黏滯阻尼器的鋼筋混凝土框架結構為例,對影響框架結構地震需求的結構中的輸入隨機變量進行了重要性度量分析,并同時用Monte-Carlo數值模擬法進行對比,驗證兩種方法的有效性以及高效性。
1.1.1 隨機森林基本原理
2001年,Bremain結合劃分隨機子空間策略的方法和Bagging學習理論,提出隨機森林算法(Random Forest, RF),以分類回歸樹作為它的元分類器。
隨機森林有回歸和分類兩種技術,隨機森林回歸算法是在隨機子空間策略方法和Bagging學習理論基礎上,提出來的一種集成的算法。
每棵分類回歸樹在生成時,隨機森林回歸算法都是獨立的抽取特征和樣本,隨機森林回歸的就是生成多棵分類回歸樹的過程,因此天生的可并行性是隨機森林回歸的一大特點,所以運行時間可以大大減少。
如圖1所示,每一棵CART樹的構建,都要用Bootstrap重抽樣方法從大小為n的訓練子樣本集中抽樣,使構建CART樹的具體數據有差別,然后將多棵CART樹的預測結果進行組合,利用投票的方法得出最終結果。

圖1 隨機森林回歸示意圖Fig.1 Random forest regression sketch map
1.1.2 結構地震需求獲得方法
(1) 首先抽取N個低偏差的sobol序列樣本,根據各個輸入隨機變量的概率密度函數轉化為相應的樣本值,N個輸入隨機變量的樣本值排為一列,假設有n個輸入隨機變量,則可得到所有樣本值的N×n維的樣本矩陣
(1)
(2) 將矩陣A中的各個樣本值輸入到OpenSEES軟件的模型中,計算輸出反應量(結構地震需求),產生N個結構地震需求Y的樣本值
(2)
1.1.3 重要性度量方法
總體訓練樣本集采用重抽樣方法抽樣后,每個樣本不被抽中的概率是(1-1/N)N,其中N代表總體訓練樣本集的樣本數。當N較大時,(1-1/N)N收斂于1/e≈0.368,這表明總體訓練樣本集中大概有36.8%的“袋外數據”(Out of Bag, OOB)會不在訓練子樣本集中,所以可用它們作為測試數據集來評價隨機森林預測性能,這種方法方法稱為OOB估計(Out of Bag Estimation ),相應的指標成為%IncMSE。若隨機森林中決策樹的數量足夠多,OOB估計具有無偏性的特點[12-13]。
隨機改變隨機森林模型中某個輸入隨機變量時(噪聲擾動),可以將擾動對隨機森林模型的影響程度作為該輸入隨機變量相對重要性的度量,在隨機森林回歸分析時,可以采用“袋外數據”估計的均方誤差的平均遞減值來評價輸入隨機變量對回歸模型的重要性,均方誤差的定義是
(3)

1.2.1 最小角回歸基本原理
2004年,Efron等[14]提出了最小角回歸(Least Angle Regression, LARS)算法,最小角回歸算法的步驟如圖2所示,具體如下[15]:
步驟1判斷輸入自變量x與輸出反應量y的相關度,然后用有最大相關度的輸入自變量xi對y逼近;
步驟2找到另一個與y具有相同相關度的輸入自變量xj,即rxiy=rxjy, 然后從xi與xj的角平分線方向xu逼近y;
步驟3同理,若出現第3個輸入自變量xk與輸出反應量y的相關度與xi相同, 則將xk也納入到逼近列隊,選擇3個向量共同的角平分線方向xv施行新一輪的逼近,此時角平分線方向表示多維空間中多個向量的平分線方向;
步驟4逐步逼近直到所有輸入自變量都參與到逼近中,或者殘差小于某個設定的閾值時,結束算法。

圖2 LARS計算步驟Fig.2 LARS calculation procedure

1.2.2 重要性度量方法
假設輸出反應量(結構地震需求)的N個樣本值為yk(k=1,2,…,N), 結構地震需求Y的總方差為
(4)


(5)

則基于最小角回歸模型的重要性度量指標Si
(6)
對于輸入隨機變量為n維時,用n個輸入隨機變量分別代入隨機森林回歸模型中,得到預測值,然后得到所有輸入隨機變量的重要性度量指標Si(i=1,2,…,n)。
1.3.1 基于方差的重要性度量指標

(7)
式中:Xi為輸入隨機變量組[Xi1,Xi2,…,Xir](1≤i1≤…≤ir≤n)或輸入隨機變量Xi,E(Var(Y|Xi))是Xi作用下,Y的條件方差的均值。
1.3.2 求解方法
準蒙特卡洛法是抽樣方法中需要樣本量較少的一種方法,為了在樣本量較少的情況下仍然得到較好的結果,本文采用低偏差的Sobol序列(當樣本量達到500左右時,方差和數學期望的偏差在千分之一以內),根據各個輸入隨機變量的概率密度函數轉化為相應的樣本,樣本量為幾百即可得到合理的結果,具體如下:

結構地震需求Y的無偏無條件方差Var(Y)如式(4)所示, 無偏條件方差Var(Y|Xi)為
(8)


圖3 計算流程Fig.3 Calculation process
某7層3跨的鋼筋混凝土框架結構,黏滯阻尼器的阻尼指數為1,底層層高4 200 mm,標準層層高3 600 mm,如圖 4所示。柱距均為6 000 mm,樓板的厚度為120 mm,混凝土強度等級為C40,鋼筋強度等級為HRB335,輸入隨機變量的信息,如表1所示。

圖4 結構簡圖Fig.4 Structure diagram

輸入隨機變量變異系數均值分布類型黏滯阻尼器的阻尼系數c/(kN·s·mm-1)0.13正態黏滯阻尼器的剛度k/(kN·mm-1)0.1100正態阻尼比DA0.2[16]0.055正態結構質量Ms/(kN·m-2)0.1[17]6正態鋼筋屈服強度fy/MPa0.078[18]384對數正態鋼筋彈性模量Es/MPa0.033[19]228 559正態混凝土強度fc/MPa0.1434.82正態混凝土彈性模量Ec/MPa0.08[20]33904正態注:表中結構質量取為重力荷載代表值
本文地面運動加速度采用El Centro地震波,用OpenSees有限元軟件進行非線性動力時程分析,運用Maxwell單元模擬黏滯阻尼器,柱和梁都采用宏觀的非線性纖維梁柱單元,鋼筋采用Steel02單元材料模型,混凝土采用Concrete02單元材料模型,選擇基底剪力、頂點位移和最大層間位移角這3種地震需求進行重要性度量分析。
圖5給出了基于隨機森林的重要性度量指標,從圖5可知,同一輸入隨機變量對3種不同的地震需求的影響水平不盡相同,但黏滯阻尼器的剛度和混凝土的彈性模量對3種地震需求的影響都較小。

圖5 隨機森林重要性度量指標Fig.5 Random forest importance measure index
圖6給出了基于最小角回歸的各個輸入隨機變量對應的最大層間位移角需求的預測值趨勢線,從圖中可以看出,阻尼比、鋼筋的屈服強度和黏滯阻尼器的阻尼系數所對應直線的斜率較大,而混凝土的抗壓強度和彈性模量以及黏滯阻尼器的剛度所對應直線的斜率較小。由于篇幅所限,其他兩種地震需求的預測值趨勢線不再一一列出。

圖6 LARS最大層間位移角需求預測值Fig.6 The predicted value of LARS’ most story drift angle demand
圖7給出了基于最小角回歸和Monte-Carlo數值模擬法的重要性度量指標結果,從圖7可知,Ms和DA對結構地震需求的影響最大,而Ec和k的影響都很小。

圖7 不同方法重要性度量指標Fig.7 Importance measure index under different methods
本文采用3種方法進行重要性度量分析,都是是全局敏感性分析方法。為便于對用3種方法的重要性度量結果進行對比,將3種方法得到的輸入隨機變量的重要性度量分析排序結果列于表2中。

表2 輸入隨機變量的重要性排序
由表3可知,采用3種方法得到的輸入隨機變量的重要性度量分析排序,除極個別稍有差別外,基本完全一致,3種分析方法的結果均表明:鋼筋的屈服強度和阻尼比對3種結構地震需求的影響都很顯著,黏滯阻尼器的剛度和混凝土的彈性模量的影響都較小。

本文通過隨機森林和最小角回歸方法,對一帶黏滯阻尼器的鋼筋混凝土框架結構進行了非線性動力時程分析,得到了3種結構地震需求,對8個輸入隨機變量進行了重要性度量分析,并通過Monte-Carlo數值模擬法進行對比,得到如下結論:
(1) 對于同一種結構地震需求,采用3種不同分析方法時,輸入隨機變量的重要性排序基本相同。
(2) 基于隨機森林和最小角回歸的重要性度量分析方法與Monte-Carlo數值模擬法相比,在總樣本量少很多的情況下,得到的重要性排序結果與Monte-Carlo數值模擬法基本相同。
(3) 同一輸入隨機變量對結構的3種不同結構地震需求的重要性排序差別較大,即同一輸入隨機變量對不同地震需求的影響水平基本不同。
(4) 對于本文的3種不同結構地震需求,采用上述3種不同的重要性度量分析方法時,阻尼比、結構質量和鋼筋的屈服強度的重要性排序均靠前;而黏滯阻尼器的剛度和混凝土的彈性模量的重要性排序均靠后。
通過不同分析方法的對比可見,本文提出的基于隨機森林和最小角回歸的重要性度量分析方法是高效準確的方法,在復雜結構的重要性度量分析中可以使樣本量大大減少,這對結構抗震具有重要的參考意義。