







關(guān)鍵詞:深度學(xué)習(xí);一維卷積神經(jīng)網(wǎng)絡(luò);智能控制;數(shù)據(jù)特征可視化;泛化性能
中圖分類號:TB381 文獻(xiàn)標(biāo)志碼:A 文章編號:1000-582X(2025)01-066-10
根據(jù)是否需要外部能源、激勵以及結(jié)構(gòu)的反應(yīng)信號,可以將結(jié)構(gòu)振動控制類型分為:主動、被動、半主動和混合控制等[1]。目前較為成熟的主動控制策略有:極點配置算法[2]、線性二次型高斯控制算法[3]、獨立模態(tài)空間控制算法[4]等,但以上方法均需建立建筑結(jié)構(gòu)的精確模型,隨著工程技術(shù)的發(fā)展,超高層建筑模型參數(shù)趨于復(fù)雜化,控制數(shù)據(jù)海量化,使得以上算法在工程中難以實現(xiàn)。神經(jīng)網(wǎng)絡(luò)控制算法為解決這一問題提供了新的途徑,該類算法具有不需要建立精確結(jié)構(gòu)模型、泛化能力強(qiáng)、穩(wěn)定性高等優(yōu)點[5]。在淺層學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)控制算法中,Ramezani 等[6]通過人工神經(jīng)網(wǎng)絡(luò)算法尋找TMD(tuned mass" dampers,TMD)最優(yōu)參數(shù),驗證其在控制方面的準(zhǔn)確性。Zhao 等[7]利用RBF 神經(jīng)網(wǎng)絡(luò)較高的容錯性和自適應(yīng)能力,設(shè)計出RBF 神經(jīng)網(wǎng)絡(luò)滑模控制器。涂建維等[8]通過RBF 神經(jīng)網(wǎng)絡(luò)預(yù)測MR 阻尼器滯后的地震響應(yīng),有效抑制了船機(jī)頂部的地震鞭梢效應(yīng)。李宏男等[9]進(jìn)行了基于遺傳BP 神經(jīng)網(wǎng)絡(luò)對偏心結(jié)構(gòu)的減震控制研究,解決了被控系統(tǒng)的非線性、時滯、時變等問題。然而,以上淺層結(jié)構(gòu)算法存在復(fù)雜函數(shù)表達(dá)能力有限,訓(xùn)練時間長,易過擬合等缺點,阻礙了其在高層建筑和復(fù)雜結(jié)構(gòu)振動控制中的應(yīng)用[10]。
為彌補以上淺層學(xué)習(xí)的不足,深度學(xué)習(xí)可根據(jù)不同任務(wù)設(shè)計出相應(yīng)深層網(wǎng)絡(luò)模型,以應(yīng)對復(fù)雜結(jié)構(gòu)診斷和龐大數(shù)據(jù)的預(yù)測等問題[11]。涂建維等[10]采用長短時記憶網(wǎng)絡(luò)(long short-term memory,LSTM)完成對3 層benchmark 模型的振動控制,這是深度學(xué)習(xí)對結(jié)構(gòu)振動的首次運用。卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的代表算法之一,由于其內(nèi)部獨特的降維構(gòu)造和強(qiáng)大的特征提取能力,被廣泛應(yīng)用于軸承故障診斷[12]、圖像識別[13]及時間序列預(yù)測[14]等領(lǐng)域。其中,圖像識別采用二維卷積神經(jīng)網(wǎng)絡(luò)(2D-CNN),時間序列預(yù)測采用1D-CNN。針對高維時間序列預(yù)測問題,1D-CNN在結(jié)構(gòu)健康檢測[15]、電路故障診斷[16]和管道震動識別[17]等方面均被成功應(yīng)用。
綜上所述,1D-CNN適用于高維時間序列的特征降維和預(yù)測,可將此特性用于高層建筑結(jié)構(gòu)的振動控制。因此,文中提出了基于1D-CNN的智能控制算法,用于高層建筑在地震作用下的振動控制。以結(jié)構(gòu)地震響應(yīng)作為時間序列訓(xùn)練神經(jīng)網(wǎng)絡(luò),可視化1D-CNN降維過程,并將控制仿真結(jié)果與淺層學(xué)習(xí)(BP、RBF)對比,驗證文中方法的有效性。
1CNN理論
CNN根據(jù)輸入數(shù)據(jù)類型和卷積方式的不同可分為1D-CNN、2D-CNN 和3D-CNN [18],但基本框架結(jié)構(gòu)相似。1D-CNN 結(jié)構(gòu)如圖1所示,分別由輸入層、卷積層、池化層、全連接層和輸出層組成。CNN相較于全連接網(wǎng)絡(luò)具有稀疏連接和權(quán)值共享兩大優(yōu)點,可降低過擬合風(fēng)險和提高網(wǎng)絡(luò)穩(wěn)定性。
1.2數(shù)據(jù)特征可視化提取
CNN“黑盒式”運行過程,阻礙了人們對其直觀的認(rèn)知。為定量化理解CNN 的運行邏輯,驗證控制器內(nèi)部降維過程,采用deep dream可視化算法[19]、activations 函數(shù)進(jìn)行中間層局部特征、數(shù)據(jù)處理層完整特征的提取和分析[13]。該算法核心函數(shù)為matlab 中的deep dreamimage,調(diào)用方式為
I= deepdreamimage ( net, layer, channels, name, value ) 。(10)
式中:net為預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò);layer 為需可視化的中間層;channels為通道數(shù),設(shè)置為索引的向量;name、value分別為輸入數(shù)據(jù)的名稱及參數(shù)值。
Activations函數(shù)激活指定網(wǎng)絡(luò)層,需與augmentedimage datastore函數(shù)(通過批量轉(zhuǎn)換增強(qiáng)數(shù)據(jù))共同使用來提取網(wǎng)絡(luò)層完整特征,具體表達(dá)式為
features = Activations ( net, augimds, layer ) , (11)
auimds = Augmentedimagedatastore ( outputsize,imds ), (12)
式中:outputsize 為特征圖輸出尺寸;imds 為數(shù)據(jù)存儲庫;augimds 為批處理后數(shù)據(jù)庫;layer、net 含義同式(10)。
2一維卷積特征可視化
在處理時序數(shù)據(jù)時,1D-CNN相較BP、RBF等淺層學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),其優(yōu)勢在于提升預(yù)測精度的同時,加快網(wǎng)絡(luò)運行效率,這主要取決于1D-CNN內(nèi)部獨特的降維構(gòu)造。然而,海量數(shù)據(jù)的特征提取流程及深度學(xué)習(xí)“黑盒式”的學(xué)習(xí)方式很難被直觀理解。為深度解析1D-CNN運行的工作機(jī)理,使用deep dream 可視化算法分析了1D-CNN學(xué)習(xí)過程中數(shù)據(jù)降維細(xì)節(jié)和邏輯變化,驗證了控制器工作的有效性和正確性。時序數(shù)據(jù)提取過程中需保留邊緣信息完整性,因此,采用0 填充(Padding)操作擴(kuò)大數(shù)據(jù)集,如圖2所示,神經(jīng)網(wǎng)絡(luò)參數(shù)如表1所示。
2.11D-CNN特征學(xué)習(xí)層可視化
1D-CNN特征學(xué)習(xí)主要通過卷積層、池化層的特征提取和降維來完成,由于計算機(jī)設(shè)備和超參數(shù)的不同,使得數(shù)據(jù)的訓(xùn)練結(jié)果有所改變,導(dǎo)致了可視化特征學(xué)習(xí)層具有一定隨機(jī)性,但預(yù)測精度不會發(fā)生大幅變化。
數(shù)據(jù)特征的維度變化體現(xiàn)了1D-CNN 的降維過程,經(jīng)試算,Conv1層和Pool1層通道數(shù)(Channels)取64,迭代次數(shù)取50,可視化層數(shù)分別為2 和3;Conv2層和Pool2層通道數(shù)(Channels)取128,迭代次數(shù)取75,可視化層數(shù)分別為6 和9。在確定神經(jīng)網(wǎng)絡(luò)超參數(shù)后,采用deep dream 可視化算法對中間層特征進(jìn)行逐層提取。圖3 為1D-CNN 雙層網(wǎng)絡(luò)的卷積、池化層特征可視化結(jié)果,展示了1D-CNN 對輸入數(shù)據(jù)的降維過程。圖3(a)和(b)分別為第1 層的卷積(Conv1)和池化層(Pool1),每層特征圖數(shù)量與卷積核相同,均為32 張。經(jīng)池化層降維后,輸入尺寸由Conv1 層的32×1 降至Pool1 層的16×1。圖3(c)(d)分別為第2 層的卷積(Conv2)和池化層(Pool2),每層特征圖數(shù)量為64 張。經(jīng)池化層降維后,輸入尺寸由Conv2 層的10×1 降至Pool2層的5×1。上述各層降維結(jié)果和理論計算值一致,驗證了1D-CNN 對數(shù)據(jù)的降維過程和運算邏輯的正確性。
2.21D-CNN數(shù)據(jù)處理層可視化
Dropout 層、ReLU層通過對輸入數(shù)據(jù)負(fù)值置零和神經(jīng)元的隨機(jī)失活,可提高網(wǎng)絡(luò)稀疏性,降低過擬合風(fēng)險,但并不改變數(shù)據(jù)維度。為定量分析Dropout 層、ReLU層前后完整特征變化,分別定義特征尺寸比例和特征層數(shù)為3和5;再采用Activations 函數(shù)激活并保存Dropout 和ReLU 層數(shù)據(jù);最后,通過AugmentedImageDatastore 函數(shù)提取目標(biāo)層完整數(shù)據(jù)特征。如圖4 和圖5 所示,輸入數(shù)據(jù)經(jīng)過Dropout 層峰值區(qū)間為[-1.706,1.811],尺寸為2 048×1 501,經(jīng)ReLU 層后峰值區(qū)間為[0,1.811],該圖顯示數(shù)據(jù)特征在正值和數(shù)據(jù)尺寸不變情況下,負(fù)值置零,驗證了ReLU 激活層的功能。
3 20層BENCHMARK 模型地震響應(yīng)控制仿真分析
3.1神經(jīng)網(wǎng)絡(luò)框架設(shè)計
因深度學(xué)習(xí)超參數(shù)的取值尚無規(guī)范化的方式,考慮到網(wǎng)絡(luò)訓(xùn)練精度和控制器的控制效果等因素,采用試算的方式加以確定,最終獲取的網(wǎng)絡(luò)框架為:數(shù)據(jù)輸入層(image input layer)、一維卷積層(convolution layer)、防過擬合層(dropout layer)、一維池化層(maxpooling layer)、全連接層(fully connected layer)和線性回歸層(regression layer)。數(shù)據(jù)訓(xùn)練時采用32個3×1和64 個2×1的卷積核,池化尺寸與對應(yīng)層卷積核尺寸相等;Dropout 率取0.2,激活函數(shù)選擇線性修正單元(ReLU),初始學(xué)習(xí)率為0.003,最大訓(xùn)練步為500,學(xué)習(xí)率下降周期為150,學(xué)習(xí)速率下降因子取0.5。
3.2整體控制器設(shè)計
文中選用ASCE 設(shè)計的Benchmark 模型第3階段20層鋼benchmark模型[20] 作為算例,該模型采用Rayleigh 阻尼,前二階振型阻尼比均取0.05。為獲取足夠多訓(xùn)練數(shù)據(jù),每層均布置作動器與傳感器(即作動器與傳感器數(shù)量為20,每層各布置1 個),其余Benchmark 模型結(jié)構(gòu)參數(shù)如表2所示。以地震波作為外部激勵作用于該模型,將模型的位移、速度、加速度響應(yīng)作為1D-CNN 數(shù)據(jù)集(61×1501維)。數(shù)據(jù)集輸入1D-CNN 前進(jìn)行數(shù)據(jù)分割,取數(shù)據(jù)集前2/3 作為訓(xùn)練集,后1/3作為測試集。通過訓(xùn)練集對1D-CNN 進(jìn)行指定精度訓(xùn)練,測試集測試未滿足精度返回訓(xùn)練集重新迭代,滿足精度后作為1D-CNN 智能控制模塊輸入控制系統(tǒng)。最終生成作動器控制力后作用于Benchmark 模型,從而完成結(jié)構(gòu)數(shù)據(jù)的快速接收、分析、控制振動的任務(wù),1D-CNN智能控制器具體仿真流程如圖6所示。
3.3控制效果對比
為直觀了解深度學(xué)習(xí)控制仿真效果,將持時30s的El-centro 波(加速度峰值為3.417 m/s2)作為外界激勵輸入神經(jīng)網(wǎng)絡(luò),采用1D-CNN 對3.2節(jié)模型進(jìn)行振動控制,并與BP、RBF 等淺層學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)行對比。圖7為不同神經(jīng)網(wǎng)絡(luò)控制時程曲線,可以看出,位移和加速度響應(yīng)峰值在不同時間點發(fā)生偏移,這是由于控制力的輸入改變被控系統(tǒng)極點位置所致;相較于無控狀態(tài),頂層加速度和位移響應(yīng)通過神經(jīng)網(wǎng)絡(luò)控制后均有所下降,但1D-CNN 控制下的響應(yīng)明顯小于淺層學(xué)習(xí),說明了深度學(xué)習(xí)的控制效果均優(yōu)于淺層學(xué)習(xí)。圖8 為各神經(jīng)網(wǎng)絡(luò)頂層控制力時程曲線圖與各層最大控制力,為直觀展示卷積神經(jīng)網(wǎng)絡(luò)的特點,采用同為200次迭代次數(shù)的BP 和RBF 神經(jīng)網(wǎng)絡(luò)與其進(jìn)行對比。為便于觀測,取峰值波動最大的前0~10s部分?jǐn)?shù)據(jù)進(jìn)行分析,由圖8(a)~(c)可知,保持相同迭代次數(shù)情況下,相較于RBF和BP神經(jīng)網(wǎng)絡(luò)預(yù)測中出現(xiàn)的過擬合現(xiàn)象,1D-CNN 預(yù)測效果最好,預(yù)測數(shù)據(jù)更貼近計算值。由圖8(d)可知,隨著樓層的增高,模型振動控制所需的控制力越小;3種神經(jīng)網(wǎng)絡(luò)中,1D-CNN 網(wǎng)絡(luò)各層控制力預(yù)測值與計算值差值最小,1D-CNN、RBF 和BP神經(jīng)網(wǎng)絡(luò)最大差值分別為5.4%、17.2%和21.3%。
El-centro 地震波激勵下無控、BP、RBF和1D-CNN控制的結(jié)構(gòu)各層最大位移和最大絕對加速度響應(yīng)如圖9所示。比較BP、RBF和CNN樓層響應(yīng)圖可以發(fā)現(xiàn),3種控制器對絕對加速度的控制最優(yōu)效果在第9層,由無控狀態(tài)下的4.19m/s2分別下降到2.70 、2.65 、1.28 m/s2,減震率分別為35.6%、36.8% 和69.0%;最大位移由無控狀態(tài)的36.7 mm 分別下降到25.0 、21.4、16.3 mm,減震率分別為31.9%、41.7%和55.6%。綜上所述,1D-CNN 相較于淺層學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),具有更好的振動控制效果。
為研究1D-CNN 智能控制器泛化能力,采用El-centro波作為訓(xùn)練數(shù)據(jù),并添加該地震波作用下20 層benchmark 模型的地震響應(yīng)(位移、速度、加速度)以擴(kuò)充訓(xùn)練集,完成對1D-CNN 訓(xùn)練后將其輸入智能控制仿真系統(tǒng)。分別采用持時為30s、采樣頻率為0.02s/次的汶川波和某人工波(加速度峰值均取2 m/s2)作為外界激勵,作用于裝有智能控制系統(tǒng)的benchmark 模型,3種控制器控制效果如表3 所示。由表可知,1)更改外部激勵后,由于訓(xùn)練數(shù)據(jù)與外界激勵并不同源,神經(jīng)網(wǎng)絡(luò)非線性函數(shù)與新的地震響應(yīng)匹配度下降,3種控制器控制效果均有所降低,但1D-CNN降幅最小,減震率最高;2)BP、RBF 在更改訓(xùn)練集后,加速度減震率大幅下降,在人工波作用下BP、RBF在第5層減震率為15.1%和19.2%,在汶川波作用下BP、RBF 在第1層減震率分別為17.2% 和19.8%,均在20% 以下,而1D-CNN 減震率最低值為36.8%,位于第5層,由上述結(jié)果可知,1D-CNN 具有更好的泛化性。
4結(jié)論
文中將1D-CNN用于振動控制領(lǐng)域,提出基于1D-CNN 的高層建筑智能控制算法,通過構(gòu)造時間序列數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)模型、可視化中間層數(shù)據(jù)特征以及完成神經(jīng)網(wǎng)絡(luò)的振動控制仿真,得出主要結(jié)論如下。
1)根據(jù)1D-CNN理論可知,經(jīng)過雙層卷積、池化后,特征圖尺寸由32×1降至5×1,說明利用1D-CNN 對時間序列的敏感性,將其用于高層建筑振動控制數(shù)據(jù)的降維提取是切實可行的。
2)在采用相同訓(xùn)練數(shù)據(jù)的情況下,1D-CNN 預(yù)測的控制力時程曲線更貼近計算值,對于非線性數(shù)據(jù)集的預(yù)測能力相較于BP、RBF 等淺層神經(jīng)網(wǎng)絡(luò)具有預(yù)測精度更高的優(yōu)點。
3)在對20層benchmark 模型的振動控制仿真中,經(jīng)試算確定最優(yōu)參數(shù)后,1D-CNN加速度和位移減震率最高分別為69.0% 和55.6%,相較BP 和RBF 等淺層學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)具備更好的減震效果;改變不同地震激勵后,1D-CNN對結(jié)構(gòu)響應(yīng)的控制效果更為穩(wěn)定,最低減震率為36.8%,高于BP和RBF 神經(jīng)網(wǎng)絡(luò)的15.1% 和17.2%,即1D-CNN較BP和RBF等淺層學(xué)習(xí)具備更好的泛化性。