李 繼 平,趙 宇 飛,劉 必 旺,王 文 博
(1.中國水利水電科學研究院,北京 100038; 2.中國水利水電第八工程局有限公司,湖南 長沙 410007; 3.中國水利水電第六工程局有限公司,遼寧 沈陽 110179)
軟土地基常包括淤泥質土、軟黏性土以及濕陷性黃土地基等[1-2]。這類地基強度低、壓縮性高、易液化,對其上部的工程建筑物安全穩定有著極大的隱患。針對此類問題,國內外普遍采用振沖碎石樁對軟弱地基進行置換和排水處理,以此提高地基的承載力,而精準掌握軟弱地基的地質信息是采用振沖碎石樁加固處理的前提和基礎。
在振沖碎石樁施工前,通常在已掌握區域地層特征的基礎上,采用現場鉆孔取土與室內外試驗相結合的方法綜合評價軟弱地基的地質條件,并以此作為確定振沖碎石樁施工工藝的設計依據。但是在實際工程中,對于軟弱地基的勘探數量較少,再加上軟弱地層的形成過程、地層產狀與賦存條件較為復雜,很難通過較少的勘探資料全面掌握整個地基加固區域中所有軟弱地層的分布情況[3]。針對此類問題,國內外研究者利用施工過程中監測到的各類參數,通過數學模型、機器學習以及大數據挖掘等方法對各類地層巖石特性的辨識進行了大量研究。Esmaeilzadeh[4]等利用基于差分進化優化算法的模糊C均值聚類方法有效識別了巖體的結構面。Kitzig[5]等通過將巖石物理與地球化學數據相結合進行巖體聚類分析,能有效地識別巖石物理結構和巖石力學性質的潛能。譚英卓、周澤宏[6-7]等通過鉆進參數的模型分析,對不同巖層的類型進行了有效的辨識。熊虎林[8]等利用鉆進參數與地層類型,通過神經網絡模型對鉆進速率進行了有效預測,可見鉆進工程中的各類參數與地層類型是密切相關的。
本文研究對象為金沙江拉哇水電工程的振沖碎石樁加固圍堰地基工程,該圍堰地基的地質條件復雜,各地層類型分布變化大。該碎石樁加固工程利用SV70碎石樁機伸縮式導桿連接振沖器,運用“水氣聯動”的方法進行造孔。同時通過安裝在不同設備上的傳感器,實現了對振沖施工過程深度、電流、電壓、水量、水壓、氣壓、填料密度等的實時監控,從而對整個施工過程進行動態跟蹤。如何利用海量采集的數據對振沖碎石樁成孔過程中的地層進行有效辨識分析,對后續進行振沖碎石樁施工質量控制與振沖碎石樁智能化施工管理有著重要的指導意義。
本文基于以往工程的研究案例,結合前述工程振沖碎石樁施工過程的實時監測數據,在成樁過程能量消耗的基礎上引入碎石樁鉆進比功的概念,通過對不同維度參數的地層鉆進展開類型辨識分析,并用聚類評估指標篩選出最有效的地層類型辨識聚類算法,以為類似的工程成樁質量控制提供技術支撐。
該工程樞紐區河床覆蓋層最大深度為71.4 m,主要為河流沖積物、湖相沉積物以及岸坡坡積物等。通過現場鉆孔取土與室內外試驗勘探得到的河床覆蓋層性狀如圖1所示。上游圍堰地基河床覆蓋層最厚約65~68 m,由上至下分別Qal-5沖積砂卵石層,厚度1.4~4.6 m;Ql-3堰塞湖靜水沉積砂質粉土,厚度14.7~18.1 m;Ql-2堰塞湖沉積層可細分為Q1-2-③黏土層,Q1-2-②砂質粉土層與Ql-2-①粉土層3個亞層,層厚約31.4 m。底部Qal-1為以沖積為主的卵石、塊石層,厚度約4.6~5.0 m。

圖1 河床覆蓋層性狀
由于前期初步勘察鉆探數量有限,得到的深厚覆蓋層地層分界及地質信息并不十分精準,但是作為最直接及最基礎的地質信息,它可以作為后期利用鉆進參數來辨識地層類型的參考依據。
隨著智能化施工管理與物聯網技術的不斷發展,該工程在振沖碎石樁施工設備上安裝了多種智能傳感器,以獲取振沖器的深度、電流、速率、留振時間以及樁體填料量等重要施工信息。同時利用無線傳輸方式將各類數據傳輸到智能化監控系統中,實現對碎石樁施工過程進行實時監控與優化管理。安裝在振沖碎石樁設備上的信息采集傳感器按照每秒1 條的頻率進行施工數據的采集與傳輸。一根深40 m的振沖碎石樁將會產生約8 000條數據,該圍堰地基處理所需的振沖碎石樁超過2 600根,整個施工過程中共收集了超過2 200 萬條數據。通過這些實時采集的施工數據,能夠繪制碎石樁施工過程中工作深度、加密電流、填料量、實時樁形與留振時間之間的過程曲線。
獲取的振沖碎石樁施工參數不是獨立的數據,各參數和地層屬性之間存在一定的對應關系。這些重要的監測數據不僅能反映施工狀況,還能反映出不同地質條件下的地層特性,尤其是在樁成孔的過程中,經歷河床不同覆蓋層物質時鉆孔的速度以及所需的加密電流都不盡相同。因此本文選取成孔過程中的數據作為原始數據集,并在此基礎上進行圍堰地層類型的辨識。
對于如何選取碎石樁數據,主要考慮了振沖碎石樁鉆孔分布位置,同時兼顧不同區域中振沖碎石樁施工信息相互校核與對比分析便利性的需要。
根據上述選取原則,本次的地層聚類分析選取6組水平方向的碎石樁數據,每組有3根進尺成孔數據樁,共18根數據樁。選取樁分布位置如圖2所示。為了使每根施工的碎石樁機所采集的數據盡可能地表征出同類地層區域的施工動態,所選取不同組的3根樁對應的編號均相同,分別為9,10,11。
對施工數據進行深度挖掘與分析之前,需要對數據進行一系列的處理,從而提取出有價值的數據進行地層分類研究,主要包括剔除無效數據、刪除重復數據、數據歸類整理等方面內容。振沖碎石樁施工過程中的異常數據主要是指不符合鉆進時間序列趨勢,不能反映鉆進過程真實狀態的的監測值。本文對碎石樁監測數據處理如下:
定義碎石樁監測過程中進尺深度樣本Hk的樣本集組成為
Hk={h1,h2,h3…hm} (k=1,2,…m)
(1)
在單位時間序列中應當有hm-1≤hm,剔除樣本中不符合該序列的樣本值,同時保留進尺深度隨時間不變的初始值以及對應電流值。
定義監測過程中進尺深度對應的電流樣本Ik的樣本集組成為
Ik={i1,i2,i3…im}
(2)
在碎石樁鉆孔施工過程中應當有著im≠0,剔除電流值為0的樣本,以及對應的進尺深度值。
巖土工程中常根據儀器鉆進過程中的參數與能量變化對巖層結構進行分類。譚卓英、岳中琦等[9-10]根據花崗巖鉆進過程中的能量變化對其進行了實時分級。田昊等[11]、張幼振等[12]利用鉆進中的能量變化,分別對隧道凝灰巖、含煤地層界面進行了識別分類。許明等[13]利用隨鉆參數與地層比功對持力層進行了有效判定。本文利用安裝在振沖器上的傳感器,對振沖施工過程的深度、電流、電壓等數據進行實時采集,并提出振沖碎石樁在鉆進過程中的鉆進比功概念。
定義振沖碎石樁鉆進比功為
(3)
式中:W=UIt,為碎石樁鉆進過程單位時間所做的功,J;U為鉆進電壓,V;I為鉆進時電流,A;t為單位鉆進時間,s。Q=Svt,為碎石樁單位時間鉆進的地層體積,cm3;S為碎石樁鉆孔接觸面積,cm2;v為單位鉆進速率,cm3。
在碎石樁實際鉆進過程中,由于鉆速很小,且該施工的地基土層以粉質砂土與低液限黏土為主,所以軸向方向的黏滯力可以忽略不計,碎石樁做功可以全部當作破碎土層所消耗的能量。不同地層類型的巖性存在差異,隨著鉆進時間的推進,在不同類型地層中所消耗的能量會不同,與其對應的鉆進比功也不同。部分振沖碎石樁的鉆進時間與鉆進比功關系如圖3所示。
由圖3可知,振沖碎石樁在不斷鉆進的過程中,在不同類型的地質層中,對應的鉆進比功有著顯著的不同。當遇到軟弱地層時,其鉆破地層所消耗的能量少,對應的鉆進比功較低。當鉆進到區域性較硬的塊石與卵石層時,其鉆進比功會在一定峰值處穩定波動。為了進一步驗證進尺深度與鉆進過程的能量消耗情況,選取ⅡA-3609數據樁分析其在鉆進過程的進尺深度與鉆進比功的關系,如圖4所示。

圖4 進尺深度與鉆進比功關系
由圖4可知,此根數據樁所鉆進的地層區域中,鉆進比功隨著地層軟弱程度的減弱而增大。當進入中部Ql-2的堰塞湖相沉積層時,由于該地層主要為砂質低液限黏土層,強度低、易液化,故消耗的能量較低,對應的鉆進比功也較低。當碰觸到黏土層的部分卵石等堅硬塊石時,消耗的鉆進能量會在局部突然增大。當鉆進到底部Qal-1層時,由于此類地層主要為較硬的卵石、塊石等,故鉆進消耗的能量增加,其對應的鉆進比功也會穩定在較高范圍??梢娝槭瘶对阢@進過程中的鉆進比功與地層軟硬特性有著顯著的相關關系。基于此,本文根據鉆進過程中的比功變化,對相應的鉆進參數進行不同方法聚類分析,從而獲得較為準確的地層類型分布情況與最合適的地層聚類方法。
學術界有關聚類的解釋,普遍采用的是Everitt在1974年關于聚類所提出的定義:一個類簇內的實體是相似的,不同類簇的實體是不相似的;一個類簇是測試空間中點的會聚,同一類簇的任意兩個點間的距離小于不同類簇的任意兩個點間的距離;類簇可以描述為一個包含密度相對較高的點集的多維空間中的連通區域,它們借助于包含密度相對較低的點集的區域與其他區域(類簇)相分離。
聚類算法在多關系數據的挖掘與機器學習中得到了廣泛的應用與發展,但是在巖土工程領域中的應用相對較少。常見的聚類算法類型有基于劃分的聚類、密度聚類、譜聚類等。為了探索適用本文數據挖掘的聚類方法,本文在各聚類方法中各選出一種代表性的聚類算法,同時結合振沖碎石樁鉆進數據的特點,選用了以下幾種聚類算法對碎石樁的參數進行挖掘與分析:基于高斯混合模型(GMM)最大期望(EM)的聚類[14]、凝聚層次(AGNES)聚類[15-17]、K-Means聚類[18-20]、基于密度(DBSCAN)的聚類[21-22]以及均值漂移(MeanShift)聚類[23-24]。在對6組碎石樁數據進行預處理后,結合不同地層中的鉆進比功與地質類型的關系,決定選取進尺深度、鉆進電流與鉆進比功3個維度進行聚類算法的處理。
由于樁孔數量較多,本文選取ⅡA-3609、ⅡA-3809兩根數據樁孔的聚類結果進行分析說明。在同一種聚類算法的聚類結果中,不同的簇類顏色代表在鉆進過程中該段地層可以劃分出不同的地質類型。具體聚類結果如圖5~9所示。

圖6 DBSCAN聚類結果

圖7 K-Means聚類結果

圖8 AGNES聚類結果

圖9 MeanShit聚類結果
從5組聚類結果可知,ⅡA-3609、ⅡA-3809兩根數據樁分別從地基深度18.6 m與22.8 m處進行聚類分析,該深度以上沒有為圍堰地基加固施工中打入的旋挖護筒,因此,不對該深度以上數據開展分析。
由圖5~9可知,在基于高斯混合模型的最大期望聚類(GMM-EM)與DBSCAN聚類的結果圖中,各簇點交叉混亂、噪聲點較多、聚類效果較差,且隨進尺深度不斷的推進,沒有明顯的地層分層效果,表明這兩種聚類算法不適用于本工程的地層辨識。而通過K-Means聚類、凝聚層次法(AGNES)以及MeanShift聚類的分析結果圖可以看出,這3種聚類在隨進尺深度推進過程中,均能較明顯地把碎石樁將要加固的地層分為3簇,這表明ⅡA-3609、ⅡA-3809兩根樁所鉆入的地層深度是可以劃分為3類不同性狀的地質類型的。這與前期的地質初勘相吻合,即對應Q1-2層的砂質低液限黏土層的3個亞層Ql-2-③、Ql-2-②與Ql-2-①。
在K-Means聚類結果中:ⅡA-3609碎石樁所在的Ql-2-③層深度在18.6~28.0 m左右,Ql-2-②層深度在28.0~41.0 m左右,Ql-2-①層深度在41.0~51.0 m左右,其整個Q1-2層的砂質低液限黏土層厚度為32.4 m左右。在MeanShift聚類結果中:ⅡA-3609碎石樁所在的Ql-2-③層深度在18.6~30.0 m左右,Ql-2-②層深度在30.0~42.6 m左右,Ql-2-①層深度在42.6~51.5 m左右,其整個Q1-2層的砂質低液限黏土層厚度為32.9 m左右。在AGNES聚類結果中:ⅡA-3609碎石樁所在的Ql-2-③層深度在18.6~34.0 m左右,Ql-2-②層深度在34.0~39.0 m左右,Ql-2-①層深度在39.0~50.1 m左右,其整個Q1-2層的砂質低液限黏土層厚度為31.5 m左右。ⅡA-3809碎石樁所在的Ql-2-③層深度在22.8~38.0 m左右,Ql-2-②層深度在38.0~45.0 m左右,Ql-2-①層深度在45.0~54.4 m左右,其整個Q1-2層的砂質低液限黏土層厚度為31.6 m左右。AGNES聚類結果與初步勘探圍堰地基的低液限黏土層厚度31.4 m基本吻合,也表明利用合適的聚類算法是能較準確地識別地層類型的。
判斷聚類的精準度是數據挖掘中必須要做的工作,主要采用相關評估指標來判斷。評估指標可分為內部評估指標與外部評估指標,外部評估指標需要知曉數據類別或進行標注,而內部評估指標則不需要。在實際工程中,很少有標注數據能幫助進行聚類,故常選用內部評估指標進行聚類效果評估。
本文結合以往學者所做的研究,選用輪廓系數(SC)[25-26]、Calinski-Haraba(CH)指數[27]和Davies-Bouldin(DB)指數[28]3種常見的內部評估指標進行聚類效果的評估。
4.2.1輪廓系數(Silhouette Coefficient)
輪廓系數最早由Rousseeuw于1986年提出。它結合內聚度和分離度兩種因素,可以用來在相同原始數據的基礎上評價不同算法對聚類結果所產生的影響。對于樣本i,輪廓系數S(i)數學定義如下:
(4)
式中:a,b分別代表樣本i到同一簇和不同簇所有樣本距離的平均值。S(i)的取值范圍為-1~1,其數值越大,說明b越大于a,即樣本距同一簇的距離越近,距不同簇的距離越遠,樣本的聚類劃分越合理,效果越好。
4.2.2Calinski-Harabaz指數
CH指數于1974年被提出,又被稱為方差比標準,為簇內色散平均值與簇間色散的比值。其數學定義如下:
(5)
式中:k表示聚類的數目;N為數據的點數;Tr(Bk)為簇內色散矩陣的跡;Tr(Ak)為簇間色散矩陣的跡。
(6)
(7)
式中:Nk表示歸屬于簇k的樣本數量,ck代表簇k的中心點,Ck表示歸屬于簇k的樣本,c表示所有樣本的中心點。CH數值越大,說明簇間協方差越大,簇內協方差越小,整體聚類效果越好。
4.2.3Davies-Bouldin指數
Davies-Bouldin(DB)指數是計算所有簇的簇內平均距離與不同簇類中心距離的比值,并求其最大值,該指標的計算公式如下:
(8)
其中,簇a和簇b的相似度Sab定義如下:
(9)
式中:da表示簇a中所有樣本與簇a中心點的平均距離;dab代表簇a和簇b中心點之間的距離(a≠b)。DB值越小意味著簇內距離越小,同時簇間距離越大,整體的聚類效果就越好。
利用上述3類評估指標,對碎石樁鉆進數據集的聚類效果進行檢驗分析,對所有數據樁聚類的3種評估指標具體分析如表1~3所列。

表1 輪廓系數數值指標

表2 CH數值指標

表3 DB數值指標
由表1~3可知:AGNES聚類、K-Means聚類以及MeanShift聚類的輪廓系數與CH指數的取值范圍與均值明顯高于GMM-EM聚類與DBSCAN聚類。其中AGNES聚類的輪廓系數與CH指數的取值范圍最大。同時AGNES聚類的DB指數范圍與均值也低于其他幾類聚類算法。結合AGNES聚類和MeanShift聚類的地層辨識分析結果可知:AGNES聚類算法在Ql-2-③層的聚類結果為18.6~34.0 m,在Ql-2-②層的聚類結果為34.0~39.0 m,在Ql-2-①層的聚類結果為39.0~50.1 m。整個Q1-2層的聚類深度為31.5 m左右,這與圍堰地基中初步勘探得到的低液限黏土層厚度是吻合的。
綜上所述,通過對進尺深度、鉆進電流與鉆進比功3個方面指標進行不同的聚類算法分析后,再對各聚類方法進行聚類效果評估分析,發現 AGNES聚類算法是適用于該工程圍堰地基地層辨識的有效方法。另外通過評價聚類效果的評價指標來看,所選用的地層識別聚類方法是合適的,為其他類似的大數據聚類分析方法選擇提供了重要參考。
本文基于振沖碎石樁施工過程中的實時監測數據提出了振沖碎石樁鉆進比功的概念,并通過聚類分析開展不同進尺深度的地層類型辨識。利用輪廓系數、DB指數和CH指數來對各聚類算法的地層辨識效果進行評估,為工程中地層類型的辨識篩選出最合適的聚類算法,主要結論如下:
(1) 振沖碎石樁在成樁過程中消耗的能量會因地層物理力學特性的不同而變化,在軟弱地層消耗能量低,堅硬巖層則較高。提出的振沖鉆進比功可有效表征不同的地層類型。
(2) 本文所選取的進尺深度、電流與鉆進比功3個指標與復雜地層分類有較強的相關性。通過聚類結果與評估指標可知,K-Means聚類、AGNES聚類與MeanShift聚類這3種聚類算法能較準確地辨識不同的地層類型,其中AGNES聚類效果最好。
(3) 凝聚層次(AGNES)聚類算法可以根據樁成孔過程采集的特征參數,對復雜地層進行有效辨識,從而實現對需要加固的軟弱地層信息的快速獲取。
本文通過對振沖碎石樁施工數據的深入挖掘分析進而開展不同地層類型的辨識,為振沖碎石樁施工成樁過程中的質量控制指標確定提供了重要技術支撐,也為分析振沖碎石樁施工后形成的復合地基綜合物理力學特性提供了基礎資料。