張 銳
(華設設計集團股份有限公司,江蘇 南京 210014)
在當前工程勘察中,對于土層劃分和土的參數確定傳統上主要依賴于CPT、SPT 等原位測試及取樣試驗,基于標貫擊數和錐尖阻力、側阻力等物理指標劃分地層一直是國內地質勘察工作者最常用的方法,也是最主要的經驗方法之一[1]。但是由于土的離散性以及收集的數據有限,很難對場地的分布有細致準確的描述。且鉆孔與鉆孔之間的距離間隔很大,尤其在公路、隧道等線性工程中,考慮到成本等因素,鉆孔的間隔甚至達到了100 m 以上,數據存在很大的不確定性。對于鉆孔之間的地層情況難以準確預測,鉆孔之間出現土的斷層、錯動影響[2],相鄰每個鉆孔測得的土層種類不一致等問題。因此,基于稀疏地層數據的插值擴充工作顯得格外重要。
香港城市大學WAND 等[3-5]基于美國某地靜力觸探實驗數據(錐尖阻力,側阻力)提出了一種基于貝葉斯壓縮感知(Bayesian Compressive Sampling,BCS)的鉆孔數據插值擴充方法。BCS 是傳統壓縮采樣(Compressive Sampling,CS)方法的概率擴展,其本質是從信號的部分信息中重構出一個信號的完整信息[6-7]。在巖土工程中,土層性質隨深度而變化,因此土層性質剖面可被視為信號進行分析。BCS 方法不僅能從有限的測量數據中合理地解釋土層性質剖面,而且還提供了量化與解釋剖面相關的統計不確定性的實用工具,量化的統計不確定性為分析的土性質剖面的準確性和可靠性提供了一個衡量標準[8-9]。
在得到充分的勘察數據之后,對于地層的劃分一直是研究的熱點問題,劃分結果的準確性關系到后期工程的安全性和可靠性。我國對土層劃分暫無統一的標準,實際工程勘察中多采用SPT 標貫實驗和取土鉆孔相結合的勘察方法,根據現場取出的實際土樣通過經驗判斷,確定土層的劃分。劉松玉等[10]對我國SPT 技術做出了全面的分析,目前采用的《巖土工程勘察規范》《水利水電工程地質勘察規范》和《公路工程地質勘察規范》中采用的分類標準都不盡相同。隨著科技的不斷進步,關于地層的劃分工作已經不僅僅局限于傳統的SPT 法、取土分析法等,近年來人工智能技術在工程勘察領域發展得十分迅速,SVM、聚類、神經網絡等在國內外地層劃分上也取得許多研究進展[11-13]。
本文基于蘇州某地塊的工程勘察數據進行實例計算分析,采用貝葉斯壓縮感知方法對貫入阻力數據進行二維插值擴充,得到整個勘察剖面的貫入阻力分布情況。隨后利用支持向量機(SVM)算法對擴充數據進行分類,得到整個地層剖面的劃分,從而實現基于少量鉆孔信息,即可得到較為準確的地層分布情況,為工程勘察提供智能化技術支持。
貝葉斯壓縮感知是一種信號處理技術,其最大優勢是可將收集的稀疏信號進行插值擴展,實現原始數據的重構,廣泛應用于各個領域。工程勘察可以認為是對地層數據的稀疏取樣,貝葉斯壓縮感知可根據稀疏數據有效地重構地層數據。例如地層剖面上的鉆孔測得的比貫入阻力可以用插值矩陣F來表示,F可以視為一個二維矩陣,維度大小為(Nx1×Nx2,可根據實際場地自行取值)。Nx1為深度方向長度,Nx2為水平方向長度,由于地層的信息為離散數據,需要用到插值輔助函數等一系列方法,插值矩陣F的計算公式如下:

式(1)為貝葉斯壓縮感知的基本公式,式中各類參數的計算和構造方法在下述小節將做出詳細介紹和推導。
式(1)中,Cx1(Nx1×Nx1)和Cx2(Nx2×Nx2)為離散余弦矩陣,AHMED 等[14]基于傅里葉變換法提出了離散余弦變化(DCT)公式,本研究對DCT 公式進行了展開,化簡為矩陣的形式,其數學公式較為復雜,但可利用Python代碼構建Cx1和Cx2矩陣,具體見表1。

表1 離散余弦矩陣構造

式(2)中,i表示Cx1的列,j表示Cx2的行,為了方便推導避免引起混淆,將二維索引i,j轉化為一維索引t。下標t是通過以升序對B2D列中的所有元素進行編號來定義的,即將二維矩陣按列展開,變為索引從1~Nx1×Nx2的一維數組。在同一列中,t隨著行數的增加而增加,例如則可以表示為

式中,Y為原始數據集(插值矩陣F的子矩陣),維度為與插值矩陣F的關系如式(4)所示:

A=為定位矩陣,反映了數據集Y作為插值矩陣F的子矩陣在F中的行列索引,可由單位矩陣輕松構造。D是維度為(Nx1×Nx2,Nx1×Nx2)的對角矩陣,其對角線的值為αi,如式(5)所示:

式中,M=Nx1×Nx2,c,d為超參數取值,可以使用HUANG等[15]人提出的策略迭代法獲得c和d,一般取值為0.000 1,C=IM×M+AD-1AT,I是單位矩陣,其維度為(Nx1×Nx2,Nx1×Nx2)。

本文選用蘇州蕾娜斯地塊場地靜力觸探實驗數據進行貝葉斯插值。場地擬建主體建筑為地上三層,地下一層,框架結構的多層古建及賓館。
如圖1 所示,選取該區域第2 剖面為研究場地,該場地剖面長度為113 m,靜力觸探孔編號7~12,共計6個,鉆孔水平間隔分別為23 m,22 m,25 m,23 m,20 m。該剖面在水平方向較為平整且鉆孔位于同一軸線上,計算誤差相對較小。

圖1 研究剖面示意圖
如圖2 所示,將鉆孔深度和對應的比貫入阻力畫成二維圖像,每組鉆孔深度為30 m,鉆孔的比貫入阻力沿深度方向間隔0.5 m,比貫入阻力由于土層不同,大致分布在0~15 MPa 之內(以7 號鉆孔為例,8~12 鉆孔同理)。

圖2 比貫入阻力原始數據
選取該剖面6 組鉆孔的比貫入阻力作為原始數據Y,沿深度方向維度為30/0.5=60,水平方向共計6 列數據維度為6,由此二維數組Y的維度為(30×6),即Mx1=30,Mx2=6。
確定完Y之后,結合場地信息預先定義場地參數,hx1,hx2表示剖面場地的深度和水平長度,hx1=30 m、hx2=113 m;ηx1,ηx2表示深度和水平方向上的數據間隔,ηx1=0.5 m、ηx2=1 m;則插值矩陣F的維度大小為hx1/ηx1=60,hx2/ηx2=113。在貝葉斯插值擴充后,每個鉆孔沿深度方向的比貫入阻力有60 組數據,水平方向場地113 m 的間距轉化為113 組矩陣的列向量,即插值矩陣F維度定義為(Nx1×Nx2=60×113)。Y作為插值矩陣的子集,6 列數據分別位于插值矩陣F的第0,23,45,70,93,112 列,后續將通過Y迭代計算,得到整個插值矩陣F的結果,從而實現數據擴充和預測未知區域比貫入阻力的目的。
由前述可知本研究剖面已經轉化為插值矩陣,將通過6 組原始數據Y進行貝葉斯插值,將一維的鉆孔比貫入阻力數據進行擴充,通過迭代計算得到插值矩陣F,即可得到113 m 剖面上所有位置的土層比貫入阻力數據,實現一維到二維的數據擴充。
離散余弦矩陣(DCT)取Nx1=60,Nx2=113,分別帶入表1 構建離散余弦函數Cx1(60×60),Cx2(113×113),計算結果如圖3 所示,Cx1,Cx2分別表示沿深度和水平方向上的變換方陣。

圖3 離散余弦矩陣Cx1,Cx2 計算結果

圖4 插值后的比貫入阻力分布圖
由圖4可知,比貫入阻力在研究剖面上成帶狀分布,深度方向呈現波動變化的特征。在插值矩陣0~10行(實際深度0~20 m 處)比貫入阻力分布較為均勻,在0~3 MPa 之間;插值矩陣15~25 行(實際深度7.5~12.5 m 處)比貫入阻力分布在4~6 MPa 之間;在插值矩陣30 行(實際深度15 m 處)附近區域為比貫入阻力最大區域,尤其在0~5、40~50 列之間出現了比貫入阻力的最大值14.1 MPa。數據之間存在明顯的分區域特征,為后續的土層劃分工作提供了重要保障。
為了驗證插值矩陣F的準確性,將地勘報告中的2 處未參與計算的鉆孔數據的插值預測結果與該處真實的地勘數據進行比對,如圖5 所示。
由圖5可知,預測的插值曲線與原始數據較為吻合,整體走勢也保持一致,在25~28 m 處個別點位略有偏差。這可能是由于鉆孔不完全在二維垂直剖面內,鉆孔不完全垂直于土層剖面,且土層的不確定性較高,插值后仍有可能出現小偏差的情況。從另一方面來說出現小部分點位偏差,可增強模型泛化能力,避免出現過擬合現象。

圖5 插值結果與原始數據對比圖
支持向量機SVM 是監督學習中一種常見的分類算法,SVM 在各種實際問題中都表現非常優秀。但是在工程勘察中,利用SVM 對地層進行劃分的研究目前在國內外相對較少,本節將基于SVM 的強學習能力,結合周邊場地的地勘數據,提出一種新的地層分類模型。
支持向量機的基本原理非常容易理解。如圖6 所示,這是一組兩種標簽的數據,兩種土層所包含的參數(本文采用的為比貫入阻力)分別由實心圓和空心圓代表。支持向量機的分類方法,是在這組分布中找出一個超平面(二維坐標系為直線)作為決策邊界,使模型在數據上的分類誤差盡量接近于0,尤其是在未知數據集上的分類誤差(泛化誤差)盡量小,對兩種不同特征的數據進行有效的劃分。因此,支持向量分類器又叫作最大邊際分類器。

圖6 SVM 原理圖
為了更好地適應本研究所在剖面地層的分布情況,做到具體問題具體分析,本研究搜集了部分周邊場地的比貫入阻力與深度的地勘數據,以及對應數據點的地層名稱,并繪制成散點圖,如圖7 所示。訓練集數據的橫縱坐標為比貫入阻力和深度,按照地層編號沿深度方向分布可分為7 類:填土、粘土、粉質粘土、粉土與粉砂、粉質粘土、粘土、粉質粘土。

圖7 SVM 訓練集數據圖
由圖7可知,該地塊土的類型主要分為7 類,在SVM 中,此數據集可看作7 分類的數據問題,找到6個超平面將數據進行劃分。劃分模型完成后,將第三節研究剖面計算得到的插值矩陣元素點帶入模型,進行逐點的預測并畫出地層剖面圖。
將場地周邊數據分為3 列向量,前兩列分別為每個數據點的深度、比貫入阻力,最后一列為該點對應的土層類型;然后將土層類型實例化,即將填土、粘土、粉質粘土、粉土與粉砂、粉質粘土、粘土、粉質粘土分別定義為數字1~7;最終將三列向量組合成矩陣形式作為訓練集輸入SVM 模型進行計算,結果如圖8 所示。

圖8 SVM 分類結果圖
由圖8可知,本文用Python 將SVM 分類結果可視化,把16×35 的區域進行網格劃分,不同顏色的區域內通過線性函數分割,分別代表不同的土層分類。分類結果準確率為95.56%,區域中心數據分類基本無誤,但是由于數據量較大,且實測數據也可能出現誤差,在邊界處不可避免地出現數據交匯現象導致部分數據分類錯誤。分類模型建立后,將第三節的插值矩陣中6 780個像素點帶入模型預測每一個像素點的分類,并畫出二維散點圖,如圖9 所示。

圖9 線性核函數預測結果圖
由圖9可知,將研究場地的標貫擊數插值結果帶入分類模型后,6 780個數據點分別劃分到不同顏色的區域當中,此時,每一個數據點都得到了相對應的土層編號1~7,從而完成了對插值數據的預測。最終將預測得到的土層編號作為像素點的顏色,得到地層劃分剖面圖,如圖10 所示。

圖10 地層剖面劃分結果圖
由圖10可知,黑色虛線為地勘報告中所給出的地層劃分線,在0~5 行為填土(編號1)、5~10 行為粘土(編號2)以及49~60 行為粉質粘土(編號7)分類效果非常準確;在15~30 列紅色粉質粘土(編號3)的下邊界、34~36 行粉色區域(編號5)的上邊界存在多個像素點分類錯誤,考慮到此處地層有起伏,且位于不同地層的交界處,數據在此交匯較多,出現分類誤差。總體地層的走勢較為清晰。分類較為準確,但土層分界處的分類情況與真實地層分布還存在一定的差距。6 780個像素點分類準確的個數為6 448個,準確率為95.10%。
本文以蘇州蕾娜斯地塊某場地勘察剖面為研究對象,通過對比貫入阻力數據進行貝葉斯插值,對整個剖面場地進行了地勘數據擴充。在插值結果的基礎上利用支持向量機模型對插值后的數據進行分類,得到最終的地層剖面圖。隨后與實際的地層劃分做出對比,計算了模型分類的準確率,主要結論如下。
(1)貝葉斯插值源于信號重建原理,對于土層這種離散性大,不確定性高的研究對象非常合適。切合工程實際,只需少量數據即可最大程度反推地層信息,提高了勘察結果的準確性。
(2)蘇州蕾娜斯地塊的比貫入阻力數據集有明顯的分塊特征,屬于線性可分數據,支持向量機SVM 在處理線性分類問題時較其他算法表現更加優異,且加入了周邊場地的地勘數據作為先驗條件,大大加強了分類的準確性。
(3)本文采用的數據集是比貫入阻力,所提出的方法不僅僅適用于比貫入阻力一個物理量,涉及地層的任意物理量,例如標貫擊數、內摩擦角等都可以進行插值擴充和地層劃分。所以本文提出的模型具有一定的泛化能力,能夠適應各類工程勘察項目,具有很強的實用性。