文:胡松丨上海市隧道工程軌道交通設計研究院
經過多年建設,軌道交通項目沉淀了大量歷史數據。鑒于近期軌道交通造價控制要求的提高,結合歷史造價數據,利用合適的數學工具分析輔助設計人員進行車站土建造價快速且準確估算,是具有較高使用意義和迫切性的。筆者選取10個造價特征值,利用20個明挖車站樣本,采用BP神經網絡算法進行造價預測分析,探討利用歷史造價資料預測車站土建造價的可行性。
因城市軌道交通項目投資大、涉及面廣,不同地區、不同環境和地質條件的造價指標差異很大。在項目前期階段,設計方案深度不足項目造價分析較為依賴設計人員自身經驗。因此,合理利用軌道交通項目歷史數據能有效提升前期造價分析的準確性,輔助設計人員進行估算分析及決策。
1.軌道交通造價構成
軌道交通項目造價主要由四部分組成,分別是工程費用、工程建設其他費用,預備費及專項費用。工程費用按照專業類別細分為,車站、區間、軌道、通信、信號等16項;工程建設其他費用包括前期工程和其他費用;預備費主要為基本預備費;專項費用包括車輛購置費、建設期利息、鋪底流動資金。
2.確定本次模擬預測對象
軌道交通項目造價組成中,工程費用主要受項目技術標準影響,前期工程費主要受項目實際外部條件影響。從利用既有歷史數據角度看,軌道交通項目外部因素較為復雜多變,而軌道交通技術標準相對穩定,歷史工程費用更加具有參考價值。
車站土建工程一方面受工程技術標準影響,另一方面受地質環境、材料價格波動等少量外部因素影響,其造價估算需要統籌把握內外影響因素,更依賴設計人員自身的經驗。鑒于近期軌道交通造價控制要求的提高,以及設計方案深化和比選的需要,結合歷史造價數據,利用合適的數學工具分析輔助設計人員進行車站土建造價快速且準確估算,是具有較高使用意義和迫切性的。因此,本次研究選取車站土建造價作為預測分析對象。
3.方法概述
BP(Back Propagation)神經網絡是一種按誤差逆傳播算法訓練的多層前饋網絡,可用于分類、預測,該算法需要有一定規模的歷史數據,通過大數據的訓練,神經網絡算法可以學到數據中隱含的知識。
BP算法包括信號的前向傳播和誤差的反向傳播兩個過程。即計算誤差輸出時按從輸入到輸出的方向進行,而調整權值和閾值則從輸出到輸入的方向進行。通過調整輸入節點與隱層節點的聯接強度和隱層節點與輸出節點的聯接強度以及閾值,使誤差沿梯度方向下降,經過反復學習訓練,確定與最小誤差相對應的網絡參數(權值和閾值),此時經過訓練的神經網絡即能對類似樣本的輸入信息,自行處理輸出誤差最小的經過非線性轉換的信息。
4.適用性
車站造價影響因素較多,無法較為準確確定各影響因素與車站造價結果的準確數學方程關系。但是經過多年建設,存在較多的歷史數據,每個車站的造價影響因素和最終造價均是確定的,即BP神經網絡訓練模型中的輸入和輸出均已明確。
不同車站造價之間既存在一定的邏輯關系,又有其獨有的方案特征,若要大規模預測車站造價,既需要設計人員具有較高的專業素養,又需要投入大量精力。BP神經網絡是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,無需事先確定輸入輸出之間映射關系的數學方程,僅通過自身的訓練,學習某種規則,在給定輸入值時得到最接近期望輸出值的結果。BP神經網絡預測模型既能夠充分利用歷史數據,又不需要進行復雜的工程量分析和價格水平分析,也不需要人為預設復雜的數學邏輯。這一特性就很好地解決了目前車站造價預測中存在的痛點。
1.選取影響因素
影響因素的選取,首先要考慮有效反映對造價構成有影響的核心參數,其次要反映工程本身的特點,再次考慮在前期階段該參數的獲取難易程度,最后考慮參數之間的相互覆蓋程度,精簡參數。
從車站土建造價構成上看,主要分為圍護工程、土石方及支撐工程、內部結構工程、地基加固工程幾個部分。各部分造價,又根據工程施工方案和結構形式,在項目特征、工程量上有所區別。如:圍護工程,根據結構形式,可分為地下連續墻、鉆孔圍護樁、SMW插拔型鋼、TRD工法墻等。
從車站建筑構成形式上看,主要分為主體、出入口通道、風亭風道幾個部分。車站主體結構一般具有相似性,其輪廓多為類矩形,主要受車站長度、車站寬度、車站埋深控制;附屬結構(出入口通道、風亭風道)則多根據實際選址,結合周邊地塊條件布置,其結構輪廓與施工方法選擇較為多樣化。
地鐵車站土建造價的影響因素眾多,且不確定性大,其造價與其自身特征又具有高度的非線性關系,因此車站造價預測研究的關鍵在于造價影響因素的選取。
筆者結合掌握的實際工程數據及本文出于探索驗證BP神經網絡在造價分析上的實用性目的,針對上海地區明挖車站進行BP神經網絡造價分析,人為控制部分變量(如施工方法、圍護形式、有無地基加固等)。
根據設計經驗,暫定車站規模(建筑面積)、主體面積、車站長度、車站寬度、主體層數、車站埋深、C35抗滲混凝土價格、鋼筋單價、人工單價等因素作為特征變量。搜集整理到20組上海地鐵車站工程特征值及車站造價數據(表1)。

表1 車站特征值及造價統計表
2.數據處理及參數設定
首先,為消除參數自身數據量綱及數量級因素對分析結果的影響,要對樣本數據進行歸一化處理,將其線性壓縮至[0~1],再進行神經網絡預測分析。歸一化是一種簡化計算的方式,即將有量綱的表達式,經過變換,化為無量綱的表達式,成為純量。目的是:
(1)避免具有不同物理意義和量綱的輸入變量不能平等使用;
(2)歸一化能夠防止凈輸入絕對值過大引起的神經元輸出飽和現象;
(3)保證輸出數據中數值小的不被吞食。
將9個特征變量作為神經網絡的輸入層神經元節點,隱含層數為1,隱含層神經元個數定為8,車站造價作為輸出神經元節點。選用logsig作為輸入層到隱含層的激活函數,選用purelin作為隱含層到輸出層的激活函數。選用trainlm做為訓練函數,MSE作為損失函數。相應參數設定為,最大循環次數1000,目標誤差1x10^-7,其他參數設為默認值。
從20個樣本中,隨機選擇3個鋼筋單價、人工單價不同的樣本作為驗證數據,排于表格最后3行,便于數據處理(表1已按此排序)。前17個作為訓練數據,后3個作為驗證數據,依據上述BP神經網絡相關參數設置,進行MATLAB模擬仿真分析。根據分析結果,第5次循環結束時,訓練樣本的均方誤差達到設定的精度要求,即小于1x10^-7。對于后3個驗證樣本的預測結果,分別為32330,30859,37969;與實際概算結果差異的絕對值為-1194,2635,94;誤差百分比分別為-3.56%,9.34%,0.25%。驗證樣本的誤差范圍較大,離直接利用分析結果進行工程可行性階段的車站投資估算分析仍有一定的距離。但是,從輔助設計人員進行造價決策等角度看,其預測結果具有較高的參考價值,可以幫助設計人員較為準確的確定物價因素對估算的影響程度,從而確定估算價格水平。
從分析結果可知,地下2層車站的估算預測精度較高,誤差均控制在5%以內,地下三層站的預測精度較差,誤差則接近10%。這是因為本次用于模擬訓練的樣本,大多為地下2層車站,而BP神經網絡是利用輸入訓練案例來自我學習的,預測結果十分依賴學習樣本特征。地下2層車站與地下3層車站預測精度的差異化,說明BP神經網絡在高效利用沉淀的歷史資料,輔助設計人員進行前期方案設計、工程可行性研究等階段的投資估算上,具有較高的研究價值。若搜集足夠多的樣本,滿足地下3層、地下4層車站的程序自我學習要求,其預測結果也同樣可以具有較高精度。
利用龐大的沉淀數據,可以不斷調整訓練BP神經網絡,直至其滿足預測需求。方案前期規劃、工可估算階段,可根據車站基本參數和信息價水平,利用訓練好的BP神經網絡,快速批量預測車站造價。設計人員只需要根據自身經驗判斷分析結果的合理性,決定是否采用預測造價。若有個別特殊車站造價偏離合理范圍,由設計人員依據自身經驗,結合其他可信的分析結果合理估算費用。與以往完全依靠設計人員經驗相比,采用BP神經網絡預測明顯減輕了設計人員工作量;納入信息價水平作為分析參數,造價預測更加準確;減少車站造價預測對設計人員經驗水平的依賴,降低估算難度。
通過小樣本驗證,BP神經網絡預測車站造價精度需要進一步訓練提升,但預測結果具有較高的參考價值,可以輔助設計人員進行投資分析與決策。
本次研究僅從上海近3年軌道交通項目的明挖車站中隨機選取20座車站用以驗證BP神經網絡的適用性,下一步可結合不同施工方法、不同地區地質情況做進一步研究。