葛振林,孫小慧
(新疆大學 建筑工程學院,新疆 烏魯木齊 830017)
在房地產項目規劃階段的工程造價估算中,房地產項目的投資者和決策者期望掌握項目規劃方案的投資估算金額,從而在資金投入、支付節奏、投資收益等方面做出科學決策。MAHAMID認為在項目開發的早期,對建設項目的成本進行高精度的估算,對于項目規劃和融資是非常重要的[1]。在項目決策階段很難計算組成項目的單項工程、單位工程、分項工程的工程量,因此很難準確估算出項目工程造價,無法為投資人提供準確的決策依據。
關于如何準確進行投資估算,國內外學者提出了許多方法。其中,通過分析單項工程或單位工程的特性指標,運用數學模型估算項目投資成本的方法應用較為廣泛。張登文等在建筑工程單位工程的主要特征指標中增加造價指數,采用BP神經網絡進行建筑工程單位工程造價測算,測算結果誤差率為1.06%[2]。劉偉軍等用思維進化算法(Mind Evolutionary Algorithm,MEA)優化BP神經網絡,同時在網絡輸入層加入水泥價格指數,結果表明預測效果優于BP神經網絡模型[3]。張媛媛等利用因子分析提取投資估算預測的公因子,建立DE-SVR改進模型預測住宅項目投資估算,測算精度達95%[4]。蔣紅妍等采用灰色關聯分析與粒子群(Particle Swarm Optimization)優化BP神經網絡的權值及閾值,構建基于灰色關聯的PSO-BP神經網絡模型對高層住宅造價進行測算,誤差率小于10%[5]。ARIF等通過分析巴基斯坦已完工的46個建設項目的成本數據,研究了影響建設工程項目成本估算的因素對估算結果準確性的影響,同時采用主成分分析和回歸分析相結合的方法估算工程造價,經驗證該方法能夠較準確地估算出實際工程造價[6]。WANG提出了一種基于模糊數學的工程造價估算方法,從工程造價分析入手,總結了工程造價的影響因素,建立了基于模糊數學的估算方法,并通過與典型工程造價進行比較,估算出工程造價與已建工程造價的相似接近程度[7]。
上述工程造價測算方法可較準確地對工程造價進行測算,但仍存在以下問題:一是研究為設計方案深化階段或施工圖設計階段的工程造價測算,缺少對規劃階段的工程造價測算研究,規劃階段的成本支出只占項目全周期工程造價的1%,但對項目工程造價的影響程度達到75%~85%[8-9];二是研究對象為單項工程或單位工程的建筑安裝工程費,對項目整體包含行政事業性收費、前期工程費、市政配套費、景觀工程費、工程建設其他費的建造成本研究缺失;三是研究BP神經網絡優化多以優化神經網絡初始權值或閾值為主,對BP神經網絡輸入層的優化篩選研究不足,而輸入層的特征指標的個數決定了模型測算的速度和測算結果的準確性。
鑒于上述問題以及工程造價計價的復雜性,本文針對建造工程造價(即不含土地成本、期間費[10]),通過統計分析碧桂園某區域公司已建房地產項目投資估算工程量及造價數據,利用灰色關聯度對規劃階段可獲取的規劃指標、業態指標、人工價格指數、材料價格指數、機械價格指數進行關聯度分析,優化BP神經網絡輸入層的特征指標,建立灰色BP神經網絡工程造價測算模型,可對擬建房地產項目進行造價測算,為投資人和決策人在房地產項目規劃階段提供準確合理的工程造價和決策依據。
BP神經網絡(Back Propagation Neural Network)是一種誤差反向前饋傳播的學習算法,其構成主要有輸入層、隱含層、輸出層三部分。典型的BP神經網絡結構如圖1所示[11]。

圖1 BP神經網絡結構圖
BP神經網絡有兩個數據傳播方向:前向傳播和反向傳播[12]。前向傳播意味著數據從輸入層傳輸到隱含層,然后傳輸到輸出層。若輸出層結果沒有達到預定的誤差值,則進行前饋反向傳播,即從輸出層傳遞到隱含層,再傳遞到輸入層,從而修正模型的權值和閾值,直到誤差達到預定值,訓練結束,得到BP神經網絡模型。BP神經網絡模型包括輸入xi,權值wij、νjk,偏置βj、λk,激活函數f和輸出yk等,計算式如下:
隱含層函數:

式中,xi、wij分別表示神經網絡輸入值即第一層網絡節點輸入值及其權重系數,βj為偏置,hj表示第一層網絡輸出值即第二層神經網絡的輸入值。

式中,qi表示網絡模型輸入層激活函數自變量。

輸出層函數:式中,νjk表示第二層網絡節點輸入值權重系數,λk為偏置,yk表示第二層網絡輸出值即神經網絡的輸出值。

式中,uk表示網絡輸出函數自變量。
BP神經網絡激活函數一般采用Sigmoid函數,Sigmoid函數又分為Log-Sigmoid函數和Tan-Sigmoid函數。
Log-Sigmoid函數:

Tan-Sigmoid函數:

因本文所研究的房地產項目建造工程造價大于0,因此選擇Log-sigmoid函數作為模型函數。BP神經網絡計算方法采用梯度下降算法,若網絡的實際輸出值“yk”與期望輸出值“dk”存有誤差,對于P個樣本,則有:

每層神經元之間權值的調整和誤差的負梯度成正比。通過各神經元的累計誤差BP算法調整權值wij、vjk,偏置βj、λk,從而達到全局誤差E迭代減小的目標,即:
(1)輸出層偏置值的變化

式中,η表示學習率。

由式(8)、(9)、(10)可得:

(2)輸出層權值的變化

由式(12)、(13)、(14)可得:

(3)隱含層偏置值的變化

由式(16)、(17)、(18)可得:

(4)隱含層權值的變化

由式(20)、(21)、(22)可得:

由于式(11)、式(15)、式(19)、式(23)的變量均為已知值或可求解值,所以可求解出自變量偏置λk、權值νjk、偏置βj、權值wij。
灰色關聯分析法是根據因素發展的相異程度來評價因素關聯程度的方法,以灰色關聯度為度量[13]。若因素之間的變化趨勢一致,就說明因素之間的關聯度高;否則,關聯度低。灰色關聯分析法包括如下步驟。
1.2.1 構建比較矩陣和參考數列
比較矩陣是影響參考數列的所有特征指標的集合。假設有m個樣本項目和n個指標特征,則比較矩陣X表示為:

式中,Xij表示比較矩陣特征指標值。
分析計算特征指標與參考值的關聯度,比較各特征指標值與目標指標特征值的關聯度。關聯度值越大,特征指標與目標特征的關系越密切。

式中,Xi0表示參考矩陣特征指標數值。
1.2.2 計算關聯系數
關聯系數是樣本比較矩陣X各特征指標與參考數列X0的關聯程度的反映。灰色關聯分析方法可計算第i個樣本的第j個指標與第i個樣本目標特征間的關聯系數ξij:

式中,ρ是分辨系數,一般取值0.5,其取值大小決定了關聯系數之間的差異[5]。
灰色關聯系數可以反映單個樣本的工程特性指標的關聯程度,不同樣本的同一特性指標的關聯程度不同。通過計算所有樣本的相關系數,采用均值法計算各個特征指標與目標特征的關聯度[5]。
根據特征指標關聯度的計算結果,進行排序。關聯度越大,比較矩陣對應指標對參考矩陣指標的影響越大。
通過對規劃階段獲取的房地產項目建造工程造價特征指標的分析得出,房地產項目工程造價會受到規劃條件、業態類型、市場信息價格(指數)三類共35個因素(變量)的影響,即房地產項目建造工程造價與規劃條件、業態類型、市場信息價格(指數)三類共35個特征指標(見表1)之間存在某種相關關系。這種非確定的相關關系可以通過建立結合灰色關聯度分析的BP神經網絡工程造價測算模型(即灰色關聯-BP神經網絡工程造價測算模型)進行描述。利用所建立的測算模型,根據影響因素(變量)的取值來測算或控制反饋變量(此處指房地產項目建造工程造價)的取值,并給出測算的精確程度。

表1 工程特征指標表
測算模型的構建首先需要進行關聯度分析,對35個工程特征指標(自變量)與輸出層即建造工程造價(因變量)的關聯度由大到小排列,然后從小到大逐個遞減特征指標依次作為BP神經網絡的輸入層,同時用試湊法按式(29)-式(33)確定的隱含層節點個數范圍逐次實驗,得出最優的模型結構,即測算值與真實值的平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)最小,均方根誤差(RMSE)最小的實驗結果。具體步驟如下。
(1)BP神經網絡輸入層的確定
以規劃指標、業態指標、技術指標、價格指標等特征類型的35個特征指標為變量,作為神經網絡輸入層;房地產項目建造工程造價指標為自變量,作為神經網絡輸出層。其中,人工指數、機械指數、鋼筋價格、水泥價格為建造工程造價測算當月當地工程造價主管部門發布的信息指導價格,建筑高度取房地產項目業態建筑面積比例最大的建筑高度作為項目特征指標。用最大值法、最小值法對樣本數據進行處理,以減少量綱因素的影響,保證特征指標的等效性。

式中,Xk和X′k為樣本中歸一化前和歸一化后的第k個指標,Xmin和Xmax為所有樣本中第k個指標的最小值及最大值。
利用灰色關聯分析法對輸入層指標進行關聯度計算,按關聯度降序排列,然后從小到大逐個遞減輸入層指標個數,分別作為BP神經網絡的輸入層進行訓練。
(2)BP神經網絡隱含層節點個數的確定
隱含層節點的數量與樣本的數量、樣本中的噪聲及函數復雜性相關。目前無完整理論用以確定隱含層節點數量。一般用試湊法確定隱含層節點的最佳個數“NH”。公式如下:

式中,Ni為輸入層神經元個數,No為輸出層神經元個數,a=1~10。
采用式(29)-式(33),根據BP神經網絡輸入層神經元個數、輸出層神經元個數確定隱含層節點個數區間,逐次進行仿真。
(3)BP神經網絡的訓練
利用得到的數據確定BP神經網的結構,設置學習率為0.001、迭代次數30 000次、訓練誤差目標0.000 01等相關參數進行初始化,啟動訓練[11]。
(4)房地產項目建造工程造價測算網絡模型的確定
逐次在已訓練的BP神經網絡中導入測試組項目特征指標并完成歸一化,得到神經網絡的測算輸出,反歸一化處理后可得項目建造工程造價的測算值,最后選擇最優項目建造工程造價模型測算結果。與最優結果對應的網絡輸入層特征指標、網絡隱含層節點個數即為模型的最優輸入層、隱含層節點數。
(5)房地產項目建造工程造價測算網絡模型精度的評價
房地產項目建造工程造價測算網絡模型的精度評價通常采用以下3個指標:平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)。計算公式如下:


式中,n是模型的測試組個數,dk是模型測算值,yk是測試組樣本實際值。
為了驗證灰色關聯-BP神經網絡工程造價測算模型的有效性,本文選取碧桂園某區域2016年至2020年已投資的51個項目的規劃階段的工程造價,隨機選取5個項目作為測算模型的測試組,其余46個項目作為測算模型的訓練組,通過模型測算出測試組的建造工程造價。然后將測算的建造工程造價與傳統BP神經網絡、多元線性回歸方法的測算結果對比,驗證模型的準確性和測算性能的穩定性。仿真實驗結果表明,灰色關聯-BP神經網絡工程造價測算模型輸入層為20個特征指標(見表2),隱含層節點個數為39時,測算結果最優。比較規劃階段可獲取的特征指標與碧桂園某區域樣本項目工程特征指標,可知規劃指標、業態指標、技術指標是影響碧桂園某區域房地產項目建造工程造價的關鍵因素,而人工、機械、主要材料的價格波動對規劃階段項目測算的影響較小,可不做考慮。

表2 碧桂園某區域樣本最優結果工程特征指標表
傳統BP神經網絡測算方法,即輸入層為35個特征指標的BP神經網絡測算方法,以及多元線性回歸方法[14]與本文測算方法的測算結果對比見表3。
由表3測算結果對比表明:采用傳統BP神經網絡測算方法誤差為-17 822.00萬元至13 453.00萬元,誤差率為2.11%至59.75%;采用多元線性回歸方法誤差為-21 313.69萬元至16 452.08萬元,誤差率為0.05%至15.74%;采用本文提出的灰色BP神經網絡方法,即經灰色關聯度篩選后輸入層為20個特征指標的BP神經網絡測算方法,誤差為-18 150.00萬元至1 189.00萬元,誤差率為1.27%至13.41%,其中4組測算誤差為1.27%~5.25%,1組誤差為13.41%,滿足項目規劃和建議書階段投資估算的誤差率在±30%左右的要求[15]。工程造價測算的平均絕對誤差、平均絕對百分比誤差、均方根誤差指標見表4,顯然,本文測算模型測算的結果誤差更小,預測性能更穩定。

表3 建造工程造價測算結果對比表

表4 建造工程造價測算性能對比表
針對房地產項目工程造價人員難以在項目規劃階段測算出房地產項目各單項工程、單位工程、分部或分項工程的工程量,難以準確計算出項目工程造價的現實問題,在房地產項目建造工程造價測算中根據可獲取的項目特征指標,采用灰色關聯分析優化BP神經網絡輸入層的特征指標的方法,構建灰色關聯-BP神經網絡工程造價測算模型對房地產項目規劃階段建造工程造價進行測算,主要研究內容及結論如下。
(1)基于碧桂園某區域已投資的51個項目規劃階段的工程造價數據,運用灰色關聯分析法計算規劃條件、業態類型、市場信息價格(指數)三類共35個特征指標與建造工程造價的關聯度,計算結果表明,關聯度的范圍為0.40~0.93,其中關聯度大于0.5的工程特征指標數為26個。
(2)基于灰色關聯分析的指標排序,按關聯度從低到高逐個遞減為BP神經網絡輸入層進行實驗,結果表明,用關聯度大于0.55的20個指標進行測算時結果最優,而價格指標,如人工價格指數、機械價格指數、主要材料價格等因素影響較小,測算時可以不考慮。
(3)將灰色關聯-BP神經網絡模型測算結果與傳統BP神經網絡和多元線性回歸方法的測算結果進行對比,發現灰色關聯-BP神經網絡模型測算的5組樣本中,4組誤差為1.27%~5.25%,1組為13.41%,平均絕對百分比誤差5.07%,滿足項目規劃和建議書階段,投資估算的誤差率在±30%左右的要求,且其測算結果更精確、穩定。
本文針對房地產項目規劃階段建造工程造價提出了有效測算模型,但房地產投資估算中土地費用、期間費用同樣是項目投資估算的重要組成部分,今后可對該部分成本的測算進一步研究。此外,工程造價測算的方法很多,除本文方法外還有灰色預測、模糊預測、卷積神經網絡等方法,今后可探索以上方法在房地產項目投資估算測算領域中的應用。