王綿斌,李歡歡,譚忠富,張金良
(1.國網冀北電力有限公司經濟技術研究院,北京市100070;2.華北電力大學電力經濟研究所,北京市102206)
充足穩定的電力供應是維持我國經濟快速發展的重要條件之一。然而隨著各產業的加速發展、人民生活水平的日益提高,需要進行大量電網基礎設施建設以滿足不斷增長的電力需求。“十二五”期間,國家電網公司將積極推進智能電網的建設,電網投資1.7萬億元。巨大的投資和繁重的建設任務將對工程造價管理提出更高的要求。建設管理單位需要加強對工程造價預測和造價控制的研究,把握輸電工程造價規律,提升科學管理水平。因此,如何在初設階段利用已建工程的造價信息,采用科學的方法對歷史數據進行分析和預測,把握工程數據之間的內涵規律,準確、高效地對工程評審進行指導變得非常重要。
當前國內對于工程造價的研究,主要從模糊數學、灰色關聯度和人工神經網絡、支持向量機等方法入手。文獻[1]根據概率論和模糊數學原理,確立隨機模糊數學特征統計方法,應用貼近度理論估算出子工程費用,疊加子工程費用構成總體工程費用的近似造價值。文獻[2-4]利用灰色系統理論估算了建筑費用,其中將預估工程項目和類似工程項目進行分解,以分部工程為計算起點,計算分部工程特征和造價關聯度。文獻[5-9]研究如何將神經網絡與聚類技術、遺傳算法等理論結合提高網絡學習能力。文獻[9]研究了支持向量機在電力輸電工程造價估算方法中的應用。但模糊數學對于工程造價的復雜問題描述過于簡單,估算結果粗糙;灰色關聯理論過高估計了不同工程的造價相似度,準確度不高;神經網絡方法則要求樣本具有較大的規模。輸電工程費用的構成和影響因素眾多,以上方法難以在小樣本的基礎上建立符合精確度要求的造價評估指標體系。為提出一種易于操作、快速有效的電力工程造價小樣本估算模型,需要結合工程造價歷史數據的具體特點,從數據處理、數據降維、指標建立和測算各方面進行優化處理。
本文在傳統輸電工程造價指標體系的基礎上,重新研究從樣本統計到指標建立和驗證整個指標體系建立流程中的新方法,選取影響因數簡化處理[10-12]、基于主成分分析、粒子群優化的最小二乘支持向量機[13-14]等方法,建立輸電工程造價三級指標體系。
對于一個給定的樣本集(xi,yi),i=1,2,…,l,xi∈Rn,yi∈R,用非線性映射 φ(·)把樣本集從輸入空間映射到特征空間,然后在高維特征空間中進行線性回歸:

根據結構風險最小化原理,回歸問題可以轉化為

約束條件:

式中:w為最小二乘支持向量機(least squares support vector machine,LSSVM)的權值系數;b為常值偏差;c為懲罰因子;ξi為松弛因子。
為求解該約束的最優化問題,通過引入拉格朗日函數,由 KKT條件求解,最終可以得到如下的LSSVM回歸函數模型:

LSSVM常用的核函數有徑向基函數、多項式函數、線性函數等。研究表明徑向基函數具有較強的泛化能力,因此本文選用徑向基核函數,其表達式如下:

此時,LSSVM的參數選擇問題即為核函數參數σ與懲罰因子c,參數[σ,c]將由粒子群優化算法給出。
粒子群優化算法是由Eberhart博士和Kennedy博士于1995年提出的一種進化計算方法,其基本思想是通過群體中個體之間的信息傳遞及信息共享來尋找最優解。設粒子群群體規模為M,每個粒子在D維空間飛行,初始速度為 vi=[vi1,vi2,…,vid],初始位置為一隨機變量 ui=[ui1,ui2,…,uid],i=1,2,…,M,d=1,2,…,D,則每個粒子是通過2個“極值”來尋找最優解,一個是粒子本身的最優解pbesti,用Pi=[pi1,pi2,…,pid]表示;另一個是整個種群目前的最優解gbest,用 Pg=[pg1,pg2,…,pgd]表示。
根據粒子適應度值,即可得到如下的粒子更新的速度和位置,直到符合終止條件:

式中:k為迭代次數;c1,c2為加速因子,它們使得每個粒子分別向 pbesti和 gbest的位置靠近;r1,r2為[0,1]間隨機數;w為慣性權重系數,是一個非負數,w取值較大時,全局搜索能力較強,反之局部搜索能力較強,在進化初期通常給w設置一個較大值以提高算法的全局搜索能力,隨著迭代的進行而縮小。
根據輸電工程造價樣本建立500 kV輸電工程造價指標評估體系,建立的整體邏輯流程如圖1所示。
本文共收集某電力公司系統內2008—2012年間竣工投產的500 kV輸電概算工程原始數據樣本47個,以輸電工程造價構成特點和一般規律為依據,運用ABC法確定構成輸電工程造價的主要費用,進一步挖掘影響輸電工程造價的關鍵影響因素,分析各個關鍵影響因素對于工程造價的影響程度以及與工程造價的關系。

圖1 輸電工程造價評估指標體系建立流程Fig.1 Building process of transmission project cost evaluation index system
關鍵影響因素的確定過程中存在兩大難點:(1)造價影響因素眾多:既有系統因素,如輸電容量;也有環境因素,如地形、地質等;還有設備因素,如導線、桿塔的類型及價格等。若計算參數選取過多,將增加造價分析的復雜性。(2)影響因素間存在一定的相關性:如塔材量、塔材價格、塔材造價存在推導關系,耐張塔基數、轉角次數間存在相關關系等。若逐一進行分析會使影響程度重復疊加,不剔除影響因素間的相關性,勢必會放大各影響因素對造價的影響。故首先需進行樣本與關鍵因素的簡化處理,其具體處理流程和操作見表1。

表1 數據處理流程與操作Tab.1 Processing flow and operation of data
結合處理后的樣本實際情況,通過數據統計及專家評定確立出各類費用的關鍵影響因素,見表2。靜態投資的關鍵影響因素為各個主要費用因素的關鍵影響因素的整合。

表2 輸電工程各部分費用關鍵影響因素Tab.2 Key influencing factors of cost in each part of transmission project
綜合輸電工程費用構成的特點,將輸電工程靜態投資作為一級指標,靜態投資的各個主要費用因素作為二級指標,再根據二級指標的關鍵影響因素求解三級指標及其計算公式。
在求解三級指標的過程中,采用主成分分析法對關鍵影響因素進行降維。以二級指標的關鍵影響因素作為輸入集,利用SPSS軟件計算相關系數矩陣,判定得到各個關鍵影響因素之間具有較強的相關性,證明樣本數據可用于主成分分析。在此基礎上,得出各成分對于總方差解釋程度的特征值表和主成分載荷矩陣(數據協方差矩陣的特征值矩陣)表。提取特征值大于1的前m個成分因子作為該費用項的主成分,以主成分載荷矩陣中的數據除以主成分相對應的特征值開平方根,得到主成分中每個指標所對應的系數[15-16],即,其中 Cif為載荷矩陣中主成分i中因素f的值,λi為主成分i的特征值。
以關鍵影響因素較少的基礎工程為例做簡要說明,表3為實際34個樣本數據,任取其中32個作為基礎數據,2個樣本留作檢驗樣本。運用SPSS軟件進行主成分分析得到表4~6,表4~6分別為解釋的總方差表、主成分載荷矩陣表、指標系數表。
由表4、表5求解表6的方法為:表5中成分1對應列的數據,除以表4中成分1對應的“合計初始特征值”的正平方根,得到表6中成分1對應列的數據。將表6中成分1作為新的三級指標,將其對應列的數值作為三級指標由關鍵影響因素計算的公式系數,至此建立了基礎工程的三級評估指標。

表3 基礎工程樣本數據Tab.3 Sample data of foundation engineering
通過Matlab實現支持向量機算法,結合處理后的34個實際樣本,以其中32個樣本作為學習樣本,其他2個樣本作為測算樣本進行預測與驗證。以各費用項所對應的主成分載荷矩陣與學習樣本中關鍵影響因素實際值進行矩陣相乘得到的數據作為預測依據,以2個測算樣本的關鍵影響因素值作為輸入集,得到各二級指標的預測數據,該數據與實際樣本的對比見表7。

表4 基礎工程解釋的總方差Tab.4 Total variance explained of foundation engineering

表5 基礎工程主成分載荷矩陣Tab.5 Component load matrix of foundation engineering

表6 基礎工程指標系數矩陣Tab.6 Index coefficient matrix of foundation engineering
由表7可知各個預測的偏差值均能控制在10%的范圍內,表明該評估指標具有較大的可靠性和實用性。同時本文進行了各項二級指標的安全區間確定。給定顯著性水平α,使得對應于某特定的單點估算值落在區間(T1,T2)的概率為1-α,即指標的安全區間為,本文取 α =0.1。得到測試樣本的500 kV輸電工程概算階段各部分費用安全區間見表8。
由預測和驗證結果可知,利用本文所建立的三級輸電工程造價評估指標與支持向量機方法進行輸電工程造價預測的誤差能夠控制在10%以內,具有較高的預測準確度,在前文研究結果的基礎上開發了基于支持向量機方法對輸電工程造價進行預測的計算機軟件,以期為實際輸電工程造價決策提供有價值的參考信息。

表7 預測結果與偏差對比Tab.7 Prediction results and deviation萬元

表8 各部分費用安全區間Tab.8 Security zone of each part cost萬元
輸電工程的費用構成與影響因素眾多,且樣本統計參差不齊,若對所有的影響因素進行統計和處理、預測,則會帶來不必要的工作量或者頻繁遇到數據缺失項、奇異點過多等問題,但若考慮的因素過少則不能很好地體現出工程造價的實際情況,造成預測值偏差大。為了建立實用、可靠的輸電工程造價評估體系,本文先后采用ABC分析法、關鍵參數簡化處理方法、主成分分析法對樣本進行了處理,通過計算得到了三級指標及其計算公式,進一步利用基于粒子群優化的最小二乘支持向量機方法對該評估指標體系做出了測算與驗證,證明了其具有較高的預測準確度,該方法可為500 kV輸電工程造價管理提供有價值的參考信息。
[1]唐曉陽.工程項目投資費用的隨機-模糊估算方法研究[J].清華大學學報:自然科學版,1996,36(4):13-18.
[2]張協奎,錢永峰.基于灰色關聯分析的建筑工程費用估算[J].建筑經濟,2000(6):41-42.
[3]張清梅,陳瑜.用聚類分析法估算建筑費用[J].國外建材科技,2001,22(2):77-78.
[4]荀志遠,于彩華.加權灰色關聯度法在工程投資估算中的應用[J].建筑技術開發,2001(9):26-29.
[5]鄧煥彬,強茂山,劉可.基于神經網絡的公路工程造價快速估算方法[J].中南公路工程,2006,31(3):127-131.
[6]李馳宇.高速公路造價快速估算模型與方法的研究[D].成都:西南交通大學,2006.
[7]王穎.數據挖掘技術在電力線路工程造價管理中的應用研究[D].重慶:重慶大學,2008.
[8]王穎,俞集輝,王玉斌.基于軟計算的電力線路工程造價預測模型[J].計算機仿真,2008,25(8):246-250.
[9]熊燕.基于人工智能技術的建筑工程造價估算研究[D].南昌:華東交通大學,2008.
[10]彭光金.小樣本工程造價數據的智能學習方法及其在輸變電工程中的應用研究[D].重慶:重慶大學,2010.
[11]韋俊濤.電力工程造價小樣本估算模型研究[D].重慶:重慶大學,2009.
[12]司海濤.有小樣本數據特征的輸變電工程造價估算與靈敏度研究[D].重慶:重慶大學,2010.
[13]張金良,譚忠富.混沌時間序列的混合預測方法[J].系統工程理論與實踐,2013,33(3):763-769.
[14]向昌盛,張林峰.混沌時間序列預測模型參數同步優化[J].計算機工程與應用,2011(01):4-7,11.
[15]林海明,張文霖.主成分分析與因子分析的異同和SPSS軟件:兼與劉玉玫、盧紋岱等同志商榷[J].統計研究,2005(03):65-69.
[16]孫德山.主成分分析與因子分析關系探討及軟件實現[J].統計與決策,2008(13):153-155.