丁艷,張海文,孫永彥
(國網甘肅省電力公司經濟技術研究院,甘肅蘭州 730050)
對電網工程造價數據的有效分析,是電網建設中不可或缺的重要環節。電網造價的合理性對于實現電網項目的效益最大化具有重要意義。建筑成本指數(CCI)已被廣泛用于衡量建筑行業的成本趨勢[1]。CCI 為估算施工成本,在建設項目的規劃階段準備預算以及在施工階段進行成本管理與控制提供了重要的參考信息。
準確的電網工程數據分析模型需要考慮到大量的數據變量,因為這些變量是人工、材料與設備成本的加權組合[2]。然而在使用因果模型分析CCI 時,模型的輸入變量也是未知的,因此必須進行準確估計。此外,單變量時間序列模型由于受其先前值的動態影響,因此該模型并未利用來自于其他變量的信息[3]。這些問題對于分析電網工程造價成本的不確定性尤為重要。
為了克服因果關系與單變量時間序列模型的缺點,文中利用協整矢量自回歸(VAR)模型來分析CCI。協整的VAR 模型可以更有效地應用于成本趨勢的隨機預測,可以輕松地將其他變量納入成本預測和風險評估中,還可以描述變量的動態行為以及變量之間的長期與短期相互作用。
為對工程造價數據進行分析,文中使用了基于固定時間序列的VAR 模型。
工程造價數據的靜態VAR 模型定義如下:令Yt=[y1t,y2t,…,ynt]' 表示時間序列變量的(n×1)向量,假定其表示平穩過程。基本的p階滯后VAR 模型可定義為:

其中,t=1,2,…,T;C為n×1的截距項;A是n×m的系數矩陣;D是m×1的說明變量;εt為n×n的系數矩陣。文中使用一個簡單的雙變量VAR 模型,可以表示如下:

其中,Di(i=1,2,…,12)表示季節虛擬變量。虛擬變量反映了不同月份對變量CCI 與CPI的季節性影響。殘差ε1t=ε2t=Cov(ε1t,ε2s)=σ12。協方差矩陣可以描述如下:

該模型的每個方程均具有相同回歸變量的特征。盡管該文方法采用過去的CCI 和CPI 來分析預測未來的CCI,但是通過合并其他可提供的有用信息來預測電網工程成本的變量,使該文的VAR 模型變得非常靈活。
當兩個變量之間存在某種協整關系時,協整VAR 模型存在如下關系:

其中,(y1t-1-β2y2t-1)為協整方程;系數β2為歸一化的協整向量;系數θ1與θ2為調整后的參數。協整方程表示兩個變量之間的協整關系或長期穩定關系的偏差。當兩個變量均不具有長期關系時,調整系數θ1與θ2將模型推回到長期均衡。協整VAR 模型不僅考慮了長期影響,還考慮了兩個變量之間的短期相互作用。
為估計協整VAR 模型,將樣本數據分為兩個子集。其中,一個子集用于開發協整VAR 模型;另一個子集用于進行各種模型的樣本外預測與評估。根據慣例,總體樣本數據的5%~15%用于樣本外預測與各種模型的評估。因此根據數據集的大小,設定這兩個子集的邊界為2005M12:將1975M01~2005M12的數據用于估計模型,將2006M01~2010M06的數據用于樣本外預測,總體評估所得預測數據的準確性,并與現有模型所得結果進行比較。
由于兩個時間序列CCI 與CPI 均是固定的過程,因此在建立模型前,應先評估CCI 與CPI 之間的協整關系。測試CCI 與CPI 之間的協整,首先需要確定VAR 模型中的滯后次數,可以使用模型選擇標準來確定VAR(p)模型的滯后長度。文中采用了Hannan-Quinn 信息準則(HQIC),其適用于一般條件下的一致性估計順序。滯后時間段p的HQIC 定義如下:

協整關系通過跟蹤檢驗與最大特征值檢驗進行評估。在這些測試中,協整方程僅包含截距。結果如表1 所示,其中第2 列表示原假設,即假設的協整方程數。跟蹤測試與最大特征值測試中的p值表示1%顯著性水平上的協整方程,用于確定CCI 與CPI之間的協整關系。

表1 CCI與CPI協整關系測試
多核處理器被認為是求解VAR(n)問題的最佳選擇,但目前的求解器沒有足夠的時序可預測性來設計硬件實時(HRT)系統[4]。
文中使用的MERASA 架構具有2~16 個內核[5],每個內核均具有同時多線程(SMT)設施,旨在支持一個HRT 線程與多達3 個的非HRT 線程[6]。HRT 與共享內存層次結構的本地內存訪問具有可預測時間的仲裁策略,但即使硬件具有定時可預測性,計算并行應用程序的WCET 也不是一個簡單的過程[7]。
圖1 顯示了并行代碼的結構,主線程與子線程之間的同步點以及子線程之間的同步[8](PiSj表示“階段i,步驟j”)。通過這種結構,可以得出整個WCET的第一個細分步驟[9],如圖2 所示。該圖結合了代碼部分的WCET[10],其中一些由主線程執行,而其他由子線程執行。根據該圖,WCET可以計算為:

圖1 并行網格求解器


圖2 WCET步驟細分
式中,WCET(main)是在不考慮等待時間的情況下計算出的。
由于迭代步驟中子線程之間的同步,因此需要第二級分析[11]。順序算法會在循環嵌套的連續迭代之間強制執行數據相關性,將3D 域劃分為多個隔離專區后,每個分區均與其相鄰隔離專區的邊界有依賴關系,這可能造成數據共享,會耗費過多的資源[12]。
由于數據共享模式是規則的,且可以計算整個插值步驟的WCET[13],所以在最后一個線程完成當前迭代之前,就需要開始外循環的新迭代。
結果將每個計算部分的WCET記為Wi且NUM_ITE 是迭代次數,則迭代步驟的WCET可由式(9)計算[14]:

文中使用兼容POSIX的互斥鎖與條件變量來實現線程間同步[15]。圖3 為互斥鎖Mutex_lock 函數的流程。

圖3 互斥鎖Mutex_lock函數流程
從圖3 可知,線程嘗試獲取互斥鎖有4 種不同的情況[16]。若互斥鎖是未被占用的,線程將獲取防護鎖,然后將其釋放。若互斥鎖由另一個線程持有,則該線程將在獲得防護鎖之后掛載在互斥鎖上。若另一個線程釋放了互斥鎖,則所有掛起的線程均將嘗試獲取互斥鎖。
并行多網格求解器的主線程與子線程間的同步依賴于共享變量,該共享變量指示出了要執行的下一個步驟。其包括一個互斥鎖(以保護對共享變量的訪問)與在變量未處于預期狀態時的等待條件。對于N個子線程,操縱鎖的線程數和條件為N+1。在主線程與子線程代碼中標識可以持有鎖的路徑:這些路徑的最大WCET乘以N+1 表示鎖定的Tw3項。在子線程到主線程同步時,每個線程均有自身的狀態變量,該變量僅與主線程共享。通過與每個子線程相關的狀態變量,來實現兩個子線程之間的同步。
文中使用MERASA 多核處理器對建筑造價數據進行分析,包含2~8 個可用于計算線程的內核(主線程包含一個額外的內核)、完善的ISP(所有指令均可以從指令暫存器中獲取)、DSP(用于堆棧數據的暫存器)、循環總線以及5 周期的DRAM 延遲。由于循環策略以及實時線程與非實時線程之間的內核仲裁機制,對于n內核配置,訪問主內存的最壞情況延遲為5·n+12。
為了確定置信區間并分析建筑成本的風險與不確定性,文中添加了蒙特卡洛技術來模擬未來成本指數與工程成本。首先,對2006 年1 月的CCI 進行仿真,然后將該值用于仿真下個月的值,以此類推,直到2010 年6 月,重復10 000 次。
圖4 為樣本外的預測與誤差帶,正負一個標準偏差與兩個標準偏差。自2008 年6 月以來,CCI的急劇上升意味著成本上升的風險較高。2008 年最后4 個月的實際CCI 值超出了預期CCI的兩個標準差,這與金融危機的爆發相吻合。

圖4 樣本外預測與誤差帶
根據圖4 中的預測值,可以較容易地計算出施工成本的上升因子。例如,在2005 年12 月~2006 年1 月的成本上升因子等于2006 年1 月的預測值除以2005 年12 月的CCI的比率,用f表示。在此示例中,2005 年12 月的CCI 為7 647,而2006 年1 月的預測為7 646.43。因此,2006 年1 月的成本上升因子為f1=7 646.43/7 647=0.999 9,而2006 年2 月的成本上升因子為f2=7 650.59/7 647=1.000 5。
為了更加具體地評估工程成本的風險,進行如下數據實驗。假設建設項目的計劃工期是2006 年1月~2006 年12 月,預算在2005 年12 月制定,基本成本約為9 455 萬元。
基本成本的分配在2006M01~2006M12 之間,其根據工程組織計劃而變化,且分配的基本成本是隨機變量。為便于計算,前5 個月分配的基本成本是相同的,從最小值545 萬元到最大值765 萬元統一分配。隨后4 個月的基本成本呈正態分布,平均值為825 萬元,標準差為410 萬元。最后3 個月的基本成本也呈正態分布,平均值為960 萬元,標準差為490萬元。令ci(i=0,1,2,…,12)表示每個月分配的基本成本,可以將預期調整后的成本計算為E(fi×ci)=E(fi)×E(ci),其中fi與ci相互獨立。工程總成本可計算為:

其中,fi與ci是隨機變量,因此總成本C也是隨機變量,其分布可以通過蒙特卡洛模擬獲得。圖5為仿真得出的工程總成本分布。

圖5 總成本分布實驗
分析圖5 可知,平均總成本約為9 589 萬元,略高于基本成本。總建筑成本從4 961~14 036 萬元(標準差為1 220 萬元)不等。偏度約為-0.02,峰度為2.99。因此,總建筑成本遵循正態分布,平均總成本為9 589 萬元,標準差為1 220 萬元。由于可以獲得任何百分位的數值,該分析系統還有助于評估電網工程的成本風險。例如,第25 個百分位數大約為8 780 萬元,而第75 個百分位數大約為1.043 6 億元,這表示該成本低于8 780 萬元的概率為25%,而成本高于1.043 6 億元的概率為25%。這樣,風險承受能力低的決策者可以將工程成本定在第95 個百分位,約為1 029 億元;而風險承受能力強的決策者可能將其建造成本定在第25 個百分位數,即約8 780 萬元。
文中使用協整VAR 模型分析電網工程造價數據。采用1975M01~2005M12的樣本數據建立了估計協整VAR 模型,并使用2006M01~2010M06的數據進行了樣本外預測,所得樣本外的預測結果證明了預測準確性。為對大量的協整VAR 模型分析工程造價數據進行分析計算,文中使用基于多網格技術的低成本與低功耗的多核處理器設計求解器,解決了現有設計通常與求解時最壞情況的時間分析不兼容問題。結果表明,與其他測試方法相比,協整VAR模型可以提供更準確的分析預測。同時,可以使用協整的VAR 模型來確定置信區間,并評估工程成本上漲的風險與不確定性。