王鑫+耿鵬云+李長錄



摘 要:本文根據光纖熔接工程少樣本、貧數據的特點,應用數理統計的知識,提出了一套運用T分布理論和數據列平穩代換的數據預處理方法,基于a/b/m統計法來確定人工、材料、機械消耗量的水平。
關鍵詞:a/b/m統計法; 數據列平穩代換法; 數據處理; 光纖熔接定額測定
DOI:10.16640/j.cnki.37-1222/t.2017.10.137
1 前言
隨著智能電網的快速發展,光纖被大量應用于智能變電站中,但目前尚未有統一的光纖熔接消耗量標準,因此有必要探索科學的測算方法對光纖熔接消耗量進行測算,從而提高智能變電站通信工程的造價管理水平,補充完善現有定額體系,提高造價的透明度,更好地服務于電網建設。
2 數據測算與預處理
在測算定額之前,首先要獲取相關數據。對于光纖熔接定額測定的數據,分為三個方面:人工、材料、機械。采用測時法測量人工工時消耗,用現場統計法測量材料和機械消耗量。
定額測定的主要目的是依據已有的工程數據,確定一個能夠體現大部分(85%)單位完成這項任務的水平,以供之后的同類工程編制預算、估計成本所用。然而實際中由于不同工程的地理位置、氣候條件、經濟發展水平、施工技術水平等存在差異,所搜集到的工程數據往往是參差不齊的,它們之間甚至可能相差幾倍,如果直接采用這些原始數據進行定額測算,勢必將導致結果與實際平均水平相差很大,因此有必要進行數據處理。通過數據處理將識別并剔除異常值,采用科學的方法將數據歸一化、標準化,以滿足光纖熔接的消耗量測定的要求。
鑒于光纖熔接多步驟、多環節的特點,下面以人工工時消耗為例,分為五步說明數據預處理的方法。
第一步:將測量的數據換算成占總工時的百分比。
光纖熔接可分為十幾道工序,不同工程每道工序上所耗用的時間有差別,這樣對所有工序直接加總得到的總工時會造成更大的差異,所以從總工時上確定光纖熔接工作的平均水平可能與實際結果相差甚遠。為降低數據之間的波動性、準確地確定光纖熔接工作的平均消耗量水平,以每道工序占該工程總工時的百分比來衡量工時的平均水平。即先計算每個工程中17道工序占該工程總工時的百分比,然后通過橫向比較收資表中同一道工序數個工程的百分比來確定每道工序應該占總工時的百分比平均水平。
第二步:T分布剔除異常值。
T分布經常應用在對呈正態分布的總體的均值進行估計。在絕大多數施工工程中,平均先進水平定義為85%的施工企業能夠達到的水平,據此,光纖熔接工作的置信度可定為85%,然后采用MATLAB程序得出T分布結果,將不在置信區間內的數據剔除,以消除異常值的影響。
第三步:回歸擬合、確定百分比的平均水平。通過MATLAB程序對每道工序的百分比值進行一元線性回歸擬合,根據擬合曲線和擬合方程可以準確地確定每道工序所占總工時的百分比的平均水平。
第四步:異常值處理。
首先確定一個平均水平作為基準值(即第三步求得的平均百分比值),將此基準值乘以1.2作為能使本組數據平穩的上限值;將此基準值乘以0.8作為能使本組數據平穩的下限值。原始數據對照上下限,若原始數據大于上限則取上限取代原數值;若原始數據小于下限,則取基準值的0.8倍作為調整后的值;若原始數據恰好落在下限和上限之間,則用原始數據不作調整,其本身即為有效值。
即:設基準值為,原始數據為xi(0
經過上述處理,即可實現數據序列趨于平穩,獲得消耗量及費用標準測定的有效數據。
第五步:根據以上確定的每個工程中每道工序的百分比,分別乘以每個工程的原總工時,得到數據處理的結果。以此來調整收資表中的不合理數據,方便對數據的進一步分析應用。
3 測定模型
3.1 常用芯數的光纖熔接定額測算方法
根據測量到的資料少樣本、貧數據的特點,構建基于概率論的數理統計模型——a/b/m統計法,計算出能反映正常施工和管理水平的定額。
a/b/m統計法的原理是:將預處理后數據按大小順序排列,求出該組數據的算術平均值,此即一般值m,表示同一道光纖熔接工序下的各個工程所代表的平均水平。根據二次平均法的原理,再對該組數據中小于一般值m的值求算數平均得到,對該組數據中大于m的值求平均得到。對于消耗量的測算,數據越大,說明消耗量越大,則其施工水平越低;反之,數值越小,說明消耗量越小,其施工水平越高。因此,先進值a即和一般值的算術平均值,先進值表示施工技術水平先進者的平均水平;同理,保守值b即和一般值的算術平均值,表示施工技術水平稍落后者的光纖熔接平均水平。
公式表示如下:
根據統計學原理,一組隨機數據服從正態分布,如圖2所示:
統計學專家根據T分布的圖形大致確定,較小值:一般值:較大值占全部數據的比例大致接近1:4:1。那么根據重要性原則,占比小的表示次重要,占比大的表示較重要,則根據1:4:1的比例,可以認為:在確定平均水平時,先進值和保守值的權重均取1/6,一般值的權重取4/6,則加權平均值即最終確定的額平均水平,由此確定的平均水平由于考慮了數據的分布而一般的平均法更能代表其平均水平。
式中:——加權平均值;
a ——先進值,權值為 1/6;
b ——保守值,權值為 1/6;
m ——一般值,權值為 4/6。
然后,根據正態分布的均值計算公式,即可確定具有平均水平的施工定額水平 t:
式中:t ——最終確定的施工定額水平,也稱優化值;
——加權平均值;
σ——標準偏差;
λ——標準偏差系數,查表可得。
標準偏差:
σ值越大說明估計值數據越分散,σ值越小說明這些估計值越集中。
該方法的優點是簡單易行,工作量小,速度快,縮短擬定定額的工作時間;通過引入二次平均法處理預處理后的數據,得出先進值a、一般值m、保守值b的改進數值,避免了單一方法所致的精確度較差、容易受個人主觀性影響的缺點,還可以使最終數值更接近實際水平,減少誤差。
基于以上原理,光纖熔接工程測定的人工工時消耗量采用的方法是:
①采用二次平均法求出a、b、m值;
②將已求得的a、b、m值代入a/b/m統計法確定加權平均值;
③計算標準偏差、標準偏差系數并代入正態分布均值公式確定消耗量水平。
3.2 任意芯數光纖熔接的定額測算方法
對于常用光纖芯數范圍外的光纖熔接定額測定,采用線性回歸預測法進行確定。根據4、12、24芯的消耗量水平,采用MATLAB進行線性擬合,求得線性回歸方程的參數a、b的值,這樣定義a、b后,將a、b代入一元線性回歸方程:
式中:X——光纖的芯數;
Y——消耗量水平或費用水平。
然后將所用到的光纖的芯數代入上述方程即可得出結果。
4 實證
假設現收集到9個可用的12芯光纖熔接工程數據,由于其它工序方法相同,現僅以第一道工序為例說明本方法的具體操作過程。
根據表1數據處理結果,計算得到相關系數如下表2。
根據正態分布推算出具有平均先進水平的施工定額 t。以第一道工序為例:
同理可計算出其余工序的消耗量,加總即可得到12芯光纖熔接的消耗量標準。機械消耗量、材料消耗量的定額測定可以參照此方法,不在贅述。
5 總結
本文充分結合實際工程特點,研究得出了一套光纖熔接消耗量測定的方法,該方法簡便易行,有助于完善概預算定額的編制,為建設單位的投資決策和施工企業投標報價提供了科學的依據,有助于企業管理水平的提高,規范了市場行為。
參考文獻:
[1]施國俊.淺談光纖通信技術在電力系統調度自動化中的應用[J].數字技術與應用,2010(07):45-46.
[2]杜鵑.光纖通信在電力調度自動化中的運用探討[J].科技創新與應用,2014(23):74.
[3]方洪鷹.數據挖掘中數據預處理的方法研究[D].西南大學,2009.
[4]王瀟洲.建筑工程人工及主材消耗量的模糊預測方法[J].五邑大學學報,2001,15(02):47-50.
作者簡介:王鑫(1978-),男,碩士,高級工程師,主要從事電力工程造價管理研究。