付健藝 王曉輝 石哲方 侯詩洋

摘 要
針對影響配網工程項目工期的因素多,情況復雜的特點,提出了一種對工程項目數據樣本進行多步驟降維,提取主要因素的方法。第一步,得到影響配網工程項目工期的因素集合;第二步,利用超限學習機(Extreme Learning Machine, ELM)分類器對工程項目的數據樣本進行分析,得到數量少但預測能力強的主要因素的集合;第三步,利用得到的樣本因素集建立配網工程項目工期的預測模型。實驗表明,該方法能快速有效地提取配網工程項目數據的主要因素,并提高工期時長的預測精度。
關鍵詞
工程項目;工期;超限學習機;降維;預測模型
中圖分類號: TM72;F426.61 ? 文獻標識碼: A
DOI:10.19694/j.cnki.issn2095-2457.2020.04.63
0 引言
目前,供電企業(yè)在配網項目工程進度管控和工程計劃實時調整的過程中存在以下難題:一是國家電網對配網工程中各步驟流程的時限沒有明確的標準和規(guī)定,且各地區(qū)配網工程推進各有特點,工程中各步驟耗時大不相同,很難以統一的標準來限定,造成公司在工程進度的管控中基本依靠經驗來判斷“快”和“慢”、“來得及”或者“來不及”,配網工程全過程精益管控很難實現;二是由于無法用準確的數據來定量分析工程各階段進度的滯后或者超前,導致工程計劃的制定和變更比較粗糙,工程完工的實際耗時與計劃安排大相徑庭;三是公司缺少項目進程中對項目總工期的實時預測能力和超時風險評估機制,造成工程項目超期完工時有發(fā)生。
然而,工期時長的預測模型的研究并不多見,[1]利用BP神經網絡模型能夠逼近任意復雜的非線性系統這一特點,建立了一個工程進度控制模型,但BP算法有可能陷入局部極值,使訓練失敗,并且學習速度很慢。[2]利用最小二乘支持向量機設計了一種建設工程項目工序工期的預測模型。支持向量機很大程度上簡化了分類和回歸等問題,但由于支持向量機是借助二次規(guī)劃來求解支持向量,而求解二次規(guī)劃將涉及m階矩陣的計算(m為樣本的個數),當m數目很大時該矩陣的存儲和計算將耗費大量的機器內存和運算時間。[3]通過研究發(fā)現,影響工程進度的因素主要有10種,包括工程的前期準備工作、人力、材料、進度安排的精確性、工程進展過程中的協調、返工、設備數量、天氣狀況等各種因素。針對以上問題,并結合網工程項目工期的因素多,情況復雜的特點,本文利用超限學習機設計了一種多步驟降維的方法,提取配網工程項目數據樣本的主要因素,得到數量少但預測能力強的主要因素,用來建立配網工程項目的預測模型。能為工程計劃的實時變更提供數據支撐,大大減少工程超期完工的可能性,有效提升工程全過程精益化管控能力,加強工程計劃的準確性,有效降低項目超期風險。
1 相關工作
[4]構造了一種命名為“超限學習機”(Extreme learning machine, ELM)的單隱層前饋神經網絡結構,該算法中輸入權和隱層偏置為隨機生成,僅需求解輸出權重,因此是一個線性參數模式(linear-in-the-parameter model),其學習過程易于在全局極小值收斂。已知N個學習樣本,對包含L個隱層節(jié)點和M個輸出層節(jié)點的超限學習機進行訓練的基本步驟為:
對于給定的N個輸入模式向量x1,x2,…,xN∈Rn和N個相應的輸出向量o1,o2,…,oN∈Rm圖1中的N個線性輸出方程可表示為([5-6]):
其中輸入權wi=[wi1,wi2,…,win]T是連接第i個隱層結點的輸入權值,輸出權βi=[βi1,βi2,…,βiL]T是連接第i個隱層結點的輸出權值,bi是第i個隱層結點的偏置,f(wi,bi,x)為第i個隱層節(jié)點的輸出,激活函數f可以是任意有界的非常量連續(xù)函數。
本文的第3節(jié)闡述了多步驟降維的具體思路與步驟,第4節(jié)用工程實例來驗證方法的有效性,第5節(jié)對全文進行總結。
2 多步驟降維選主要因素的方法
除了前期準備工作、人力、材料、進度安排的精確性、工程進展過程中的協調、返工、設備數量、天氣狀況等各種共通的因素之外,配網工程項目還有一些獨特的影響因素,我們將高壓線路長度、低壓線路長度、電纜長度、配變容量、地理調整系數等獨特的因素和工程項目共通的因素合并成一個的影響配網工程項目工期時長的因素集。
選取配網工程項目主要因素的降維算法描述如下:
步1:用上述因素集中的所有因素訓練超限學習機分類器,用10折交叉驗證得到分類精度p;
步2:隨機臨時剔除因素集中的某個因素,重新訓練超限學習機分類器,并用10折交叉驗證得到分類精度p;
步3:如果p大于p,則說明被剔除的這個因素對分類結果有貢獻,應該保留;反之則正式剔除;
步4:重復以上步驟,直到剩下的因素無法剔除為止;
步5:利用新的因素集訓練超限學習機預測配網工程項目工期時長。
3 實驗
數據來源:浙江省麗水市2015年至2017年配網工程項目,天氣數據通過麗水統計局網站、中國天氣網、麗水水文信息網等途徑收集。選擇前期準備工作、人力、材料、進度安排的精確性、工程進展過程中的協調、返工、設備數量、天氣狀況、高壓線路長度、低壓線路長度、電纜長度、配變容量、地理調整系數這13個因素構成輸入樣本,對應的工期時長(天數)作為輸出樣本。采用0均值標準化對輸入樣本進行歸一化處理。
對于測試集的工期預測值,我們規(guī)定,如果預測的工期時長和該項目實際完成的工期時長的相對誤差小于等于10%,則該預測被認為是有效預測,否則為無效預測。
實驗中使用的仿真軟件為:python3。Window 7 64位操作系統,Intel Core i3-6100 3.70GHz,8GB內存。
實驗采用5-折交叉驗證法,運行50次。
配網工程項目數據集經過多步剔除因素的過程,工期預測精度達到85%,主要因素減至5個,分別是進度安排的精確性、設備數量、天氣狀況、電纜長度、配變容量。
4 小結
本文提出了一種降維的特征方法,提取樣本的主要因素,并將該方法用于配網工程項目的工期時長的預測當中,通過工程實例數據的測試表明,該方法是有效的,能夠有效提高配網工程項目的工期時長的預測的準確率。
參考文獻
[1]孫斌.基于神經網絡BP模型的建筑項目工程進度控制[J].科技風,2009,16:253-254.
[2]祁神軍,張云波,丁烈云.建設工程項目工序的LS-SVM工期預測模型[J].華僑大學學報(自然科學版),2010,31(5):562-565.
[3]BORERO L F, ALVAREZ M E, Last planner: An advance in planning and controlling construction projects: Case study in the city of Medellin[C].Proc of the 4th Brazilian Symposium on Construction Management and Economics. Porto Alegre: ?[s. n.], 2005, 1-9.
[4]HUANG G B, ZHU Q Y, SIEW C K, Extreme learning machine: Theory and applications [J].Neurocomputing, 2006,70(1-3), 489-501.
[5]盧誠波,梅穎.前饋網絡的一種高精度魯棒在線貫序學習算法[J].上海交通大學學報(自然版),2015,49(08):1137-1143.
[6]梅穎,盧誠波.面向不平衡數據流的自適應加權在線超限學習機算法[J].模式識別與人工智能,2019(2),144-150.