鄭海波 譚亞軍 張紅兵 李鵬
在核電建設項目管理過程中,會產生各種類型的工程數據資料,這些工程資料可能隱含大量項目控制所需的工程規律、經驗和知識,對于后續項目的建設管理具有重要的指導意義,是提高項目管理決策科學性、有效性準確性的重要參考依據,然而這些信息由于提取使用的難度過大,往往隨著建設的完工和資料歸檔而被擱置無法得到有效利用。如何利用這些珍貴的數據資產解決目前核電建設中遇到的問題是當前一項極其迫切且具有極高價值的工作。
大數據技術不僅能夠對海量、多元且異構的數據進行有效的組合與分析,而且更重要的是其可以通過對歷史數據及實時產生的數據的快速分析與推演,為企業的生產與服務提供前瞻的、強有力的決策支持。通過用數據來規劃生產架構和流程,不僅能夠幫助企業發掘傳統數據中無法得知的價值組合方式,而且能給對組合產生的細節問題,提供相關性的、一對一的解決方案,為企業開展生產提供保障,進而提升企業整體的管理與決策水平。
一、大數據分析常用工具
目前常見的數據分析工具有SPSS、RapidMiner、Knime、Kettle,將它們進行簡要的對比如下圖所示:

二、核電施工管理系統
核電多項目管理信息系統是核電建造業務標準化軟件,規范了核電建造的管理,滿足股份公司、建設公司、核電項目部多層級單位使用。產品主要實現核電項目部的核電安裝、土建施工業務的全過程管理,系統包括8大板塊共30多個業務領域,能夠滿足核電工程的項目管控、資源管控、計劃控制、安全控制的全面、全過程的核電建造管理。
三、核電施工領域數據特點
核電施工領域由于行業的特殊性與復雜性,其數據存在以下特點:
首先,數據維度比較復雜,數據結構多樣,簡單來看,既有建筑類數據,也有管理類數據。
其次,行業鏈條多,參建方多,數據資源分散在不同單位手中,數據資源的整合存在一定困難。對于業務類數據來說,主要的設計數據存在于業主或設計單位,大量的甲供物資采購信息及供應商信息也都在業主手中。
再次,隨著信息化建設的升級,各系統之間的數據繼承性較差,大量的技術性文件分散于各單位。
最后,隨著移動互聯、物聯網、區域鏈等新技術逐步應用于核電施工領域,由此帶來了數據量的爆發式增長,也為核電施工領域數據的管理帶來新的考驗。
四、 面向核電施工領域的大數據平臺的研究
(一)技術架構
核電施工領域大數據支撐平臺技術以集成成熟開源產品為主,下圖是核電施工領域大數據平臺的技術架構。
數據存儲關鍵技術是分布式文件系統及基于分布式文件系統的各類數據庫。基于核電施工領域大數據平臺的選型,分布式文件系統主要采用Hadoop的HDFS,HDFS有著高容錯性(fault-tolerant)的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(highthroughput)來訪問應用程序的數據,適合那些有著超大數據集(largedataset)的應用程序。HDFS可以實現流的形式訪問(streamingaccess)文件系統中的數據。滿足對分布式、擴展性、容錯性、低成本的要求。
(三) 數據分析架構
數據分析子系統總體架構主要包括分析工程、數據接入、數據處理、數據分析、場景/故事設計、成果發布等模塊,實現數據分析平臺業務的全面支撐。
(四)數據分析結果
選取某核電站項目部數據,選擇電氣施工中的支架安裝工作量分析,數據庫中支架安裝相關數據表及說明如下:
通過對基于廠房及區域、廠房及時間、廠房及標高的工作量分布分析,可以得知在某幾個廠房工作量較多。通過對工作量的分析,有利于進度計劃的調整及優化,有利于對工作計劃的安排優化。
五、總結
通過本文的研究,提出了核電施工領域大數據平臺的技術架構、數據存儲架構和數據分析架構,提出了建設核電施工領域大數據平臺的建設路徑,為后續開展與業務相關的大數據分析提供了基礎。