刁柏青,孟祥軍,劉學強,蔣雷雷
(1.國網山東省電力公司,山東 濟南 250001;2.國網臨沂供電公司,山東 臨沂 276001)
信息技術浪潮的發展和互聯網技術的迅速推廣應用,使得社會進入數據時代,各項數據信息在企業經營生產中所發揮的作用越來越重要,公司的科學決策、重大事項的立項建設、企業的發展戰略、市場選擇、產品營銷決策等都離不開數據資源的基礎支撐。電力企業隨著信息化手段對企業的日常業務運行全覆蓋,產生的數據量也是與日俱增,電網數據總量已達到PB級,且日增長量達到TB級[1],但是部門系統間的數據壁壘問題凸顯,數據管理及應用呈現出以部門自傳為主的趨勢,跨專業少、業務與數據融合不足,凸顯數據應用部門“業務不清,有數不懂,無從追溯”的問題,數據共享困難,制約了大數據應用的成效發揮。同時,企業級的大數據應用、新技術應用主要是以清晰、干凈、關聯性的數據為基礎,在此基礎上大數據挖掘技術才能發揮其應用價值。因此,如何將部門級數據資源轉換成企業級的數據資源,突破企業級數據應用過程中,數據資源“黑盒”的現狀,是目前企業在數據資源集中管控需要回答的問題。
針對企業數據資源“黑盒”和共享不足問題,通過借鑒“百度百科”和“維基百科”的運營管理理念,按照“互聯網+數據百科”的工作思路,采用“自下而上”的模式,以促進公司數據業務化、資產化、共享化、清晰化、標準化的目標實現,打通業務層、數據層、邏輯層和應用層,運用網絡爬蟲、倒排鏈表等先進信息技術,構建企業級數據資源百科平臺,并基于平臺研究企業信息資源共享應用管理機制。……