萬嬋
摘 要 2017-2018年廣東電網針對內部數據質量問題,按照“發現問題、發布問題、提供治理指引及工具、及時治理”的數據治理思路,建立了規范化的管理制度,主動管控數據全生命周期的質量問題;建立了全方位發現問題數據的方法,依托認責矩陣和標準固化數據質量規則,建立端到端的分析及定位問題數據的平臺,自動化分層校驗數據,發現問題數據,并定位問題責任人,建立各個業務系統的數據治理工具,由問題責任人負責整改,實現問題數據端到端整改,為公司數據治理提供了高效的整改方法和工具。
關鍵詞 數據主人;電力行業;數據治理
背景
隨著“云大物移智”前沿科技的迅猛發展,超出人類預計的數據量爆發式增長,數據生產者與數據使用者交疊重復,當代人類生活的方方面面離不開數據,而這些海量的數據構成了這個信息社會的基礎。作為海量數據的擁有者——資源型大型企業的數字化轉型之路勢在必行。作為典型的國有大型企業的電力公司,其電力數據量大,類型多,價值高,變化速度快,并且其數據質量關乎國民經濟,因此數字化轉型成為電力公司在電力體制改革中的一個新的著力點。
廣東電網在進行數字化轉型工作—數據資產管理系列行動中,發現數據質量問題嚴重影響數據資產價值,數據治理工作理應先行,而由于業務系統數據體量大、基數大,業務系統間數據協同復雜,缺乏相應的數據治理管理規范制度,問題數據追溯定位難,數據治理自動化程度低、治理效率低,加大了數據治理工作的難度,影響業務應用及數據價值體現。
參考國內外大型企業數據治理經驗,企業要進行數據治理首先要弄清楚的是誰的責任。DAMA數據資產管理體系中指出當前企業關于數據的問題,被廣泛認為是IT部門的職責,但數據定義和業務規則、數據錄入、數據使用、數據考核等又全都與業務部門有關。對此,DAMA強調,數據治理應該是業務部門與IT部門共同的職責。與此同時企業應該提供面向數據生命周期的數據治理方法。
廣東電網信息中心基于實際條件,分析歷史問題數據的成因及解決方案,設計了數據治理體系總體思路,如下圖所示,首先根據對業務系統數據進行認責,捆綁數據責任人—數據主人,形成數據認責矩陣,然后固化認責關系到數據質量管理平臺,建立起評價體系,再通過數據治理工具使得數據主人能自主治理數據,最后提供全面的數據主人全視圖和問題數據視圖。按照“發現問題、發布問題、提供治理指引及工具、及時治理”的數據治理思路,首先由質量平臺進行規則校驗發現問題數據,再生成基于數據主人的數據質量報告,體現到數據主人問題視圖,再由問題視圖中的問題記錄有針對性地使用治理工具進行整改,最后更新系統數據,完成數據全生命周期的數據治理過程。
1 梳理數據認責矩陣,形成數據主人認責機制
數據主人機制包括為數據匹配主人,找到問題數據的責任人,對責任人進行考核。其中最基礎的核心工作便是為數據匹配主人:
(1)梳理數據流圖,主要是根據元數據清單結合現業務系統界面,按照“數據流圖-流圖節點-節點對應數據項”的對應關系進行梳理,形成數據流圖文件,并下發至試點局,然后試點局根據實際情況對其進行了核對、確認、修改并最終形成統一文件。
(2)確定認責矩陣,試點局將統一后的數據流圖進行細化,關聯業務系統的數據模型和庫表,建立認責文檔,結合公司的4A組織機構及崗位設置,確認每一個數據流的節點的負責崗位路徑,核對節點中所有字段對應的責任人崗位,形成認責矩陣。
(3)形成認責成果,統計業務系統和數據中心的數據項并對其重要程度劃分,并設置、調整和確定數據認責矩陣中每一個崗位對數據項的權重,兩者結合,根據認責矩陣,對所涉及的數據項進行重要性分級,規范各級數據在不同流程節點、不同崗位的不同權重,形成認責成果。
(4)形成考核方案,數據認責矩陣讓基于問題數據的責任追溯得以實現,確認的數據責任人,即數據主人,根據問題數據的級別及數據主人崗位的權重,進行績效考核,考核結果按各地市局實際考核方案制定比例。
2 結合質量校驗規則,形成數據主人數據質量報告
對數據主人認責成果分析、設計、完善,集成到數據質量管理平臺,使基于規則的數據校驗結果進行認責得以實現。在數據質量管理平臺上設計并開發出數據主人的數據質量報告模板,包括基于數據質量規則校驗出的問題數據清單,對數據主人整改進度跟蹤,并進行成效評估。在數據質量管理平臺上實現按照崗位展示所有問題數據和重要程度,按照問題數據定位到所在崗位,從“數據項”及“數據主人”兩個不同維度實現對數據項重要性的展示。
通過質量平臺追溯問題數據責任人不僅實現了對問題數據的定位、定責和分析,而且形成的基于數據主人的數據質量報告具有針對性,易于理解與快速進行整改操作,節省人力物力,大大提高數據治理效率。
3 提供數據治理工具,督促數據主人主動整改
在統一數據認責規范,發現問題數據,定位問題數據主人之后,便是問題數據的整改,而大部分問題數據的處理更改“牽一發而動全身”,細微的變動有可能對整個數據鏈產生巨大的影響,為此項目開發了營銷、生產等五個業務域的數據治理工具和一個賬卡一致性工具,為應用單位開展數據治理提供便捷入口,輔助數據治理平臺完成數據主人問題數據的治理工作,為數據質量的治理提供整改工具,解決問題數據整改流程長,跟蹤監督困難等問題,減輕數據維護人員后臺處理數據的壓力和安全風險。數據主人運用這些數據治理工具輔助分析、自動化修正,將可提升每月人工處理的數據量,并保證數據治理過程的安全及全程監控。通過問題數據發起整改和整改完成統計等監控,實現整改過程動態監控,構建良好的綠色數據生態。
4 提供數據主人視圖,開通數據質量管理自助通道
基于數據主人的數據治理體系,要想從業務端著手,達到全面信息化數據治理的目的,還需要一個面向業務系統操作人員的終端用戶系統,借以提升整改效率及基層用戶體驗,減輕基層人員工作壓力,提升工作效率,通過調研數據主人認責工作全流程,提供數據主人視圖系統:一個主要界面是以數據認責成果為基礎,展示給數據責任人的全部負責數據的全視圖(數據主人全視圖),另一主要界面,是結合數據質量管理平臺提供的數據主人數據質量報告形成數據主人問題視圖,并且提供整改及申訴通道,同時系統與4A組織配套形成基于數據主人賬號權限的用戶管理,讓數據主人自助整改問題記錄,將數據治理工作化整為零。
5 結束語
該體系成果在地市局開展應用,通過確定數據主人,提高全員數據主人責任意識,提升了公司數據質量。
(1)通過制定一系列工作標準文件、管理數據質量管理系統、建立數據認責工作成果評價體系三個方面進行控制,形成對數據主人的閉環管理;
(2)通過梳理數據流圖,確定數據責任矩陣,根據業務流程節點、數據項和崗位對應的關系,形成統一的崗位認責文件,明確了業務人員的數據質量責任范圍與權重,為數據精準地找到主人,提高了問題數據的有效處理效率;
(3)通過信息化手段支撐數據認責、追責過程,提供了高效的數據治理工具,并取得了良好的數據質量提升效果。
該舉措大大提升數據質量水平,提高數據準確度,為社會提供更加精準、良好的電力服務,能夠降低數據風險,降低客戶服務抱怨的發生率和處理時間,提高廣東電網公司電力服務的可靠性,提高社會滿意度,大幅提升電力數據質量水平,提升電力數據價值,將公司的數據分析成果與政府、社會相關部門共享,輔助了解把握電力運行狀態及經濟動態,及時優化調整社會政策,起到電網企業主動承擔社會責任的作用。