左航
(國網鄭州供電公司,河南 鄭州 450000)
隨著電網信息化水平的提升,各業務系統中的數據量越來越大,如何從海量數據中挖掘出想要的信息,充分發揮電網數據資產的價值,是電網大數據技術應用和數據分析需要解決的核心問題。由于客戶消費心智的不斷提升,客戶對供電服務質量的要求也越來越高,隨之而來的客戶投訴也在不斷增加。如何有效處理客戶投訴,進一步減少或消除客戶投訴,降低和消除投訴帶來的不良影響,已經成為電力企業亟待解決的問題,而且隨著電力銷售市場競爭的加劇以及新能源和分布式電源的迅速發展,客戶的用電選擇也逐漸多樣化。因此如何及時準確了解客戶心聲、快速應對、提高客戶滿意度和市場占有率,獲得商業服務模式的創新,已經成為國家電網公司面臨的重大挑戰;目前國家電網公司已經積累了大量的客戶信息、用電信息及客戶投訴等相關信息,如何挖掘、利用數據價值,驅動電網向智能化發展,也已成為國家電網公司管理者思考的重點。
本文以國家電網積累的海量數據為基礎,分析挖掘數據的潛在價值,達到對客戶全面、準確的認識、把握客戶心理、掌握客戶期望,以獲得客戶服務模式上的巨大轉變,最終促進國家電網商業服務模式創新,推動電網智能化發展。
用戶畫像是真實用戶的虛擬代表,是建立在一系列真實數據之上的目標用戶模型,是一種描述目標用戶、了解用戶特點與需求方向的有效工具。
“標簽”的核心概念是:由屬性條件組成,是對客戶某種較為穩定的特征的描述,是沉淀下來的共性客戶知識,會被多次使用。
“標簽庫”的核心概念是:在完成研究對象的各個維度的主要信息數據收集后,高度精煉的抽象出的該對象的全貌標簽庫。
“畫像”的核心概念是:對研究對象信息的標簽化、數字化表征,即通過數據分析、提取、歸納,形成可以準確描述研究對象屬性、特征、性能等信息的標簽庫,利用標簽完美的抽象出研究對象的信息全貌,并能夠有效支撐實際應用場景的執行。
“畫像”構建的核心是高度精煉的抽象出研究對象的標簽。標簽化的目的一方面是對多維信息進行標簽化聚合,方便使用者理解,另一方面標簽本身具有準確性和非二義性,利于后期計算機的識別、分析和統計。
電網用戶數據量大、數據類型多、信息復雜,如何在如此海量的大數據量級中,找到對應每個用戶最具代表性的數據進行分析,依靠數據挖掘算法得到相應標簽,并最終為客戶提供精準服務是首要解決的問題,而相應的數據挖掘算法更是重中之重,見圖1。

圖1 用戶畫像模型構建步驟
一個完整的用戶畫像模型構建流程分為業務定義、數據選擇、數據預處理、模型建設、模型應用5個完整步驟,在實際運用中,業務定義主要是要明確分析主題、明確最終輸出、明確應用場景;而數據選擇部分,則是根據模型實際應用情況,選擇適用于模型的業務數據;數據預處理部分,主要是對數據進行探索,從而發現數據存在問題,并對數據進行清洗,同時根據需求計算衍生指標;模型建設部分,則是利用聚類算法、分類算法、文本挖掘算法,構建相應的用戶畫像模型,最后根據模型結果構建電網精準服務與預警系統,幫助電網企業加深對用戶的認識,掌握客戶實際需求,實現客戶的精準化服務,提升客戶滿意度,最終促進電網智能化發展。
整個系統包括后臺數據管理存儲,以及前臺應用和展示功能,其中后臺原始數據和數據預處理之后的數據,利用MYSQL數據庫進行存儲。前臺應用和展示界面則使用ECharts技術,對后臺分析數據進行可視化展示。本系統利用這樣的總體架構對整個用戶畫像及的電網精準服務與預警系統進行開發與設計,初步實現對電網客戶的用戶分群及預警作用,見圖2。

圖2 功能模塊設計圖
數據匯總層是對營銷系統數據、客服系統數據、采集系統數據以及第三方數據進行整合,并對數據進行預處理。
客戶畫像層是根據客戶屬性中基礎信息、用電行為、觸點記錄、費用記錄等基本屬性,同時統計客戶交費行為、用電行為、互動行為、客戶價值作為簡單標簽,同時利用算法挖掘復雜標簽,如決策樹。
標簽應用層主要是對模型結果進行信息輸出,例如經營分析、客戶畫像,從而實現客戶的精準化服務,提升客戶滿意度,最終促進電網智能化發展。
以用戶畫像實時監測預警與主動服務相結合的管理模式,有效降低了投訴數量,實現主動服務,降低投訴風險;完成對客戶畫像的精準分類,并給予客戶畫像分類結果,對營銷策略和服務模式進行優化完善,為客戶提供更加豐富的增值服務;通過系統的實施,加強了各業務部門之間的聯系,促進部門之間的業務協同,使信息在內部能夠自由流通,并且有效發揮了數據應用的價值。