陳俐冰,何 容,邱 林,王 穎,孫天昊
(1.國網重慶市電力公司 客戶服務中心,重慶 400017;2.重慶大學 計算機學院,重慶 400044)
電力客服中心用戶行為分析研究與實現
陳俐冰1,何 容1,邱 林1,王 穎1,孫天昊2
(1.國網重慶市電力公司 客戶服務中心,重慶 400017;2.重慶大學 計算機學院,重慶 400044)
目前電力客服中心已經開展了多元化服務渠道為客戶提供全方位的服務,但缺少對各渠道的深度挖掘和分析。針對這種情況,提出基于大數據進行電力客服中心用戶行為分析,將為多個電力客戶服務渠道建立智能在線監測分析系統。首先進行分布式多線程的數據采集,然后基于大數據從多維度進行用戶在線行為分析,包括統計分析和聚類分析等。其中統計分析包括服務渠道指標、服務功能總指標、單個服務功能指標、客戶訪問時間指標、客戶區域分布等,聚類分析采用K-means聚類根據忠誠度、使用頻度、貢獻度三個指標進行用戶細分挖掘分析。實現的系統能夠獲得各渠道的客戶行為特性,為企業全面掌握各服務渠道提供了支撐,有助于提供更為智能便捷的個性化服務。
大數據;電力大數據;數據挖掘;用戶行為分析
隨著數字信息化時代的迅猛發展,信息量也呈爆炸性增長態勢。近年來,電力行業信息化發展迅速,特別是伴隨著下一代智能化電網的全面建設,以物聯網和云計算為代表的新一代IT技術在電力行業得到廣泛應用,電力數據資源開始急劇增長并形成了一定的規模。
電力大數據是以業務趨勢預測、數據價值挖掘為目標,利用數據集成管理、數據存儲、數據計算、分析挖掘等方面的核心關鍵技術,實現面向典型業務場景的模式創新及應用提升[1]。電力大數據的應用將推動公司業務發展和管理水平。其中客戶服務中心是公司優化整合服務資源,打造“全業務、全天候,服務專業化、管理精益化、發展多元化”的供電服務平臺。
目前重慶電力客服中心已經開展了多元化服務渠道為客戶提供全方位的服務,包括短信、網站、手機APP、微信、有線電視等。
文中將基于電力大數據對電力客服中心的用戶行為進行分析研究。用戶行為的研究與心理學、社會學、社會心理學、人類學以及一切與網絡行為的學科密切相關,它研究網絡用戶行為的規律性,借以控制并預測網絡用戶行為,并實現特定的目標。具體來說,網絡用戶行為研究就是分析網絡用戶的構成、特點及其行為表現出來的規律[2]。
對短信、網站、手機APP、微信、有線電視等多個電力客戶服務渠道建立智能在線監測分析應用,進行分布式多線程的數據采集,從多維度進行用戶在線行為分析,研究用戶行為,各渠道的客戶群體特性,為提供更為智能便捷的服務奠定基礎。進行全面系統的用戶行為分析,有助于掌握各渠道客戶實際使用情況,為有針對性地進行各服務渠道的優化提升,進一步提供個性化服務定制奠定基礎。
目前基于大數據的用戶行為分析最常用的技術是數據挖掘技術,包括大數據平臺的構建、數據整合、數據挖掘、分析展示等方法。
文獻[2-3]研究了基于大數據的網絡用戶行為分析。文獻[4]實現了一個基于數據挖掘技術的電網用戶行為分析系統進行用電客戶細分、客戶信用等級評估和欠費高風險客戶預測。文獻[5]提出了一個基于大數據,云計算和智能網格的關系分析的電力大數據平臺的通用框架。電力大數據的關鍵技術包括大數據管理技術、大數據分析技術、大數據處理技術和大數據可視化技術。
文獻[1,6-7]研究了大數據技術在電力行業的具體應用。其中,文獻[1]利用大數據技術應用于客戶服務中心,可實現面向典型業務場景的模式創新及應用提升,包括服務質量實時監控,熱點問題集中處理等。文獻[6]根據電力行業特征,分析了電力大數據的生成階段、大數據的應用方式等。文獻[7]討論了大數據時代下電力企業數據挖掘的過程。
文獻[8-11]研究了數據挖掘技術在客戶服務中的應用。其中,文獻[8]具體研究了數據挖掘技術在電信客戶服務的應用。文獻[9]提出了一個大數據應用框架來分析客戶行為。首先客戶相關數據被轉化為拓撲數據結構,然后使用拓撲關系生成共生矩陣,并用來為客戶行為分析推導馬爾可夫鏈模型。文獻[10]提出并實現了一個網絡用戶行為分析系統,該系統基于Hadoop分布式平臺獲取流量,分析用戶行為。文獻[11]通過個案研究,大數據分析支持創建,提高和增強各種商業服務,既能顯著提高客戶體驗,又能為企業創造價值。
基于目前大數據技術和數據挖掘技術,研究和實現了電力客戶服務中心的用戶行為分析系統。
2.1 系統流程
系統按照圖1所示流程進行。先從多個數據源中基于大數據平臺進行數據采集,具體數據源包括為客戶提供全方位服務的短信、網站、手機APP、微信、有線電視等多元化服務渠道所產生的客戶服務數據,具體包括用電查詢、電費繳納、業務辦理、信息訂閱、服務開通等。接著對采集到的數據進行建模,包括數據約簡和轉換等環節,形成標準化的可以使用的數據,如統一標準的服務功能訪問記錄等。建模好的數據通過Sqoop工具進行抽取,整合到Hadoop大數據平臺的分布式數據庫HBase中。然后使用數據挖掘技術進行具體的用戶行為分析,從多維度(如服務渠道指標、服務功能總指標、單個服務功能指標、客戶訪問時間指標、客戶區域分布等)進行包括用戶行為特征、客戶群體特性、服務渠道特征等行為分析。最后進行可視化的結果展示,包括柱狀圖、曲線圖、餅圖和條形圖等,為進一步決策提供支撐。

圖1 用戶行為分析流程
2.2 系統設計
用戶行為分析系統的功能包括數據采集與建模、數據挖掘與分析、結果可視化展示等關鍵內容,如圖2所示。
(1)數據采集具體包括數據源選擇與數據源維護等功能。數據源選擇,就是選擇需要進行處理的數據源,通過數據接口的方式進行數據采集。數據源維護,就是數據源相關信息(如名稱、鏈接地址、用戶名和密碼等信息)的修改。
(2)數據建模主要加工在數據采集中所選擇的數據源,包括數據清洗、數據集成、數據歸約和數據轉換四個功能。數據清洗是在確定清洗的數據屬性后對所選擇的數據源進行清洗加工。數據簡化主要是對數據源中某些數據按月份或年份做匯總處理。數據歸約是對所選擇的數據源中某些不相關屬性利用直接刪減法、信息增益法等進行處理。數據轉換包括數據標準化和數據泛化,主要是對數據源中的連續值和離散值做不同的處理。針對數據源中的連續值,采用標準化作為數據轉換的方法,而針對數據源中的離散值,采用數據泛化的方法。

圖2 用戶行為分析系統的功能
(3)數據挖掘模塊,可選擇使用統計分析方法、層次分析法、KNN分類算法和K-means聚類算法等對用戶行為進行具體的分析和預測。
統計分析方法是指對目標數據集中的關系屬性進行整理歸類并進行解釋的數據挖掘方法[12]。比較常用的有:因子分析、相關分析、判別分析、回歸分析等。
K-means是一種基于樣本間相似度度量的非監督學習的聚類算法[13]。可以用來對用戶進行分類等。首先隨機選取k個點作為k個初始聚類中心,然后對剩下的點依據對k個聚類中心的相似度劃歸到對應的聚類中,再更新每個聚類的中心,不斷迭代,直到收斂。
(4)結果可視化展示對挖掘出的結果進行數據分布、數據對比、報表生成。數據分布可以分別按照客戶類別、渠道、功能等不同的分類條件輸出相應的統計信息,并以餅圖或柱狀圖的直觀化形式呈現。數據對比可以分別按照渠道不同的對比屬性輸出相應的對比信息,并以柱狀圖形式輸出對比結果。報表生成分為年報表和月報表,按照渠道的不同屬性生成相應的報表。
2.3 系統實現
最終實現的系統主要完成了各類指標的統計分析和用戶細分。
(1)統計分析。
系統分別從服務渠道指標、服務功能總指標、單個服務功能指標、客戶訪問時間指標、客戶區域分布等幾個方面進行統計分析。其中,對電力客服中心的用戶行為的統計分析包括以下幾個指標:
①服務渠道指標:對每個服務渠道統計出渠道的總用戶數、訪問次數和訪問總時長。
②單功能指標:對每個服務功能統計出其用戶數、訪問時間和訪問時長。
③功能總指標:對每個服務功能統計出各服務功能的總用戶數、訪問次數和訪問總時長。
④用戶喜好指標:從訪問渠道、訪問時長、所訪問服務功能三個方面統計用戶的喜好。
⑤用戶區域分布指標:統計用戶所屬區域的分布情況,給出分布圖及其各占比例。
數據分布和對比包括:
①指標在時間上的分布:包括指標在不同時間粒度(日、周、月、年)上的分布;分布對比(同一指標在不同時間粒度上的對比,不同指標在同一時間粒度上的對比)。
②指標在空間上的分布,包括不同指標在一個地區上的分布;同一指標在不同地區分布的對比。
③時間和空間的結合:指標在同一時間粒度不同地區的分布,指標在不同時間粒度同一地區的分布,分布對比。
用戶喜好分析包括渠道、時間、業務等幾方面,具體為:
①渠道愛好:以用戶在一段時間內對各個渠道的訪問次數作為衡量用戶對渠道的喜好標準。
②時間愛好:以用戶在各個時段訪問時長作為衡量用戶時段喜好的標準。
③功能愛好:以用戶在一段時間內對各個服務功能訪問次數作為衡量用戶對功能的喜好標準。
系統實現的數據分析界面如圖3所示。
其中,渠道分析分別向系統用戶展示每個渠道的用戶數、訪問次數、訪問頻度等,用統計圖和表格兩種方式顯示。服務功能總指標分析以統計圖和表格的方式顯示不同渠道下各服務的用戶數、訪問次數、訪問總時長。服務歷年走勢分析中系統用戶選擇待分析服務和起止年份,選擇待分析指標(用戶數、訪問次數、訪問總時長)后生成趨勢圖。客戶訪問時間分析中系統用戶選擇待分析服務,設置起止時間后點擊生成分析圖。客戶區域分布分析統計出客戶所屬區域的分布情況并以餅狀圖和表格兩種形式展示結果。

圖3 用戶行為分析系統界面
(2)用戶細分。
客戶細分是把客戶按照一定的標準劃分為多個不同的客戶群,以便有針對性地實行不同的營銷策略[14]。具體的客戶細分指標可以是用戶行為的不同、行為習慣的不同或者客戶需要的不同等等。對客戶進行正確的細分,是電力企業制定營銷策略的起點。
目前,電網企業的一些靜態分類方式,例如根據行業類別、用電類別、用電方式、電壓等級等等,并不能很好地反映出客戶的行為習慣和動態需求,而在實際情況中,客戶的忠誠度、客戶對各渠道服務的使用情況以及客戶對企業利潤的貢獻等指標得到了極大的關注。文中使用K-means聚類技術根據這三個指標進行用戶細分挖掘分析。
①忠誠度:主要表現在客戶從開戶至今所經歷的時間(以月為單位)。
客戶保持時長=當前年月-開戶年月
②使用頻度:是以客戶對各渠道服務的使用頻度情況。使用情況可由用戶對服務的月平均點擊次數來衡量。
使用情況=客戶對各服務總的點擊次數/客戶保持時長
③貢獻度:主要以客戶的月平均用電量來衡量。該指標是電網公司關注的重點指標,因而也是用電客戶細分的關鍵指標之一。
月平均用電量=累計用電量/客戶保持時長
系統實現的客戶細分界面如圖4所示。

圖4 客戶細分界面
在用戶設置好聚類的K值以及時間段之后,系統使用K-means聚類算法訓練學習得出用戶細分結果。
基于大數據技術和數據挖掘技術,研究和實現了電力客戶服務中心的用戶行為分析系統。該系統已投入實際運行,能夠根據短信、網站、手機APP、微信、有線電視等多元化服務渠道所產生的客戶服務數據進行用戶行為分析,包括用戶行為特征、客戶群體特性、服務渠道特征等。通過用戶行為分析,發現用戶行為規律,對企業和用戶都有重要意義。對企業來說,用戶行為分析可以發現用戶對服務渠道、業務的使用特征,幫助企業進行合理資源規劃,使得資源在最大限度滿足用戶需求的同時,降低運營成本;幫助企業了解用戶對服務渠道、業務的興趣所在,從而為企業制定個性化服務提供依據。對用戶來說,企業根據用戶行為進行了服務優化,能夠更快更方便地使用網絡服務。
[1] 陳 超,張順仕,尚守衛,等.大數據背景下電力行業數據應用研究[J].現代電子技術,2013,36(24):8-11.
[2] 任思穎.基于大數據的網絡用戶行為分析[D].北京:北京郵電大學,2015.
[3] 劉淑鑫.面向大數據的網絡用戶行為分析研究[D].上海:東華大學,2015.
[4] 林嘉暉.基于數據挖掘的電網用戶行為分析系統的設計與實現[D].廣州:中山大學,2013.
[5]ZhanJie,HuangJinxin,NiuLin,etal.Studyofthekeytechnologiesofelectricpowerbigdataanditsapplicationprospectsinsmartgrid[C]//Proceedingsof6thIEEEPESAsia-Pacificpowerandenergyengineeringconference.[s.l.]:IEEE,2014.
[6] 趙云山,劉煥煥.大數據技術在電力行業的應用研究[J].電信科學,2014,30(1):57-62.
[7] 盧建昌,樊圍國.大數據時代下數據挖掘技術在電力企業中的應用[J].廣東電力,2014,27(9):88-94.
[8] 陶曉英.大數據支撐下的客戶服務應用探索[J].信息通信技術,2014,8(6):14-20.
[9]ZinTT,TinP,ToriuT,etal.Abigdataapplicationframeworkforconsumerbehavioranalysis[C]//2013IEEE2ndglobalconferenceonconsumerelectronics.[s.l.]:IEEE,2013:245-246.
[10]GuanJianfeng,YaoSu,XuChangqiao,etal.DesignandimplementationofnetworkuserbehaviorsanalysisbasedonHadoopforbigdata[J].CommunicationsinComputerandInformationScience,2014,490:44-55.
[11]AnkurB,NikitaM,SwadeshP,etal.Forecastingconsumerbehaviorwithinnovativevaluepropositionfororganizationsusingbigdataanalytics[C]//Proceedingsof4thIEEEinternationalconferenceoncomputationalintelligenceandcomputingresearch.[s.l.]:IEEE,2013:1-4.
[12]LiuHong.Discussiononthestatisticalanalysismethod[C]//7thinternationaljointconferenceoncomputationalsciencesandoptimization.[s.l.]:[s.n.],2014:383-385.
[13]KhandareA,AlviAS.Surveyofimprovedk-meansclusteringalgorithms:improvements,shortcomingsandscopeforfurtherenhancementandscalability[M]//Informationsystemsandintelligentapplication.[s.l.]:[s.n.],2016:495-503.
[14] 耿筱媛,張燕平,閆 屹.改進的K-means算法在電信客戶細分中的應用[J].計算機技術與發展,2008,18(5):163-167.
Research and Implementation of User Behaviors Analysis of Electric Power Customer Service Center
CHEN Li-bing1,HE Rong1,QIU Lin1,WANG Ying1,SUN Tian-hao2
(1.Customer Service Center,State Grid Chongqing Electric Power Corporation,Chongqing 400017,China; 2.College of Computer,Chongqing University,Chongqing 400044,China)
At present,the electric power customer service center has already carried out the diversified service channels to provide customers with a full range of services,but the lack of depth mining and analysis for each channel.In view of this,the user behaviors analysis of electric power customer service center is conducted based on big data.An intelligent online monitoring and analysis system is set up for multiple power customer service channels.First it collects data using distributed multi thread,then makes online analysis of user behavior with multiple dimensions based on big data,including statistical analysis and cluster analysis.Statistical analysis contains service channel index,service function total indexes,service function single index,customer access time index,customer area distribution,etc..Cluster analysis usesK-meansclusteringtoanalyzeusersegmentationaccordingtoloyalty,frequencyandcontribution.Thesystemimplementedcangetthecustomerbehaviorcharacteristicsofeachchannel,providesupportforenterprisestofullygraspthevariousservicechannelsandhelptogivemoreintelligentandconvenientpersonalizedservice.
big data;power big data;data mining;user behavior analysis
2016-03-29
2016-08-03
時間:2017-01-10
國家自然科學基金資助項目(61472051);重慶市科技計劃項目(cstc2013kjrc-qnrc40003)
陳俐冰(1979-),女,經濟師,研究方向為信息數據分析。
http://www.cnki.net/kcms/detail/61.1450.TP.20170110.0941.020.html
TP
A
1673-629X(2017)02-0116-04
10.3969/j.issn.1673-629X.2017.02.026