999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

湛江地區用電客戶電費回收風險分析

2015-05-30 18:13:47鄭芒英
中國新通信 2015年7期
關鍵詞:數據挖掘模型

鄭芒英

【摘要】 從湛江電網企業的實際需求出發,利用SAS軟件通過分析不同客戶的繳交電費的行為以及客戶基本屬性特征,研究并創先性構建了電費回收風險預測模型,預測并明確客戶的電費回收風險等級。基于現有客戶服務管理資源,有效利用客戶動態數據資源和邏輯回歸預測模型,充分把握客戶需求,按照不同客戶群體的特點開展個性化服務。針對高風險的客戶,提前有針對性地采取個性化服務策略和具體措施,確保電費及時回收,降低企業經營風險,進而加強電費回收風險管控能力的提升,為電網企業個性化優質服務策略的制定奠定了基礎。

【關鍵詞】 邏輯回歸 數據挖掘 客戶細分 差異化服務 模型

新電改方案已于2014年底在深圳市試點實施,方案的核心內容是確立電網企業新的盈利模式,不再以上網及銷售電價差作為收入來源,而是按照政府核定的輸配電價收取過網費[1]。湛江地區是新電改方案非試點實施區域,目前湛江電網企業的主要經營利潤仍來自于電費回收。湛江電網企業為了加強對電費回收的實時監控;加強銀企合作,加快電費資金歸集速度;全面推廣客戶信用評價機制,建立基于客戶信用的電費回收策略,防范電費回收風險,希望通過分析不同客戶的繳交電費的行為以及客戶基本屬性特征,進行客戶的電費回收風險預測,對不同客戶提前采取差異化的電費回收策略和預防措施,保障企業的電費收入,有效控制企業經營風險,進而加強電費回收風險管控能力的提升。

一、用電客戶電費回收風險的現狀分析

在湛江地區進行需求調研的過程中,在電費回收方面均有一定的需求反饋。

(1)高欠費風險客戶增加了資金風險,但目前缺少針對高欠費風險客戶的差異化的服務措施和辦理業擴業務時的防范措施,以降低企業資金風險;

(2)部分欠費風險高的用戶重新申請業擴新裝時,缺乏有效手段發現其欠費風險和欠費情況,并要求其清剿歷史欠費;

(3)在裝表接電環節,無法根據客戶拖欠電費的風險程度,有選擇地對部分客戶選用預付費卡表;

(4)無法根據客戶的欠費風險和獲取繳費信息渠道的偏好采取不同的電費通知方式,使電費信息能夠及時有效的通知到客戶;

(5)無法找出電費回收可能存在風險的客戶或群體。

在這樣的業務背景下,想要強化電費回收風險的管控,需要明確每個客戶的電費回收風險等級,找到高風險客戶,有針對性地采取差異化的策略和具體措施,確保電費及時回收,降低企業經營風險。

然而,在當前的業務現狀下,尋找用檢風險高的客戶存在一定的困難,主要體現在以下兩個方面:

(1)電費回收高風險客戶沒有統一的定義。目前,不同業務人員心目中都有一些電費回收風險高的客戶的特征(也就是通常所謂“壞客戶”的特點)。例如抄核收人員認為多次催繳,甚至上門催繳也不來繳費的客戶是高風險的客戶;電費核算人員認為連續幾期電費都存在逾期的客戶是高風險的客戶;客戶經理認為生產波動性大的企業,由于經營狀況不穩定,經常容易發生欠費,是高風險客戶等。

(2)電力營銷系統中沒有統一標識每個客戶的電費回收風險等級。目前,電力營銷系統中并沒有“電費回收風險”這樣的客戶標識,同時存在許多和電費風險相關的字段,如欠費金額、欠費次數、信用等級、是否預存電費等。這些字段較多較散,無法讓業務人員綜合使用。

為了解決以上業務人員在實際業務過程中遇到的問題,需提取電力營銷系統里的與電費回收相關的各字段信息,運用算法模型,預測客戶的電費回收風險,并在系統中為客戶進行標識。

電費回收風險預測,是對用電客戶未來按期繳費行為的提前預測,希望通過差異化提醒和賬單等方式,提高電費回收率指標。根據湛江地區的199.9萬非居民用戶和176.9萬居民用戶龐大、異構、多源的基本數據和業務數據,通過數據挖掘[2][3]工具對數據進行分析、預測。

二、用電客戶電費回收風險分析的建模

本研究工作采用的主要工具是SAS軟件。SAS(全稱STATISTICAL ANALYSIS SYSTEM,簡稱SAS)是全球最大的軟件公司之一,是由美國NORTH CAROLINA州立大學1966年開發的統計分析軟件,具有完備的數據存取、數據管理、數據分析和數據展現功能[4]。在計算機上安裝SAS Enterprise Guide(以下簡稱SAS EG)5.1瘦客戶端和SAS Enterprise Miner(以下簡稱SAS EM)后,根據SAS方法論流程進行分步實施。根據湛江地區用電客戶電費回收風險現狀、調研需求及SAS方法論,制定電費回收風險分析流程。從電費回收的業務數據獲取、整理,數據導入,數據處理,數據建模,模型評估到實際應用,該分析流程是一個PDCA循環過程。

2.1數據獲取、整理

經過與電網企業客服服務中心、市場營銷部、區(縣)單位的營銷部門交流溝通后,對業務數據和結合實際情況對用電客戶信息進行相關性分析[5]。相關性分析是指對兩個或多個具備相關性的變量元素進行分析,從而衡量兩個變量因素的相關密切程度[5]。初步確定用電客戶的電費回收風險可能與用電客戶的城鎮/農村用戶、出賬周期、當前是否銷戶、地市局編碼、電費計算日期、電費實際金額、電價代碼、罰金金額、負荷類型、供電電壓、行業類別、合同容量、計算日期、繳費方式、繳費日期、繳費月份、客戶編號、客戶類型、客戶名稱、客戶身份、失敗次數、違約次數、用電類別、用電性質、月份和總電量有密切關聯。

確定時間窗口為2012年1月至2013年12月,從電力營銷系統后臺導出湛江地區非居民和居民用戶基本數據表和業務數據。2013年6月以前為表現期,用于計算客戶的行為屬性;2013年7月至2013年12月為觀察期,用來確定目標客戶。

2.2數據處理

根據與電費回收風險相關基本數據表及相關字段,從電力營銷系統后臺導出與電費回收風險具體的數據表數據,在SAS EG進行數據導入。對導入SAS EG的數據表需進行數據篩選[6](刪除無效數據,篩選有用數據)、對變量進行二次變量生成等數據處理[6][7]步驟。

將欠費客戶根據客戶編碼分為兩部分:居民欠費客戶和非居民欠費客戶。找出在2013年1月至2013年12月之間有欠費的客戶,根據欠費客戶數占總體客戶的比例,以及欠費金額和欠費次數分布情況,最終根據平均值或中位數劃分好與壞客戶,確定一個標準。根據平均值、中位數劃分壞客戶,劃分金額都存在偏大或偏小,可能都與湛江地區實際情況不符,與業務專家討論收集意見,結合湛江地區實際需求。最終確認湛江地區非居民電費回收風險“壞客戶”樣本選取標準:當非居民欠費客戶的累計欠費金額達到1000元,欠費次數達到2次;居民欠費客戶的累計欠費金額達到20元,欠費次數達到3次,就認為它是目標客戶。

將原始數據表經過多次數據處理后,將處理完的得到的數據表按客戶編號與客戶基本信息進行關聯,得到模型所需寬表合并數據表,最后形成居民和非居民電費回收數據寬表。

2.3數據建模

數據處理得到居民和非居民的目標客戶的客戶編碼CUSTOMER_ID,與處前面處理得到的數據按照CUSTOMER_ID進行匹配。新建一個目標變量TARGET,匹配成功的客戶取值為1,其它為0。將SAS EG得到的數據寬表導入SAS EM進行數據建模。導入SAS EM的各個變量的極值、水平值、標準差等進行變量分析[2]。經過數據處理(計算字段、表合并及異常值處理等)后,在數據建模前對各個變量進行頻數分析。分析發現有幾種情況:電量為負數,主要是沖銷導致有幾戶為負數;客戶年齡缺失值較多;其他未發現數據不可用情況。使用邏輯回歸[8]或決策樹[8]方法時,缺失值也會進行分類處理。因此對上述異常情況不需要特別剔除。

為了找出與樣本客戶有較強相關關系的屬性字段,采取相關性分析方法。經過相關性分析后最終選取高相關字段進行建模,與樣本客戶有較強相關關系的屬性字段:合同容量、城市/農村、繳費時長、繳費金額、繳費次數。

2.4模型選擇

電費回收風險預測,是對用戶未來按期繳費行為的提前預測,希望通過差異化提醒和賬單等方式,提高電費回收率指標,因此需要采用預測模型(邏輯回歸、決策樹模型)。

(1)邏輯回歸模型

邏輯回歸模型的算法:對概率發生比率 (odds值) 進行對數變換,作為目標變量X,然后用各種因素進行線性回歸預測其概率轉換后的目標值Y,假設p為事件發生概率,設,建立模型[7]。

(2)決策樹模型

決策樹模型的算法:根據各個變量的區分度(如信息熵,基尼統計量等),從根節點對每個節點進行分裂直到不滿足分裂準則,每個節點上的好壞占比即為發生概率[7]。

電費回收風險模型中,選擇居民客戶,一年之內有過3次及以上欠費的,并且累計欠費金額大于20元的;非居民客戶,一年之內有過2次及以上欠費的,并且累計欠費金額大于1000元的。這些客戶為電費回收高風險客戶,將這些客戶的目標變量設定為1,其余客戶設定為0。為了防止樣本客戶的過度訓練,需對數據進行分區,按40%, 30%, 30% 拆分成訓練集、驗證集和測試集;如需將區間型或列名型變量轉換成序數型變量則需采取交互式分箱轉換方法。

采用邏輯回歸方法,非居民客戶模型對驗證集進行評分排序后,前5%的客戶里壞客戶占比為8.31%,提升度為 15.8 倍;居民客戶模型對驗證集進行評分排序后,前5%的客戶里壞客戶占比為33.1%,提升度為 12.2 倍。

應用邏輯回歸公式對全量客戶打分,之后對每個分群的風險客戶占比進行統計。統計發現,非居民(居民)全量客戶中壞客戶占比與驗證集的比例接近。也就是模型具備較好的普適性,不存在“過擬合”的問題。運用決策樹模型建模,由于純度低,沒有變量滿足決策樹根節點分裂的條件,因而該建模方法不適用。對比之后,最終采用利用邏輯回歸算法建模得到的非居民和居民電費回收風險模型。

運用SAS EM工具,進行數據建模。最終選定的建模流程,如圖1、 2所示。

2.5模型評估

運用邏輯回歸算法,提取全體客戶數據,對全體客戶打分排名。將電費回收風險分數從高到低進行排列,按照湛江電網的服務資源,劃分不同等級的客戶風險度,前5%非居民(居民)純度比對發現高風險客戶群主要集中在前5%。將前5%客戶進一步細分,可以確定前1%的純度非常高。因此建議非居民電費回收風險的分群方法為:前1%為高風險群;2%-5%為次高風險群;后95%為低風險群。

三、模型應用

模型評估后,分別對非居民和居民的電費回收風險進行業務特征刻畫,從而反映不同客戶群體的特征差別。

(1)非居民電費回收風險特征刻畫

行業類別:從絕對數量來看,高回收風險群數量最多的行業是其他,其次是無行業分類和制造業;從相對概率來看,交通運輸倉儲和郵政業中高回收風險客戶比例最高,其次是商業住宿及餐飲業、公共事業和管理組織。

用電類別:從絕對數量來看,高回收風險群數量最多的是普通工業,其次是非工業;從相對概率來看,非工業中高回收風險客戶比例最高,其次是農業生產和普通工業。

合同容量:從絕對數量來看,高回收風險群數量最多的是合同容量小于100kVA的客戶,其次是100-315kVA的客戶;從相對概率來看,合同容量100-315kVA的客戶中高回收風險客戶比例最高,其次是315-1000kVA的客戶。

(2)居民電費回收風險特征刻畫

城鎮/農村:居民客戶電費回收高風險客戶主要是城市客戶,其他兩個群的城市農村占比接近。

利用電費回收風險客戶細分[9][10]的結果,可在實際業務場景進行應用,如下幾點:

(1)在用電客戶電費回收的催費流程中,抄核收人員可根據用電客戶電費回收風險細分結果設置流程處理的優先級,以保證業務員進行電費催收時重點關注高風險用戶,提高電費回收成效。

(2)對高電費回收風險的客戶,客戶服務人員在電費通知單上增加客戶近12個月繳費時間列表,違約金情況;提醒高風險客戶,及時交費避免產生違約金;對渠道溝通活躍度高的客戶,在電費通知單上增加網上營業廳網址和掌上營業廳應用二維碼,引導客戶使用自助服務渠道進行及時交費。

(3)在客戶新報裝時,注意清剿歷史欠費;出賬、帳單生成、打印和遞送,制作差異化賬單;提供上門收款服務,移動式POS機收款等差異化服務等。

四、結論

通過對湛江地區用電客戶電費回收風險分析,解決營銷系統中原先并沒有統一標識電費回收風險客戶的問題,有助于電網企業電費回收風險管控能力的提升。得到結論如下:

(1)用電客戶電費回收風險分析模型穩定,有利于基于電費回收風險的差異化催收,高電費回收風險客戶的賬單差異化和出賬、帳單生成、打印和遞送差異化服務等,將催費環節前移到繳費期截止前,從而促進電費回收;

(2)建立了用電客戶電費回收風險分析模型,適用范圍不局限于湛江地區,同樣適用于其他地區;

(3)根據用電客戶電費回收風險分析思路,有助于湛江地區新的用電客戶行為及服務業務主題的新需求的工作開展。

為了進一步提高湛江地區用電客戶電費回收風險分析模型精確度和適用度可抽取一個新的時間窗口(2014年)的數據,通過模型對新數據進行打分,然后與實際情況作比較,并根據模型在訓練集、驗證集上的表現來看模型是否穩定,其衰減度是否可接受。

參 考 文 獻

[1] QQ858339881.新電改方案 [DB/OL].百度百科,2014-12-26

[2][美]維克托.邁爾.舍恩伯格(ViktorMayer-Sch?nberger)著.大數據時代[M].周濤譯.浙江:浙江人民出版社,2013:26-232

[3]徐子沛.大數據[M].廣西:廣西師范大學出版社,2013:25-89

[4]姚志勇.SAS編程與數據挖掘商業案例[M].北京:機械工業出版社,2010:21-246

[5] p8p9p11.相關性分析 [DB/OL].百度百科,2014-12-12

[6]JiaweiHan,MichelingKamber,JianPei,等著.數據挖掘:概念與技術[M].韓家威,譯.北京:機械工業出版社,2006:62-81

[7]張文霖,劉夏璐,狄松.誰說菜鳥不會數據分析[M].北京:電子工業出版社,2012:8-30

[8](新西蘭)IanH.Witten,EibeFrank著.數據挖掘實用機器學習技術[M].董琳,邱泉,于曉峰,等譯.北京:機械工業出版社,2006:40-133

[9]溫德爾史密斯.客戶細分[DB/OL].百度百科,2014-07-31

[10]林嘉暉.基于數據挖掘的電網用戶行為分析系統的設計與實現[D].廣州:中山大學,2013

猜你喜歡
數據挖掘模型
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
3D打印中的模型分割與打包
一種基于Hadoop的大數據挖掘云服務及應用
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 亚洲无码高清免费视频亚洲| 日韩精品久久无码中文字幕色欲| 国产无遮挡猛进猛出免费软件| 孕妇高潮太爽了在线观看免费| 综合人妻久久一区二区精品| 国产精品yjizz视频网一二区| 欧美一级夜夜爽www| 国产精品无码作爱| 久久夜夜视频| 日韩天堂视频| 久久人体视频| 综合色在线| 国产一区二区人大臿蕉香蕉| 毛片大全免费观看| 中文字幕色站| a毛片基地免费大全| 又粗又大又爽又紧免费视频| 国产色网站| 五月天香蕉视频国产亚| jizz亚洲高清在线观看| aaa国产一级毛片| 国产精品短篇二区| 亚洲swag精品自拍一区| 18黑白丝水手服自慰喷水网站| 1769国产精品视频免费观看| 亚洲色无码专线精品观看| 国产成人一区免费观看| 免费看一级毛片波多结衣| 国产无码网站在线观看| 亚洲国产成人超福利久久精品| 欧美性猛交xxxx乱大交极品| 国产麻豆精品久久一二三| 午夜少妇精品视频小电影| 国产精品xxx| 日韩国产 在线| 国产一在线| 特级aaaaaaaaa毛片免费视频| 国产午夜看片| 青青青国产视频| 4虎影视国产在线观看精品| 国产欧美日韩精品综合在线| 成人免费一区二区三区| 亚洲日韩精品伊甸| 久久夜夜视频| 国产免费人成视频网| 国模在线视频一区二区三区| 日韩不卡免费视频| 国产精品一区二区在线播放| 中文字幕人妻av一区二区| 久久毛片基地| 亚洲a免费| 丝袜久久剧情精品国产| 国产v欧美v日韩v综合精品| 亚洲欧美一区二区三区蜜芽| 亚洲色图欧美激情| 天天色综网| 五月天福利视频| 99精品免费在线| 99热这里只有精品免费| 免费观看三级毛片| 亚洲国产av无码综合原创国产| 久久网欧美| 97在线国产视频| 国产国拍精品视频免费看| 大陆精大陆国产国语精品1024| 亚洲成人在线免费| 日韩二区三区| www成人国产在线观看网站| 亚洲美女高潮久久久久久久| 欧美日韩在线亚洲国产人| 日本亚洲最大的色成网站www| 成人免费一区二区三区| 女人18毛片久久| 久久精品国产91久久综合麻豆自制| 干中文字幕| 99在线视频网站| 免费一级毛片在线播放傲雪网| 亚洲一区二区三区国产精华液| 中文字幕在线日韩91| 欧美翘臀一区二区三区| 免费一级毛片在线观看| 婷婷色一区二区三区|