周艷梅 朱好 李松琛 夏通

【摘 要】對95598客服中心接到的工單數據進行分析,結合往年同期溫度、降雨量、極端天氣、節假日等外部因素,利用超限學習機訓練得到95898故障工單預測模型,從而可以提前布置搶修隊伍、搶修車輛、搶修物資的合理化安排,從而綜合提升95598工單精準服務。測試實驗表明,該預測模型的預測精度能達到85%以上。利用該模型,能夠有效地實現故障報修服務的事前管控。
【關鍵詞】95598客服;故障工單;超限學習機;加權超限學習機;預測模型
中圖分類號: TM911.4文獻標識碼: A文章編號: 2095-2457(2019)31-0034-002
DOI:10.19694/j.cnki.issn2095-2457.2019.31.014
95598是全國電力系統公用的客服電話,屬于呼叫中心的一種,是目前國內最好的服務熱線之一。服務熱線95598,主要功能是受理客戶的故障報修、業務咨詢、信息查詢、投訴、舉報、建議、意見等七大類,是供電公司營銷體系的重要組成部分。95598利用電話平臺,建立“一口對外”的客戶服務中心,為電力企業與用戶之間建立起直接的溝通渠道,為電力客戶提供快捷、優質的服務。縮短了供電企業與客戶在時空上的距離、對外提高供電公司的客戶服務水平,樹立專業、高效的良好社會形象,對最終創建全國乃至世界一流的供電企業做出了重要的貢獻[1]。
95598收集到的客戶信息涵蓋了國網向客戶提供的所有服務,通過客戶的來電可以全面了解客戶需求及關心的所有熱點、難點問題[2]。以浙江省麗水市為例,近期某個樣本時間段內95598工單數26937件。其中,故障工單數19710件,投訴、咨詢、舉報、表揚、建議、意見、服務申請等非故障工單數7227件。可見,故障工單數在總工單數中的占比是最高的。
此外,由于目前故障報修采用直派流程方式,故障服務熱點分散在不同類型的95598工單中,無法快速反應當前供電服務的熱點問題,同時95598工單依賴人工統計分析,導致不能及時發現處理一些服務熱點問題,并且,依靠人工統計分析95598工單的數據有局限性和帶有主觀性。因此,有必要將數據進行整合分析,利用以往數據建立故障工單預測模型,實現故障報修服務的事前管控。
目前,故障工單預測模型的研究并不多見,文[3]設計了一種多元線性回歸模型來預測故障工單數,但實際上,并沒有研究表明,故障工單數與相關因素是線性回歸的關系,因此本文利用超限學習機算法進一步對故障工單預測模型進行研究。
1 超限學習機
由于單隱層前饋神經網絡(Single-hidden layer feedforward network,SLFN)能夠逼近任何非線性模型,且逼近效果好,速度快,這使得單隱層前饋神經網絡在目標識別、樣本分類、自動控制等許多研究和應用領域得到了廣泛的應用。
圖1為一個單隱層前饋神經網絡。
圖1 單隱層前饋神經網絡
最近幾年,新加坡南洋理工大學的黃廣斌教授提出了一種稱為“超限學習機(Extreme Learning Machine,ELM)”[4]的單隱層前饋神經網絡學習算法,在該算法中,模型的隱層權和偏差為隨機設置,然后利用最小二乘法計算得到外權矩陣,訓練過程為直接法,并不需要反復迭代和更新。與已知的其他神經網絡算法,譬如BP算法以及支持向量機等方法相比,簡單高效且泛化性能好等特點。超限學習機理論最近也得到了生物和腦神經學的直接生物驗證,彌補了機器學習和腦學習機制之間的空白,解決了計算機之父馮·諾依曼60年前的關于人腦和計算機結構和能力的困惑。現在超限學習機已經被廣泛應用在模式識別、模式分類、預測等當中[5-6]。
超限學習機算法中,設輸入樣本為x,則其隱層輸出的形式表現為一個向量h(x)=[h1(x),h2(x),…,hL(x)]對于給定的N個訓練樣本(xi,ti)學習機的數學模型為:
Hβ=T(1)
其中H為隱層輸出矩陣,β為輸出權矩陣,T為目標矩陣,其中:
■(2)
利用正交投影法計算H的廣義逆后可得:
當■時,
β=H■(HH■)■T(3)
當N>1時,
β=(H■H)■HTT(4)
為了進一步提高超限學習機的泛化性能,文[7]引入了一個正數C,將(3)式和(4)式分別修正為,
β=H■(■I+HH■)■T(5)
當N>L時,
β=(■I+H■H)■H■T(6)
其中I為N階單位矩陣.
當超限學習機作為預測算法使用時,期望輸出向量ti可按照實際情況定義為實數、向量或者矩陣。
2 故障工單數據的獲取與分析
與故障工單數相關的分析數據有氣象數據、極端氣候數據、節假日信息、月份信息等數據信息。分別從95598系統、麗水統計局網站、中國天氣網、麗水水文信息網等途徑收集數據。
首先對數據進行預處理。
第一步:剔除重復數據或者適當加入噪聲數據,避免出現過擬合訓練數據的情況。
第二步:利用熱卡填充的方法,對缺失數據進行填充,使得數據得以有效使用。
第三步:剔除異常點和強影響點。異常點是遠離數據集合中心的數據點,強影響點是數據集中的那些對統計量或參數的估值結果有非常大的影響力的數據點,通過剔除這些點,可對預測模型進行改進。
3 故障工單數預測模型
實驗中使用的仿真軟件為:Matlab R2017b。實驗的環境為: Window 10 64位操作系統,Intel Core i3-6100 3.70GHz,8GB內存。
輸入樣本屬性為5個,分別為氣溫、降水量、極端天氣、月份、節假日。其中,12、1、2月的氣溫數據采用每日最低溫度值,3、4、5、9、10、11月的氣溫數據采用每日平均溫度值,6、7、8月的氣溫數據采用每日最高溫度值。降水量按氣象學上的降水等級劃分小雨、中雨、大雨、暴雨、大暴雨分別對應取值1、2、3、4、5。極端天氣主要考慮臺風、雷暴、雪,按照嚴重程度分別對應取值1、2、3。月份信息12、1、2對應數值1,3、4、5、9、10、11月對應取值2,6、7、8月對應取值3。節假日信息中,節假日對應數值1,非節假日對應數值。以麗水市2018年的365天對應生成365個輸入樣本數據,對應的365個故障工單數作為輸出數據。同時,生成已經過去的2019年上半年麗水市的輸入樣本數據和輸出數據。對輸入數據進行標準化。
預測模型采用的激勵函數為Logistic函數f(a,b,x)=■;(5)式和(6)式中的參數C與單隱層節點個數L的取值采用grid搜索法,C的搜索范圍為2■,2■,…,2■,2■,L的搜索范圍為15,25,…,625,635。
對于測試集的預測值,如果預測的故障工單數和當天實際的故障工單數的誤差小于等于5,被認為是有效預測,否則為無效預測。
實驗中對于2018年的數據集采用5-折交叉驗證,運行50次。
經過驗證,2018年的故障工單數的有效預測率達到了85%以上,2019年上半年的故障工單數的有效預測率達到了80%以上,說明該預測模型能夠滿足電網運監對于故障工單數進行監控工作的實際需要。
4 小結
本文以國網麗水供電公司為例,對95598客服中心接到的故障工單數據進行分析,首先對數據進行預處理,然后利用超限學習機訓練得到一種故障工單預測模型,該預測模型訓練速度快,泛化性好,有效預測率達到了85%以上。利用該模型,能夠有效地實現故障報修服務的事前管控,幫助提高運監部門的工作效率。
【參考文獻】
[1]田媛,試論如何提高95598電力客戶服務工作[J].中國市場,2013(45):36-37.
[2]程超,張凱,程慧,95598系統數據的分析方法及其應用[J].河北電力技術,2015,34(3):37-38.
[3]董知周,陳顯輝,吳海峰,等,基于大數據的配電網搶修工單分析與預測研究[J].供用電,2018,35(4):60-67.
[4]HUANG G B,ZHU Q Y,SIEW C K, Extreme learning machine: Theory and applications[J].Neurocomputing,2006,70(1-3):489-501.
[5]盧誠波,梅穎.前饋網絡的一種高精度魯棒在線貫序學習算法[J].上海交通大學學報(自然版),2015,49(08):1137-1143.
[6]梅穎,盧誠波.面向不平衡數據流的自適應加權在線超限學習機算法[J].模式識別與人工智能,2019(2),144-150.