王旭勇
(深圳供電局有限公司,廣東 深圳 518000)
移動客服終端的運維狀態將直接影響用戶對企業服務的評價,進而影響企業的營銷績效[1]。在企業日常的經營管理過程中,感知移動客服終端的運維狀態并監測其各項基本功能是否正常運行是1項十分重要的工作內容。目前關于設備狀態感知的研究成果較多,但是應用客服終端運維狀態感知的相關內容較少。文獻[2]針對變壓器的狀態感知問題,利用信息屬性約簡技術提升了復雜工況下對變壓器狀態感知的準確性。文獻[3]設計了1種應用于電力生產區域的安全管理狀態感知系統,利用生產區域內的傳感設備,獲取生產設備運行數據進行逼近理想解排序法(Technique for Order Preference by Similarity to Ideal Solution,TOPSIS)分析,保障生產區域安全。對于設備運維狀態感知主要是利用模糊理論、概率統計、灰色模型等分析數據之間的關系,確定設備狀態。上述方法需要大量的先驗樣本,無法保證感知效率與感知精度。而機器學習具有良好的學習性,能夠減輕對先驗樣本的依賴。根據上述分析內容,為了確保終端能夠正常向用戶提供服務,將機器學習算法引入該領域,研究1種基于機器學習的移動客服終端運維狀態自主感知方法。
移動客服終端在向用戶提供相關服務時,會產生大量緩存數據和終端運行數據,這些數據中包含了為用戶提供服務的詳細后臺數據、用戶的反饋信息以及上行指令等。終端中存儲的數據日志和終端與服務響應中心管理服務器間的通信數據中含有大量的終端運維狀態數據序列,在深入分析終端運維狀態數據序列前,需要對其進行基礎預處理,以提升感知效率。
為了減少數據量綱對終端運維狀態數據序列分析的干擾,使用最大-最小值法將同類來源的運維數據轉換為[0,1]區間上的無量綱數據。移動客服終端在運維過程中會隨著時間推移持續不斷地產生數據日志,導致數據量級較大。經過無量綱化處理后,運維數據的體量仍然較大,難以處理。使用時間窗將終端運維數據分段,得到較短時間內的運維數據。分割終端運維數據的時間窗長度計算公式為

式中:β為時間窗長度的決定參數,取值范圍為(0,1];Tp為終端運維狀態數據的基礎循環周期;T1為終端采集運維狀態數據的時間間隔。在數據序列上移動時間窗,保留時間窗內的數據,從而完成按照時間特性對數據序列的分割處理。為了便于對狀態數據序列進行處理,將時間窗分割后的數據轉換為多維結構形式,并進行興趣區域識別。
若分割后的終端狀態片段為z、數據維度為d,依據設定的時間窗長度從不同維度觀測數據序列,得到多維結構化數據為

式中 :Zjt,d表示當時間窗分割后的數據序列長度為t時,在維度d下以截片j為基準觀測到的終端數據。
由于并非所有的數據均表示終端的真實狀態數據,利用聚類算法識別狀態序列中的興趣區間,選擇D密度峰值聚類算法(Density Peak Clustering,DPC)與k均值聚類算法(k-means Clustering Algorithm,kmeans)相結合的方式得到狀態感知的主要數據興趣區域。結構化形式的運維數據集為,其中M為運維數據集中的數據點。數據集某一數據點Zi及其鄰域數據的局部密度ρi為

式中:Dx為選定數據截斷基準片段后基準片段截斷序列的距離;Dij為數據點Zi及其鄰域數據點Zj之間的歐式距離[4];ξ(·)為參數函數,其取值表達式為

在DPC算法中輸入截斷距離Dx作為輸入參數,預先選擇數據序列興趣區域初步聚類范圍。將序列中的所有數據均按照局部密度ρi的大小降序聚類,得到k-means聚類的初始聚類簇。從初始聚類簇中隨機選擇數據點作為對應簇的聚類中心,使用高斯核函數作為權值計算聚類中心與剩余數據點間的加權歐式距離。按照k-means聚類結果,聚類簇中密度最大的區域即為運維狀態感知的興趣區域。
考慮到終端運維數據維度較高,使用機器學習中的卷積神經網絡算法分析上文識別的興趣區域內數據,得到運維狀態感知結果。
本研究使用的卷積神經網絡由1個輸入層、4個卷積層、3個池化層、1個全連接層以及1個輸出層組成。其中,輸入層節點數量與終端運維數據的維度相同,卷積層的卷積核大小分別為12×12、9×9、5×5以及3×3,池化層交替采用平均池化和最大池化2種方式對輸入池化層中的數據進行處理,全連接層將卷積層和池化層在激活函數處理下的數據進行重新加權組裝,最終的結果由輸出層輸出。全連接層中的權重矩陣根據移動客服終端運維指標特征重要性確定[5]。全連接層輸出為

式中:fs為激活函數;Wq為權重矩陣;fc(0)為池化層與連接層的偏差函數;bf為輸出偏置。
在感知卷積神經網絡(Convdution Neural Networks,CNN)中,選用整流線性單元(Rectified Linear Unit,ReLU)函數作為各層計算處理的激活函數。感知CNN各項參數需要經過樣本數據訓練得到,為實現對設備運維狀態的自動感知,對CNN進行如下訓練。
由專家給出移動終端運維狀態數據特征的權重,建立全連接層中的數據特征權重矩陣。初始化感知CNN中的各項參數,進行前向和后向訓練。前向訓練中,向感知CNN輸入樣本數據,根據輸出層與樣本數據之間的相對誤差調整CNN參數。反向訓練中,設定樣本數據的期望輸出E(o),利用似然估計原理計算E(o)與實際CNN輸出R(o)之間的誤差。根據數據梯度下降速度,動態調整CNN的學習速率。判斷感知CNN的訓練輸出誤差是否收斂,若誤差收斂則停止訓練,確認感知參數。將興趣區域內的數據輸入CNN中,經過卷積、池化處理得到客服終端運維中狀態感知數據,從而完成基于機器學習的移動客服終端運維狀態自主感知。
從理論層面對狀態感知方法進行研究后,設計實驗方案對該方法的性能和應用效果進行驗證與分析。
為了對所提方法的性能和應用取得的成效進行驗證,從狀態感知方法的感知效率、狀態數據感知誤差2個方面對比本文所提感知方法與文獻[2]所提方法、文獻[3]所提方法的應用表現。
使用相同參數的移動客服終端開展對3種運維狀態感知方法的驗證實驗,共計150個終端。將移動客服終端隨機均分為3組,分別記為實驗組A、實驗組B、實驗組C。將客服終端投入實際的使用環境中,通過人工技術處理對實驗組內終端的運維狀態進行調整,實驗組A、B、C中的客戶終端每5個進行相同的運維狀態人工調整處理。記錄人工處理后終端運維狀態數據的理論變化值,將該值作為實驗結果分析的參考標準。由3種不同的方法分別感知實驗組A、B、C中的終端運維狀態,并以每5個終端方法的感知數據平均值作為最終的記錄結果。根據相對誤差計算原理公式,計算實驗組A、B、C終端狀態感知結果與參考標值之間的相對誤差。通過指標數據的分析,衡量本文所提出感知方法的應用效果。
使用3種不同的終端狀態感知方法對實驗組A、B、C中的終端運維狀態進行感知,得到各個方法的感知結果與設定的標準參考值之間的相對誤差如表1所示。為7.8%;文獻[2]所提方法的感知相對誤差最高為27.9%,最低為19.8%;文獻[3]所提方法的感知相對誤差最高為29.7%,最低為21.8%。基于機器學習的感知相對誤差上下限之間的范圍更小,說明該方法對于終端狀態的感知更加精準。

表1 終端運維狀態感知相對誤差 單位:%
計算表1中各方法的感知相對誤差平均值,本文所提方法的感知平均相對誤差為10.06%,文獻[2]所提方法的感知平均相對誤差為24.09%,文獻[3]所提方法的感知平均相對誤差為24.28%。相對誤差數值分布越均衡,表明感知方法對不同情況下的終端運維狀態都有較為穩定的感知結果。從各方法感知相對誤差范圍的中間誤差數值波動來看,文獻[2]方法相對誤差中間值波動幅度較大,誤差數值分布不均衡。本文所提的感知方法相對誤差中間數值分布更均衡、誤差上下限更小,說明對終端狀態的感知可靠性更高。
隨機從實驗組A、B、C中的客戶終端抽取同參數的10個終端,人為動態改變終端的運維狀態。使用3種方法同時對終端狀態變化進行感知,得到如圖1所示的方法感知響應效率曲線。

圖1 方法狀態感知效率曲線
由圖1可知,當人為動態改變終端的運維狀態時,基于機器學習的方法感知響應時間更短,感應效率更高。從方法感知效率曲線波動性分析,本文所提方法的感知響應時間變化幅度相對更小,對不同程度的終端狀態改變都有良好的快速感知能力。
綜合上述分析內容可知,在移動客服終端運維過程中應用基于機器學習的方法感知終端狀態的相對誤差最小,對終端狀態變化的感知速度更快。將該方法應用于實際的設備狀態管理的可靠性更高,感知效果更佳。
移動客服終端為客戶獲取優質的商業服務提供了良好的媒介渠道,方便企業及時為客戶解決服務問題,能夠提升企業的商業化形象。本文研究了1種基于機器學習的移動客服終端運維狀態自主感知方法,通過對終端運維狀態感知能夠獲取全面的終端運行數據、控制信息,以期為運維人員掌握終端運行性能提供參考。