[肖軍 陳震原 李芳 陳茂強]
由于電信運營商各大業務系統初期都以煙囪方式建設,各業務系統間數據關聯出現了各種各樣的問題,數據源多種多樣、數據標準不統一、數據質量也參差不齊。在生產經營過程中,企業實時監控的數據往往來自于不同的業務系統,又必須在統一的對比環比等聯動分析下才能指導企業生產,完成績效指標,提高勞動效率。所以打破數據煙囪,建立數據關聯分析是數字化改造的關鍵第一步,這就涉及到了多源數據采集處理的問題。
既然是數據煙囪,那么這些煙囪的建設者往往來自不同廠商,有的甚至年代久遠,接口不統一或缺乏一些數據接口功能,有些數據還是非結構化數據,例如語音或文本段落,需要自動語音識別技術(ASR)進行語音轉寫和自然語言處理技術(NLP)進行語義識別后提取關鍵詞。
以電信客服領域涉及到的業務為例,在本地網客服的處理過程中,座席人員處理投訴需要查看的關鍵信息系統有10000 號系統,BSS 系統、CRM 系統、綜調系統、裝機地址庫等,座席人員的排班打卡數據可能又來自于釘釘等外部系統,客服投訴處理形成的各項滿意度、重投率、及時率等數據又來自于其它信息系統。我們的目標就是對客服領域的投訴工單量和處理質量全程跟蹤和對比分析;對座席人員的生產時效、質量實時地全程跟蹤分析;對投訴工單開展根因分析。并且針對這些分析后的結果,通過大數據可視化技術,以圖形界面形式呈現出來。……