王敏輝,趙東明,石 理,槐秋媛,吳 娜
(中國移動通信集團天津有限公司人工智能實驗室 天津 300020)
隨著中國移動業務復雜度的不斷提升,在應對營業廳、渠道等一線人員的服務請求時會遇見各種各樣的系統問題,一線人員多使用投訴工單或問題工單方式派發,需后端智能處理系統以知識圖譜技術進行分析和處理,并半自動化生成問題解決方案[1],幫助投訴工單處理人員等服務團隊進行快速響應,優化客戶感知,進而提升內部滿意度。
當前投訴工單分析處理存在的問題包括如下4點:①問題定位不夠準確,由于處理人員經驗不足,可能會造成定位不準確的問題,進而形成有偏差的處理方案,這不但無助于解決問題,還進一步降低了客戶體驗,增加了系統運行風險[2];②工單分類準確度低,投訴工單需要轉發到相應的一線處理人員進行處理,再向客服返回處理結果,首要環節就是工單的有效分派,如果出現工單分派錯誤的情況就會影響工單的順利流轉;③無法快速匹配歷史工單,相似的投訴工單重復出現,是投訴工單處理工作中的常見現象,有經驗的處理人員能很快找到類似的歷史工單,并參照歷史處理方案進行處理,確保處理高效率,但新的人員無法在短期內具備這種能力,造成了低效的重復勞動;④工單數據價值亟待挖掘,公司發展積累了海量的歷史投訴工單數據,然而工單往往以非結構化文本數據的形式存儲,這嚴重制約了工單數據中關鍵信息的提取分析工作和價值發揮[3]。
因此,亟需構建基于工單處理日志的專用知識圖譜,向投訴工單處理機制開放接口能力,通過對工單內容進行實體提取和語義理解,并與知識圖譜模板的匹配獲取解決方案合并后形成處理意見,自動推送到工單處理人待辦進行決策輔助,進而實現“人-機”協同的投訴工單的自動分析、自動處理和自動回復。
基于機器閱讀理解技術的工單分析知識圖譜系統,從場景化應用出發,服務于企業工單一線提單人員、工單處理人員和工單分析人員。
通過工單知識圖譜系統實現工單的自動化流轉和分析功能,解決了一線營業人員無法快速獲取解決方案的問題,同時也服務于一線運維人員,在減少一線營業人員的提單量與咨詢量的同時也降低了運維人員對同類問題的人力成本投入。工單分析圖譜受眾面比較廣,可通過消息申請和返回機制應用在任何信息交互系統,并幫助應用人員在海量的歷史數據中快速檢索想要獲取的數據。
工單分析知識圖譜主要面向內部用戶提供幫助,如工單一線提單人員。在接受到客戶訴求時,工單分析圖譜為內部用戶提供異常問題解決方案、解釋口徑等查詢;提供語義搜索及可視化,體現在內部用戶的系統運維知識庫上,進行面向知識語義的智能搜索,并提供搜索決策過程的可視化能力;可以根據圖譜中已構建的工單處理經驗自動分析下一步工單處理動作、處理人或回復口徑,輔助工單處理人員進行快速業務處理。
工單分析知識圖譜主要用于投訴工單智能分析場景。通過對工單內容進行實體提取和語義理解并與知識圖譜模板的匹配實現“人-機”協同的投訴工單的智能處理,如圖1所示。

圖1 知識圖譜系統服務場景Fig.1 Knowledge graph system service scenario
2.2.1 工單內容分析
構建知識圖譜將提供統一對外接口,同步待辦工單內容進行后續處理。
2.2.2 故障現象分類
依托知識圖譜中構建的故障分類模型,對工單內容文本進行現象分類和定位用戶問題類別。
2.2.3 故障原因預測
根據故障現象類別在知識圖譜中查找針對問題的故障原因內容,并按關系強弱依次排列。
2.2.4 解決方案預測
根據故障現象類別在知識圖譜中查找針對問題的故障解決方案內容,并按關系強弱依次排列。
2.2.5 處理意見生成
根據模板將“故障現象-故障原因-故障解決方案”的內容進行有機整合,并生成一段處理意見文本,然后返回前臺業務工單系統。
工單分析知識圖譜的數據源為用戶咨詢歷史、工單處理記錄等,均能清晰體現工單的問題描述、處理解決方案和業務要素之間的關系,并在工單分析等場景進行智能推薦。
模式是知識圖譜的概念模型和邏輯基礎,其借助實體關系的規則定義來約束知識圖譜的數據。面向內部運維場景的模式設計是知識圖譜構建的基礎,具體來說,從工單場景的服務訴求出發,基于工單數據設計出一套行業領域的知識圖譜。為圖譜自動抽取的框架進行語義分析,面向故障的模式包括故障現象、故障原因、解決方案、工單動作、處理人及其電話、關鍵詞、投訴類別、關聯問題單、關聯需求單等。
根據工單自動化處理和分析需求設計適合場景的圖譜結構 Schema,以“實體-關系-實體”方式進行連接,運行過程如圖2所示。以故障現象類別為中心,其代表了用戶可能咨詢的問題,故障原因類別代表了發生相關故障現象的原因,解決方案代表故障現象應該如何解決,工單動作和處理人則代表當前故障現象的后續處理建議,如表1所示。

圖2 工單分析知識圖譜運行過程Fig.2 Operation process of work-order analysis knowledge graph

表1 工單分析圖譜的實體類型Tab.1 Entity type of work-order analysis graph
輸入輸出參數具體為:①輸入數據,在訓練過程中輸入投訴處理工單、用戶問題記錄等信息,包括故障內容描述、故障原因、故障解決方案、工單工作、工單處理人、投訴類別、關聯問題單、需求單等關鍵信息,在應用過程中輸入為客戶的一種問題表述“故障現象”、待獲取對應的“故障原因”、“問題解決方案”或工單下一步動作、處理人等信息,知識圖譜訓練數據以 RDF(資源描述框架)方式存入關系數據庫,即 Neo4j;②輸出數據,根據輸入的問題在知識圖譜關系型數據庫Neo4j中查詢對應的故障原因、解決方案、下一步動作、處理人信息,并反饋到請求方。
實體識別是知識圖譜語義分析的關鍵,采用機器學習技術自動或半自動地從多源數據中提取知識圖譜的實體、關系、屬性等要素。知識抽取包含實體抽取、關系抽取和屬性抽取。
實體識別是知識圖譜語義分析的關鍵步驟。具體為:①清洗后源業務數據,去除惡意詞匯,進行句法分析后形成明確語義文本;②對長文本分詞形成斷句和詞語,依據的分詞數據庫包括術語詞典、業務詞典和停用詞典;③置入文本分析模型結構,采用向量空間進行詞句的建模,以最大程度保留詞句的上下文關系;④通過 LSTM(長短期記憶)網絡的處理得到了好的對輸入數據的表示方法,然后將 LSTM 與 CRF(條件隨機場)結合,即在輸出端將 softmax與 CRF結合起來,使用 LSTM 解決提取序列特征的問題和CRF有效利用句子級別的標記信息;⑤輸出實體列表,如網易定向流量權益包、花卡等。
多實體識別的聚類特殊處理機制:在傳統的知識圖譜中,實體往往是相對確定的一個名詞,而在運維領域中的實體名稱往往是一句話甚至是幾句話的描述。因此,輸出實體過程中還需要考慮對相近實體進行聚類,以提升系統感知。
關系識別是對非結構化文檔處理的重要環節,自然語言中對事件的描述往往會以多個子句的形式存在,且多句之間具有相關性。關系識別需要對投訴工單數據的上下文進行依存句法相關性分析,進而找出實體間存在哪種關系和關系周邊的實體分別是什么,如運維場景中“A導致了 B”“C的故障原因是 D”“E的變更產生了 F現象”,面向運維場景的關系識別是構建RDF三元組的基礎。
具體構建方法為:①故障現象,可以將申告類型作為故障現象類別,同時抽取申告內容的“業務內容”文本來構建文本分類模型,實現將長文本映射到申告類別的能力,訓練出的模型可以對新入工單的申告內容進行分析,并自動得到申告類別信息;②故障原因和解決方案,對回復口徑的長文本內容進行分析,通過機器閱讀理解模型進行目標文本位置識別。
抽取完成后還需要對多類故障原因的描述文本進行聚類或分類操作,并屏蔽描述的不確定性。系統完成實體提取和關系提取后,通過歷史工單的操作記錄對工單文本構建文本分類模型,根據文本描述不同預測可能的工單操作,并給出置信度,如圖3所示。

圖3 工單分析知識圖譜在工單處理的應用示例Fig.3 Application of work-order analysis knowledge graph in work-order processing
該項目實施以來,重點關注了業務運營執行中的客戶滿意度,先進管理手段的實施使安全風險、故障、異常、投訴等情況出現的頻率大幅降低。通過智能服務輔助能力對客戶進行精細化服務大幅提升了通信行業內的市場份額、客戶滿意度和客戶保有率,服務能力提升也避免了客戶離網。
通過AI和大數據分析的工單智能處理可滿足大部分工單處理服務請求,單個客戶服務時長縮短為之前的10%,系統平均在10s內能準確定位客戶需求,并完成答案反饋,通過迅速、準確匹配客戶問題將用戶問題匹配率提升到目前的 87.2%。服務效率極高,問題解決率達到98%,客戶滿意度上升到96%,客戶感知良好。
在認知智能時代,機器閱讀理解引領了自然語言理解的研究,以知識圖譜技術打造了面向運營商運維領域的機器閱讀理解系統,將其陸續拓展到服務工作中各個領域和場景,并積累了體系化的技術方案與業務實踐,使得機器閱讀理解技術也從最初的單一模型成長為圍繞著公司運維、運營、投訴處理全生命周期管理的解決方案。通過引入 BERT預訓練模型和Dureader模型,并基于 B域運維標注數據進行個性化微調,形成了個性化機器閱讀引擎;通過對接幫助臺和工單系統使客服系統在業務規則、需求規則和運維管理中具備了對非結構化文章的閱讀和問答能力;通過引入需求管理平臺中的需求規格說明書文檔和OA系統的業務管理文檔,在 B域運維、投訴、服務等多個業務領域落地了機器閱讀技術,重點解決了機器閱讀在大規模業務應用中碰到的難題,包括百萬級規模的多文檔、長文檔、多語言、多模態、多輪次等問題,并逐漸完成了領域數據、算法模型、解決方案的沉淀。工單分析知識圖譜和機器閱讀理解結合的分析引擎可以實現面向工單系統的業務知識推送,自動從歷史知識中閱讀核心語義,并輔助工單處理人員進行快捷問題的處理與回復。
本文開發了一套基于機器閱讀理解技術的工單分析知識圖譜系統,從場景化應用出發,服務于企業工單一線提單人員、工單處理人員和工單分析人員。通過系統實現了工單的智能分析與自動應答能力,解決了一線營業人員無法快速獲取工單處理方案的問題,在減少一線營業人員的提單量與咨詢量的同時也降低了運維人員對同類問題的人力成本投入,有效提升了內部用戶的服務感知。