許 暉,黃倩云
(廣東電網珠海供電局,廣東珠海,519000)
遠程服務渠道統一運營模式下的智能搜索技術實現
許 暉,黃倩云
(廣東電網珠海供電局,廣東珠海,519000)
為實現對各個服務渠道的智能搜索,使客戶感受到親切體貼的服務體驗,本文從技術層面出發,將智能搜索技術分割為信息輔助抽取子方法、服務渠道接入子方法和問題檢索子方法。
遠程服務平臺;統一服務;統一智能搜索;問題搜索;問句相似度
當前供電服務渠道從以往營業廳、95598轉向了更多的遠程服務渠道,如微信、微博、網上營業廳、掌上營業廳,為實現遠程服務渠道精益化運營,提升客戶體驗及遠程服務渠道運營能力,供電局已經探索遠程服務渠道統一運營管理模式。該模式為:當客戶采用任意遠程服務渠道傳遞客戶需求時,客戶服務人員可以通過平臺掌握客戶的業務辦理記錄、歷史交互記錄以及營配信息等,從而與客戶進行有效溝通,建立以客戶體驗感知為主的運營模式和服務導向,完成客戶服務信息多渠道傳遞、實時互動及統一高效處理。
1.1 信息輔助抽取
信息抽取技術可視為信息檢索技術的一個深化。信息檢索從文檔的集合中尋找與用戶要求相關的文本或段落。信息抽取則是在相關文本或段落的基礎上,發現用戶需要的信息。信息檢索一般對文本的語義不進行分析,而由用戶對文本的語義做出解釋。信息抽取則有系統分析文本的語義,在此基礎上,給出用戶需要的信息。
遠程服務平臺為完成信息的智能搜索處理技術,應首先執行信息輔助抽取子方法,構建FAQ庫:
1.2 服務渠道接入
遠程服務渠道統一智能搜索方法主要通過適配器模式,將微信、微博、掌廳等遠程服務渠道統一接入至智能問答平臺,為多種遠程服務渠道提供統一、一致的服務,同時,也可通過擴展插件的方式接入平臺的適配器中,以達到更多更全的服務渠道覆蓋。
1.3 問題檢索
通過服務渠道接入子方法將各渠道接入后,統一智能搜索方法會首先嘗試自動應答的方式自動解答用戶提出的問題。自動從智FAQ庫里面尋找最匹配的問句,后將相應的答案返回給用戶。從FAQ庫里尋找問題答案由幾個過程實現:中文分詞→問題搜索→問句相似度計算。

圖1 信息輔助抽取子流程
1.3.1 中文分詞
會話過程中用戶提問一般是單個句子,基本不會有多句組成的文章,所以不需要切分句子即可直接對問句進行分詞。此外,搜索引擎無法完全以人類的思想去理解關鍵詞的含義,所以可能會出現分詞錯誤。由于英文是以單詞為一個單位,一個單詞亦可以單獨表達一個完整的意思,一個語句中單詞之間是以空格隔開,搜索引擎很容易進行分詞,而中文是以字為一個單位,至少兩個字即一個詞語才能表達一個完整的意思,但詞語詞之間并無任何符號隔開,因此需要用分詞工具將最合適的詞從句子中提取出來,給下一步使用關鍵字搜索相似問句做準備。
1.3.2 問題搜索
在使用分詞器將用戶發來的問句進行分詞提取關鍵字后,則可使用提取出來的關鍵詞從FAQ庫里使用LUCENE(一個開源的全文檢索工具包)搜索引擎搜索相似的問句。FAQ庫里面的問題是事前由人工或系統輔助從知識文章中抽取出來的問答庫內容。FAQ庫里的內容在入庫的同時也需要預先做分詞提取關鍵字,然后建立索引處理,以供搜索問題時使用。
1.3.3 問句相似度計算
使用LUCENE搜索引擎通過關鍵字搜索出來的相似問句可能會有多條結果,系統需要從這多條結果問句中尋找最接近用戶提問的問句。這里則需要使用問句相似度計算,用以排序,找出最相似的問句。
1)詞型相似度計算(同義詞庫)。詞型相似度是通過計算兩個問句的相同詞個數來比較相似度的。兩個問句相同的詞越多則越相似。同時如果兩個問句的詞有同義詞或近義詞,則也可以算作相同詞,但是計算相似度的分值相應降低。
2)長度相似度計算。問句長度相似性在一定程度上反映了問句形態上的相似性。從問句整體上來看,兩個句子長度相差越小,相似可能性越大。
3)詞序相似度計算。關鍵詞的順序可以反映兩個問句中所含相同詞或同義詞在位置關系上的相似程度。當一個分句或短語整體發生長距離移動后,使用詞序相似度可發現其仍與原來的語句很相似。
4)距離相似度計算。編輯距離是指把一個以字為單位的句子變成另一個以字為單位的句子所需要最小的編輯操作個數。編輯操作有插入、刪除和替換3種。在漢語中,單個字往往不具備具體意義;另外使用以字為單位的編輯距離方法插入操作的代價會很大,這魚實際情況相差太大。因此以普通編輯距離算法為基礎,白用詞語取代單個的漢子或字符作為基本的編輯單元參與運算,借助構建的同義詞庫作為語義資料來源計算詞匯間的語義距離,并且給不同編輯操作賦予不同的權重。
5)問句總體相似度計算。綜合以上幾種相似度的計算值,按照權重疊加計算出總體相似度。
[1]自由文本信息抽取技術.情報科學.李向陽,苗壯.2004,7.
[2]智能搜索引擎技術初探.課外閱讀.吳妮真.2012.
[3]智能問答系統中問句相似度計算方法.武漢理工大學學報?信息與管理工程版.董自濤,包佃清,馬小虎.2010,2.
Realization of intelligent search technology in the unified operation mode of remote service channel
Xu Hui,Huang Qianyun
(Zhuhai Power Supply Bureau of Guangdong power grid, 519000)
In order to realize the intelligent search of each service channels,enabling customers to feel warm and considerate service experience,this paper from the technical level of the intelligent search technology for auxiliary information extraction methods,service channel access methods and problems are retrieved method segmentation.
remote service platform;unified services;unified intelligent search;search;sentence similarity