韓屹



摘 要:客服系統(tǒng)作為國內(nèi)發(fā)起的最早的商業(yè)信息化服務系統(tǒng)之一,長期的在企業(yè)信息化的發(fā)展當中扮演鏈接客戶和企業(yè)的重要角色。本文創(chuàng)新性地提出一種基于VoLTE視頻通信的AI數(shù)字人客服系統(tǒng)架構,其中VoLTE基于IMS網(wǎng)絡下的SIP信令實現(xiàn)實時音視頻通話功能,與傳統(tǒng)客服使用的互聯(lián)網(wǎng)通道不同,可由坐席端主動觸達。在坐席端設置虛擬數(shù)字人替代人工客服,實現(xiàn)7×24小時全天候標準化服務。
關鍵詞:VoLTE、AI;數(shù)字人;視頻智能客服
1、引言
隨著互聯(lián)網(wǎng)技術和移動手機應用的蓬勃發(fā)展,企業(yè)的客服形式也在不斷更替,從最初的線下人工客服,到后來的線上呼叫中心再到如今的移動客服、智能視頻客服,這些短時間內(nèi)的形式上、內(nèi)容上的改變表明了客服行業(yè)的更替之快,到目前為止,客服市場總共經(jīng)歷了四大發(fā)展階段[1]。階段一為2000年,其自建的本地呼叫中心為市場主力,核心技術是硬件程控電話交換機、PC系統(tǒng)交互的CTI集成技術和語音板卡,以這些技術為基礎的客服主要面向的業(yè)務方向是呼叫中心系統(tǒng)用。在2010年開始,托管型呼叫中心逐步興起。起先是架構上從企業(yè)本地機房部署改變?yōu)镮DC機房集中式部署硬件程控交換系統(tǒng), 通過硬件服務器的堆疊,實現(xiàn)更大并發(fā)容量的語音軟交換處理能力。從商業(yè)模式上,改變自建呼叫中心模式下的一次性建設和投入為按期租用方式,減輕了企業(yè)建設呼叫中心的成本,減少了資金壓力,從管理難度的角度上也減少了企業(yè)因需要進行維護的持續(xù)性投入。這一階段下的業(yè)務主要針對的是企業(yè)級的電銷外呼服務中心和客服中心。2015年,隨著云計算、云存儲、SaaS概念的引入,將客服系統(tǒng)帶入了云服務的階段,其軟交換服務采用高可用、彈性可伸縮、模塊化的云計算資源部署,摒棄了傳統(tǒng)的硬件部署方式,極大地提升了應用擴展性和成本控制的靈活性。在此階段中,互聯(lián)網(wǎng)企業(yè)、保險業(yè)、金融業(yè)和在線教育行業(yè)的客服系統(tǒng)迎來一波快速發(fā)展,因其存儲模式可以支撐較小客戶的初始化建設。而在2017年以后,智能AI技術的引進加強了客服系統(tǒng)的能力及價值,其標志就是智能文本、語音機器人和智能質(zhì)檢等功能的大力發(fā)展,降低了客服成本并且增加了效率,這一降本增效的價值得到了大力發(fā)展。
進入到2020年,隨著5G網(wǎng)絡的加速鋪設和相關場景應用的深入挖掘,大量企業(yè)業(yè)務由線下轉(zhuǎn)線上已是大勢所趨,在線音視頻將變得更加高清,時延更加低用戶可以根據(jù)意愿選擇服務形式,以最高效得方式解決問題。傳統(tǒng)呼叫中心業(yè)務逐漸被邊緣化,隨之替代的是視頻客服日益成熟,逐漸成為主流服務模式,實現(xiàn)現(xiàn)象級的服務形式改變。
2、智能VoLTE數(shù)字人客服
智能VoLTE數(shù)字人客服依托運營商的高網(wǎng)絡帶寬,基于IMS網(wǎng)絡,新興5G技術,通過AI賦能,提供面向客戶的高清、低時延音視頻產(chǎn)品平臺傳統(tǒng)互聯(lián)網(wǎng)入口+VoLTE主動觸達入,實現(xiàn)全方位多模式客戶專屬通道。VoLTE是面向數(shù)據(jù)終端的高速無線通信標準,基于IMS網(wǎng)絡,使得音視頻服務不再依賴傳統(tǒng)的電路交換語音網(wǎng)絡[2]。IMS是IP多媒體系統(tǒng),是多媒體業(yè)務形式,能夠?qū)崿F(xiàn)數(shù)據(jù)、語音和視頻的融合業(yè)務[3]。后臺管理語音質(zhì)檢的應用,使得對客戶的偏好和情緒更加準確,也對客服有實時的警告。在視頻客服的坐席端,設置虛擬數(shù)字人。數(shù)字人面向B端客戶,融合5G、人工智能、虛擬數(shù)字人和全息展示等技術,具有高顏值、高智能、高品質(zhì)的數(shù)字人智能對話等功能以及特點。以5G技術、虛擬數(shù)字人形象創(chuàng)建、智能動畫合成、語音識別、自然語言理解、語音合成、智能交互等技術為核心,應用在數(shù)字人的感知、推理、展現(xiàn)層面,賦能智能助手生態(tài)。在平臺側(cè)的視頻雙向錄像功能并可關聯(lián)錄像和通話信息,可以對服務內(nèi)容進行信息留存、回溯和責任確認。
2.1應用場景與系統(tǒng)架構
智能VoLTE數(shù)字人客服的應用場景,可廣泛用于銀行、金融產(chǎn)品銷售現(xiàn)場、保險、證券、互聯(lián)網(wǎng)金融、汽車金融、股票開戶、期貨開戶、其他金融業(yè)務。除了金融市場外,例如政務審核、面簽,傳統(tǒng)行業(yè)的企業(yè)線上服務客服等金融機構之外的其他領域也可廣泛應用。
目前受制于部分終端和網(wǎng)絡能力,VoLTE客服以功能模塊的形式嵌入現(xiàn)有客服系統(tǒng),作為有效補充部分更符合實際商用落地場景的需求,一個總體的融合通信客服系統(tǒng)架構示意圖如下:
該系統(tǒng)架構打造了傳統(tǒng)互聯(lián)網(wǎng)入口和基于VoLTE的4G/5G主動觸達入口的智能視頻客服應用,實現(xiàn)全方位多模式客戶觸達。系統(tǒng)支持WebRTC,4G/5G主動觸達入口,在座席端調(diào)用虛擬數(shù)字人接口,替代真人坐席。數(shù)字人視頻坐席通過VoLTE,WebRTC互聯(lián)網(wǎng)應用和傳統(tǒng)電話與客戶交互,開展視頻面簽,視頻客服,視頻核驗和視頻雙錄等業(yè)務。
2.2 VoLTE音視頻通道技術概要
2.2.1 VoLTE視頻傳輸信令流程
客戶坐席呼出信令流程如下圖所示,客服坐席側(cè)所在地,需要本地IMS支持固網(wǎng)傳輸,客服坐席的固話可接入全國移網(wǎng)IMS,實現(xiàn)VoLTE視頻通話[4]。
用戶端呼入信令流程如下圖所示,用戶手機呼出信令由所在地的移網(wǎng)IMS傳輸至固網(wǎng)IMS,如本地IMS不支持固網(wǎng)視頻傳輸,則視頻回落為語音,由用戶呼出所在地的固網(wǎng)IMS將語音信令傳輸至客服坐席所在地的固網(wǎng)IMS。
2.2.2 VoLTE通道與IMS網(wǎng)元對接方式
A-SBC:部署在接入網(wǎng)及核心網(wǎng)之間,用做代理。需要在IMS核心網(wǎng)進行開戶,獲取一批Sip賬號,然后由SIP網(wǎng)關服務代理注冊,并及時刷新、維持注冊狀態(tài)。協(xié)議轉(zhuǎn)換網(wǎng)關從SIP網(wǎng)關服務獲取Sip賬號,并組建Sip報文發(fā)送至SBC。通話過程中如果未及時刷新,出現(xiàn)注冊過期的現(xiàn)象,則通話將被IMS核心網(wǎng)掛斷。
I-SBC:部署在兩個核心網(wǎng)之間,做協(xié)議轉(zhuǎn)換。不需要在IMS核心網(wǎng)進行開戶,并維持注冊狀態(tài);只要在I-SBC上配置對應的中繼(IP地址+端口號+透傳碼號)即可通過IMS核心網(wǎng)進行全網(wǎng)的話路疏導。
注冊方式為使用Sip號碼池獲取賬號,發(fā)起注冊。一個RPC客戶的Sip賬號需要由一個SIP網(wǎng)關單獨代理注冊,并維持刷新。RPC Client 賬號與Sip賬號綁定關系包括 所有的域用戶共用所有的SIP賬號,即多對多的數(shù)量關系[4]。
2.2.3 外呼信息流轉(zhuǎn)流程
從Client A呼叫落地用戶B開始,請求RPC調(diào)用OnInvited到SIP網(wǎng)關服務。在SIP網(wǎng)關收到請求后,拉起協(xié)議轉(zhuǎn)換網(wǎng)關的進程。在 協(xié)議轉(zhuǎn)換網(wǎng)關啟動后首先登錄一個B的賬號,登錄成功后,云賬號B加入對應過程1中OnInvited中帶的會議號的會議中。成功加入后,協(xié)議轉(zhuǎn)換網(wǎng)關發(fā)送SIP 邀約至SIP網(wǎng)關,SIP網(wǎng)關收到協(xié)議轉(zhuǎn)換網(wǎng)關的SIP信令后代理發(fā)送至SBC。至此,外呼信息流轉(zhuǎn)-全部完成。具體外呼流程內(nèi)外部網(wǎng)元信息流轉(zhuǎn)圖如下所示:
2.3數(shù)字人技術概要
數(shù)字人,是信息科學與生命科學融合的產(chǎn)物,是利用信息科學的方法對人體在不同水平的形態(tài)和功能進行虛擬仿真,其包括四個交叉重疊的發(fā)展階段,可視人,物理人,生理人,智能人,最終建立多學科和多層次的數(shù)字模型并達到對人體從微觀到宏觀的精確模擬。
在客服場景下,數(shù)字人可以自動化實現(xiàn)與真人一致的服務效果,與真人相比,優(yōu)勢在于可以持續(xù)工作7×24小時,極大地提升了金融客服的工作效率,不受工作時長,身體疲勞程度,情緒都能人本身的生理因素影響;同時數(shù)字人形象能夠?qū)崿F(xiàn)多音色、多風格、多人格的個性化定制,能夠針對個體用戶的個性化需求提供多樣化的客服服務,滿足用戶多元化的金融服務需求;同時,隨著5G、物聯(lián)網(wǎng)、傳感器、AR、VR等新技術不斷深化應用,資訊信息的傳播從“擬態(tài)化”升級為體驗感更強大的“臨場化”和“全景化”,數(shù)字人技術可以與新技術更高效的結(jié)合,結(jié)合具體金融場景發(fā)生地的多維數(shù)據(jù),營造出讓用戶在三維空間直接“到達”現(xiàn)場的直播體驗,進一步提升用戶在金融服務中的代入感。
數(shù)字人現(xiàn)階段已廣泛應用到各個金融領域、電商直播等營銷手段上,例如興業(yè)應該正在規(guī)劃建設智慧數(shù)字人營銷,以應對疫情期間的無接觸網(wǎng)點業(yè)務辦理[5]。
2.3.1 數(shù)字人交互邏輯
根據(jù)上圖數(shù)字人邏輯圖,數(shù)字人交互邏輯以此為:發(fā)起數(shù)字人啟動消息;確認數(shù)字人啟動;生成聆聽狀態(tài)的數(shù)字人視頻;推送數(shù)字人處于等待聆聽狀態(tài)的視頻到客戶端,等待客戶發(fā)問;接收NLP解析后的用戶問題文字;確認接收用戶問題文字;合成數(shù)字人音視頻;把目前的等待傾聽視頻流切換成發(fā)聲視頻流,如繼續(xù)下一輪則重復8步驟,重復聽說切換,循環(huán)對話;客戶端發(fā)出關閉消息信息;確認消息關閉;關閉實時音視頻流,完成本輪對話。
2.3.2 功能模塊
音視頻模塊有實時視頻流管理,負責將客戶端傳輸?shù)囊粢曨l的管理,音頻輸出到語音識別模塊進行轉(zhuǎn)寫,視頻流輸出到視頻捕捉。而音視頻捕捉負責捕捉客戶端需要錄制的視頻,并將需要存儲的視頻轉(zhuǎn)給內(nèi)容存儲模塊,滿足業(yè)務合規(guī)要求。
業(yè)務管理模塊中,按照不同的進入方式及參數(shù),系統(tǒng)將用戶的輸入解析后直接切換合適的對話場景,乙方負責為甲方定制10個不同的業(yè)務場景對話,這10個業(yè)務場景都是可以使用虛擬數(shù)字員工的實時對話模式。之后按照用戶的點擊輸入和用戶在業(yè)務流程的辦理狀態(tài),系統(tǒng)負責判斷是否在不同的業(yè)務流程中跳轉(zhuǎn)以及跳轉(zhuǎn)的目的業(yè)已啟動下一項業(yè)務或者退出系統(tǒng)。
ASR語音識別模塊負責將語音識別為文字,可以有用戶配置熱詞,置入敏感詞,加標點符號。識別的結(jié)果傳回數(shù)字員工管理平臺后為NLP語義理解服務提供輸入。另外導出的文字還可以提供給行方已有業(yè)務統(tǒng)計系統(tǒng)作為業(yè)務數(shù)據(jù)統(tǒng)計依據(jù)。
NLP語義理解模塊提供對話流程配置、對話節(jié)點意圖判斷和問答庫管理,并按照行方要求配置好的業(yè)務場景的對話流程。該模塊可以提供知識庫的數(shù)據(jù)挖掘定制,也可以業(yè)務方已有知識庫系統(tǒng),知識庫的更新保證在24小時內(nèi)生效。最后數(shù)字人生成引擎,按照NLP解析后知識庫生成的文本,輸入的文本后可以實時生成視頻流,以及設置口型、手勢。
3、機會分析
3.1優(yōu)勢與機遇
目前VoLTE主要多用于語音業(yè)務,視頻業(yè)務較少,并且還未有面向企業(yè)的接入模式,基于VoLTE的智慧視頻客服是對金融企業(yè)現(xiàn)有視頻客服、面簽功能的補充,與企業(yè)現(xiàn)有的視頻客服平臺并不沖突。VoLTE的主動觸達模式可以使得企業(yè)端變被動為主動,主動與潛在客戶聯(lián)絡,完成業(yè)務的拓展。并且其與互聯(lián)網(wǎng)的入口不沖突,是對互聯(lián)網(wǎng)入口的補充,但相較于互聯(lián)網(wǎng)視頻通話,其無需下載APP,無需使用瀏覽器,大大的提升了。在5G大力發(fā)展的現(xiàn)狀下,是客服多元化的一個重要拓展。
盡管現(xiàn)階段國家對金融行業(yè)的政策收緊,但國家對使用技術手段賦能金融行業(yè)的應用卻更加提倡和支持,對智慧視頻客服等金融科技產(chǎn)品提供了新的空間和機會。并且,5G的誕生,對金融科技行業(yè)的發(fā)展起了推動作用。目前國內(nèi)提倡全面實現(xiàn)5G+計劃,5G+4G協(xié)同發(fā)展,5G+人工智能、大數(shù)據(jù)p融合創(chuàng)新,5G+Ecology生態(tài)共建。智能VoLTE數(shù)字人客服依托4G/5G+AI等能力,與各大金融機構實現(xiàn)生態(tài)的共建。主要針對需求明確的金融行業(yè)視頻客服需求進行切入,在智能識別領域進行場景的落地。
3.2價值體現(xiàn)
智能VoLTE數(shù)字人客服在數(shù)據(jù)運營層面的能力可以讓很多企業(yè)提升對數(shù)據(jù)化運營的認識,其中包括數(shù)據(jù)預處理,例如數(shù)據(jù)清洗和專名識別。企業(yè)運營過程的關鍵內(nèi)容包括數(shù)據(jù)運營,孤立起來的數(shù)據(jù)會讓企業(yè)在運營情況方面的認識有偏差,而缺失的數(shù)據(jù)將會導致嚴重的決策性錯誤。所以,智能客服在服務過程中的對數(shù)據(jù)的對所產(chǎn)生的數(shù)據(jù)進行收集,也就支持了數(shù)據(jù)的回溯與存儲。并且基于AI能力,客服機器人、虛擬數(shù)字人和客服動作的RPA應用不但幫助傳統(tǒng)的線上、線下客服業(yè)務進行提升與優(yōu)化,也綜合了業(yè)務流程和數(shù)據(jù)流,把兩者進行了有效統(tǒng)一。
4、5G下的客服潛力與發(fā)展
在國家大力發(fā)展5G,各相關企業(yè)普遍配合支持5G建設的情況下,VoLTE作為4G下的通信制式可以平滑過渡到5G下的VoNR制式,基于VoLTE/VoNR的視頻客服有機會享受到客服行業(yè)發(fā)展和更替的紅利。5G下的海量數(shù)據(jù)奠定了客服中的機器學習的良好根基,使得客服不再是單模塊化產(chǎn)品和單一場景,可以實現(xiàn)對服務流程和多樣場景的多功能覆蓋,實現(xiàn)內(nèi)部服務的串聯(lián)。在視頻通道打通后,客戶發(fā)起咨詢時,響應速度以及接起率都會大大提升。
雖然近些年客服行業(yè)技術上進步頗大,但在一些客服應用場景上實現(xiàn)的效果尚不符合企業(yè)的高期望。以質(zhì)檢場景為例,為降低硬件成本,對話錄音壓縮導致的語音失真降低了ASR準確率,再加上中文存在多義性及方言,有時就會難以通過機器判斷客戶服務是否違規(guī)。再以外呼場景為例,一方面對于客戶無關外呼目的的提問,如以信息確認為目的的外呼,客戶反問了和產(chǎn)品相關的問題,機器的預測能力和應變能力不足,讓用戶很難接受;另一方面在場景復雜的情況下,如營銷、催收等,機器依舊難以應對,實際使用效果不符合企業(yè)對于技術的期望,需要由專業(yè)的客服人員介入,這其中人和機器銜接點的判斷也是難點。正是這些因素的存在,降低了大家對客服行業(yè)的期望,因而市場整體抱持著邊發(fā)展、邊觀望的態(tài)度,在客服場景價值的挖掘上并沒有使出全力。
因此,基于VoLTE以及未來VoNR技術的虛擬數(shù)字人可帶領客服行業(yè)的整體轉(zhuǎn)型與升級,以更好的應對挑戰(zhàn),擁抱機遇。其以智能化、數(shù)字化結(jié)合通信技術為主要驅(qū)動力,完成了服務模式與管理模式的雙重升級,打通了用戶端、服務端和業(yè)務場景之間的連接。并且,在5G超高清視頻的支撐下,智能VoLTE數(shù)字人視頻客服有能力作為現(xiàn)有互聯(lián)網(wǎng)視頻客服和人工坐席的有效補充升級,覆蓋比現(xiàn)有更多的業(yè)務場景,在結(jié)合了智能數(shù)字人的情況下,客服綜合能力飛速提升。在這種綜合能力下,智能客服中心有潛力成為金融機構的網(wǎng)點或是網(wǎng)上銀行之外的一個主要業(yè)務渠道,用來釋放身份核實、操作演示和展示商品等業(yè)務占用現(xiàn)場人力資源。除此之外,智能VoLTE數(shù)字人客服可以將更豐富的高清精準數(shù)據(jù)信息連接起來,可承接售前、售中和售后等多個業(yè)務環(huán)節(jié)。更加高效的多種技術環(huán)節(jié),如前端部分的客戶話術內(nèi)容預測與分析,后端部分的企業(yè)和商戶知識圖譜、產(chǎn)品屬性和多維度數(shù)據(jù)匹配,都可以在智能VoLTE數(shù)字人客服系統(tǒng)中得到更好的發(fā)展,用戶畫像也會更加準確,智能數(shù)字人在接收到全面、精準的數(shù)據(jù)接入后,語義識別、語音轉(zhuǎn)換、語言處理等AI技術也可以得到最大效率的應用。
5、結(jié)束語:
隨著5G網(wǎng)絡的加速普及和深入應用,企業(yè)業(yè)務由線下向線上轉(zhuǎn)移將成為大勢所趨,本文提出的基于VoLTE以及未來VoNR技術的可直接觸達C端客戶的視頻通信方案,結(jié)合最新AI數(shù)字人實現(xiàn)了客服坐席端標準化,智能化,是視頻客服市場的一次有效的創(chuàng)新和探索。
參考文獻:
[1] 智能客服趨勢發(fā)展白皮書:智能客服預見未來.2020.05
[2] Poikselka, M., Holma, H., Hongisto, J., Kallio, J. and Toskala, A., 2012. Voice over LTE: VoLTE. John Wiley & Sons.
[3] 韓濤·基于IMS的下一代網(wǎng)絡簡介[J] . 科技資訊, 2011(35): 24.
[4] Poikselka, M., Holma, H., Hongisto, J., Kallio, J. and Toskala, A., 2012. VoLTE end to end and signalling.
[5] 葉博宇,林懿楠,李瑾,趙天琪.興業(yè)銀行“智慧數(shù)字人——小興”在實體網(wǎng)點成功探索應用[J].中國金融電腦,2020(05):71-74.