文/本刊記者 史 詩
金融領域對智能交互的強需求,至少在10年前就顯示出來。2009年甚至更早之前,以銀行為首的金融行業,就已經在在其系統中嘗試使用客服機器人,滿足客戶的基本需求。
截止到2014年,基于FAQ的客服機器人基本上是各類金融機構的標配。只是,FAQ能夠處理的任務相對簡單固定,而且效果一般。不僅沒有提升金融機構們的效率,還時常因為體驗不佳對用戶造成困擾。
2015年以來,深度學習算法將人工智能請出“冷板凳”,第三次人工智能浪潮浩浩蕩蕩開始了,最先影響到的便是金融領域。原因就在于,智能交互對于金融領域的企業而言,可以說是絕對剛需。
還有另一個原因,就客服這一項而言,金融領域用戶量巨大,日常交互頻率極高,人工客服成本高,且服務無法穩定輸出,人工智能賦能下的智能客服則更具優勢。此外,人工智能還能在反欺詐、客戶行為預測與價值挖掘、智能投顧、智能外呼等方面發揮巨大作用。但在實際使用中,用戶也常常表達對當前人工智能的不滿,認為與其說是人工智能不如說是人工智障。的確,體驗不佳的智能交互,給用戶造成的困擾遠遠大于驚喜。
怎么做才能提升智能交互的效能與價值?

數據是深度學習的關鍵要素,數據質量是模型的準確度和識別能力的重要影響因素,而模型準確度和識別能力則直接決定了智能交互的效能與價值。簡單來說,智能交互體驗好不好,基礎是數據。
第一個需要解決的問題,是高質量的數據采集。針對語音智能交互而言,指的就是語音數據。數據在人工智能時代是稀缺資源,尤其是語音數據,非常年的積累、龐大的用戶群無法獲得。玖富在金融領域擁有12年的專注,累計用戶7000萬,且業務場景覆蓋面廣,涉足金融行業的多個方向,因此擁有著驚人的數據量。加之近幾年,隨著智能手機的普及,前端設備在語音數據采集、降噪方面表現越來越好,因此語音數據的質量得到了初步的保證。
第二個需要解決的問題,是數據采集之后的清洗與標注。采集來的數據無法直接用來訓練模型,需要經過處理。目前玖富在金融領域的文本標注訓練數據積累已經達到了數百萬,視頻圖像標注訓練數據積累也已達到了百萬級別,語音標注訓練數據積累達到數千小時。目前玖富已經研發出一套自動標注系統,大量數據可以運用自動標注系統進行標注,再由人工進行補充測試篩查,完成整體標注任務。
第三個需要解決的問題,就是模型訓練。在這方面,玖富多年來大膽嘗試,積極探索前沿科技,與全球頂級科研機構開展合作,并在北京、硅谷等地建立創新實驗室,以保持在技術方面的領先。舉例而言,2018年玖富集團分別聯合中科院自動化研究所和清華大學五道口金融學院成立聯合實驗室/研究中心,推動中國金融業與人工智能等技術的全面融合。基于此,玖富在通用的NLP訓練基礎上,也針對特定金融場景中的訓練進行了優化,例如語音端點檢測(VAD),將長語音切短;語音識別聲學模型建模單元為聲韻母,BLSTM-CTC模型;解碼算法,基于3-gram的WFST搜索空間等。
此外,從前CNN/RNN的成功應用,深度學習在自然語言處理方向取得了長足的進展,但缺陷是在隨著梯度迭代,會出現語義信息丟失,另外在上下文關聯上也沒有好的解決方案。在2017、2018年中,attention、memory機制在機器翻譯、情感識別等領域都在之前的準確率基礎上又取得了提升。2018年谷歌的bert預訓練模型推出后,可以利用小批量的數據進行二次訓練,就可以在文本分類、意圖識別中取得良好的準確率。
在技術層面提升數據的質與量,不斷優化算法訓練模型之外,產品本身的設計也非常重要。尤其是考慮到數據分布的不均勻會造成模型的語義傾斜,所以針對特定領域內的語音識別模型,為了提高在該領域內數據的識別準確率,必須要在訓練集中加入一定比例的領域內數據。
在玖富的產品設計中,利用領域內的數據來提升智能交互的效能和價值是一大特點。目前,玖富的產品實際形態有三個,分別是智能客服(智能問答機器人)、智能語音外呼、智能對話分析(智能質檢+智能助手)。
以智能外呼系統中的催收數據為例,我們可以更直觀的看到這一特性。首先是數據預處理,去除特殊字符以及字符轉換(阿拉伯數字和中文數字之間的轉換,以及英語字母大小寫之間的轉換),進行簡單的文本糾錯,分詞,去停用詞,在此期間需要建立金融領域內的分詞詞典和停用詞表;其次是需要根據業務需求來調整訓練集中各類別數據的比例,并整理成符合模型輸入條件的數據格式;最后選擇合適的模型,并進行參數調優。
在智能外呼這個產品中,基于對歷史注冊用戶的通話數據分析,玖富開發了一套用于提升整體接通率的模型;在NLP模型中,為了提高客戶意圖識別的準確性,利用了模型融合的方法,依靠深度學習來增強對語義的理解,綜合了多種文本相似度和文本分類方法,對用戶意圖進行判斷,綜合多輪對話的內容,最終給出用戶的意圖。
玖富智能客服在2017年底上線,已經穩定運行了一年,為商城用戶提供常見問題咨詢。而智能語音外呼是2018年的主打產品,已經對接了催收、電銷等多個業務,而且意圖識別準確率和用戶還款率都要高于同業產品,同時提供了包括撥打策略、用戶意圖分析、用戶未接通原因等配套服務,能在2019年投入使用。智能對話分析已在玖富全業務線中廣泛投入使用,并得到良好反饋。2019年將圍繞客戶滿意度與產生業務價值,重點優化智能質檢和智能助手功能,提升智能對話分析能力。