廖美紅(廣西工商職業技術學院)
在互聯網技術、大數據技術、物聯網技術飛速發展的今天,電子商務越來越成熟,人們對于電子商務也要求也越來越高。隨著應用電子商務平臺的人群數量快速增長,傳統的人工客服已經無法滿足當前的電商客戶服務需求,所以自動問答客服系統因此產生,利用人工智能客服為客戶提供更加快速優質的服務,例如京東的JIMI、阿里的旺旺機器人、蘇寧的自主服務機器人等。電商客服機器人開發過程中,除了保證能夠正常應對客戶的問題以外,還應該積極開發能夠識別客戶意圖的功能,進而為客戶提供更加優質的服務,減少不必要的時間,直接找到客戶想要的商品。
我國自1996年開始互聯網技術實現了蓬勃發展的狀態,互聯網能夠為人們提供各種服務和產品,更新人們的網絡生活方式。進入到21世紀以后,電子商務技術實現了跨越式的發展,網絡購物已經實現了全民普及。網絡技術將商品和消費者有機聯系到一起,在網絡上完成消費行為,選擇性和快速性都得了有效實現,電子商務發展越來越快。對比傳統購物方式,網絡購物更加方便、快速、選擇廣、無地域限制、價格更低,具有諸多優勢,而且消費者和商家通過網絡都能夠獲取更高的利益。商家能夠利用網絡簡化購物流程,節省人力物力,降低成本,提升利潤,打破地域限制,獲得更多的商機。消費者能夠擴大選擇空間,多個商家對比,不用出家門就能夠完成購物。而且消費者進行網絡購物的時候,能夠通過和客服溝通獲取更多的信息,完成售后服務,這就需要電子商務客服人員隨時在線為客戶提供服務。
電子商務在線人員為客戶提供客服服務這種方式非常方便,但是有時候也會產生負面影響,例如網絡商城相對較大,想要滿足客戶的服務需求,必須設計非常多的客服人員,這必然會導致成本大幅度上漲;再如網絡購物客戶咨詢的問題很多事基本一致的,重復性的問題非常多,設置在線服務人員會造成明顯的資源浪費;此外,在線客服人員也不是所有的都符合職業道德要求,綜合素質良莠不齊。上述問題都可能導致電商平臺上的商家遭到客戶投訴,降低自身的信譽度。
隨著人工智能技術不斷發展進步,未來電子商務領域中的人工客服必然會被自動問答客服系統所取代,特別是簡單重復性的工作,人工客服僅僅用于處理復雜敏感的問題,全面提升服務質量。而自動問答客服系統如何提升自身的服務水平,就需要有效識別客戶的意圖,從聊天中散碎的信息中獲取有效信息整合處理,更準確快速的理解人類語言。
中文分詞,指的是將一個句子或是文章分成獨立的詞語。自然語言處理中,中文分詞技術是其中的基礎,也是挖掘文本關系的基礎,漢語這種語言本身存在著較為明顯的復雜性、籠統性,所以分詞技術存在著一定的難度。
漢語分詞技術有多種方法,其中較常見的有詞典分詞方法、統計分詞方法、混合分詞方法。其中,詞典分詞,指的是通過文本和詞典進行對照,二者匹配獲得分詞,這種方法簡單、精確,但是機器的匹配原則、詞條數量以及掃描順序互懟分詞精度造成影響;統計分詞,通過統計語料庫中的信息制定模型,通過字與字之間的共現信息表示緊密程度,計算兩個字同時出現的頻率,這種方法應用更廣,不需要指定詞典,但是需要大量的訓練庫和參數,需要大量的基礎數據;混合分詞,指的是將詞典分詞和統計分詞結合到一起,混合兩種方法的優勢,解決分詞中遇見的問題。但是目前分詞仍然存在很多問題,還沒有找到合適的方法解決。
自動問答客服系統在消費領域中,想要識別客戶意圖,自動分詞的好壞將直接影響后續的詞向量訓練工作。中文分詞技術從上個世紀70年代開始就已經投入了研究,而且是該領域的研究重點,發展至今已經開發出了多種分詞系統,目前使用較多的分詞系統是NLPIR系統。
詞語相似度計算,該技術也是文本處理領域中的基礎技術,應用范圍非常廣,例如檢索中,詞語相似度計算可以幫助查找衡量和檢索目標相似的程度。應用在自動問答客服系統中,詞語相似度計算能夠用于推薦答案語義的相似度計算。計算詞語相似度有多種方法,按照類型區分可以分成兩種類型,即語料庫計算方法和語義詞典計算方法。
語義詞典計算方法。參考語義詞典計算相似度,需要參考兩個詞匯在詞典中的相關性,兩個詞語在詞典概念網絡上的聯通路徑距離可以計算二者的相似程度,如果只有一條通路,那么二者之間是存在語義方面的相關性的。
關鍵詞,指的是從文本中提取主要思想,能夠概括文本的詞語,提取關鍵詞的準確性將直接影響到意圖識別的準確性。關鍵詞提取要求自動問答客服系統將每個人的聊天語句集合到一起進行文本整理,從文本的總數量確定表達文本主題的關鍵詞提取數量。關鍵詞提取需要基于兩個條件:第一,所有的聊天詞語關鍵詞都是圍繞著商品主題開展的,用戶具有購買意圖的商品;第二,聊天中的語句大部分都和主題詞相近,不相干的詞匯非常少。
關鍵詞提取最早使用的方式是通過統計詞語的出現次數進行詞頻權重計算,也就是詞頻更高的詞語更容易成為關鍵詞。但是這種方法準確度十分有限,需要在詞頻的基礎上加入詞長、詞共現、逆向文件頻率等因素,綜合提取關鍵詞。例如TF-IDF關鍵詞提取方法,就是通過分析詞頻和逆文檔頻率的方式提取關鍵詞。這種方法的思想為:詞語的重要性不能單單考慮某個詞語出現的次數,同時還需要考慮該詞語在其它領域出現的次數,如果不同領域中的頻率不同,差異較大,在本文檔中的頻率較高,說明該詞語重要性更高。除了統計方法以外,關鍵詞提取還可以采用基于語義的方法,這種方法需要參考語義詞典和詞語鏈。基于語義的關鍵詞提取方法能夠更符合自然語言的邏輯,準確度和語義信息質量都高于統計方法,但是這種方法對于詞庫的依賴性較高。基于機器學習的關鍵詞提取方法是當前研究較多的方法,分成有監督學習和無監督學習兩種方法,有監督學習的方法代表有樸素貝葉斯、SVM等方法,無監督學習方法代表有層次聚類、kmeans方法等等。基于機器學習的方法對比統計方法和語義方法能夠更好地利用數據集信息,但是沒有考慮語義的聯系,例如同義詞和反義詞,所以工作效果并不理想。所以,關鍵詞提取技術目前仍然在進一步深入開發。
隨著通信技術不斷發展,智能手機不斷普及,網絡交友購物已經成為了普遍現象,互聯網能夠通過用戶信息記錄海量的生活日志。所以用戶在網絡上的信息中會包括商品的購買傾向,商家如果能夠充分利用此類信息,必然能夠更好的完成客戶意圖識別。目前應用的技術具有代表性的就是情感分析技術,這種技術能夠對用戶在網絡上記錄的具有主觀性的意見進行歸納總結,挖掘情感。學者們可以通過分析用戶在網絡上留下的信息分析用戶的情緒,采用的方法包括語義分析方法和機器學習方法兩種。語義分析是通過已有的詞典進行情感匹配,機器學習是通過訓練好的語言模型分類器進行文本情緒分類。情感分析技術如果發展得當,未來不僅僅能夠用于電商平臺,同時也能夠應用到警方的輿論監督、重大事件的網絡監控等,幫助維護良好的社會環境。
綜上所述,網絡購物發展越來越快,未來人工客服必然會被自動問答客服系統所取代,所以當前相關工作者的研究重點應該是提升自動問答客服系統對于客戶意圖識別的準確度,改善客戶的網絡購物體驗。