陳美芳
?
基于智能語音的車輛售后技術文檔需求分析與研究
陳美芳
(上海汽車集團股份有限公司技術中心,上海 200041)
隨著語音識別和自然語言處理技術的進步,車載等智能語音應用越來越廣泛,傳統車輛售后技術文檔轉化為適用智能語音的結構語言面臨極大挑戰。文章基于智能語言技術來分析車輛售后技術文檔的多個基本需求,如支持對話形式的檢索語言、分解場景和用戶的操作意圖等,以及研究支持智能語音的車輛售后技術文檔語音基礎詞庫、知識模型、數據結構化等要求。
智能語音;車輛售后技術文檔;數據結構化
提供產品信息、技術文檔和客戶支持內容的聊天機器人正在被廣泛推進。
車載智能語音將AI技術和汽車相結合,其通過車載語音設備與人類直接交流。他可以為你提供車輛使用支持,提醒你即將可能發生的危險。這一切,會讓你覺得自己不再是坐在一臺冰冷的工業機器里,而是有一個好朋友的陪伴。
而應用在維修場景的智能語言則是為維修工程師提供服務的,維修過程中經常有這樣的場景,維修人員因為需要查詢某項操作或參數,而在查詢設備和車輛零件維修操作之間切換穿梭,AR眼鏡的應用可以使維修人員隨時查看維修信息,而智能語音的介入又為他們提供了更為便捷的信息交互方式,售后維修工程師完全可以在維修操作的同時通過語音指令隨時獲取想要的信息。
傳統的售后支持往往是一頁一頁的文件,要實現上述智能語言場景,離不開車輛售后技術文檔的突破,而將傳統文檔轉化為適用智能語音的結構語言將是文檔內容管理人員面臨的最大挑戰。
車輛售后智能語言主要用于售后技術支持、客戶服務及資訊獲取。針對售后技術支持的研究方向還是基于查找、知識庫、規則來的,即主要通過擷取關鍵字,再從數據庫中找尋最合適的應答;而針對客戶服務及資訊則需要構建類似聊天機器人的虛擬助理,除龐大的數據信息庫外,還需語音情感應對等等。
智能語音作為人類助手的價值其主要為協助知識工作者提高效率,然而當前書面文字并非旨在以對話的方式提供,這就需要內容管理人員創建智能會話內容來實現目標。謹慎的會話單位,或者稱為問題-答案(線程標題/回復),輕松的使用自然語言對話發現有用的相關內容,這種良好的體驗可以促進參與并滿足客戶。
智能語音相當于通過語音來建立搜索,經過自然語言→檢索語言→自然語言的轉換,類似“上下文關聯幫助(context -sensitive)”,其主要目的是基于用戶當前操作,提供和檢索主題相關的幫助內容,同時又將復雜的專業化技術內容轉化為適合會話的自然語言。
基于良好的智能語音系統,檢索語言是技術文檔適用智能語音的創建重點。用于智能語音的檢索語言是根據語音檢索的需要而創制的,需要能夠區別標記技術文檔信息,并支持系統排列,便于將標引語言和檢索用語進行相符性比較。一般操作是依據一定的規則對自然語言進行規范,將售后技術文檔中的關鍵檢索分類、檢索主題、檢索結構等編制成表(表1),供信息標引以及檢索時使用。
表1 維修信息檢索分類舉例

場景相關性可以理解為用戶的上下文,即收集關于用戶想要實現的目標以及目標的參數信息,其包括可能有的各種變化的各種元素。結合場景和用戶意圖的智能語音文檔非常具有挑戰性。每個需求往往包含多個具體條件,當無法獲取明確的需求時,需要通過語音提問來定位,以便獲取完整的用戶意圖。當提取到的關鍵信息與數據庫內容一一對應匹配時,智能語音才能準確提供相應的幫助。
(1)確定用戶的使用場景
掌握用戶的使用場景即意味著需要獲取當前用戶的相關狀態和潛在需求,即明確需要解決用戶在什么場景下的問題,可以通過詢問的方式捕捉用戶的需求,或者通過車聯的相關數據自動獲取用戶潛在需求,例如車載模塊故障報警、地理位置、車輛當前模式、設備配置交互歷史等等。
簡單的舉個例子。問:保養時需要加多少機油?針對這個問題,不同的發動機答案是不同的,可能1.5T的發動機只需要5升,而2.0T的發動機則需要5.2升。對于用戶體驗來說,基于提問補充來提供相應的建議并不是很好的智能方法,因此智能語音要精確回答必須能夠自動獲取該車所搭載的哪款發動機。
(2)識別用戶的意圖
快速識別用戶的意圖,即確定用戶想干什么或者想了解什么,這就需要將話題控制到一個較小的信息范圍,即限定語音對話范圍,以免答案非常復雜或出現偏差。語音對話的限定有兩種。其中之一是有效控制問題的關鍵點條件(圖1),或者通俗來說就是要問到點子上,通常也可以通過對話將信息范圍縮小;其二限定智能語音的可對話范圍(表2),即通過限定某些話題的方式,只要用戶的提問不超出這個范圍,智能語音就比較容易滿足用戶的需求。

圖1 語音信息條件舉例
如果采用對話來縮小范圍,可以設計如下對話:
用戶:你好!怎么開360全景影像?
聊天機器人:請問您是需要在倒車時開啟么?
用戶:不是,前進時能打開么?(識別,前進=D擋)
聊天機器人:可以,您可以設置起步或轉向時開啟該系統,也可觸摸360開關直接開啟。
表2 維修工程師語音對話限定范圍舉例

精準提供智能語音服務的需要一個信息庫支持,而如何組織這個信息庫來滿足用戶需求的內容是我們當前面臨的最大挑戰。數據信息庫的兩個重要原則,其一是數據的易發布以及共享,其二是可支持高效的查詢和搜索。而實現這兩者并能支持智能語音則離不開支持智能語音的基礎詞庫設計和知識模型的構建。
(1)專業術語基礎詞庫建設
我們知道智能語音技術離不開兩大基礎建設:語音識別和語義識別。因此,支持車輛售后技術的智能語音詞庫建設主要方向是在專業術語庫的基礎上進行專業詞匯擴展和語義擴展。
雖然使用機器學習技術結合多級融合算法,可以借助于每個請求之后的用戶響應及上下文來確定預測是否正確,并通過考慮與用戶對話所獲得的分類結果改善了系統的決策性能。然而在某一智能語音的專項領域,其運用的初期必須對專業的基礎詞庫進行研究。語義理解針對詞匯級的研究主要有詞性識別、專有名詞、詞重要性、同近義詞、需求詞、位置關系,這也是建設基礎詞庫時必須要考量的6個維度。
(2)構建知識模型
知識模型的構建是后續智能語音應用的基礎,與傳統技術文檔不同,構建前就需要考慮把相關特征數據從不同的數據源中抽取出來,并以結構化的方式存儲,以便支持預處理并作為后續智能系統的輸入。因此,知識模型的構建最重要的核心在于對業務(或者說用戶意圖)的深入理解以及對知識模型結構的設計。一個完整的知識模型構建一般包含:定義需求模型(圖2)、知識模型特征設計、數據關系定義及存儲。

圖2 功能類知識模型需求圖例
(3)精簡知識模型數據
復雜場景的智能語音需要構建一個強大的信息架構來組織內容和知識,結合適當的智能語音技術來理解和精準快速反饋用戶的目標需求。而要實現這一目標需要遵循效率原則(Efficiency Principle)、分析原則(Analytics Principle)、 冗余原則(Redundancy Principle),即讓知識模型盡量輕量化、并決定哪些數據進行智能語言交互,哪些數據不需要。其核心在于把技術文檔內容單元設計成小而輕的存儲載體。我們僅需要把重點信息進行智能語音開發,而那些訪問頻率不高、對關系分析無關緊要的信息,以及部分高頻反復記憶的信息可以放到傳統數據庫當中。
可能大多人會認為只要堆砌足夠大的問答數據庫,智能語音在回答問題方面就能反饋較為相近的正確率,這樣就能達到更智能的目標,而這在我們的實踐過程中印證單單憑借足夠大的數據庫是遠遠不夠的。
“關鍵詞匹配”方式是比較原始的,還需要有數據結構的概念。智能所體現的學習能力,其本質是通過算法將數據分配到相應的數據組織結構中。結構化內容就是將關聯內容聚合到一起,從而為用戶提供完整而自然的信息。
(1)結構內容以塊的形式創建
從分解場景和用戶的操作意圖這一需求出發,作為內容幕后提供者需要模塊化的思維方式,就像使用樂高基本單元塊來構建各個子單元再組裝成為一個龐大信息庫,基于智能語音的售后技術文檔也需要建立基本塊信息,把較大的技術文檔拆分成基本塊,這些基本塊賦予指定的檢索特征信息后,通過特定的規則可集成不同的獨立單元,從而構建結構化文檔內容。
根據場景和用戶意圖分解而形成的不同內容塊,對每個內容塊做分類/打標簽后賦予不同特征。比如輪胎應急場景提取出如下特征(表3)。
表3 輪胎應急場景內容塊及特征分類

(2)結構內容集成提供
結構化內容是豐富了語義標記的內容,它提供了有關每個顆粒整體及其各部分含義的信息。粒度的、分散的內容塊通過彼此之間的概念聯系(即相關性),將給定的內容塊組合連接,從而提供精確地智能語言服務。實現智能語音如果完全依賴于手動構建多個分支的決策樹,將大大增加維護工作量,因此基于內容元數據塊自動生成語言服務值得進一步深入研究。

圖3 輪胎應急場景結構關系圖
語義特征標記通過關系定義將內容塊之間聯系起來的。比如上述輪胎應急場景 (結構關系圖見圖3),當提示“胎壓低”時,智能語言獲取該問題所涉及的相關內容塊模型,但是需要解決具體問題仍需要特定條件,智能語音可以提示用戶從內容塊中選擇一種配備工具和相應輪胎外觀情況,來推薦提供相應的操作和服務。
適用于智能語音發布的售后技術文檔內容應是語義豐富、不受格式影響的,簡潔的結構化智能內容。技術時代和信息時代容不下一絲猶豫,企業需要從現在開始就做好準備,采用結構化的內容創作方式,并逐漸打通企業技術與售后信息內容存儲的孤島。
[1] 李鵬.中文分詞在聊天機器人中的應用研究[D].中南大學,2009 (05).
[2] 黃際洲.聊天機器人知識庫自動抽取算法的研究與實現[D].重慶大學, 2006.
[3] 王浩暢,李斌.聊天機器人系統研究進展[J].計算機應用與軟件, 2018(12).
[4] 王磊,魏勇,邸建勛,et al.本體聊天機器人的設計與應用[J].自動化與信息工程,2016(4).
Demand analysis and research on vehicle after-sales technical documents based on intelligent voice
Chen Meifang
( Technology center of Shanghai automotive group co., LTD., Shanghai 200041 )
With the progress of speech recognition and natural language processing technology, intelligent voice applications such as on-board vehicles are more and more widely used. It is a great challenge for traditional vehicle after-sales technical documents to be converted into structural languages that are suitable for intelligent voice. Based on intelligent language technology, this paper analyses many basic requirements of vehicle after-sales technical documents, such as search language supporting dialogue form, decomposition scene and user's operation intention, and studies the requirements of basic vocabulary, knowledge model and data structure of vehicle after-sales technical documents supporting intelligent voice.
Intelligent voice; Vehicle after-sales technical documents; Data structure
U471
A
1671-7988(2019)07-175-04
陳美芳,就職于上海汽車集團股份有限公司技術中心。
U471
A
1671-7988(2019)07-175-04
10.16638/j.cnki.1671-7988.2019.07.058