馮世杰,劉鵬飛,靳 兵
(海馬汽車有限公司,河南 鄭州 450016)
從語音識別技術的智能化程度來講,車載語音發展可粗略地劃分為3個階段[1]。第1個階段為發展期 (2000~2010年),最早搭載語音交互功能的車是通用的OnStar系統,可以通過駕駛員在車內進行語音激活,根據需求提供實時交通與路況信息、天氣、新聞等。這時的語音技術為條目式語音交互,網絡狀態為本地識別,產品識別率低,用戶體驗比較差;第2個階段為普及期 (2010~2015年),這個階段自然語言技術開始應用,車聯網汽車加入了網聯服務和云端識別,產品表現上識別率得到了較大的提升;第3個階段為成熟期(2015~至今),自然語言技術和4G網絡成為主流,產品的識別準確率超過90%,新車型的搭載也達到100%。
目前車載語音功能[2]大致可以分為這幾類:語音導航、收音機及在線音樂等音頻控制、藍牙電話及短信控制、車輛狀態信息查詢、生活服務信息查詢以及車輛智能語音控制。本文涉及的車載語音功能設計為車載智能語音控制,控制的車載功能主要有空調控制、全景天窗控制、燈光雨刮洗滌控制、座椅加熱控制、外后視鏡及氛圍燈控制、車載智能場景控制等,具體場景功能見表1。
語音功能的實現路徑見圖1。

圖1 車載語音功能實現過程
駕駛員喚醒車載語音系統之后,發出自然語言指令,車載麥克風接收語音進行前段信號處理,并將其傳遞給音響主機,音響主機對接收到的語音數據進行語音識別和語音理解,將其轉換為CAN網絡報文信號傳遞給執行控制器,控制器接收到相關的報文信號后驅動執行機構,實現語音控制功能,并把功能實現后的狀態反饋給音響主機。
CAN總線[3]為本文項目的基礎車載網絡通信技術,負責各個CAN控制器節點功能信號傳輸,所以基于CAN總線進行車載語音功能的設計,具備傳輸性能可靠成熟、報文信號定義簡便、開發周期短及開發成本低等優點,詳細的語音功能總線信號設計見表2。

表1 語音車控功能列表

表2 語音功能網絡通信設計

表2 (續)

表2 (續)
在整車網絡通信系統中,以ASR(Automatic Speech Recognition)開頭命名的信號為車載語音功能專有信號,信號名稱中后綴的“X”U為該信號占用的字節位數。
本文中描述的車載語音功能設計與實現已經完成了設計與測試工作,并在海馬汽車某車型上量產發布。在后續的車載語音控制功能中還可以擴展:主副駕座椅調整、記憶及迎賓功能,外后視鏡打開與折疊功能,五門開啟與關閉功能,360全景界面切換功能等車輛輔助駕駛設置與控制。
在未來車載語音[4]數據的收集與分析將會成為車載語音系統競爭的關鍵要素,一方面可以通過持續的數據積累提升語音識別準確率與語義理解能力,另一方面豐富的數據將會為整個產業帶來巨大的變現潛力。
從車載語音技術上講,被動式的語音交互將會朝向主動式語音發展,車載語音系統將會根據當前的時間、外部環境、車況及交通狀況,結合用戶的使用習慣和日常出行等數據,分析可能存在的需求,主動推送和詢問。同時,在自動駕駛和汽車共享的推動下,車載語音系統的個性化服務也將迎來新的發展機遇。