劉 權(quán) , 徐 偉 , 李深安
(1.廣州汽車集團(tuán)股份有限公司汽車工程研究院, 廣東 廣州 511434;2.科大訊飛股份有限公司 智能汽車事業(yè)部, 安徽 合肥 230000)
近年來(lái),中國(guó)汽車工業(yè)取得了飛躍式發(fā)展,從2009年起連續(xù)12年穩(wěn)居全球汽車產(chǎn)銷第一。汽車行業(yè)也正在面臨著幾十年來(lái)最大的變局,儲(chǔ)能技術(shù)、人工智能、云計(jì)算和移動(dòng)互聯(lián)網(wǎng)技術(shù)也正在以驚人的速度不斷快速突破。與此同時(shí),汽車用戶也越發(fā)追求電動(dòng)化、智能化、娛樂化和個(gè)性化。用戶對(duì)汽車的控制使用也從最基本的駕駛功能、空調(diào)控制等傳統(tǒng)功能,逐步地?cái)U(kuò)展到導(dǎo)航、多媒體、信息娛樂、個(gè)性化設(shè)置等多樣化功能。交互方式也從傳統(tǒng)的物理按鍵到觸屏,發(fā)展到現(xiàn)在的多模態(tài)交互,從用戶發(fā)起請(qǐng)求車輛被動(dòng)接收?qǐng)?zhí)行,到智能化的主動(dòng)式交互和關(guān)懷。因此,汽車智能交互技術(shù)發(fā)展,尤其是從被動(dòng)到主動(dòng)式交互的發(fā)展升級(jí)是非常重要的研究課題。
近年來(lái),隨著互聯(lián)網(wǎng)行業(yè)不斷滲透?jìng)鹘y(tǒng)的汽車行業(yè),智能座艙概念的不斷涌出,各家車企都希望可以打造出以“極致的互聯(lián)網(wǎng)汽車體驗(yàn)”為核心標(biāo)簽的智能網(wǎng)聯(lián)汽車產(chǎn)品,而智能汽車不再是簡(jiǎn)單的以車子為中心,而是以人為中心,在保證車內(nèi)外人員安全的前提下,為駕駛員和乘客提供豐富的智能化、個(gè)性化和愉悅的駕乘體驗(yàn)。人機(jī)交互的方式也從最初的單純的按鍵發(fā)展為按鍵、觸屏、語(yǔ)音、視覺等多種交互模式。
1.1.1 傳統(tǒng)人機(jī)交互方式
按鍵和觸屏我們都可以認(rèn)為是傳統(tǒng)的人機(jī)交互方式,都需要車內(nèi)人員通過(guò)手去操作車內(nèi)的設(shè)備。汽車在早期主要以駕駛為目的,駕駛員和乘客對(duì)車輛的控制只能通過(guò)按鍵的形式。而且最初的按鍵基本上都集中在中控儀表盤上,距離駕駛員較遠(yuǎn),操作不方便。后期才逐步過(guò)渡到現(xiàn)在的方向盤按鍵控制加上中控儀表盤按鍵相結(jié)合的方式,這種方式的改變使得駕駛員對(duì)按鍵的控制更加靈活和安全。
20世紀(jì)80年代,觸摸屏被大規(guī)模商用化。隨著觸摸屏技術(shù)的不斷發(fā)展以及在智能手機(jī)上的大規(guī)模應(yīng)用,汽車中控屏幕也逐步普及推廣,而且各家車企也開始著手車機(jī)中控屏幕的外觀、應(yīng)用以及應(yīng)用的交互等的設(shè)計(jì)和優(yōu)化。甚至特斯拉在2013年推出了采用垂直定向搭載17英寸車載顯示屏的電動(dòng)車—MODEL S,全面取消中控物理按鍵,幾乎可利用屏幕操控所有的車載功能。2018年,比亞迪第2代唐推出了支持90°旋轉(zhuǎn)功能大尺寸的懸浮式中控屏。中控屏也朝著大尺寸、可移動(dòng)、多屏幕方向發(fā)展[1]。
1.1.2 智能語(yǔ)音交互方式
隨著人工智能技術(shù)突飛猛進(jìn)的發(fā)展和在智能語(yǔ)音上的應(yīng)用,智能語(yǔ)音交互方式開始在車上廣泛應(yīng)用。通過(guò)語(yǔ)音交互的方式完成車輛功能的控制和信息查詢,更加便捷,解放了用戶的雙手。智能語(yǔ)音交互技術(shù)與汽車產(chǎn)品相結(jié)合,不僅很大程度上提升了用戶駕駛過(guò)程中的體驗(yàn),也提高了駕駛的安全性。智能語(yǔ)音是一個(gè)系統(tǒng)性工程,涉及語(yǔ)音增強(qiáng)、語(yǔ)音喚醒、語(yǔ)音識(shí)別、語(yǔ)義理解、汽車視覺、主動(dòng)交互、語(yǔ)音合成等多項(xiàng)技術(shù)和過(guò)程[2]。
1.1.3 多模態(tài)交互方式
除了聽覺之外,人與人之間還可以通過(guò)視覺、觸覺、嗅覺等多種方式進(jìn)行交流。同理,在人機(jī)交互過(guò)程中,人可以給車機(jī)輸入語(yǔ)音、圖像、表情、手勢(shì)、觸摸等多種模式的信息,機(jī)器可以綜合利用這多種輸入信息處理用戶的請(qǐng)求,從而提高人機(jī)交互的自然度和效率。多模態(tài)并非多個(gè)模態(tài)的集合,而是各單一模態(tài)之間的有機(jī)協(xié)同和整合[1]。
最后,需要指出的是,雖然當(dāng)前汽車人機(jī)交互方式多種多樣,而且越來(lái)越智能,但是還沒有完全丟棄傳統(tǒng)的按鍵,因?yàn)橄啾容^其他交互方式,物理按鍵最為可靠和安全,尤其是對(duì)車門、落鎖、發(fā)動(dòng)機(jī)等跟車輛安全緊密相關(guān)的零部件和功能。
如上所述,語(yǔ)音交互是一個(gè)系統(tǒng)性的功能,涉及語(yǔ)音增強(qiáng)、語(yǔ)音識(shí)別和語(yǔ)義理解等多項(xiàng)技術(shù)。
1.2.1 語(yǔ)音增強(qiáng)
在人與車機(jī)的語(yǔ)音交互過(guò)程中,麥克風(fēng)錄制的用戶語(yǔ)音信號(hào),往往都會(huì)伴隨著車輛行駛的胎噪、發(fā)動(dòng)機(jī)噪聲、開窗時(shí)的風(fēng)噪、空調(diào)噪聲等,而且在高速、鬧市區(qū)等一些特定的場(chǎng)景下,噪聲信號(hào)甚至比用戶語(yǔ)音信號(hào)更強(qiáng)。另外,車機(jī)播放的音樂、提示音等也會(huì)跟著用戶語(yǔ)音信號(hào)一起被麥克風(fēng)錄制進(jìn)去。以上各種噪聲的存在,使得麥克風(fēng)直接錄制到的用戶語(yǔ)音信號(hào)品質(zhì)非常的差,如果直接將帶著噪聲信號(hào)的音頻送入識(shí)別,可想而知,效果會(huì)非常的差,基本上不可能完成人機(jī)交互的任務(wù)。因此,麥克風(fēng)錄制的原始信號(hào)都會(huì)經(jīng)過(guò)語(yǔ)音信號(hào)的增強(qiáng)處理,“去除” (只能盡可能的降低噪聲,不可能完全去除)掉胎噪、風(fēng)噪等噪聲和播放音樂和提示音等的回聲信號(hào),提升用戶語(yǔ)音的信噪比,得到“干凈的”用戶語(yǔ)音信號(hào)。另外,通過(guò)麥克風(fēng)陣列技術(shù)實(shí)現(xiàn)語(yǔ)音信號(hào)的分離和非目標(biāo)區(qū)域的噪聲抑制,從而實(shí)現(xiàn)車內(nèi)多音區(qū)交互[4]。
從技術(shù)發(fā)展上,語(yǔ)音增強(qiáng)從最初的單通道語(yǔ)音增強(qiáng)發(fā)展到基于麥克風(fēng)陣列的多通道語(yǔ)音增強(qiáng),以及在多音區(qū)上的優(yōu)化和應(yīng)用。語(yǔ)音增強(qiáng)的算法也從傳統(tǒng)的數(shù)字信號(hào)處理方案發(fā)展到現(xiàn)在的基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型和數(shù)字信號(hào)處理相結(jié)合的方案。
1.2.2 語(yǔ)音喚醒
當(dāng)前無(wú)論是汽車語(yǔ)音交互還是音箱、手機(jī)等語(yǔ)音交互,因?yàn)檎`觸發(fā)問題還未達(dá)到全時(shí)免喚醒 (任何時(shí)候用戶都可以通過(guò)語(yǔ)音進(jìn)行交互,而且有意圖的交互給出結(jié)果,用戶沒有交互意圖的時(shí)候不給響應(yīng))交互的狀態(tài)。在連續(xù)語(yǔ)流中實(shí)時(shí)檢測(cè)說(shuō)話人特定語(yǔ)音片段的語(yǔ)音喚醒技術(shù),是目前最主流的語(yǔ)音觸發(fā)方式。
從發(fā)展階段上來(lái)看,語(yǔ)音喚醒也經(jīng)歷3個(gè)階段:?jiǎn)⒚呻A段、新技術(shù)探索階段和大規(guī)模產(chǎn)業(yè)化階段。從技術(shù)上來(lái)看,語(yǔ)音喚醒從最初的模板規(guī)則到最新基于神經(jīng)網(wǎng)絡(luò)的方案,喚醒的效果和誤喚醒的優(yōu)化都得到了很大提升[1]。
1.2.3 語(yǔ)音識(shí)別
簡(jiǎn)單來(lái)說(shuō),語(yǔ)音識(shí)別就是將用戶所說(shuō)語(yǔ)音信號(hào)轉(zhuǎn)換成文字,包括語(yǔ)音信號(hào)的特征提取和識(shí)別轉(zhuǎn)碼兩大過(guò)程。語(yǔ)音增強(qiáng)后的數(shù)字信號(hào),提取音頻的特征 (如MFC特征)信息之后,經(jīng)過(guò)聲學(xué)模型和語(yǔ)言模型解碼,將音頻信號(hào)轉(zhuǎn)換成文本序列 (即識(shí)別文本)。其中,聲學(xué)模型判斷每段語(yǔ)音屬于各音素 (例如聲韻母)的概率,如用戶說(shuō)的“中國(guó)”,聲學(xué)模型將其轉(zhuǎn)換成“zh”、“ong”、“g”、“uo”的音素序列。語(yǔ)言模型則反映字詞出現(xiàn)的先驗(yàn)概率和詞順序是否符合語(yǔ)言習(xí)慣。如上文“中國(guó)”的聲學(xué)模型發(fā)音序列,通過(guò)聲韻母和字詞的組合,能夠出現(xiàn)很多候選序列,如“中國(guó)”、“鐘國(guó)”、“重過(guò)”,語(yǔ)言模型會(huì)判斷文字為“中國(guó)”的概率比“鐘國(guó)”和“重過(guò)”的概率大,從而最后輸出的文本序列為“中國(guó)”[4]。
1.2.4 語(yǔ)義理解
語(yǔ)義理解從用戶語(yǔ)音識(shí)別文本中抽取意圖和槽位,并結(jié)合交互邏輯給出提示語(yǔ)、信源搜索結(jié)果等。在語(yǔ)音交互對(duì)話系統(tǒng)中,語(yǔ)義理解一般主要包括:語(yǔ)義抽取、對(duì)話管理和語(yǔ)言生成。在技術(shù)方案上,近幾年隨著詞向量模型、端到端注意力模型以及谷歌最新BERT[5]模型的提出和應(yīng)用,語(yǔ)義理解正確率在汽車垂直領(lǐng)域達(dá)到較好效果,基本能夠滿足用戶日常交互需求。但是,語(yǔ)義理解最核心的難點(diǎn)是語(yǔ)義表示問題和開放性說(shuō)法等問題,導(dǎo)致在語(yǔ)義效果評(píng)判上很難統(tǒng)一,也是未來(lái)人機(jī)交互中最核心板塊。
1.2.5 語(yǔ)音合成
跟語(yǔ)音識(shí)別剛好相反,語(yǔ)音合成 (TTS)是將文本轉(zhuǎn)換為語(yǔ)音信號(hào)的過(guò)程。在人機(jī)交互系統(tǒng)中,機(jī)器給人的信息反饋,除了界面交互的展示之外,通過(guò)語(yǔ)音信號(hào)的合成和播報(bào)也是非常重要的方式之一。尤其是在汽車交互場(chǎng)景,TTS合成播報(bào)顯得尤為重要,好的TTS不僅能夠給用戶他想要的信息,同時(shí)能夠減少用戶轉(zhuǎn)移視線看車機(jī)屏幕的頻次和時(shí)間,從而大大的提升了駕駛的安全性。近年來(lái)基于神經(jīng)網(wǎng)絡(luò)技術(shù)的語(yǔ)音合成,在主觀體驗(yàn)MOS分達(dá)4.5分,接近播音員水平。另外,當(dāng)前在個(gè)性化合成、情感化合成以及方言小語(yǔ)種合成等方面繼續(xù)探索[6-7]。
下面以用戶一句語(yǔ)音交互請(qǐng)求為例,說(shuō)明汽車語(yǔ)音交互整體鏈路和流程。
1)首先用戶發(fā)起語(yǔ)音請(qǐng)求 (一般通過(guò)語(yǔ)音喚醒詞喚醒或者車機(jī)按鍵,在此不贅述語(yǔ)音喚醒的過(guò)程),車機(jī)麥克風(fēng)拾音之后,調(diào)用語(yǔ)音增強(qiáng)能力接口,對(duì)音頻做回聲消除、噪聲抑制等語(yǔ)音增強(qiáng)處理,提升音頻的品質(zhì)。
2)語(yǔ)音增強(qiáng)之后的音頻進(jìn)行識(shí)別轉(zhuǎn)寫,轉(zhuǎn)寫之后的文本做文本后處理,如標(biāo)點(diǎn)符號(hào)的處理、敏感詞的檢測(cè)和大小寫規(guī)整等。
3)識(shí)別規(guī)整后的文本進(jìn)行語(yǔ)義理解 (包括語(yǔ)義抽取、上下文交互、信源搜索、對(duì)話管理等),給出語(yǔ)義理解的結(jié)果。
4)車機(jī)端拿到語(yǔ)義結(jié)果之后解析出對(duì)應(yīng)的技能名稱、意圖和語(yǔ)義槽,然后根據(jù)對(duì)應(yīng)技能交互設(shè)計(jì)進(jìn)行交互上的展示和操控 (如UI展示天氣查詢的結(jié)果、TTS播報(bào)天氣查詢結(jié)果、控制空調(diào)等)。
由上可知,從語(yǔ)音交互流程來(lái)說(shuō),語(yǔ)音交互過(guò)程大致可以分為錄音、語(yǔ)音增強(qiáng)、語(yǔ)音喚醒和識(shí)別、語(yǔ)義理解、語(yǔ)音合成和UI/UE交互展示,語(yǔ)音交互過(guò)程示意如圖1所示。

圖1 語(yǔ)音交互過(guò)程示意圖
從汽車語(yǔ)音交互整個(gè)鏈路來(lái)看,我們可以將其分為3大部分,車機(jī)端、云端調(diào)度和云端AI能力。
2.1.1 車機(jī)端
從整個(gè)車機(jī)端來(lái)說(shuō),主要包含系統(tǒng)硬件層、系統(tǒng)層和應(yīng)用層。其中系統(tǒng)硬件作為車機(jī)最底層的設(shè)備,提供如錄音、屏幕觸控和展示、CPU核心運(yùn)算能力等基礎(chǔ)能力支撐。系統(tǒng)層作為應(yīng)用層和硬件層之間的橋梁,給應(yīng)用層提供相應(yīng)的硬件操作能力接口,如通過(guò)麥克風(fēng)錄音、揚(yáng)聲器實(shí)現(xiàn)提示語(yǔ)播報(bào)功能等。應(yīng)用層作為人機(jī)交互的入口,則通過(guò)云加端AI核心能力的集成 (云端調(diào)度接口和本地AI能力SDK)、系統(tǒng)能力接口的調(diào)用和APP實(shí)現(xiàn)車內(nèi)智能交互功能。當(dāng)前科大訊飛語(yǔ)音交互系統(tǒng)中,語(yǔ)音增強(qiáng)、語(yǔ)音喚醒、語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成等AI能力均實(shí)現(xiàn)了本地化,可以在無(wú)網(wǎng)絡(luò)或者弱網(wǎng)絡(luò)情況下實(shí)現(xiàn)用戶的語(yǔ)音交互需求,而且能達(dá)到很好的效果。如圖2所示。

圖2 車機(jī)端
2.1.2 云端調(diào)度
云端調(diào)度服務(wù)作為車機(jī)端和云端AI能力服務(wù)之間的連接橋梁,提供車機(jī)端請(qǐng)求云端的調(diào)度接口,然后根據(jù)車企項(xiàng)目配置的云端AI能力調(diào)度,獲取云端語(yǔ)音識(shí)別、語(yǔ)義理解等AI能力結(jié)果,并通過(guò)調(diào)度鏈路返回給車機(jī)端,如圖3所示。

圖3 云端調(diào)度服務(wù)
2.1.3 云端AI能力
相比本地車機(jī)端AI能力而言,云端AI能力具備更優(yōu)的性能和效果,而且云端的AI能力可以結(jié)合配套的平臺(tái)化工具體系進(jìn)行靈活的配置,如是否進(jìn)行識(shí)別后處理、語(yǔ)義理解支持的技能范圍、信源搜索調(diào)度配置等。另外,云端AI能力的升級(jí)相比本地端更方便,代價(jià)更小。一般在保證接口、協(xié)議等不變的情況下,可以根據(jù)效果、性能等方面的需求不斷迭代優(yōu)化升級(jí)。但是車機(jī)端的AI能力更新升級(jí)往往只能通過(guò)OTA的方式進(jìn)行,甚至需要讓車主到4S店去升級(jí)。隨著移動(dòng)互聯(lián)網(wǎng)和5G的發(fā)展,車企越來(lái)越注重云端AI能力的接入和持續(xù)迭代升級(jí),這也為云端AI能力的智能性、創(chuàng)新性以及平臺(tái)化等方面帶來(lái)了挑戰(zhàn)。
提到主動(dòng)交互,大家可能并不陌生,比如當(dāng)我們走向車輛,汽車會(huì)通過(guò)傳感器或人臉識(shí)別等技術(shù)來(lái)以語(yǔ)音、燈光、全息影像、車外屏等形式來(lái)給我們來(lái)打招呼。不僅僅是用戶上車之前的一些主動(dòng)式交互,在用戶駕駛過(guò)程中,甚至在用戶離開車輛之后,均會(huì)存在主動(dòng)式交互的需求。比如用戶駕駛過(guò)程中主動(dòng)監(jiān)測(cè)用戶是否在疲勞駕駛、身體健康數(shù)據(jù)等。主動(dòng)式交互由機(jī)器發(fā)起,實(shí)時(shí)跟蹤、積累數(shù)據(jù),信息反饋?zhàn)兊酶鼮榧皶r(shí)有效,在為用戶帶來(lái)便利的同時(shí),也提升了安全性。
汽車主動(dòng)交互過(guò)程中,首先車機(jī)通過(guò)麥克風(fēng)、攝像頭等采集車輛信息、路況信息、用戶信息以及環(huán)境感知等信息,然后對(duì)提取到的各種信息數(shù)據(jù)進(jìn)行融合,提取對(duì)應(yīng)的特征信息,上傳到認(rèn)知決策模塊。場(chǎng)景引擎根據(jù)收集的信息判定是否符合特定的主動(dòng)交互場(chǎng)景觸發(fā)條件,并結(jié)合推薦引擎推送的用戶個(gè)性化推薦數(shù)據(jù),對(duì)符合條件的場(chǎng)景,則向車機(jī)推送主動(dòng)交互場(chǎng)景數(shù)據(jù),車機(jī)響應(yīng)執(zhí)行并等待用戶的后續(xù)交互。大數(shù)據(jù)模塊則根據(jù)不斷收集到的數(shù)據(jù)信息進(jìn)行大數(shù)據(jù)的挖掘分析,生成用戶畫像個(gè)性化數(shù)據(jù)、車輛畫像數(shù)據(jù)等大數(shù)據(jù)信息。推薦引擎則會(huì)根據(jù)用戶畫像個(gè)性化數(shù)據(jù)和車輛畫像數(shù)據(jù)生成推薦數(shù)據(jù)。最后,系統(tǒng)再根據(jù)車機(jī)端的執(zhí)行和用戶的后續(xù)交互反饋等信息,迭代優(yōu)化認(rèn)知決策模塊的算法和數(shù)據(jù)收集策略、特征提取策略、感知融合算法等[8]。圖4為汽車主動(dòng)交互過(guò)程示意圖。

圖4 汽車主動(dòng)交互過(guò)程示意圖
以用戶導(dǎo)航過(guò)程中主動(dòng)推薦沿途加油站為例,主動(dòng)交互過(guò)程如圖5所示。用戶發(fā)起導(dǎo)航之后,感知收集服務(wù)收集位置信息、導(dǎo)航信息、油量油耗等數(shù)據(jù)信息,并實(shí)時(shí)計(jì)算,將計(jì)算結(jié)果數(shù)據(jù)給到場(chǎng)景引擎和推薦引擎,在滿足特定的加油站推薦場(chǎng)景 (如剩余油量較低、即將經(jīng)過(guò)用戶經(jīng)常加油的加油站等)下給用戶推薦合適的沿途加油站。最后將推薦數(shù)據(jù)下發(fā)到車機(jī)端,用戶做二次交互選擇。

圖5 汽車主動(dòng)交互過(guò)程案例演示
智能座艙場(chǎng)景自定義是智能網(wǎng)聯(lián)汽車產(chǎn)品的重要組成部分之一,也是市場(chǎng)潮流發(fā)展的趨勢(shì),用戶可以根據(jù)自己的喜好、安全意識(shí)、精神修養(yǎng)、兒童娛樂、生活習(xí)慣等行為,通過(guò)手機(jī)端設(shè)置,經(jīng)過(guò)云端,同步車機(jī),快速語(yǔ)音、軟按鍵、主動(dòng)等方式觸發(fā),串聯(lián)音樂、車窗、空調(diào)、座椅、氛圍燈等執(zhí)行動(dòng)作自動(dòng)運(yùn)行。另外,智能座艙場(chǎng)景自定義通過(guò)積累并記錄用戶習(xí)慣選擇數(shù)據(jù),融合人工智能引擎和主動(dòng)交互技術(shù),與車輛、用戶、環(huán)境、生態(tài)、交通數(shù)據(jù)等深度挖掘,多維度融合,為用戶推薦經(jīng)典場(chǎng)景、高頻場(chǎng)景、主動(dòng)提醒場(chǎng)景等模式,從而減少用戶操作行為,降低用戶負(fù)面情緒,提升用戶行車滿意度與行車安全性、感受沉侵式場(chǎng)景體驗(yàn)。
用戶可以通過(guò)手機(jī)APP、車機(jī)APP、網(wǎng)頁(yè)平臺(tái)等多個(gè)終端入口完成場(chǎng)景自定義的功能,既可以自定義觸發(fā)的指令(如自定義的語(yǔ)音說(shuō)法、車機(jī)軟硬按鍵、手勢(shì)等),也可以自定義指令觸發(fā)之后的執(zhí)行動(dòng)作 (如播放歌曲、控制空調(diào)、形象互動(dòng)等)。舉例來(lái)說(shuō),用戶可以定義觸發(fā)指令為語(yǔ)音說(shuō)法“寶寶醒了”,執(zhí)行動(dòng)作為播放兒歌+打開空調(diào),編譯打包引擎將用戶定義的觸發(fā)指令和執(zhí)行動(dòng)作編譯打包成特定格式的數(shù)據(jù),此數(shù)據(jù)作為用戶場(chǎng)景個(gè)性化數(shù)據(jù),識(shí)別和語(yǔ)義理解時(shí)均會(huì)用到。后面當(dāng)用戶說(shuō)到“寶寶醒了”的說(shuō)法時(shí),語(yǔ)義服務(wù)會(huì)讀取用戶自定義個(gè)性化數(shù)據(jù),匹配到觸發(fā)指令對(duì)應(yīng)的執(zhí)行動(dòng)作數(shù)據(jù),并下發(fā)到車機(jī)客戶端解析執(zhí)行。另外,用戶在自定義場(chǎng)景數(shù)據(jù)時(shí),場(chǎng)景推薦引擎根據(jù)用戶交互習(xí)慣、熱點(diǎn)數(shù)據(jù)等給用戶推薦場(chǎng)景數(shù)據(jù)。匹配到觸發(fā)指令之后,執(zhí)行動(dòng)作也會(huì)跟場(chǎng)景推薦引擎打通,給用戶做個(gè)性化推薦,如推薦加油站、歌曲等。場(chǎng)景自定義交互技術(shù)示意如圖6所示。

圖6 場(chǎng)景自定義交互技術(shù)示意圖
從按鍵交互到語(yǔ)音交互,再到多模交互;從被動(dòng)式執(zhí)行交互再到主動(dòng)式交互,當(dāng)前汽車人機(jī)交互逐步向數(shù)字化、智能化和個(gè)性化發(fā)展。今后隨著5G的發(fā)展普及和人工智能算法的迭代發(fā)展,汽車主動(dòng)化交互將會(huì)越來(lái)越智能和個(gè)性化。汽車會(huì)通過(guò)不斷優(yōu)化,綜合處理復(fù)雜的信息,為用戶提供最精準(zhǔn)的解決方案,成為你越來(lái)越走心的朋友。而針對(duì)駕駛員和其他乘客提供個(gè)性化服務(wù),具有更多的應(yīng)用價(jià)值和更廣的前景。另外,在萬(wàn)物互聯(lián)即將到來(lái)的時(shí)代,汽車作為人們出行必要的交通工具之一,必將會(huì)跟人們的出行、工作和生活的所有場(chǎng)景互聯(lián)互通,給用戶提供無(wú)縫銜接的智能化交互體驗(yàn),滿足人們?cè)诓煌瑘?chǎng)景下的需求。