張承業(yè) 張憲民
摘要:首先回顧了人機交互模式的變革史,并從5個方面討論了人工智能對人機交互的影響,分析了智能人機交互形式、技術(shù)缺陷及應(yīng)用挑戰(zhàn),提出人工智能時代對人機交互未來發(fā)展的討論和思考。
關(guān)鍵詞:人機交互;人工智能;自然交互;技術(shù)挑戰(zhàn)
中圖分類號:TH122;TP274 文獻標識碼:A 文章編號:1007-9416(2018)05-0206-02
人機交互技術(shù)作為人與計算機之間信息交流的接口,是推動計算機產(chǎn)業(yè)發(fā)展的關(guān)鍵因素之一。智能化時代,交互無處不在,人的智能與機器智能共同發(fā)展,擴展了交互設(shè)計的廣度和維度,對人機交互能力提出了新的挑戰(zhàn)。由于缺少與新時期智能交互需求相適應(yīng)的、高效的交互界面,及成熟統(tǒng)一的交互技術(shù)[1],目前人機交互能力和交互效率仍停留在較低的水平,并沒有隨著人工智能時代的發(fā)展得到相應(yīng)的提高。為了應(yīng)對智能時代的挑戰(zhàn),把握智能時代人機交互技術(shù)發(fā)展的新機遇,實現(xiàn)交互技術(shù)的跨越式發(fā)展。本文首先回顧了人機交互模式的發(fā)展變革史,分析了人工智能對人機交互的影響,總結(jié)了智能人機交互的技術(shù)缺陷及應(yīng)用挑戰(zhàn),最后對人工智能時代人機交互未來發(fā)展進行了討論和思考。
1 人機交互模式的變革
人機交互關(guān)注用戶與系統(tǒng)(計算機)之間的信息交換,包括用戶到系統(tǒng)和系統(tǒng)到用戶的信息交換兩部分。人機交互模式的發(fā)展史,是“以計算機為中心”到“以用戶為中心”的發(fā)展過程,就交互形式而言共經(jīng)歷了以下幾個階段:
(1)基于鍵盤與命令語言交互階段。交互界面采用命令語言驅(qū)動操作,專業(yè)性強,只能通過操作鍵盤來輸入數(shù)據(jù)和命令信息,界面輸出為靜態(tài)字符。交互邏輯與流程復(fù)雜,拷貝粘貼等關(guān)鍵操作未簡化,易出錯,只能完成單線程的單一任務(wù)。這一階段確定了QWERTY的鍵盤布局并沿用至今。(2)基于鼠標和圖形用戶界面的交互階段。伴隨著圖形界面技術(shù)的發(fā)展,逐漸形成了WIMP界面,并引入鼠標,解決了精確定位、快速切換的難題。以超文本標記語言HTML及超文本傳輸協(xié)議HTTP的網(wǎng)絡(luò)瀏覽器為特征,所形成的網(wǎng)絡(luò)用戶界面,成為當前Internet的支柱。(3)基于多點觸控技術(shù)的觸屏交互。伴隨著移動互聯(lián)網(wǎng)及微型電腦產(chǎn)品的普及,基于圖形用戶界面的多點觸控交互技術(shù)的出現(xiàn)豐富了交互場景,解決了小屏設(shè)備界面利用率及隨時隨地交互的問題。此時交互設(shè)計以功能為中心,關(guān)注用戶體驗和用戶情感。(4)多通道、多模態(tài)的自然交互階段。物聯(lián)網(wǎng)的發(fā)展,人機交互形式多樣并出現(xiàn)融合交叉,逐漸回歸“以用戶為中心”的初心,參與式設(shè)計與眾創(chuàng)模式成為主流,交互界面依賴于大數(shù)據(jù)、物聯(lián)網(wǎng)及人工智能進行創(chuàng)新與精簡[2],并出現(xiàn)了多種形式,如NUI自然交互界面、TUI實體交互界面[4]、可穿戴計算等。
人機交互及交互界面技術(shù)的發(fā)展伴隨著人工智能波動與繁榮直至爆發(fā),但受限于計算機科學(xué)發(fā)展水平,在很長一段時間內(nèi),人機交互以適應(yīng)機器為主,各種編程語言、輸入法、數(shù)據(jù)輸入設(shè)備等就是例證。隨著技術(shù)和情境的發(fā)展變化,現(xiàn)存交互形式已不再適應(yīng)要求,人們越來越追求體驗和高效、自然和無感,回歸人機交互技術(shù)的初心,讓計算機服務(wù)并適應(yīng)人類的需要,而不是強求人類去適應(yīng)計算機。人工智能的繁榮與爆發(fā),為人機交互技術(shù)的更迭提供了可能。
2 人工智能對人機交互的影響
人工智能的出現(xiàn)促進了傳統(tǒng)人機“輸入-反饋”循環(huán)向“推薦-選擇”循環(huán)的過渡。人機交互關(guān)系由“單向從屬”向“雙向訓(xùn)練”過渡。這種改變將重寫交互設(shè)計的設(shè)計思維、架構(gòu)、形式、流程、規(guī)范等。
(1)對交互設(shè)計思維的突破。人工智能連接工程師、設(shè)計師和用戶的心智模型,能夠靈活根據(jù)交互的方式與內(nèi)容,在目標、動機、條件與結(jié)果之間達成最優(yōu)解決方案。根據(jù)功能目標確定交互行為模式,映射匹配出各種人機、人際、人事、人境的交互場景,達到場景化的目標最優(yōu)路徑。而后根據(jù)用戶的體驗反饋,分析優(yōu)化和測試改進交互流程與交互體驗結(jié)果,形成新的人機共生關(guān)系[2]。(2)對信息架構(gòu)的優(yōu)化。GUI時代,信息架構(gòu)由頁面和流程決定。當信息量不斷增加,信息的展現(xiàn)需要更多的頁面來承載,導(dǎo)致了信息架構(gòu)的層級和流程變得復(fù)雜,增加了用戶的使用成本。人工智能時代,可以利用語音輸入以特定關(guān)鍵詞進行信息搜索和功能觸發(fā),使信息流獲取的準確性大幅度提高,產(chǎn)品不再需要復(fù)雜的架構(gòu)來承載不同內(nèi)容,可極大提高用戶的交互效率,并具有高兼容性和擴展性,為原有信息架構(gòu)賦予了活力和流動性。(3)對交互界面的擴展。隨著可穿戴設(shè)備和物聯(lián)網(wǎng)技術(shù)的發(fā)展,萬物得以數(shù)字化形式展現(xiàn),并均可能作為人機交互界面的一部分,成為人機交互的媒介,交互界面不再局限于GUI,會呈現(xiàn)不同的形式,實現(xiàn)從“有形”設(shè)計到“無形”設(shè)計的改變。(4)對交互流程的改變。一個完整的交互設(shè)計過程中的步驟主要分為:用戶調(diào)研、概念設(shè)計、創(chuàng)建用戶模型、創(chuàng)建界面流程、開發(fā)原型以及用戶測試、實現(xiàn)、統(tǒng)測試。人工智能可以分析設(shè)計過程及各階段的任務(wù),尋求符合科學(xué)規(guī)律和設(shè)計效率的最優(yōu)解,通過深入剖析人的思維模式,能夠以直接、精確的方式獲得符合人類體驗愿景的交互設(shè)計。(5)對交互形式的顛覆。當前人機交互多屬于近場、接觸式實體交互,用戶通過移動、點擊、觸控等實體操作形式進行信息的輸入,當脫離計算機或輸入設(shè)備時信息輸入則無法完成。人工智能技術(shù)的發(fā)展拓展了信息輸入的距離和空間,如近場交互中,除了實體操作,語音、圖像等形式同樣有效;而在中遠場景的交互中,語音、動作成為了信息輸入的第一選擇,并逐漸成為重要的輸入方式之一。
人機交互趨勢,是從無序到有序、從數(shù)據(jù)到語義、從線下到線上、從精確到非精確、從機械到自然。人工智能技術(shù)的應(yīng)用,可以將一些模糊和用戶行為習(xí)慣識別為具體、準確的交互意圖,隨著人工智能技術(shù)的進步,人類可以用自然的方式和機器進行交互,而不是被迫去適應(yīng)機器,重新建立一套與機器對話的語言。
3 智能人機交互技術(shù)缺陷及應(yīng)用挑戰(zhàn)
3.1 智能人機交互技術(shù)形式
智能人機交互技術(shù)簡言之是能夠?qū)崿F(xiàn)類人的“能聽會說、自然交互、有問必答”能力的綜合技術(shù),涉及自然語言處理、語義分析和理解、知識構(gòu)建和自學(xué)習(xí)能力、大數(shù)據(jù)處理和挖掘等技術(shù)領(lǐng)域,同時包括整合多種信息承載形式(如文字、語音、體感等)的通信和識別等能力。
就表現(xiàn)形式而言,可概括為多通道、多媒體的智能人機交互,如手勢識別、姿勢識別、語言識別、表情識別、眼部識別、情感識別等。是一種依靠人類本能與機器進行“無感”交互的技術(shù)形式,以人為中心,關(guān)注體驗和意識。
盡管智能人機交互技術(shù)已逐漸在智能硬件、可穿戴設(shè)備、智能家居、物聯(lián)網(wǎng)等領(lǐng)域展開應(yīng)用,但總體來說仍存在很多的不足。
3.2 當前智能人機交互的技術(shù)現(xiàn)狀
深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用使得語音識別、人機對話、機器翻譯、手勢檢測與跟蹤、等領(lǐng)域技術(shù)得到了快速發(fā)展和應(yīng)用,如情感識別的結(jié)果僅比專業(yè)人士相差10%,語音識別的準確率已接近人類水平,而圖像目標識別已超過普通人類辨識水平。但要像人一樣“能聽會說,善解人意”,仍有大量技術(shù)難題待攻破。如在完全自然的口語識別及方言識別方面,語音識別準確率還很不理想;智能硬件產(chǎn)品存在“沒聽清、聽不懂、不聰明”問題;智能家居不“智能”,用戶激活率不足20%;而被認為最直觀、自然的多通道人機交互,由于其信息表達的豐富性和模糊性,很難準確映射為人機交互的界面操作,導(dǎo)致能以準確理解用戶的意圖。究其原因,機器學(xué)習(xí)、深度學(xué)習(xí)、自然語言理解、語義理解、人機對話、需求預(yù)測、數(shù)據(jù)挖掘等技術(shù)尚處于早期,在足夠智能之前,智能水平與用戶體驗、可靠性存在矛盾。
3.3 應(yīng)用挑戰(zhàn)
(1)使用范圍有限。盡管有新興交互方式的嘗試,但大多數(shù)交互方式的使用率不高,未形成普及化的商業(yè)應(yīng)用,更沒有達到無障礙、隨心所欲溝通的水平。如體感交互目前只應(yīng)用于游戲領(lǐng)域,動作捕捉交互方式更多應(yīng)用于電影制作領(lǐng)域。(2)仍未擺脫界面交互,體驗性差。雖然觸摸交互漸成主流,但仍需用戶精確輸入,對用戶而言費神費力。如特斯拉配備的中控大屏在操作時易造成開車過程中的分心。同時多數(shù)智能人機交互產(chǎn)品的用戶界面仍未脫離GUI的思維束縛,而超越傳統(tǒng)GUI、能與用戶及環(huán)境進行主動感知和交互的界面設(shè)計仍未出現(xiàn)。(3)改變用戶習(xí)慣較困難。應(yīng)用新技術(shù)開發(fā)新的交互平臺具備其合理性,但忽視與已建立操作習(xí)慣的一致性,或增加用戶的學(xué)習(xí)成本,會給用戶帶來極大的困擾。如代碼界面到圖像界面,單點觸控到多點觸控等的習(xí)慣跨越歷程。
4 未來人機交互的發(fā)展趨勢及應(yīng)用熱點
當前移動互聯(lián)網(wǎng)、虛擬現(xiàn)實、普適計算等飛速發(fā)展,對人機交互技術(shù)提出了新的調(diào)整和更高的要求,人機交互研究內(nèi)容也從精確到非精確、從功能到場景、從交互轉(zhuǎn)向?qū)嵺`。未來的人機交互,將會演變成“交互人”和“智能機”在物理空間、數(shù)字空間及社會空間等不同空間上的交互[5]。人作為人機交互的核心,將隨著技術(shù)的發(fā)展與交互設(shè)備融為一體。計算機的主要交互行為將變成感知行為,感知場景、人的行為及相關(guān)屬性,形成物理世界的“直覺”,從而實現(xiàn)為人類服務(wù)。
未來,人與機器的交互,將從外在互動轉(zhuǎn)向情感交流,所有操作性設(shè)備融入智能空間內(nèi),傳感與交互無處不在,而融合人工智能、大數(shù)據(jù)的云計算平臺使得人機交互系統(tǒng)越來越聰明、越來越人性化,會是一種沒有交互的“交互”。
5 結(jié)語
人機交互技術(shù)是當前信息產(chǎn)業(yè)競爭的焦點,各國紛紛將其列為重點發(fā)展的信息技術(shù)之一。人工智能時代,以人為中心、自然、高效等特征將是下一代人機交互系統(tǒng)的主要目標特性。隨著技術(shù)的突破,人機交互領(lǐng)域必將實現(xiàn)跨越式發(fā)展,也必將影響整個人類發(fā)展史。
參考文獻
[1]Hewett T T, Baccker R, Card S, etal. ACM SIGCHI Curricula for Human-Computer Interaction. New York: ACM, 1992.
[2]覃京燕.人工智能對交互設(shè)計的影響研究[J].包裝工程,2017,38(20):27-31.
[3]郝凝輝,魯曉波.實體交互界面設(shè)計的方法思辨[J].裝飾,2014,(2):34-37.
[4]林應(yīng)明,董士海.多通道融合算法和軟件平臺的實現(xiàn)[J].計算機學(xué)報,2000,23(1):90-94.
[5]范俊君,田豐,杜一,等.智能時代人機交互的一些思考[J].中國科學(xué),2018,48(4):361-375.