志剛
《我》《復仇者聯(lián)盟》《黑衣人》……基本每一部科幻電影中,都會有智能汽車的身影,這讓很多人都對此產(chǎn)生的向往,并似乎也啟發(fā)了科技公司和汽車制造商競相開發(fā)無驅(qū)動技術。隨著無人駕駛汽車等紛紛試行,人工智能汽車已近在咫尺,但是,現(xiàn)實真的如此嗎?
近十年來,感知、自然語言處理、形式邏輯、控制理論、認知系統(tǒng)架構、搜索與優(yōu)化技術等領域的發(fā)展推動了人工智能技術的廣泛應用,特別是對汽車人工智能領域應用的推動尤為明顯。汽車人工智能的核心是“交互”,包括車輛與周邊環(huán)境進行交互與適應、與其他車輛進行信息交換、與車內(nèi)/車外人員進行交互等。與已有的駕駛輔助系統(tǒng)(ADAS)不同,汽車人工智能是指車輛同時具備根據(jù)外部事件和自我目標作出判斷的能力,即使面對意外事件和未知環(huán)境,也能給出解決方案。
汽車人工智能的主要研究內(nèi)容為人機共駕、無人駕駛和車輛協(xié)同駕駛。其中,人機共駕是指汽車人工智能系統(tǒng)根據(jù)人類狀態(tài)感知信息、外部事件感知信息,通過智能化人機界面在駕駛人與自動駕駛系統(tǒng)之間協(xié)調(diào)任務分配,使兩者的能力達到最優(yōu)組合;無人駕駛是指汽車人工智能系統(tǒng)根據(jù)行駛環(huán)境感知、社會規(guī)則感知和人員意圖感知,以恰當?shù)男袨榘踩匦旭傇诳蓜偃蔚膮^(qū)域內(nèi);車輛協(xié)同駕駛是指汽車人工智能系統(tǒng)在連續(xù)、可靠、穩(wěn)定的互聯(lián)數(shù)據(jù)環(huán)境下,通過訓練和學習,在AI車輛之間實現(xiàn)群體性協(xié)同決策。
感知與認知技術:基于機器視覺的部分隱藏障礙或輪廓無法區(qū)分障礙的識別、提取和分類。自動駕駛汽車在行駛過程中,行駛路徑上常有重疊或遮擋的障礙物或行人,這部分的目標識別能力將大幅提高自動駕駛汽車的安全性。
基于機器視覺的極端環(huán)境下障礙識別。例如在背光、黑暗或狹窄空間等環(huán)境下實現(xiàn)自動駕駛,汽車人工智能技術可提高此類障礙識別的準確率。
汽車行駛在嘈雜環(huán)境下的語音識別技術,特別是交談中識別并跟蹤某個指定人的語音。這將使自動駕駛汽車像人類駕駛人一樣與乘客相互溝通,以此適應汽車內(nèi)部環(huán)境中的應用。
研究駕駛人的意識、情緒、意圖、控制能力的識別技術。通過綜合研究視覺傳感、聲音處理與識別、嗅覺傳感、分布式傳感、傳感融合等技術,實現(xiàn)對意識、情緒、意圖、控制能力的識別。
基于人工智能的大數(shù)據(jù)分析技術:將交通大數(shù)據(jù)廣泛應用到汽車人工智能系統(tǒng)中,進行數(shù)據(jù)的學習和訓練,可提高自動駕駛汽車的交通適應性,更有效地提高通行效率。
操作系統(tǒng)與中間層軟件開發(fā):研究和開發(fā)基于人工智能的識別、推理和自主駕駛控制等高級應用程序,使其更易于使用,且便于與標準化的操作系統(tǒng)、中間層軟件在仿真平臺上進行驗證和產(chǎn)品化開發(fā)。
目前的技術不足以識別和評估由于人工智能技術在自動駕駛汽車上使用范圍擴展而引起的潛在風險。
由于一些共性領域短期內(nèi)商業(yè)利益不明顯,企業(yè)和工業(yè)界進行系統(tǒng)性研究的可能性較小,但這些領域是人工智能基礎平臺,它們的完整性決定了人工智能技術的整體應用進展。因此,需制定長期研究計劃,開展系統(tǒng)性研究。
人工智能基礎理論研究:雖然許多人工智能系統(tǒng)的最終目標是提供擬人化解決方案,但人工智能系統(tǒng)的能力范圍和限制仍無法界定,雖然很多學科(包括數(shù)學,控制科學和計算機科學)都在研究這個問題,但目前仍缺乏一個理解人工智能系統(tǒng)性能的統(tǒng)一理論模型或框架。
對交通大數(shù)據(jù)進行智能化理解和知識挖掘的基礎工具:在確保數(shù)據(jù)來源真實有效的前提下,用機器學習方法識別隱含在交通大數(shù)據(jù)里的有效信息,以便用于汽車人工智能系統(tǒng)的訓練和學習。汽車人工智能系統(tǒng)的輸入信息往往來自多個領域的異構數(shù)據(jù),因此需要有多模并行的機器學習機制,從不同的數(shù)據(jù)種類中提取有效數(shù)據(jù),不但可以根據(jù)統(tǒng)計學規(guī)律處理問題,還要能夠聯(lián)合其他知識源(比如交通規(guī)則、社會準則等)進行協(xié)同判斷。
汽車感知認知能力增強技術:汽車人工智能感知內(nèi)容包括精準位置獲取、移動障礙識別、內(nèi)部人員生理及心理狀態(tài)感知、車輛故障診斷等。感知系統(tǒng)需要能夠集成來自各種傳感器和其他信息源的數(shù)據(jù),提高在干擾和動態(tài)環(huán)境下的障礙檢測、分類、識別技術。此外,通過傳感器和算法的組合改進人類的感知,使汽車人工智能系統(tǒng)與人更有效地協(xié)同工作。
通用人工智能技術研究:人工智能技術可分為“狹義人工智能技術”和“通用人工智能技術”。狹義人工智能技術在單一域內(nèi)執(zhí)行單獨任務,如語音識別、圖像識別等。而通用人工智能技術的系統(tǒng)目標是在廣泛的認知領域中同時表現(xiàn)出擬人化的靈活性和多功能性。目前,人們在探索如何通過學習和訓練將狹義人工智能擴展成通用人工智能,汽車人工智能需要探索通用人工智能在無人駕駛領域的應用。
開發(fā)可擴展的汽車人工智能系統(tǒng):汽車人工智能系統(tǒng)協(xié)同云計算可以執(zhí)行單個汽車人工智能系統(tǒng)不可能完成的任務,這種人工智能系統(tǒng)群體運行的規(guī)劃、協(xié)調(diào)、控制需要人工智能控制單元具有可擴展性。目前,已有一些基于人工智能的集中規(guī)劃和協(xié)調(diào)技術的研究,然而,這些方法在可靠性和安全性方面不適用于群體車輛控制。另外,以人工智能車輛為主體的分布式規(guī)劃和控制技術難以通過算法實現(xiàn)。因此,必須重點開發(fā)更有效、更可靠和可擴展的技術,實現(xiàn)人工智能系統(tǒng)群體規(guī)劃、控制與協(xié)作。
開發(fā)擬人化汽車人工智能系統(tǒng):擬人化的汽車人工智能技術要求其以人類能夠理解的方式來表達,這將催生新一代的智能汽車系統(tǒng),如基于人工智能技術的駕駛輔助系統(tǒng)和人機共駕系統(tǒng)。然而,當前人工智能技術的實現(xiàn)結果與人類行為結果仍然存在較大差距,人類能夠從有限的幾個示例中學會駕駛操作,通過接收明確指令或提示來進行駕駛,也可通過觀察其他人的駕駛過程來學習駕駛。相比之下,人工智能系統(tǒng)所需的學習訓練數(shù)量更多。
開發(fā)車載人工智能系統(tǒng)硬件:雖然人工智能技術研究與軟件密切相關,但人工智能系統(tǒng)的性能在很大程度上取決于它的硬件。深度機器學習的興起與基于GPU的硬件技術直接相關,但是,針對人工智能算法特點開發(fā)的硬件將可以實現(xiàn)比GPU更高的性能水平,如“神經(jīng)形態(tài)”處理器可以專門針對神經(jīng)網(wǎng)絡算法進行優(yōu)化設計。
人工智能數(shù)據(jù)開放平臺
只有基于有效訓練數(shù)據(jù)和測試數(shù)據(jù),汽車人工智能技術才能逐漸發(fā)揮其強大優(yōu)勢。同時,訓練所用數(shù)據(jù)集和數(shù)據(jù)源的多樣性、深度、質(zhì)量和準確性也顯著影響汽車人工智能系統(tǒng)的性能。
汽車人工智能系統(tǒng)訓練和測試的數(shù)據(jù)集必須具備完整性和有效性。為了使汽車人工智能系統(tǒng)的研究可再現(xiàn),需要建立一個經(jīng)審查、有明確來源的開放式數(shù)據(jù)集。同其他數(shù)據(jù)密集型技術一樣,獲取數(shù)據(jù)源具有非常重要的意義,數(shù)據(jù)庫的建立需要技術、社會組織、法律等多方面的支持。
汽車人工智能的技術難點通常與“大數(shù)據(jù)分析”技術密切相關。考慮到相關數(shù)據(jù)集的多樣性,如何對非結構化或半結構化數(shù)據(jù)進行適當?shù)谋磉_、訪問和分析仍然是一個大挑戰(zhàn),如何用術語表達數(shù)據(jù),仍需大量工作。當前的交通數(shù)據(jù)庫可能不一致、不完整、帶有嚴重噪聲。因此,需要開發(fā)一系列的數(shù)據(jù)預處理技術才能使交通數(shù)據(jù)庫對汽車人工智能系統(tǒng)應用有實際使用意義。
建立人工智能數(shù)據(jù)分享社會平臺,加大促進汽車人工智能方法和解決方案的創(chuàng)新。因為數(shù)據(jù)擁有者在共享數(shù)據(jù)時會承擔風險,所以需開發(fā)能夠確保數(shù)據(jù)安全的數(shù)據(jù)共享技術,確保數(shù)據(jù)集的開發(fā)和共享遵守相關法律法規(guī),并合乎社會道德。
汽車人工智能開放工具平臺
越來越多的開源軟件庫和工具包可為開發(fā)人員提供最先進的人工智能開發(fā)技術,如Weka工具包、MALLET和OpenNLP工具等,這些工具可加速人工智能技術的開發(fā)和應用。因為開發(fā)相關工具、免費或低成本的代碼存儲庫、免費或低成本的開發(fā)語言可極大降低人工智能技術的開發(fā)門檻。目前已有在線提供專用硬件服務的供應商,包括基于GPU的計算系統(tǒng)。可以設想,將來也可以通過這類在線資源獲取用于人工智能算法的專用硬件服務,包括神經(jīng)形態(tài)處理器等。
這些資源集中在一起,提供了人工智能技術基礎設施。這種開發(fā)環(huán)境鼓勵市場創(chuàng)新,可為狹窄領域問題找到解決方案,而無需昂貴的硬件或軟件投入,也無需高水平的人工智能相關專業(yè)知識。鼓勵更多人使用開放人工智能技術,盡可能為開源項目提供算法和軟件,可幫助創(chuàng)新者保持低準入門檻。這種開放式開發(fā)工具平臺有助于人工智能新技術與新知識在各個應用領域里的快速橫向流動。
從汽車工業(yè)的發(fā)展延續(xù)角度看,汽車人工智能技術不會像航天外空間探索或者深海潛水器那樣追求純無人系統(tǒng),在相當長的一段時間內(nèi)汽車人工智能技術會以人機協(xié)同駕駛的方式存在。協(xié)同駕駛可以利用人類和人工智能系統(tǒng)的互補性。雖然有效的人與人工智能系統(tǒng)的協(xié)作方法已經(jīng)存在,但大多數(shù)只能在特定環(huán)境中使用特定平臺來實現(xiàn)特定目標。人機協(xié)同需要尋找更具兼容性的協(xié)作方案。
人工智能算法雖然已經(jīng)能夠解決很多復雜問題,然而,要使汽車人工智能系統(tǒng)與用戶無縫協(xié)作,還需要開發(fā)“人員狀態(tài)感知智能系統(tǒng)”。在人機交互過程中,人工智能系統(tǒng)需要基于用戶的行為歷史數(shù)據(jù),或基于用戶意圖的深層模型。汽車人工智能系統(tǒng)應具備增強人類認知的能力,在用戶沒有提出明確需求的前提下,在各種場合下向用戶提供必要信息。未來的智能系統(tǒng)必須能夠掌握人類社會規(guī)范并相應地采取行動。具有情緒智能的人工智能系統(tǒng),可以識別用戶的情緒并做出適當響應,可以更有效地與人類一起工作。
“主動學習”是另一種類型的人機協(xié)作,這種人工智能系統(tǒng)可以對數(shù)據(jù)進行智能理解。在主動學習中,輸入來自于專家系統(tǒng),只有當學習算法不確定時才對數(shù)據(jù)執(zhí)行學習。這一技術可以減少生成初始模型的數(shù)據(jù)量或?qū)W習量。主動學習也是獲取專家系統(tǒng)輸入和增加學習算法信任度的重要方法,目前只在監(jiān)督學習中使用,未來需要進一步研究將主動學習納入無監(jiān)督學習和強化學習。
可視化用戶界面可以幫助人們了解大量數(shù)據(jù)集和各種來源的信息。可視化用戶界面必須以人類可理解的方式清楚地呈現(xiàn)日益復雜的數(shù)據(jù)和其來源。人類在駕駛汽車或乘坐自動駕駛汽車時,獲取實時信息至關重要,這可以通過增加車載智能系統(tǒng)計算能力和使相關系統(tǒng)互聯(lián)的方式來實現(xiàn)。在這些情況下,可視化人機界面技術可以快速傳達正確的實時響應信息。(編輯/高緯時)