張迪扉
(中科星圖股份有限公司,北京,101399)
利用高度人工智能訓練機器人的視覺感知處理層面、操作處理層面或是具體認知處理層面可以進行深化設定,讓訓練機器人能夠發揮實際的技能作用達到效果,例如通過視頻軟件快速播放自己選擇的智能音樂節目內容,快速的檢查到自己需要的訓練電話號碼,提供和實際訓練要求的相匹配的智能營養餐,將這些人工制造智能應用技術和其他大數據應用技術有機的集合起來讓訓練機器人不僅可以能夠像其他人類一樣快速進行分析決策或是進行思考,將大量的訓練信息通過高度信息處理傳感器系統進行準確傳遞,利用模式識別分析引擎將利用大數據技術進行高度結構化或是高度系統化的數據分析,利用高度數據處理反饋或是深度學習分析算法對于訓練機器人的具體技能需求設定進行深化,經過實際學習應用后會發現在相對應的具體訓練定義語料中的數據應該越多,神經元每個節點的技能需求就應該更多,對于具體訓練語義的模式識別就應該能夠更加精準,通過結合科學的數據計算,一千萬和一百萬的兩個神經元節點整體語義識別率之間差距已經可以達到百分之十,一百億和十億的兩個神經元節點整體語義識別率之間差距已經遠遠高于百分之二十,因此針對大數據技術應用的不斷優化也也是一個必然趨勢。
在發展人工智能的基礎上它也產生了人工智能智力制造,知識技術是如何推進我國智能制造發展的基本,智力制造是如何充分利用人工知識技術進行綜合應用的一種重要水平。智能系統制造這個時候已經包括了工業智能系統制造信息系統、智能裝備制造業等技術,具體研究應用發展過程中已經展開了一系列化的類似數據分析、推理、決策等的技術活動,在掌握智能系統制造的理論基礎上對于行業相關集成自動化的關鍵概念技術進行不斷創新,并且行業發展日漸高度趨向集成自動化、智能化、柔性化,多年的技術研究應用發展已經對于智能制造業的行業發展產生深遠影響。制造業過程中的質量數據采集、管理,訂單的質量管理、智能化產品制造、定制的服務平臺均一直關系影響到企業大數據,深入分析挖掘后數據可以幫助實現更精準的資源匹配,減低傳統制造商的經營風險。
智能交通系統已逐漸在國內外很多重要城市地區得到示范應用和廣泛普及,并充分顯示其突出具有高效率、低能耗、輕量無污染和少發生事故等巨大市場優勢。車輛安全檢測和人臉識別系統技術一直是推動智能交通系統以及車輛輔助安全自動駕駛等相關領域快速發展的重要技術研究發展方向。在道路交通管理監控系統中,通過對違法車輛的動態檢測進行識別,實現車輛動態監測車流情況監測車輛監控、非法營運車輛的現場稽查以及用戶提供道路停車車輛管理咨詢服務等。在自動輔助安全自動駕駛中,高標準精度的機動車輛路況檢測及識別方法可為自動安全駕駛的各種智能安全決策應用提供重要依據。智能交通系統在其中的智能交通管理以及交通輔助安全自動駕駛等諸多領域都對高質量精度及實時的智能車輛路況檢測和自動識別系統有著迫切的技術需求。本章以新型車輛智能檢測與人臉識別技術為一實例,研究汽車大數據在構建人工智能交通系統中如何發揮的重要作用。
采取人工大數據分析技術在實現人工智能車輛識別檢測車輛屬性檢測中的過程主要功能包括人工車輛識別檢測智能VPN及車輛屬性智能識別檢測ARN兩個主要步驟共同組成,第一步,利用VPN可以獲得所有檢測可能性的車輛檢測建議框。首先,生成輸入訓練及模擬測試數據的每個感興趣模塊區域,其次,采用卷積模擬神經網絡數據提取軟件輸入生成訓練及模擬測試數據的不同深度卷積數據特征,然后,將軟件生成的每個感興趣模塊區域在不同深度卷積數據特征上分別進行背景投影與數據池化,最后,將生成感興趣模塊區域中的特征向量經全局的連接層及數據分類器后,預測出所有認為可能的機動車輛駕駛建議框,并將所有認為可能的機動車輛駕駛建議框數據送入軟件ARN。第二步,采用ARNR來獲得一個車輛屬性建議框的車輛屬性設置信息。首先,提取整個車輛模型建議框的細粒深度卷積屬性特征,然后,利用一種多任務的機器學習分析模式及利用SOFTMAXY的分類器方法獲取整個車輛模型建議框的細粒度卷積屬性特征信息,該方法的整個總體數據處理工作流程如下圖圖1所示。

圖1 實現方法流程
本文主要采取了ACOMPCARS車型數據集,在多種大數據分析技術的共同特點下,該車型數據集的突出技術優點之一是該數據圖片規模較大,包含208826張不同車輛車型圖片,涉及1716個不同車輛圖片型號。與此同時,該應用數據集還能包含兩種應用場景的不同車輛行駛數據,便于針對交叉應用場景進行實驗。其中一種類型是自然停車場景,數據主要來源于行業論壇、網站和其他搜索結果引擎,總共數據包含136727張車輛整幅大型車輛配件圖像,27618張大型車輛整體局部配件圖像,涉及1716個品牌車輛配件型號,163家大型車輛配件生產廠家。另一種方法是遙控監督車輛場景,數據內容來源于一臺監控車輛攝像機,總共數據包含44481張監控車輛不同整幅監控圖片,涉及281個監控車輛不同型號。監督停車場景的拍攝車輛外觀圖片的整體外觀效果受當地光照、天氣、交通狀況的因素影響很大。此外,COMPCARS模型數據集中還包含豐富的車輛屬性模型信息,如拍攝車輛的各個拍攝場景視角、車輛的各個局部模型零件以及能夠描述一個車輛真實行駛位置的車型標注框等。以移動視角中的屬性信息為單舉例,COMPCARS這個數據集總共包含5種移動視角屬性信息,分別為前移動視角、后視角、側移動視角、前側移動視角以及后側移動視角。本文主要選取自然環境場景條件中的一個具有重要代表性的431個人的車輛樣本型號36458張一個車輛型號圖片樣本用于行車訓練,15624張一個車輛型號樣本圖片用于行車測試。圖2給出了一個測試者在訓練中使用的實例的結構示意。

圖2 大數據訓練集選取
為了方便綜合分析評價各種人工智能檢測方法的質量檢測系統性能,通常建議采用一種P-R檢測曲線度量作為性能評價度量標準,P-R度量曲線主要描述的關系是檢測查全性概率R與查準率數值P之間的度量關系。對于一個P-R##I的曲線來說,其中的查全準確率和查準率都越高或接近1越好。對于需要檢測的軟件錯誤主要分為包括漏檢和錯誤虛警兩種。對于在P-R直角曲線下與兩個坐標軸連線圍成的水平面積曲線AUCUD進行精度統計,用平均測量精度系數AP和R表示。將本人論文VPN分析方法與E-DPM分析方法、CASCADE-DPM分析方法及CABBPC方法分別進行綜合定性化和定量分析對比進行分析。圖3給出了4種轉換方法在POCOMPCARS這個數據集上的一個P-R轉換曲線。在相同曲線前段RRRECALL∈[0,0.5],4種查準方法在相同曲線查全的概率下的查準率基本近似。在整個曲線中段,RRECALL∈(0.5,0.8],隨著曲線查全準確率不斷增加,VPNPN方法仍然能保持比較高的查準,DPMPN方法查準下降最快。在這個曲線后段RECALL∈(0.8,1],VPN這種查全方法在一次性的查全查準率已經達到非常接近0.9時仍然可能會連續保持將近0.8的查準率,其他幾種查全方法則不會連續出現很多次的錯誤或者虛警。

圖3 P-R曲線
表1顯示了COMPCARS數據集中不同方法綜合探測的性能。DPM方法、CASCADEDPM方法和BB方法采用HOG特征與滑動窗搜索策略,確定了測量的實際效果,而SSL方法采用CNN特征強大的抽象功能,與EDGEBOX算法相配合快速獲得感興趣的區域,其平均AP為84.1%,相對BB方法則為84.1%。提高了2.8%,同時處理速度提高到15MBPS/S,檢測性能得到了較大提升。總的說來, VPS 方法的 PR 曲線靠近右上角,在較高查全率的情況下仍然保持著很高的精確度,優于其它各種方法,對光線有很好的魯桿性,適用于稍微遮擋的情況。

表1 檢測性能
大數據技術在人工智能中的應用不僅局限在上述幾個領域,而且還有一些智能化農業種植中心,一些智能的教學評價分析系統,等等。在借助于大數據技術的支持,人工智能將人們從繁忙的工作中釋放出來,減輕了工作壓力,降低了學習的壓力,提高了工作效率和學習成績。然而,人工智能卻是一把雙刀劍,在人工智能和大數據技術融合的過程中,應注意防止相關的安全風險,從而更大地推進人類社會發展。