黃斌+盧金金+王建華+吳星明+陳偉海



摘 要:針對傳統物體識別算法中人工設計出來的特征易受物體形態多樣性、光照和背景的影響,提出了一種基于深度卷神經網絡的物體識別算法。該算法基于NYU Depth V2場景數據庫,首先將單通道深度信息轉換為三通道;再用訓練集中的彩色圖片和轉換后的三通道深度圖片分別微調兩個深度卷積神經網絡模型;然后用訓練好的模型對重采樣訓練集中的彩色和深度圖片提取模型第一個全連接層的特征,并將兩種模態的特征串聯起來,訓練線性支持向量機(LinSVM);最后將所提算法應用到場景理解任務中的超像素特征提取。所提方法在測試集上的物體分類準確度可達到91.4%,比SAE-RNN方法提高4.1個百分點。實驗結果表明所提方法可提取彩色和深度圖片高層特征,有效提高物體分類準確度。
關鍵詞:計算機視覺;卷積神經網絡;特征提取;線性支持向量機;物體識別;場景理解
中圖分類號:TP391.4
文獻標志碼:A
文章編號:1001-9081(2016)12-3333-08