田鈺杰,管有慶,龔 銳
(南京郵電大學 物聯網學院,南京 210023)
點云是一種常用的三維圖形表示方式,許多場景都是基于點云進行三維環境感知和交互的,對點云進行分類和分割是目前深度學習領域的研究熱點。點云數據是傳感器最原始的數據形式,主要采用深度學習處理點云。點云具有無序性,可利用深度神經網絡強大的學習能力解決點云數據的排序問題。PointNet[1]和Deep Set[2]利用對稱函數處理無序的點云,從而對其進行優化。PointNet++[3]對PointNet 方法進行擴展,通過多尺度優化局部特征提取性能。DGCNN[4]深度神經網絡根據絕對坐標計算空間中的局部區域,通過計算點的邊緣特征學習邊緣特征與其他特征之間的關系。VoxNet[5]將采樣三維的點送入32×32×32 的三維網格,進而由三維卷積神經網絡(Convolutional Neural Network,CNN)進行處理,但該網絡計算量較大。曾碧等[6]提出一種聚類算法融合特征的方法,通過聚類算法對學習到的特征進行融合,用于解決點云室內場景分割。MVCNN[7]從點云中采樣80 個視圖,將它們投影到二維空間并進行二維的CNN 處理。楊曉文等[8]提出一種基于八叉樹的CNN,構造高效的八叉樹結構化來表示三維點云,將卷積計算限制在八叉樹節點上,不需要投影到二維空間且能減少一定的計算量。SO-Net[9]網絡結構使用自組織映射(Self-Organization Map,SOM)進行分層特征提取。
研究者利用多層感知機(Multilayer Perceptron,MLP)提取每個點的語義特征以處理點云數據,但這類方法不能很好地學習點的局部特征且魯棒性較差。在點云分類分割中,既要考慮輸入點的全局特征,也要考慮點與點之間的局部關系。……