陳元相, 陳建, 鄭明魁, 陳志峰
(福州大學物理與信息工程學院, 福建 福州 350108)
隨著3D感知和獲取技術的進步, 虛擬現實(virtual reality, VR)/增強現實(augmented reality, AR)/混合現實(mixed reality, MR)、 移動地圖、 文物掃描、 智慧城市、 機器人和自動駕駛等新興智能產業飛速發展, 3D點云已經成為這些產業中一種流行的數據存儲和傳輸的格式. 在智能駕駛和移動機器人領域, 3D 激光雷達(light detection and ranging, LiDAR)傳感器作為關鍵的點云采集設備, 對于真實環境的數字感知, 以及在定位、 路徑規劃[1]和障礙物檢測[2]等應用中起著至關重要的作用. 存儲和共享LiDAR點云是智能交通及車路協同系統的必然要求. 然而, 在實際應用中, 點云數據面臨著與2D應用相同的帶寬、 存儲和壓縮限制, 以及相似的質量水平期望, 3D技術所需處理的點云數據量通常比相似分辨率的2D媒體應用至少高一個數量級. 因而, 研究高效的點云壓縮(point cloud compression, PCC)解決方案對于自動駕駛、 高級輔助駕駛等相關的產業具有重要的科學意義.
本文關注于單幀LiDAR點云壓縮問題, 因為LiDAR點云序列的基本組成是單幀點云, 在點云后續的幀間預測中, 為了有效利用鄰近幀之間的時域相關性, 使用先前已經編碼的重建幀作為參考幀(關鍵幀),對后續的編碼幀進行預測. 對關鍵幀的壓縮是幀間預測基本前提, 高性能的單幀壓縮方案不僅可以為后續幀提供高質量的參考幀, 提高幀間預測準確度, 而且可以提升點云序列壓縮率與性能. 單幀壓縮是點云序列壓縮的重要組成部分, 為此本文提……