湯哲君
摘要:本文主要介紹基于機器視覺的三維重建技術的主要方法、技術及應用,對單目視覺、雙目視覺、三目視覺和四目視覺的三維重建技術進行對比分析,總結了基于機器視覺的三維重建技術在工程應用中存在的問題、面臨的挑戰和研究方向,希望對該領域有一個比較全面的把握。
關鍵詞:機器視覺;特征匹配;三維重建
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2020)05-0063-01
0引言
無論是在計算機輔助幾何設計方向、計算機圖形學、亦或是計算機動畫制作和數字媒體創作等領域的研究中,物體三維重建是它們的共性科學問題,同時也是引領發展的核心技術。基于機器視覺三維重建技術的基本原理簡單來說就是針對—個標的物,通過多個不同的視角所獲取的圖像,應用相關三角測量原理計算出標的物的位置偏差,從而獲得該標的物的空間三維信息。當我們將二維圖像所獲得的坐標點與三維空間的特征點的空間位置相匹配,就可以實現標的物的三維重建。可以快速對標的物進行三維重建而不受限于其具體形狀便是三維重建技術的優點,通過該技術,可以實現全自動或半自動建模。
1機器視覺系統
一個完整的立體視覺系統包含攝像機標定、圖像獲取、特征提取、圖像校正、立體匹配、三維重建六個步驟。
攝像機標定就是為了得到實驗中攝像機的內外參數,而使用標定板對各個攝像機分別進行標定。特征提取主要是提取圖像的邊緣信息。常用的邊緣提取的方法有SIFT、sobel邊緣檢測算子、Laplasian算和基于小波變換的圖像邊緣提取方法。基于平面的圖像校正方法是最常用的圖像校正方法,除此之外還有基于外極線的圖像校正方法。三維重建技術的關鍵、同時也是最艱巨的研究熱點是立體匹配算法,所使用算法的精度可以直接決定三維測量的準確性。常用的立體匹配算法主要包括特征匹配算法、相位匹配算法和區域匹配算法。常用的圖像三維重建技術有主動三維重建和被動三維重建兩種。使用三維掃描儀重建標的物就是主動方法的代表,被動方法則指基于機器視覺技術獲取二維圖像進行三維重建方法。
2單目視覺的三維重建技術
單目視覺方法是指在三維重建實驗中使用單臺攝像機進操作。常用單目視覺的三維重建方法分為以下六種。第一種是明暗度法,用一個非線性偏微分方程來表示二維圖像中每個像素點明暗度和對應的三維點的法向、反射率以及光照方向之間關系。第二種是光度立體視覺法,是對明暗度法進行了改進。第三種是紋理法,最早由Wiktin提出。第四種是輪廓法,最早由Marrtin等學者提出。第五種是調焦法。第六種是運動法,即基于運動的建模,是通過在多幅還沒有進行標定圖像中檢測匹配特征點集,再使用數值方法得到三維信息的一種方法。
3多目視覺的三維重建技術
3.1雙目視覺的三維重建技術
雙目視覺,我們也會稱之為雙目立體視覺,是最常用的立體視覺實現方式之一,同時也是最接近于人類視覺的三維數據恢復方式。而在另一方面,雙目立體視覺也是計算機被動測距方法中我們現在接觸到的最重要的也是應用最廣泛的距離感知技術。當已知兩臺攝像機之間的相對位置關系時,希望通過兩臺攝像機所采集到的圖像恢復出一個標的物體的三維空間信息,以此來恢復且重建該標的物體的空間位置和三維形狀,這就是基于人眼視差的雙目立體視覺工作原理。雙目視覺在圖像處理、三維建模、物理科學和物體參數提取等領域中占有重要的地位,可見,雙目視覺是三維建模技術發展的一個重要方向。
3.2三日視覺的三維重建技術
三目重建系統尋求的是建立在透視投影的可靠基礎之上的三元匹配。因其重建數據正確率高、構造簡單等優勢,三目立體視覺被廣泛應用于機器人視覺導航和環境三維感知等場合。比起單目與雙目立體視覺,三目立體視覺可以解決諸如特殊結構的景物、對方向平行于核線匹配出現歧義、遮擋嚴重、能重建的空間點減少等問題。
3.3四目視覺的三維重建技術
相對于雙目視覺和三目視覺,國內外對于四目視覺的研究還比較少,國內對于四目視覺的研究大多集中于歷史文化遺產的保護方面,對于工業生產以及實際應用方面的研究還較少。顯然四目視覺的研究處于方興未艾的階段,對于工業、農業生產無損檢測方面有很大前景。
4比較與分析
無論是單目視覺還是多目視覺,在圖像重建過程中各有自己的應用優、缺點。雖然相對于單目視覺而言,多目視覺,無論是在結構還是重建時間、成本方面都有優勢,但是受限于重建局限條件和重建效果的影響,在實際應用過程中,多目立體視覺的使用是大大多于單目立體視覺。基于研究的現狀,目前在圖像三維重建過程中所面臨的主要問題和挑戰是:(1)對于相機標定算法的研究。如何行之有效的快速進行攝像機的標定直接決定著后期重建進程。張氏標定法是目前應用最廣泛的標定方法,然而內參矩陣和外參矩陣的求解與確定是一個難點,為求解內參與外參需要不斷變換相機與標定板之間的位置獲取行之有效的數據,工作量大而繁瑣。實驗室環境下和工業環境中的不同外在影響是否會對標定結果產生影響亦是一個問題。(2)特征提取。在不同光照強度、不同的物體、不同的室內、外環境下攝像機采取的圖像信息會有一定程度的差異,對于靜止物體、運動物體、剛性物體和非剛性物體特征點的提取各有各的特點,如何去除由于拍攝運動物體而產生的拖影,去除圖像中噪聲,提取有效的物體特征信息同樣是一個研究的方向,只有提取出有效的特征信息才能進行下步工作。(3)匹配與重建。立體視覺的精度不僅依賴于景物的深度,還取決于攝像機之間的距離,即基線。通常來說,基線越長精度越好,然而當基線長度增加時,圖像之間的透視形變也越來越大,從而給利用相似度進行匹配帶來了困難;另一方面,當基線減小時,匹配精度也會變差,對于均勻分布、模式重復的景物難以匹配。
針對以上這些問題,基于機器視覺的三維重建方法的相關研究可以從以下幾個方面展開:(1)相關算法的改進與優化。從實際情況出發,對各種算法進行優化,使之更加符合真突情況,提高運算與工作效率,提高準確性。(2)重建對象。在三維重建應用研究中,主要對象都是靜態物體,很少有對動態物體進行研究,因此,對于運動物體的三維重建也將是未來研究的方向之一。(3)四目視覺。國內對于四目視覺的研究還較少,僅有的幾項研究集中于文物保護方面,因此向其他領域擴展亦是后期研究的方向之一。(4)針對大規模場景的三維重建。如何使用衛星或航拍圖片對自然地形和城市景觀等大規模場景的三維場景進行快速準確的重建,也是一個非常有價值的研究方向。(5)醫學領域的應用。雖然國內外對于三維重建在醫學上已經有了一定的應用,但是應用范圍還較小,因此在將三維重建技術應用于醫學亦是一個很好的研究方向。(6)識別與應用。國內對于通過三維重建后的圖像對所重建物體進行篩選分類雖然已經取得了一定成果,但是無論是效率還是準確性、自動化程度上還有一定的缺陷,此方向的研究還有很大提升空間。
5結語
基于機器視覺的三維重建技術研究正處于發展延伸階段,但是各種方法距離實際應用還有一段距離,各種應用需求還沒有達到預期效果。因此,在未來很長的一段時問內,還需要在這—領域科研人員做更加深入細致的研究。