陶鯖宇 劉漢湖 陳建華 許開(kāi)行 盧健
摘 要:全面分析了Web地理空間360°全景從圖像采集的兩種要求、平面投影、球形投影、柱形投影和立方體投影等四種圖像投影方式、基于面積和特征的兩種圖像匹配的方法以及圖像的融合方法探究;再分析了全景瀏覽的步驟和其不同的實(shí)現(xiàn)方法,并簡(jiǎn)單闡述了不同方法之間的優(yōu)缺點(diǎn);還分析對(duì)比了360°全景和二維圖片、三維建模等表現(xiàn)形式及各自具備的優(yōu)勢(shì);以及360°全景可觀的發(fā)展前景。
關(guān)鍵詞:360°全景;圖像投影;圖像融合
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2019)01-0158-03
Abstract: This paper studies the 360°Panorama Technology of Web Geospace in terms of two image acquisition requirements, four image projection methods, i.e. plane projection, spherical projection, cylindrical projection and cube projection, and two kinds of image matching methods based on area and feature as well as image fusion methods. Then, it analyzes the steps of panoramic browsing and its different methods of implementation, and briefly describes the advantages and disadvantages of different methods. Besides,the paper compares the 360° Panorama, two-dimensional pictures, three-dimensional modeling and other forms of representationas well as their respective advantages. Finally, it describes the considerable development prospects of 360° Panorama.
Keywords: 360° Panorama; image projection; image fusion
Web地理空間360°全景技術(shù)是基于地理環(huán)境和視覺(jué)效果討論空間信息所反映的規(guī)律知識(shí)的技術(shù)。它是計(jì)算機(jī)虛擬現(xiàn)實(shí)技術(shù)的一個(gè)分支,真正實(shí)現(xiàn)了數(shù)據(jù)可視化。隨著二維影像成像技術(shù)的成熟、三維建模技術(shù)的發(fā)展,360°全景因其更高的真實(shí)性、更小的體積、更短的開(kāi)發(fā)周期、更好的網(wǎng)絡(luò)傳播性和更強(qiáng)的擴(kuò)展性,在場(chǎng)景展示方面占據(jù)了一席之地。
1 全景圖像處理
全景圖像的制作流程為:原始圖像采集及處理、圖像投影、圖像匹配與拼接、圖像融合。
1.1 圖像采集及處理
全景圖像采集通常有兩種方法。
一種是使用專業(yè)全景相機(jī),相機(jī)具有多個(gè)超廣角攝像頭,將拍攝數(shù)據(jù)導(dǎo)入與相機(jī)配套的設(shè)備軟件,軟件會(huì)自動(dòng)處理并導(dǎo)出一張全景照片,照片是可以獲得用于生成360°全景圖像的二維圖片。這種方式具有采集方便、操作簡(jiǎn)單等優(yōu)點(diǎn),但設(shè)備價(jià)格昂貴,不適于所有人。
另一種是使用手機(jī)等具有普通拍照功能的設(shè)備,使設(shè)備原地轉(zhuǎn)動(dòng)360°,拍攝從天空到地面的景象,保證照片有一定重疊率,然后將得到的數(shù)張圖片導(dǎo)入到如PTGui等全景像片處理軟件,自己手動(dòng)處理這些照片,然后生成一張用于生成360°全景圖像的二維圖片。這種方式可以完全不需要購(gòu)買(mǎi)設(shè)備,如人手持手機(jī)就可以做到。但這種方式對(duì)拍攝要求較高,為了保證很好地對(duì)準(zhǔn)、合并圖片,拍攝時(shí)需要盡量使設(shè)備在同一水平面上進(jìn)行360°旋轉(zhuǎn),并保持拍攝時(shí)的穩(wěn)定,因此最好使用三腳架;對(duì)于照片的重疊率,最好不低于70%。由于獲得的照片里會(huì)有三腳架等放置設(shè)備的儀器,因此需要對(duì)圖片進(jìn)行剪貼蒙板處理;為了精確對(duì)準(zhǔn),需要對(duì)沒(méi)找圖片的視點(diǎn)等進(jìn)行精確優(yōu)化,這都可以用PTGui軟件進(jìn)行處理。在生成全景二維圖片后,可能會(huì)發(fā)現(xiàn)照片中缺少天或地的一部分,這就需要使用PTGui將圖片拆分為頂、底、前、后、左、右六張照片,找到缺失部分所在的照片,在PS中對(duì)圖片進(jìn)行填充處理。
1.2 圖像投影
在采集圖像時(shí),每張圖像都是以二維平面上的中心投影方式進(jìn)行獲取。而為了進(jìn)行拼接,并可以生成360°全景圖像,這些圖片需要投影到特定的幾何體上。一般投影方式有平面投影、球形投影[1-2]、柱形投影[3]和立方體投影[4]。
1.2.1 平面投影
平面投影即是在平面上以中心投影方式輸出圖像,輸出的圖像與原圖像沒(méi)有區(qū)別,因此圖像拼接得到的結(jié)果經(jīng)常錯(cuò)誤,最后呈現(xiàn)的是一個(gè)錯(cuò)誤的長(zhǎng)圖片。
1.2.2 球形投影
球形投影是把拍攝的照片投影到一個(gè)以觀察者(即相機(jī))為中心的圓球上,球形全景達(dá)到水平360°、垂直180°,可以觀察到任何一個(gè)角落;球形全景是與人眼模型最為相似的描述,可以提供在視點(diǎn)處的全方位連續(xù)觀察。但由于球形投影是以相機(jī)為中心,因此在進(jìn)行圖片拼接時(shí),上下兩側(cè)的投影逐漸變大,由于誤差的積累,全景的頂部和底部難以精確對(duì)準(zhǔn)、變形嚴(yán)重,當(dāng)重疊率較低時(shí),可能出現(xiàn)嚴(yán)重失真。
在導(dǎo)出全景圖像的二維圖片時(shí),由于球面坐標(biāo)是三維的,因此需要把球面上的點(diǎn)投影到二維平面上。常使用經(jīng)緯映射法進(jìn)行投影,最后得到一張2:1的矩形圖。
1.2.3 柱形投影
柱形投影是把拍攝的照片投影到以觀察者(即相機(jī))為中心的圓柱體上,柱形全景達(dá)到水平360°,但垂直小于180°,可以看到四周,而頂部和底部不可見(jiàn),這也是通常所說(shuō)的“環(huán)視”。很多專業(yè)全景拍攝設(shè)備直接獲得的全景圖片即是這種,它是最簡(jiǎn)單的全景。由于缺少了頂部和底部,因此柱形全景變形也較小,圖像質(zhì)量均勻,細(xì)節(jié)真實(shí)程度更高。
1.2.4 立方體投影
立方體投影所得到的全景圖也可以全方位表達(dá)場(chǎng)景信息,即達(dá)到水平360°、垂直180°。立方體全景圖像的二維圖片不同于前面的幾種投影方式得到的二維圖片,它是由六張圖片組成,分別代表了全景的頂、底、前、后、左、右六個(gè)方位。這種投影方法打破了原有的單一圖像拼合技術(shù),克服了球面全景中嚴(yán)重變形、圖像失真的問(wèn)題,具有更高精度和更高存儲(chǔ)效率。同時(shí)立方體全景圖中的場(chǎng)景同樣是連續(xù)的,因此在瀏覽全景的時(shí)候,同樣需要根據(jù)視線投影出相應(yīng)的場(chǎng)景。
1.3 圖像匹配與拼接
圖像拼接是指用算法將多張有一定重疊率的序列圖像拼接成一幅360°全景圖對(duì)應(yīng)的二維圖片。對(duì)圖像重疊部分的識(shí)別決定了圖像拼接的質(zhì)量,而圖像拼接的質(zhì)量直接影響到全景圖的展示效果。一般情況下,兩張照片的重疊率保持在70%左右比較合適,得到的照片總數(shù)不多,也容易判斷重疊部分的特征。具體來(lái)說(shuō),重疊部分的大小取決于重疊部分的特征的明顯程度,對(duì)于特征明顯的部分,可以有較小重疊區(qū)域,對(duì)于特征不明顯的部分,應(yīng)當(dāng)有較大重疊區(qū)域。識(shí)別重疊部分的過(guò)程被稱為圖像匹配,目前圖像匹配的方法有基于面積的匹配[5]和基于特征的匹配[6]。
1.3.1 基于面積的匹配
根據(jù)圖像的像素值進(jìn)行圖像匹配的方法。利用待拼接圖像的灰度值,用一定的數(shù)學(xué)方法,如最小二乘法等,來(lái)計(jì)算圖像重疊部分的灰度值的差異,通過(guò)比較差異的大小來(lái)判斷待拼接部分的相似性。其優(yōu)點(diǎn)是易獲得需要的信息、實(shí)現(xiàn)簡(jiǎn)單;但其計(jì)算量偏大、獲取結(jié)果較慢、精讀低,且待拼接的兩幅圖像的亮度和對(duì)比度也不能相差太大。
1.3.2 基于特征的匹配
根據(jù)圖像的特征值進(jìn)行圖像匹配的方法。從圖像中提取圖像的特征,如點(diǎn)、線、紋理、邊緣等,并找出特征之間的關(guān)系進(jìn)行匹配。這種方法極大地減少了計(jì)算量,提高了匹配精度,但其過(guò)程較為復(fù)雜。
1.4 圖像融合
由于獲取圖像時(shí)拍攝角度不同,光照條件也可能不同,因此為了避免拼接后的圖像在拼接處出現(xiàn)不同的亮度,需要進(jìn)行圖像融合以消除拼接的痕跡(如圖1所示)。圖像融合主要是對(duì)圖像像素的亮度值進(jìn)行處理,可以對(duì)局部進(jìn)行亮度調(diào)整的融合,也可以對(duì)整體進(jìn)行亮度調(diào)整的融合,如灰度域算法、最佳縫合線方法和梯度域方法。
2 全景瀏覽
根據(jù)全景圖像的二維圖片創(chuàng)建360°全景圖像,即在場(chǎng)景中創(chuàng)建一個(gè)三維對(duì)象,然后將二維圖片貼在三維對(duì)象的表面,將視角中心放在三維對(duì)象的中心位置,在瀏覽時(shí)只需轉(zhuǎn)動(dòng)三維對(duì)象即可達(dá)到全景瀏覽的效果。在創(chuàng)建三維對(duì)象時(shí),不同的投影方式創(chuàng)建的三維對(duì)象不同,球形投影對(duì)應(yīng)的三維對(duì)象是球形,柱形投影對(duì)應(yīng)的三維對(duì)象是柱形,立方體投影方式對(duì)應(yīng)的三維對(duì)象是立方體。在轉(zhuǎn)動(dòng)三維對(duì)象時(shí),需要實(shí)時(shí)獲取轉(zhuǎn)動(dòng)的角度和觀察坐標(biāo),以計(jì)算可見(jiàn)部分和隱藏部分。
生成全景圖像后需要選擇合適的全景播放器來(lái)瀏覽全景,并將其嵌入到網(wǎng)頁(yè)中,以達(dá)到Web頁(yè)面瀏覽全景的目的。目前常用的全景播放技術(shù)有Java Applet[7]、QTVR、Adobe Flash Player、HTML5[8]。
Java Applet是用Java語(yǔ)言編寫(xiě)的小應(yīng)用程序,可以直接嵌入網(wǎng)頁(yè)中,是常用的顯示插件。當(dāng)其運(yùn)用在全景播放的時(shí)候具有文件小、下載速度快的優(yōu)點(diǎn),但是也有幅面小,圖像質(zhì)量差,動(dòng)態(tài)顯示不連續(xù)等的缺點(diǎn)。
QTVR是Quick Time Virtual Reality的簡(jiǎn)稱,是美國(guó)蘋(píng)果公司對(duì)Quick Time技術(shù)的擴(kuò)展。它是新一代的、基于靜態(tài)圖像處理的初級(jí)虛擬現(xiàn)實(shí)技術(shù)。它的優(yōu)點(diǎn)是圖像幅面大、質(zhì)量好,缺點(diǎn)是視像范圍小,不能實(shí)現(xiàn)全屏播放,較高的版本需要付費(fèi)注冊(cè)。
Adobe Flash Player的功能強(qiáng)大,并且免費(fèi),可以完美的結(jié)合上述兩種技術(shù)的優(yōu)點(diǎn),具有圖像幅面大、質(zhì)量好,并且免費(fèi),還沒(méi)有圖像動(dòng)態(tài)不連續(xù)的缺點(diǎn)。但是它需要安裝,對(duì)于不同瀏覽器的兼容性不好,并且Flash近年來(lái)已經(jīng)有了被HTML5所取代的趨勢(shì),正漸漸走向消亡。
HTML5在2014年由萬(wàn)維網(wǎng)宣布制定完成,并在幾年的發(fā)展時(shí)間幾乎完全代替了Flash的地位。相比Flash,HTML5具有更好的兼容性不需要依賴其他插件,并且它的使用更加靈活。HTML5在三維圖形方面提供了基于SVG、Canvas、WebGL和CSS3的3D功能,能呈現(xiàn)更加真實(shí)的視覺(jué)效果(如圖2所示)。有時(shí),在生成全景后,可能需要給全景中的某個(gè)地點(diǎn)或某個(gè)景物增加介紹性文字、圖片、視頻、音頻等,還可以使用HTML為全景增加圖層,以顯示這些內(nèi)容。
3 小結(jié)與討論
經(jīng)過(guò)上面的討論,可以知道,360°全景和二維圖片、三維建模等表現(xiàn)形式相比,有以下幾點(diǎn)優(yōu)勢(shì):
(1)有更好的真實(shí)感和沉浸感,更能給觀賞者帶來(lái)身臨其境的感覺(jué)。
(2)相比傳統(tǒng)二維圖像,融入了空間信息,因而能夠表達(dá)更多的訊息。
(3)交互性能好,能隨意旋轉(zhuǎn)查看。
(4)制作成本低,制作周期短。
(5)文件內(nèi)存小、發(fā)布格式多,傳輸方便,能隨時(shí)隨地拷貝或傳輸,便于網(wǎng)絡(luò)傳播。
因此,360°全景在真實(shí)、全面、直觀、便捷表現(xiàn)某一場(chǎng)景時(shí)非常適用。目前,在酒店行業(yè)、旅游行業(yè)、科普領(lǐng)域和房地產(chǎn)行業(yè)等都能看到360°全景影像的應(yīng)用,將來(lái)也必然會(huì)用于更多領(lǐng)域。
參考文獻(xiàn):
[1]李松,張欽泉,呂卓,等.基于特征點(diǎn)的球面全景圖快速生成算法[J].長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,35(3):75-78.
[2]楊燕,王雪瑞,戴青,等.球面全景圖像生成技術(shù)的研究[J].計(jì)算機(jī)應(yīng)用與軟件,2007,24(10):164-165.
[3]鐘力,張茂軍,孫立峰,等.360度柱面全景圖象生成算法及其實(shí)現(xiàn)[J].小型微型計(jì)算機(jī)系統(tǒng),1999(12):899-903.
[4]韋群,高麗,龔雪晶.基于立方體全景圖的虛擬場(chǎng)景瀏覽技術(shù)研究及實(shí)現(xiàn)[J].中國(guó)圖象圖形學(xué)報(bào),2003,8(9):1061-1066.
[5]Brown, M., Lowe, D. Automatic Panoramic Image Stitching using Invariant Features[J]. International Journal of Computer Vision, 2007,74(1):59-73.
[6]華順剛,張靜,歐宗瑛.基于圖像繪制的球面全景圖生成及自動(dòng)拼接技術(shù)研究[J].大連理工大學(xué)學(xué)報(bào),2003,43(5):640-644.
[7]宋利,周源華,周軍.一種全景圖瀏覽器的JAVA實(shí)現(xiàn)算法[J].計(jì)算機(jī)應(yīng)用與軟件,2003,20(12):1-2.
[8]Gesquière, G., Manin, A. 3D visualization of urban data based on CityGML with WebGL [J]. International Journal of 3-D Information Modeling (IJ3DIM), 2016,1(3):1-15.