黃濤娟
上海建工集團(tuán)工程研究總院 上海 201114
增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)是一種新興計(jì)算機(jī)應(yīng)用和人機(jī)交互技術(shù),通常所說的增強(qiáng)現(xiàn)實(shí),指的是用虛擬內(nèi)容來做視覺上的增強(qiáng),通過屏幕或投影設(shè)備來顯示。它的本質(zhì)是通過計(jì)算機(jī)技術(shù)將生成的虛擬物體、場景、視頻、音頻、動畫及提示信息等疊加到真實(shí)世界,通過混合技術(shù)給用戶呈現(xiàn)一個信息增強(qiáng)的現(xiàn)實(shí)世界與虛擬世界的混合體,可以增強(qiáng)用戶對真實(shí)世界的感知能力[1-4]。根據(jù)AR在其他領(lǐng)域的指導(dǎo)應(yīng)用,AR技術(shù)也可以應(yīng)用于建筑施工中,早在1996年,Webster就將AR技術(shù)應(yīng)用于建筑施工、檢查和維修中,展示了其教學(xué)指導(dǎo)作用,后來也有研究應(yīng)用AR技術(shù)實(shí)現(xiàn)圖紙的三維可視化、施工模擬可視化等。本文通過增強(qiáng)現(xiàn)實(shí)技術(shù)在建筑施工中的應(yīng)用及發(fā)展研究,將建筑施工領(lǐng)域的分析和技術(shù)相結(jié)合進(jìn)行探討,汲取國外先進(jìn)的AR建筑應(yīng)用技術(shù),開發(fā)移動端應(yīng)用程序并在實(shí)景中疊加可以互動的3D圖像,便于施工過程中信息的交流理解,減少誤讀、信息傳遞失真等情況。
移動增強(qiáng)現(xiàn)實(shí)系統(tǒng)由硬件和軟件2部分組成。硬件部分主要包括可以把計(jì)算機(jī)所生成的虛擬物體和用戶當(dāng)前所處的真實(shí)環(huán)境及提示文字等同時進(jìn)行顯示的載體,本課題利用帶有攝像功能的用戶手持終端(如智能手機(jī)、平板電腦等)作為虛擬顯示器。軟件系統(tǒng)則是基于Vuforia SDK插件和Unity3D開發(fā)的可以進(jìn)行增強(qiáng)現(xiàn)實(shí)對象的移動、旋轉(zhuǎn)、縮放、動作觸發(fā)、視頻播放等交互功能的APP。
總體上看,AR技術(shù)的關(guān)鍵在于設(shè)備對周圍環(huán)境的感知理解:最基本的,是確定設(shè)備自身的空間位置;再高級一點(diǎn)的,是對環(huán)境進(jìn)行實(shí)時重建;更高級的,就涉及到識別、認(rèn)知和交互了。其中,定位是最基礎(chǔ)的,只有設(shè)備自身的位置和朝向精確地被確定,虛擬出來的內(nèi)容才能和現(xiàn)實(shí)很好地結(jié)合,以達(dá)到足夠的真實(shí)感,并且該過程需要實(shí)時地進(jìn)行。目前應(yīng)用于移動設(shè)備上的AR主要有2類:基于圖片標(biāo)記的AR和基于IMU的AR。本文研究的是基于圖片標(biāo)記的AR,在移動終端拍攝特定的圖像,在預(yù)覽畫面中疊加3D動畫效果,移動或者旋轉(zhuǎn)手機(jī),3D動畫始終與拍攝的圖片保持固定的位置關(guān)系,從而達(dá)到增強(qiáng)現(xiàn)實(shí)的體驗(yàn)。
增強(qiáng)現(xiàn)實(shí)技術(shù)的程序基本流程(圖1)為:獲取攝像頭的圖像、識別標(biāo)識、檢測標(biāo)識的位置和方向、虛實(shí)結(jié)合,合成CG動畫顯示。

圖1 增強(qiáng)現(xiàn)實(shí)技術(shù)的程序基本流程
1.2.1 真實(shí)高效的3D渲染
目標(biāo)物體的識別完成時,展現(xiàn)在移動端顯示器中的三維輔助圖形需要根據(jù)實(shí)際施工現(xiàn)場施工工藝進(jìn)行3D模型的精確建模(圖2、圖3)。三維精確建模主要是利用現(xiàn)有成熟BIM軟件實(shí)現(xiàn)從二維CAD建筑結(jié)構(gòu)圖紙到三維建筑結(jié)構(gòu)模型的轉(zhuǎn)變。其中需要整理模型物理參數(shù)和高效材質(zhì)等內(nèi)容,實(shí)現(xiàn)真實(shí)、高效的模型建模渲染和設(shè)置。

圖2 主樓及裙房三維模型

圖3 裙房近景
1.2.2 目標(biāo)的精確識別
此應(yīng)用程序采用高通的Vuforia SDK插件來實(shí)現(xiàn)目標(biāo)物體的識別功能。Vuforia是一個能讓應(yīng)用擁有視覺的軟件平臺,開發(fā)人員可以輕松地為任何應(yīng)用程序添加先進(jìn)的計(jì)算機(jī)視覺功能,使其能夠識別圖像和對象,并與現(xiàn)實(shí)世界中的空間進(jìn)行交互。Vuforia提供Unity 3D開發(fā),通過上傳圖片數(shù)據(jù)到云數(shù)據(jù)庫進(jìn)行圖片識別(圖4),識別完成后在對應(yīng)的現(xiàn)實(shí)場景中增加虛擬現(xiàn)實(shí)的內(nèi)容。Vuforia SDK同時允許5個目標(biāo)在攝像頭范圍內(nèi)并且同時可以允許50個圖像目標(biāo)在資源數(shù)據(jù)庫中。運(yùn)行時允許交換數(shù)據(jù)集,這使得應(yīng)用程序可以容納更多的目標(biāo)。它的圖片識別機(jī)制如下:
1)服務(wù)器對上傳圖片進(jìn)行灰度處理,使其變?yōu)楹诎讏D。
2)提取黑白圖像特征點(diǎn)。
3)將特征點(diǎn)數(shù)據(jù)打包。
4)程序運(yùn)行時對比特征點(diǎn)數(shù)據(jù)包。
1.2.3 界面和可視化
用3DMAX等專業(yè)建模軟件構(gòu)建的三維模型沒有地理坐標(biāo),在構(gòu)建大范圍場景時有一定困難,為實(shí)現(xiàn)把三維模型準(zhǔn)確地繪制到當(dāng)前的場景中(圖5),就需引入AR技術(shù),將識別代碼植入三維模型對應(yīng)的二維CAD圖紙上。

圖4 二維識別圖紙

圖5 Unity中二維圖紙上繪制三維模型
本課題開發(fā)工具選用Unity,它是一款專業(yè)的游戲引擎,能夠提供方便、簡潔的多平臺游戲開發(fā),擁有高度優(yōu)化的圖形渲染管道,比較適用于虛擬現(xiàn)實(shí)世界的生成。Unity 3D技術(shù)實(shí)現(xiàn)全系統(tǒng)資源整合和集成,物體坐標(biāo)采用笛卡爾坐標(biāo)系描述,Transform組件用來描述在空間中物體的狀態(tài),它包括位置、旋轉(zhuǎn)和縮放。在Unity中導(dǎo)入Vuforia SDK插件包和資源包后,就可以給模型添加腳本,實(shí)現(xiàn)3D模型的放大、縮小、旋轉(zhuǎn)、文字顯示等,也可以設(shè)計(jì)用戶界面,通過按鈕控制視頻和音頻的播放、暫停、終止,以及為模型添加文字、圖片等輔助信息。在Unity中,利用Vuforia實(shí)現(xiàn)虛實(shí)結(jié)合的操作如下:
1)新建Unity 3D工程,導(dǎo)入Vuforia-Unity 3D數(shù)據(jù)包和從云數(shù)據(jù)庫下載的包含識別圖的目標(biāo)包。
2)添加AR Camera和Image Target到場景中,模型添加到Image Target下。
3)設(shè)置AR Camera參數(shù)。
4)設(shè)置Image Target參數(shù)。
5)編寫腳本為模型添加事件。
交互操作時,程序會根據(jù)用戶的手勢信息判斷接觸點(diǎn)的位置、數(shù)量以及手勢方向調(diào)用對應(yīng)的函數(shù),從而實(shí)現(xiàn)對模型的交互控制。觸摸點(diǎn)的數(shù)量由Input.touchCount函數(shù)獲得。當(dāng)Input.touchCount<=0時,代表觸摸點(diǎn)為零,即沒有觸摸,否則當(dāng)Input.touchCount=1時為單點(diǎn)觸摸,控制模型水平上下旋轉(zhuǎn)。當(dāng)Input.touchCount=2時為多點(diǎn)觸摸,控制模型放大縮小。Offset記錄老的2個觸摸點(diǎn)距離和新的2個觸摸點(diǎn)距離差,Offset值為正表示放大手勢,為負(fù)表示縮小手勢,然后調(diào)用對應(yīng)的函數(shù)(圖6)。

圖6 手勢識別和模型控制流程
本文研究了基于Android和IOS平臺發(fā)布apk格式的應(yīng)用程序。圖7為安卓手機(jī)上安裝APP后測試示例效果,運(yùn)行APP后,手機(jī)攝像頭對準(zhǔn)并識別圖紙,屏幕上疊加顯示建筑的3D模型,點(diǎn)擊屏幕或虛擬按鈕實(shí)現(xiàn)交互操作。
本文的研究成果可廣泛應(yīng)用于工程建設(shè)中的數(shù)字化輔助建造。

圖7 測試示例效果
AR 應(yīng)用可以用于復(fù)雜的機(jī)械裝配、維護(hù)和修理,允許施工人員在需要的地方查看設(shè)計(jì)、施工或運(yùn)維信息,通過真實(shí)環(huán)境疊加的3D畫面,查看具體的施工操作流程。
AR技術(shù)可以用于書籍的模型化展示,讓圖片上靜態(tài)的建筑變成3D立體建筑模型,可以讓用戶直觀地看到建筑物的構(gòu)造細(xì)節(jié),點(diǎn)擊屏幕可以與3D建筑模型進(jìn)行交互,將視覺的畫面擴(kuò)展到視聽多方位的體驗(yàn)。
代替?zhèn)鹘y(tǒng)的宣傳展示形式,展會中將3D建模的卡通人物疊加到展覽圖片中,通過實(shí)時視頻顯示或音頻講解進(jìn)行現(xiàn)場解說,并將內(nèi)容以多媒體的方式呈現(xiàn)給參觀者,展示更多的咨詢內(nèi)容,提升參觀者的觀賞體驗(yàn)。
本文是基于圖紙的AR研究,在此基礎(chǔ)上的下一個目標(biāo)是將AR技術(shù)引入施工現(xiàn)場,將虛擬模型與真實(shí)環(huán)境等比例結(jié)合,以產(chǎn)生更好的視覺沖擊,輔助施工作業(yè),保證工期、施工質(zhì)量,提高生產(chǎn)效率。另外,有人把AR看作新的計(jì)算平臺,完全不為過,試想一下,最早期的尋呼機(jī)、功能機(jī)只是提供一維的通知、電話或短信服務(wù),到了智能機(jī)時代,大屏的出現(xiàn),二維的圖像、音視頻成了主流,那下一個時代呢,也許3D技術(shù)、AR會是計(jì)算設(shè)備的核心能力之一。
在全面建設(shè)智慧城市的形式下,智能建筑的發(fā)展需要新技術(shù)的支撐,AR技術(shù)代表的先進(jìn)科技應(yīng)該得到重視,要加快對先進(jìn)科技的研究和應(yīng)用,推進(jìn)建筑行業(yè)的改革。