孫有恒,薛志剛,王傳寶,鄒永紅
(1.廣州地鐵集團有限公司,廣東廣州 510220;2.北京九碧木信息技術有限公司,北京 102200;3.中鐵建華南建設有限公司,廣東廣州 511458)
在地鐵建設過程中,視頻監控系統與新技術的融合應用,使施工現場的安全管控水平顯著提高。比如在施工現場安裝相應的人員定位基站,給施工人員佩戴定位卡,可查看施工區域人員的實時坐標位置和歷史軌跡[1]。但同時也伴隨著更多的資金投入,所以減少現場設備的安裝投入,利用軟件技術充分挖掘已有設備的應用價值也成為智慧工地技術的一個研究方向。
該文結合廣州市軌道交通十八和二十二號線建設工程綜合監控系統的開發工作,研究并實現了一種基于視頻圖像分析及單目視覺技術的工地人員定位方法,可有效解決上述問題。
廣州市軌道交通十八和二十二號線建設工程綜合監控系統已經在GIS 地圖上精確標記出了每個視頻監控攝像頭的坐標位置;通過集成接口獲取到每個攝像頭的實時方位、攝像機參數、視頻監控畫面;并通過視頻圖像分析技術識別出視頻圖像中的人體?;谝曨l圖像分析及單目視覺技術的工地人員定位方法即是基于單目視覺原理建立單張視頻圖像相片中人體與視頻監控攝像頭的相對位置關系,并通過GIS 地圖中的視頻監控攝像頭的地理坐標,解算方位參數后再推算目標人體的坐標。再通過GIS地圖技術展示出每個人體的實時坐標位置。
近些年來,不斷發展起來一種視覺定位的方法,主要是通過攝像機獲得周圍景物的圖像,利用景物中的一些自然或人為的特征,通過圖像的方法得到周圍環境模型來實現自身位置的確定的方法[2-4]。單目視覺的室內多行人目標連續定位方法[5]提出基于單目視覺檢測方法,構建像素坐標系到世界坐標系的坐標轉換模型,實現對多行人目標的連續定位與跟蹤。單目視覺三維運動位姿測量方法研究[6]提出基于點特征的單目視覺位姿測量,通過特征點約束和正交迭代解算法完成目標物體的位姿測量。
基于視覺原理的空間定位方法中,單目視覺具有顯著的優點:結構簡單、標定步驟少,避免了立體視覺中視場小和匹配難的缺點。常見的單目視覺方法[7-9]包括結構光法[10-12]、幾何光學法[13-14]、輔助測量棒法、激光輔助測距法、幾何形狀約束法等。
該文所介紹的方法,是利用單目視覺技術建立單張視頻圖像相片中人體與相機的相對位置關系,然后通過GIS 地圖獲取攝像機鏡頭的實際坐標(經緯度或投影坐標),解算方位參數后再推算人體的坐標。
相片上的任意一個像點與對應地面點都可以由一條通過光心的直線連接起來,即所謂的中心投影,通過這條直線再輔以輔助坐標系,就可以建立起像點與地面點之間的關系。
常用的輔助坐標系包括1)像素坐標系;2)圖像坐標系;3)光心坐標系;4)世界坐標系。通過這四個輔助坐標系之間的相互變換,建立攝像機成像幾何模型,各坐標系關系及內外方位元素,如圖1 所示。坐標系變換主要分為三個過程,如下:

圖1 各坐標系關系及內外方位元素
1)根據像素坐標計算圖像坐標系;
未來一周,江南大部、華南西部、西南地區東部等地累計降水量有10毫米-30毫米,部分地區有40毫米-60毫米,云南南部局地有80毫米-110毫米;此外,新疆西部、內蒙古東北部、東北地區等地降水量有8毫米-20毫米,部分地區30毫米-50毫米。上述地區累計降水量較常年同期偏多3-6成,內蒙古東北部、東北部分地區偏多1倍以上。
2)根據圖像坐標系建立光心坐標系;
3)建立光心坐標系和世界坐標系之間的關系[15-16]。
圖像坐標系與光心坐標系之間通過主點、焦距等內方位元素決定;光心坐標系與世界坐標系之間通過投影中心地面坐標和攝像機成像時的姿態參數建立聯系。
假設空間一點P,世界坐標為[Pcx,Pcy,Pcz]T,對應的像素坐標為[pu,pv]T,建立攝像機的成像幾何模型如式(1)所示:
其中,Zc是點P在光心坐標系中的Z值;ax=f/dx,ay=f/dy,f為焦距,dx、dy是圖像坐標系原點在像素坐標系中的坐標;M是4 階投影矩陣,N是與攝像機內方位元素有關的3 階矩陣(通常由設備廠商提供)。相機成像原理如圖2 所示。

圖2 相機成像原理
在內方位元素已知的情況下,根據攝像機成像幾何模型,像素坐標系到世界坐標系的變換包含六個轉換參數(三個平移參數和三個旋轉參數)。通過GIS 地圖和攝像機圖像相片中已知坐標的同名點對求解這六個參數。將式(1)進行整理,得到式(2):
將上式代入式(2),展開整理得到如下三個方程:
將第三個方程中的Zc代入上面兩個方程,整理得到式(7):
根據式(7)每一個同名點對可以建立兩個方程,n個同名點對可以建立2n個方程。為了獲得最佳的結果,使2n>11(n為同名點對個數),即可采用最小二乘法進行參數求解。如果內方位元素也未知,只需要增加同名點對或其他約束條件即可一并進行解算。
解算出方位元素后,即可得到該攝像機成像幾何模型的全部參數。對于相片中的人體可以通過圖像分析得到的像素坐標,直接計算出對應地面點的世界坐標,進一步可計算出在該點垂直于地面或平行于地面的邊長。
通常而言,每個攝像機的視點位置是相同的,視頻監控圖像相片的成像幾何模型只需要計算一次即可。
基于廣州市軌道交通十八和二十二號線建設工程綜合監控系統的GIS 地圖技術和視頻圖像分析技術,開發了一套工地人員定位軟件,并作為綜合監控系統的一個應用模塊。該定位軟件的數據組織如表1 所示。

表1 數據組織方案
該定位軟件的主要功能包括:
1)GIS 地圖及攝像機配置展示功能。此功能是基于GIS 地圖添加攝像機的配置信息,包括攝像機的名稱、IP 地址、訪問用戶名、訪問密碼、初始安裝方位、視角范圍、視角半徑等配置參數。并在GIS 地圖上標記出攝像機安裝的精確位置,完成的攝像機配置功能和展示功能。攝像機在地圖上的位置展示如圖3 所示。

圖3 攝像機在地圖上的位置展示
2)視頻監控攝像機的方位姿態展示。配置完成攝像機后,軟件根據配置的初始安裝方位角以及通過訪問攝像機獲取的旋轉角度,可計算出當前的方位角(槍機是固定方位角),再根據配置的攝像機角度范圍和視角半徑數據,在GIS 地圖上實時動態繪制攝像機的有效監控區域。攝像機動態視角范圍展示如圖4 所示。

圖4 攝像機動態視角范圍展示
3)視頻監控實時畫面獲取和人體識別。軟件集成了視頻圖像人工智能(Artificial Intelligence,AI)分析算法,通過已配置的攝像機訪問參數,可實時讀取視頻監控畫面。再通過配置的人體目標識別參數,即可識別分析視頻畫面中的人體目標,當識別到視頻畫面中的人體時,軟件會自動保存畫面,記錄當前攝像機的人體頭部或腳部的像素坐標、攝像機成像姿態參數、人體識別可信度數據,此時軟件就采集到了用于單目視覺技術計算人體坐標的所有輸入參數。視頻監控圖像中人體識別圖片如圖5 所示。

圖5 視頻監控圖像中人體識別圖片
4)人體定位坐標的計算和基于GIS 地圖的定位展示。把視頻圖像AI 分析算法輸出的圖像(含人體的像素坐標)、攝像機成像姿態參數、攝像機位置坐標、攝像機方位角等輸入條件,通過上文中的單目視學技術相關算法(攝像機成像幾何模型算法、坐標計算或邊長量測算法)即可計算出人本的定位坐標,然后再疊加到GIS 地圖上定位展示。通過設置合理的軟件執行頻率、并過慮掉人體可信度較低的輸入數據,即可實現較好的人員定位效果。人體坐標計算及基于GIS 地圖展示如圖6 所示。

圖6 人體坐標計算及基于GIS地圖展示
利用該文方法和實現的軟件,在廣州市軌道交通十八和二十二號線建設工程的兩個工點進行了應用,結果表明,1)經對照無人機航拍正射影像地圖和特征點交會測量坐標可知,誤差控制在2 m 以內,滿足施工區域人員定位的管理要求。2)該方法可廣泛應用于已安裝視頻監控設備的建筑施工區域以及其他視野相對開闊的工業園區的人員定位。3)該方法充分利用工地現場已安裝的視頻監控設備,深化應用視頻圖像分析技術、GIS 地圖技術,在不增加安裝人員定位設備的前提下,可有效實現地鐵施工人員定位技術。