摘要:步態(tài)識(shí)別是一種新的生物特征識(shí)別技術(shù),旨在根據(jù)人們走路的姿勢(shì)進(jìn)行身份識(shí)別。本文利用圖像背景減除技術(shù)進(jìn)行步態(tài)輪廓檢測(cè),然后利用傅立葉描述子對(duì)步態(tài)輪廓圖像進(jìn)行描述,進(jìn)行維數(shù)壓縮,得到模板匹配,最后,利用最鄰近法進(jìn)行識(shí)別。實(shí)驗(yàn)證明,該算法具有較高的識(shí)別率。
關(guān)鍵詞:步態(tài)識(shí)別;圖像背景減除;傅立葉描述子;最鄰近法
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2008)19-30120-04
Gait Recognition Based on Background Subtraction
WANG Chun-xian, WU Jie
(School of Machinery and Automobile Engineering, Hefei University of Technology, Hefei 230009, China)
Abstract: Gait recognition is a new technology of recognition based on biologic character, it aims to recognize the human's identity based on their style of walking. In this paper, we detect gait contour by using background subtraction, at the same time, we adopt Fourier descriptor to describe gait contour, using this method, we can reduce the dimension of data and create template. The recognition is achieved by nearest algorithm. Tests proved that this method have achieved comparative high correction identification ratio.
Key words: Gait Recognition Background Subtraction; Fourier Descriptor; Nearest Algorithm
1 引言
步態(tài)是在人的后天成長(zhǎng)過(guò)程中形成的一種具有個(gè)體差異性的行為特征,指的是在人的行走過(guò)程中,整個(gè)身體的運(yùn)動(dòng)姿勢(shì)。而步態(tài)識(shí)別是通過(guò)對(duì)人的步態(tài)動(dòng)作的檢測(cè)和跟蹤,獲取人的軀體在時(shí)空維上的運(yùn)動(dòng)特征,進(jìn)而在步態(tài)庫(kù)的支持下,對(duì)人的身份做出識(shí)別。
步態(tài)特征主要反映人行走的姿勢(shì),較之人臉識(shí)別、指紋識(shí)別、虹膜識(shí)別,具有可在遠(yuǎn)距離非接觸的情況下或低質(zhì)量視頻的狀態(tài)下進(jìn)行人身份鑒別等優(yōu)點(diǎn)。因此,步態(tài)識(shí)別應(yīng)用前景廣泛,特別適用于一些安全敏感場(chǎng)合,如機(jī)場(chǎng)、銀行、軍事基地、家庭住宅等。它不僅可以幫助刑偵、保安人員在人群中辨認(rèn)罪犯,增強(qiáng)監(jiān)控、防盜、防暴能力;而且可以用于反恐部門(mén),增強(qiáng)國(guó)防、民用設(shè)施等場(chǎng)合的自動(dòng)保護(hù)能力。
步態(tài)識(shí)別近年來(lái)受到關(guān)注,如2000年美國(guó)國(guó)防高級(jí)項(xiàng)目署DARPA制定的HID(Human Identification at a Distance)計(jì)劃;美國(guó)五角大樓也正擬定采用步態(tài)識(shí)別技術(shù)進(jìn)行反恐工作。國(guó)際上許多知名大學(xué)和研究機(jī)構(gòu)如英國(guó)南安普頓大學(xué)、美國(guó)麻省理工學(xué)院、卡耐基梅隆大學(xué)等在HID項(xiàng)目的驅(qū)動(dòng)下廣泛開(kāi)展了步態(tài)識(shí)別研究工作。日本、瑞士、加拿大和中國(guó)的一些研究機(jī)構(gòu)和大學(xué)也逐步展開(kāi)了相關(guān)研究。
步態(tài)度識(shí)別的研究可分為兩類(lèi):基于模型的和非模型化的。基于模型的方法是按照生理學(xué)的知識(shí)把步態(tài)模型化。主要有:Cunado將大腿建模為鏈接的鐘擺,并從其傾斜角度信號(hào)的頻率分量中獲取步態(tài)特征;LEE把人體建模成幾部分,然后根據(jù)各部分屬性得到步態(tài)的特征。非模型化方法是用數(shù)學(xué)方式描述步態(tài),根據(jù)數(shù)學(xué)描述子識(shí)別。主要有:Little與Boyd從光流圖像中獲取頻率和相位特征識(shí)別個(gè)人;Hayfran Acquah使用廣義對(duì)稱(chēng)算子進(jìn)行步態(tài)識(shí)別。
在國(guó)內(nèi),許多大學(xué)和機(jī)構(gòu)正在進(jìn)行生物識(shí)別技術(shù)的研究,其中居于領(lǐng)軍地位的是歸國(guó)博士譚鐵牛領(lǐng)導(dǎo)的中科院自動(dòng)化所,而且取得了令人鼓舞的成果。如王亮和胡衛(wèi)明提出了基于統(tǒng)計(jì)主元分析的方法[1],被國(guó)外的許多研究機(jī)構(gòu)引用。
在步態(tài)識(shí)別過(guò)程中,步態(tài)檢測(cè)、步態(tài)特征提取和步態(tài)的分類(lèi)識(shí)別是步態(tài)識(shí)別過(guò)程的三個(gè)方面,也是本文的主要內(nèi)容。步態(tài)識(shí)別系統(tǒng)包括兩個(gè)主要的技術(shù)環(huán)節(jié),首先是步態(tài)的檢測(cè),即從輸入的圖像序列中建立背景模型,并將步態(tài)輪廓序列從背景中分割出來(lái),然后才是對(duì)提取出來(lái)的步態(tài)圖像進(jìn)行特征提取與識(shí)別。本文首先利用中值法建立圖像背景模型,然后使用圖像背景減除的方法檢測(cè)運(yùn)動(dòng)人體區(qū)域;之后在二值化人體區(qū)域的基礎(chǔ)上,用人體的寬度特征來(lái)分析步態(tài)運(yùn)動(dòng),提取關(guān)鍵幀,并且利用傅立葉描述子建立模板;最后使用最鄰近分類(lèi)方法來(lái)進(jìn)行模板匹配,實(shí)現(xiàn)人的身份識(shí)別。
2 步態(tài)檢測(cè)
步態(tài)檢測(cè)是步態(tài)分析的第一步,它的目的是從圖像序列中將變化區(qū)域從背景圖像中提取出來(lái)。把運(yùn)動(dòng)區(qū)域有效地分割出來(lái)對(duì)于目標(biāo)分類(lèi)、跟蹤和行為理解等后期處理是非常重要的。現(xiàn)有的步態(tài)檢測(cè)方法大體可以分為以下三類(lèi):
(1)幀間差值法。利用這種方法計(jì)算相鄰兩幀圖像的差并取閾值,即使場(chǎng)景發(fā)生大幅變化,也能實(shí)時(shí)檢測(cè)運(yùn)動(dòng)目標(biāo),但是分割出的運(yùn)動(dòng)目標(biāo)不完整,不利于目標(biāo)的識(shí)別[2]。
(2)基于運(yùn)動(dòng)場(chǎng)估計(jì)的方法。此類(lèi)方法通過(guò)視頻序列中的時(shí)空相關(guān)性分析估計(jì)運(yùn)動(dòng)場(chǎng),建立相鄰幀對(duì)應(yīng)關(guān)系,進(jìn)而利用目標(biāo)與背景表觀運(yùn)動(dòng)模式不同進(jìn)行運(yùn)動(dòng)目標(biāo)的檢測(cè)與分割。與幀間差值法相比,運(yùn)動(dòng)場(chǎng)分析能夠較好地處理背景運(yùn)動(dòng)的情況,適用范圍更廣,但是計(jì)算的時(shí)空復(fù)雜度遠(yuǎn)高于前者[3]。
(3)背景減除。背景減除是利用當(dāng)前圖像與背景圖像的差分檢測(cè)出運(yùn)動(dòng)區(qū)域的一種技術(shù),是目前運(yùn)動(dòng)分割中最常用的一種方法,它一般能夠提供最安全的特征數(shù)據(jù),但是對(duì)于動(dòng)態(tài)場(chǎng)景的變化,如光照和外來(lái)無(wú)關(guān)事件的干擾特別敏感。大部分的研究人員都致力于開(kāi)發(fā)不同的背景模型,以期減少動(dòng)態(tài)場(chǎng)景變化對(duì)于運(yùn)動(dòng)分割的影響。
2.1 圖像背景建模
首先,我們使用中值法從圖像序列中恢復(fù)出背景,即將輸入的連續(xù)N幅圖像的像素值的中間值作為背景圖像的像素值。令{Ik,k=1,2,3,…,N}代表一個(gè)包含N幀圖像的序列。則背景圖像b可用以下公式獲得:
b(x,y)=■(Ik(x,y)) (1)
其中,Ik(x,y)是(x,y)處的灰度值,b為背景。
2.2 圖像背景減除及二值化
圖像背景建模以后,可以利用圖像背景減除的方法從當(dāng)前圖像中減去背景圖像,差分值大于特定的閾值,從而確定人體的運(yùn)動(dòng)區(qū)域。如果將圖形進(jìn)行簡(jiǎn)單地處理效果還可以,但是在人體區(qū)域和背景差別不大的時(shí)候這種方法效果很不理想。可以采用下面的公式來(lái)確定人體區(qū)域。
■(2)
其中,a(x,y)與 b(x,y)分別是當(dāng)前圖像和背景圖像在像素(x,y)處的亮度值。求出每點(diǎn)的函數(shù)值后,設(shè)定一個(gè)閾值,對(duì)圖像進(jìn)行二值化即得到人體部分。實(shí)驗(yàn)中發(fā)現(xiàn)閾值設(shè)定在0.75左右比較合適[4],如果人體區(qū)域和背景差別不大,閾值就小一些,反之就大一些。
2.3 形態(tài)學(xué)處理及輪廓圖像提取
經(jīng)過(guò)二值化處理的圖像含有許多的噪聲區(qū)域,在人體區(qū)域內(nèi)部也有小的縫隙。使用形態(tài)學(xué)變換處理可以消除一些小的噪聲,并且圖像會(huì)更平滑,更符合實(shí)際人的輪廓。實(shí)驗(yàn)中采用垂直模板,對(duì)圖像先進(jìn)行閉運(yùn)算,再進(jìn)行開(kāi)運(yùn)算得到的效果最好。經(jīng)過(guò)形態(tài)學(xué)處理后,一些較大的噪聲區(qū)域還是不能消除。這時(shí)要計(jì)算每一個(gè)區(qū)域包含的像素點(diǎn)個(gè)數(shù),選擇像素點(diǎn)最多的區(qū)域作為人體區(qū)域,其它區(qū)域作為背景。處理后的圖像如圖1(b)所示。
■
圖1 二值圖像
經(jīng)驗(yàn)指出,圖像區(qū)域邊界對(duì)應(yīng)景物目標(biāo)的邊緣,人類(lèi)視覺(jué)系統(tǒng)也多是根據(jù)目標(biāo)的邊緣進(jìn)行識(shí)別的。對(duì)于步態(tài)識(shí)別,人體的輪廓完全可以表現(xiàn)出人的步態(tài)特征,并且使用輪廓曲線(xiàn)可以降低計(jì)算的復(fù)雜性,提取的人體輪廓如圖2所示。
■
圖2 提取的人體輪廓
3 步態(tài)的特征提取
3.1 關(guān)鍵幀輪廓提取
運(yùn)動(dòng)人體輪廓的寬度隨著時(shí)間的變化呈現(xiàn)周期性變化,在時(shí)間軸上曲線(xiàn)有著明顯的波峰和波谷[5],如圖3所示。因此,提取人的四個(gè)關(guān)鍵幀,分別為兩腿邁開(kāi)時(shí)左腳在前(左雙撐)、右腳在前(右雙撐)、兩腿合攏時(shí)左腳擺動(dòng)(左單撐)、和右腳擺動(dòng)(右單撐)對(duì)應(yīng)的四個(gè)關(guān)鍵幀。通過(guò)步態(tài)運(yùn)動(dòng)分析提取關(guān)鍵幀進(jìn)行識(shí)別,大大減少了后續(xù)識(shí)別運(yùn)算的數(shù)據(jù)量。
■
圖3 高度隨幀變化曲線(xiàn)
3.2 步態(tài)的傅立葉描述子
傅立葉描述子主要有三個(gè)優(yōu)點(diǎn):①它將圖像轉(zhuǎn)換成一維特征;②它提供了非常清晰的物理意義,即頻譜的幅度表示形狀信息,而相位代表了旋轉(zhuǎn)、反射、起始點(diǎn)等信息,且具有對(duì)起點(diǎn)、旋轉(zhuǎn)、平移的不敏感性;③傅立葉頻譜的頻率分量大部分集中在低頻部分,大大降低了識(shí)別的數(shù)據(jù)維數(shù)。正是由于這些優(yōu)點(diǎn),本文使用傅立葉描述子來(lái)描繪步態(tài)特征。
步態(tài)的輪廓線(xiàn)屬于二維形狀,直接用來(lái)識(shí)別是不方便的,需要將其轉(zhuǎn)換為一維向量。降步態(tài)輪廓線(xiàn)表示為復(fù)數(shù)形式:
zi=xi+jyi i=1,2,3,…,N
N為輪廓像素點(diǎn)數(shù),步態(tài)輪廓的重心點(diǎn)坐標(biāo)為(xc,yc),即
■
步態(tài)輪廓上面的任意一點(diǎn)到重心的距離為ri,ri=(xi-xc)2+(yi-yc)2所有的距離構(gòu)成特征矢量R=(r1,r2, …,rN),R的離散傅立葉變換為:
■
將得到的傅立葉系數(shù)歸一化,即將所有的系數(shù)被a1除,作為步態(tài)特征的描述子:
■
為了消除圖像的大小所造成的不一致,對(duì)每一幀步態(tài)圖像的輪廓點(diǎn)到重心的距離進(jìn)行歸一化處理,為了保證相互比較的圖像具有相同的輪廓點(diǎn)數(shù),必須對(duì)每一幀的圖像進(jìn)行重采樣,有兩種方法可以產(chǎn)生這種等輪廓點(diǎn)數(shù)的重采樣:
1) 等間隔角度:以相同的角度θ=2π/N選擇序列{ri};
2) 等間隔長(zhǎng)度:以相同的輪廓曲線(xiàn)長(zhǎng)度選擇序列{ri}。
本文采用的是等間隔長(zhǎng)度重采樣算法。
根據(jù)傅立葉變換的性質(zhì)指導(dǎo),最能夠反映步態(tài)特征的數(shù)據(jù)集中在步態(tài)特征傅立葉描述子的低頻部分,利用傅立葉描述子的30個(gè)低頻分量f={f1,f2,f3…f30}作為步態(tài)識(shí)別的特征。
4 步態(tài)的分類(lèi)識(shí)別
用模板向量間的歐氏距離比較測(cè)試序列模板與訓(xùn)練庫(kù)中模板的相似度。假設(shè)a和b為待比較的模板,a與b值之間的匹配值為■。
訓(xùn)練庫(kù)中的雙撐模板記為{Dks},S取值為所有個(gè)體,K取值范圍為對(duì)每個(gè)體所提取的所有雙撐幀。類(lèi)似地,{Qls}為訓(xùn)練庫(kù)中的單支撐集合。從測(cè)試序列提取模板{Di}和{Qj},i和j對(duì)應(yīng)于所有的雙撐幀和單撐幀。計(jì)算所有的匹配值U(Di,Dks)和U(Qj,Qls),i,j,k,l對(duì)應(yīng)于適應(yīng)的取值范圍。需要說(shuō)明的是,只對(duì)雙撐對(duì)雙撐,單撐對(duì)單撐進(jìn)行匹配。經(jīng)過(guò)關(guān)鍵幀匹配以后,得到了測(cè)試序列的模板與訓(xùn)練庫(kù)中每個(gè)對(duì)應(yīng)模板的匹配值。識(shí)別時(shí)用每個(gè)步態(tài)周期內(nèi)的步態(tài)組合進(jìn)行匹配,而不是僅僅匹配單個(gè)模板。在提取關(guān)鍵幀時(shí),每個(gè)步態(tài)周期有四個(gè)關(guān)鍵幀,相應(yīng)的為右雙撐、右單撐、左雙撐、左單撐。因此,形成的四元組{Di,Qj,Di+1,Qj+1}包含了測(cè)試序列的每個(gè)完整的步態(tài)周期。模板Di和個(gè)體S0的相似度計(jì)算為
■
即個(gè)體S0的所有模板的最大匹配值除以雙撐樣本庫(kù)中所有模板的最大匹配值。對(duì)于Qj,可類(lèi)似進(jìn)行計(jì)算。樣本庫(kù)中最佳匹配測(cè)試四元組的樣本個(gè)體為:
■
通過(guò)上式計(jì)算,得到最佳匹配四元組的個(gè)體。該個(gè)體被判定為測(cè)試序列所對(duì)應(yīng)的人。
5 實(shí)驗(yàn)
本文使用的是中科院自動(dòng)化所提供的NLPR步態(tài)數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)包含20個(gè)人,每個(gè)人側(cè)面視角四個(gè)序列。這些彩色圖像序列以25fps的速度拍攝,原始尺寸為352×240像素點(diǎn),且平均長(zhǎng)度約為100幀。
步態(tài)人體輪廓序列的提取采用背景與當(dāng)前幀差分的方法。提取的步態(tài)輪廓線(xiàn)大約1000個(gè)點(diǎn),對(duì)輪廓線(xiàn)進(jìn)行等間隔采樣,得到512點(diǎn)的固定長(zhǎng)度。然后,對(duì)這512點(diǎn)序列進(jìn)行傅立葉變換,去除高頻部分,保留位于低頻部分的30個(gè)點(diǎn)。
實(shí)驗(yàn)中從20個(gè)人中各選擇一個(gè)圖像序列進(jìn)行訓(xùn)練,其余的步態(tài)序列用于測(cè)試。訓(xùn)練時(shí),對(duì)每個(gè)人的步態(tài)序列提取關(guān)鍵幀模板,存入訓(xùn)練樣本庫(kù)中。識(shí)別時(shí),計(jì)算測(cè)試序列與模板庫(kù)中每個(gè)人模板的相似度。用該數(shù)據(jù)庫(kù)測(cè)試最后得到的識(shí)別率為76%,高于文獻(xiàn)[6]使用圖像自相關(guān)作為原始特征在同一數(shù)據(jù)庫(kù)下所取得的75%的識(shí)別率,識(shí)別性能有一定的提高,而且計(jì)算代價(jià)相對(duì)要小得多。
6 結(jié)束語(yǔ)
本文從步態(tài)周期中提取關(guān)鍵幀,然后采用圖像背景減除技術(shù)對(duì)關(guān)鍵幀進(jìn)行背景差分,提取人體輪廓,再利用傅立葉描述子對(duì)所獲得的人體輪廓進(jìn)行步態(tài)的檢測(cè)和識(shí)別,通過(guò)傅立葉描述建立模板,用最鄰近發(fā)進(jìn)行模板匹配,實(shí)現(xiàn)人的身份識(shí)別。實(shí)驗(yàn)表明,該方法相對(duì)于其它的識(shí)別方法而言,具有算法簡(jiǎn)單,計(jì)算量小的特點(diǎn),是一種有效的步態(tài)識(shí)別方法。
參考文獻(xiàn)
[1] 王亮,胡衛(wèi)明,譚鐵牛.基于步態(tài)的身份識(shí)別[J].計(jì)算機(jī)學(xué)報(bào),2003,26(3):353-360.
[2] 張運(yùn)楚,梁自澤,李恩,等. 基于C-均值聚類(lèi)的視覺(jué)監(jiān)控背景圖像構(gòu)建算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2006,14:45-47.
[3] 田光見(jiàn),趙春椿. 步態(tài)識(shí)別綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2005,5:20-22.
[4] 黎雷生,肖德貴.基于不變矩的步態(tài)識(shí)別[J].計(jì)算機(jī)應(yīng)用,2005,25(8):1795-1796.
[5] 韓鴻哲,李彬,王志良,等.基于傅立葉描述子的步態(tài)識(shí)別[J].計(jì)算機(jī)工程,31(2):18-19.
[6] J H Yoo,M S Nixon,C J Harris.Extracting Human Gait Signatures by Body Segment Properties[D].UK:Department of Electronics and Computer Science University of Southampton.
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文