◆王文燁
(福州大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院 福建 350116)
隨著深度學(xué)習(xí)在人臉識(shí)別、指紋識(shí)別、虹膜識(shí)別等領(lǐng)域取得的突破性發(fā)展,生物特征識(shí)別技術(shù)日益受到社會(huì)關(guān)注。步態(tài)識(shí)別是新興的生物特征識(shí)別技術(shù),旨在基于行走姿態(tài)識(shí)別行人的身份。由于可以在遠(yuǎn)距離下隱蔽地采集行人的步態(tài)特征,故步態(tài)識(shí)別技術(shù)具備非接觸性、難偽造性等特點(diǎn),因此在安全監(jiān)控及庭審取證等領(lǐng)域具備一定的發(fā)展?jié)摿ΑJ聦?shí)上,步態(tài)識(shí)別技術(shù)已經(jīng)在刑偵領(lǐng)域得以應(yīng)用[1][2]。然而由于原始步態(tài)特征通常是以視頻的形式采集得來的,故傳統(tǒng)的步態(tài)識(shí)別技術(shù)深受到步態(tài)視頻拍攝環(huán)境、特別是拍攝視角這一擾動(dòng)因素影響,識(shí)別準(zhǔn)確率受到了限制。鑒于深度學(xué)習(xí)的成功,文獻(xiàn)[3]提出使用卷積神經(jīng)網(wǎng)絡(luò)提取步態(tài)樣本的深度特征,對(duì)視角變化具備不錯(cuò)的魯棒性,在視角跨度較大時(shí)仍能取得較高的識(shí)別準(zhǔn)確率。另一方面,基于特征重利用的思想,文獻(xiàn)[4]提出了密集連接神經(jīng)網(wǎng)絡(luò)(DenseNet),并通過實(shí)驗(yàn)證明了其網(wǎng)絡(luò)性能優(yōu)于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò),并且被成功地應(yīng)用在許多機(jī)器學(xué)習(xí)領(lǐng)域。本文提出將密集連接卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于步態(tài)樣本的深度特征提取,并且通過對(duì)比實(shí)驗(yàn)證明該方法的有效性。
現(xiàn)有的步態(tài)識(shí)別方法有許多是通過文獻(xiàn)[3]提出的方法,從原始步態(tài)視頻樣本中提取步態(tài)輪廓圖,再對(duì)步態(tài)輪廓圖進(jìn)行下一步的特征提取。圖1展示了CASIA-B步態(tài)數(shù)據(jù)集中不同拍攝視角下的步態(tài)能量圖。
現(xiàn)有步態(tài)數(shù)據(jù)集存在屬于同一身份標(biāo)簽的樣本數(shù)較少、標(biāo)簽數(shù)較多的問題,如CASIA-B步態(tài)數(shù)據(jù)集共有124個(gè)身份標(biāo)簽,每個(gè)標(biāo)簽下最多僅有66個(gè)樣本。因此,任取兩個(gè)不同的步態(tài)樣本將其組成二元組樣本,若這兩個(gè)步態(tài)樣本所屬身份標(biāo)簽相同,則該二元組樣本的標(biāo)簽為1,否則為-1,從而將步態(tài)識(shí)別問題轉(zhuǎn)化成二分類問題。
本文步態(tài)識(shí)別方法的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。對(duì)輸入的二元組步態(tài)樣本,將其作差并取絕對(duì)值,得到兩步態(tài)能量圖的差異特征圖,再利用密集連接卷積神經(jīng)網(wǎng)絡(luò)提取差異特征圖的深度特征,最后與線性分類器相連。密集連接卷積神經(jīng)網(wǎng)絡(luò)主要由兩個(gè)密集連接塊構(gòu)成,每個(gè)密集連接塊中包含六個(gè)隱含層,塊中的每一層都與后面的隱含層相連接。兩個(gè)密集連接塊之間是由卷積窗窗高為1的卷積層與池化窗窗高為7的平均池化層組成的過渡層。

圖2 本文步態(tài)識(shí)別方法流程圖
本文通過與文獻(xiàn)[3]提出的LBnet在CASIA-B步態(tài)數(shù)據(jù)庫上進(jìn)行對(duì)比實(shí)驗(yàn),證明了所提出改進(jìn)方法的有效性。由于二元組樣本的組成特點(diǎn),樣本空間中標(biāo)簽為-1的樣本數(shù)量將遠(yuǎn)高于標(biāo)簽為1的樣本數(shù)量,故在采樣時(shí),對(duì)每一個(gè)身份標(biāo)簽,先隨機(jī)取一同身份標(biāo)簽的樣本組成正例二元組樣本,再取一不同身份標(biāo)簽的樣本與之組成負(fù)例二元組樣本。該采樣方式保證了訓(xùn)練樣本的平衡性,由于所取樣本的拍攝視角是隨機(jī)的,故這種采樣方式能保證訓(xùn)練得到的模型對(duì)視角變化具有魯棒性。
在測(cè)試階段,取一組已知身份標(biāo)簽的樣本,逐個(gè)與待測(cè)樣本組成二元組樣本并輸入模型。若識(shí)別出與待測(cè)樣本身份標(biāo)簽相同的樣本,則認(rèn)為識(shí)別成功。為了探究模型性能,本文令已知身份標(biāo)簽的樣本取自一固定視角X_view,分別求出待測(cè)樣本取自11個(gè)視角的識(shí)別準(zhǔn)確率,取其平均值來衡量模型在視角X_view下的性能。實(shí)驗(yàn)結(jié)果如表1所示。

表1 實(shí)驗(yàn)結(jié)果