999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度可分離卷積的多目標(biāo)追蹤神經(jīng)網(wǎng)絡(luò)研究

2021-10-31 01:37:18溫博閣
大連交通大學(xué)學(xué)報 2021年5期
關(guān)鍵詞:深度特征檢測

溫博閣

(大連交通大學(xué) 交通運輸工程學(xué)院,遼寧 大連 116028)*

隨著近年來人工智能神經(jīng)網(wǎng)絡(luò)的爆發(fā)式發(fā)展,在圖像識別領(lǐng)域,結(jié)合人工智能方法的目標(biāo)追蹤屬于剛剛興起的研究方向,其應(yīng)用場景十分廣闊.智能追蹤算法可以極大地提高各個領(lǐng)域的效率,目前很多的跟蹤技術(shù)是基于卡爾曼濾波的算法.卡爾曼濾波被廣泛應(yīng)用于無人機、自動駕駛、衛(wèi)星導(dǎo)航等領(lǐng)域,但通過卡爾曼濾波的預(yù)測值沒法應(yīng)對復(fù)雜環(huán)境下目標(biāo)追蹤所帶來的挑戰(zhàn).因此為了更好地追蹤效果,大部分使用卡爾曼濾波的方法都借助了更為先進的設(shè)備,如激光雷達,深度攝像頭等.得益于雷達生成的3D點云,深度攝像頭的像素深度信息,利用卡爾曼濾波將需要追蹤的點云與目標(biāo)區(qū)域相結(jié)合,進而得到穩(wěn)定的追蹤區(qū)域.但是缺點也十分明顯,激光雷達成本不菲,其可靠性也難以達到工業(yè)產(chǎn)品7×24全天運行要求.

基于這種情況,引入深度學(xué)習(xí)的方法,讓普通攝像頭在追蹤方面也達到激光雷達和深度攝像頭的水平就成了研究的熱點.其中最著名的就是相關(guān)濾波KCF[1]方法,自其提出以來,優(yōu)秀的追蹤算法就開始不斷涌現(xiàn),但相關(guān)濾波方法有很多不足的地方,如HOG特征不能很好地體現(xiàn)被追蹤物體特征,導(dǎo)致追蹤精度出現(xiàn)問題.隨著深度神經(jīng)網(wǎng)絡(luò)的不斷完善,深度神經(jīng)網(wǎng)絡(luò)替換濾波的追蹤方法也涌現(xiàn)出來,如DCF[2],Siamese[3],SINT[4]等相關(guān)算法將傳統(tǒng)KCF的濾波過程替換成基于深度神經(jīng)網(wǎng)絡(luò)的過程.

本文提出一種基于深度可分離卷積的神經(jīng)網(wǎng)絡(luò)來進行實時的多目標(biāo)追蹤,還可利用神經(jīng)網(wǎng)絡(luò)大規(guī)模訓(xùn)練樣本的能力提取更加準(zhǔn)確的特征,提高了整體追蹤的準(zhǔn)確度.除此之外,一般的追蹤網(wǎng)絡(luò)需要給定追蹤目標(biāo)的初始坐標(biāo),而本文提出的網(wǎng)絡(luò)通過增加目標(biāo)追蹤的分支,滿足了在各種環(huán)境和光照的變化下端到端的準(zhǔn)確追蹤.

1 多目標(biāo)追蹤神經(jīng)網(wǎng)絡(luò)總體架構(gòu)

多目標(biāo)追蹤神經(jīng)網(wǎng)絡(luò)主要由四個部分組成,

分別為殘差層(Resnet),瓶頸層(Bottleneck),檢測層(Detections),深度可分離卷積層(Depthwise),如圖1所示.

圖1 多目標(biāo)追蹤神經(jīng)網(wǎng)絡(luò)總體架構(gòu)

2 殘差層結(jié)構(gòu)

本文的殘差層基于Resnet50[5]的網(wǎng)絡(luò)結(jié)構(gòu)進行修改,使其輸出可以滿足檢測層和瓶頸層的輸入要求.其結(jié)構(gòu)如圖2所示.

圖2 殘差層結(jié)構(gòu)圖

殘差層的網(wǎng)絡(luò)主要由卷積(Conv),批標(biāo)準(zhǔn)化(BN),激活函數(shù)(ReLU)以及殘差塊(Block)組成.其中殘差塊是由三個部分的卷積批處理激活函數(shù)ReLU組成.每組的卷積核大小、通道數(shù)、步長如表1所示.

表1 Resnet50網(wǎng)絡(luò)具體參數(shù)

3 檢測層結(jié)構(gòu)

檢測層網(wǎng)絡(luò)修改了YOLOv2[7](Redmon, Joseph, Farhadi, Ali)網(wǎng)絡(luò)在物體位置檢測的分支.YOLOv2在物體檢測方面使用了Darknet-19作為骨干網(wǎng)絡(luò)提取特征.本文使用了修改后的殘差層作為骨干網(wǎng)絡(luò)提取特征,可以有效地降低網(wǎng)路的運算量,提升處理速度.改進了其檢測分支,通過三層特征堆疊,可以有效檢測大中小物體.通過向上采樣與原特征相加來引入殘差方法避免梯度爆炸發(fā)生.檢測層的結(jié)構(gòu)如圖3所示.

圖3 檢測層結(jié)構(gòu)

4 瓶頸層結(jié)構(gòu)

瓶頸層負責(zé)將殘差網(wǎng)絡(luò)輸出進行調(diào)整.為了在全尺度上都可以精確地跟蹤物體,殘差網(wǎng)絡(luò)輸出一個金字塔特征矩陣,每一層矩陣代表不同尺度下圖像的特征.瓶頸層的輸入分別是殘差層Block*4,Block*6,Block*3層的輸出,每一層的特征圖大小不一,通過卷積對特征圖進行統(tǒng)一并融合[8],利用最后一個卷積對不同尺度的特征進行融合并降維,得到一個多尺度的特征矩陣,其結(jié)構(gòu)如圖4所示.

圖4 瓶頸層結(jié)構(gòu)

5 深度可分離卷積層結(jié)構(gòu)

深度可分離卷積層主要目的是將需要追蹤的目標(biāo)進行特征提取并比對接下來每一幀中與其特征匹配度最高的位置,由此可以推斷當(dāng)前時刻,追蹤目標(biāo)的位置.其結(jié)構(gòu)示意圖如圖5所示.

圖5 深度可分離卷積層結(jié)構(gòu)

Depthwise卷積可以將輸入特征與原有特征進行互相關(guān)卷積,輸出響應(yīng)特征圖代表了圖片中與待追蹤物體特征的相關(guān)性分布.通過Depthwise卷積后的特征圖大小為25*25*檢測物體數(shù)量,每個位置還有5種預(yù)先設(shè)置的先驗框(Anchor number[9]),其寬長比為{1∶3,1∶2,1∶1,2∶1,3∶1}.因此每張?zhí)卣鲌D上共有25*25*5*檢測物體數(shù)量個先驗框,每個先驗框與物體坐標(biāo)位置的偏差用4個坐標(biāo)表示,對于原始anchor,用A表示,真實坐標(biāo)框用G表示,尋找一種變換F使其可以通過平移與縮放近似等于真實坐標(biāo):

其中:FC2為F函數(shù),(x,y,w,h)分別表示中心點坐標(biāo)和寬高,代表先驗框的坐標(biāo).通過F映射為新坐標(biāo),使其更接近真實坐標(biāo)G.

FC1為置信度函數(shù),用來表示先驗框中有目標(biāo)物體的情況,共2組,分別對應(yīng)存在物體和不存在物體的概率.

6 多目標(biāo)追蹤神經(jīng)網(wǎng)絡(luò)的訓(xùn)練

網(wǎng)絡(luò)訓(xùn)練分為兩個部分,一個部分是圖片作為輸入,殘差層與檢測層組成的檢測分支,輸出圖片中不同物體的坐標(biāo)與分類;另一部分將殘差層的輸出作為輸入,瓶頸層和深度可分離卷積層作為追蹤分支,輸出每一個物體的追蹤坐標(biāo).檢測分支的偏差由三部分組成,分別是坐標(biāo)偏差、置信度偏差和分類偏差.其中坐標(biāo)偏差為:

其中,N為特征圖尺寸,本文中有三種尺寸125、63、31.bool為每一個特征圖中包含物體的可能,包含為1,不包含為0.Ax、Ay、Aw、Ah為網(wǎng)絡(luò)輸出的預(yù)測中心坐標(biāo)和寬高.Gx、Gy、Gw、Gh為真實中心坐標(biāo)和寬高.

置信度偏差為:

BCE是binary cross entropy,P、Q分別為真實物體存在和預(yù)測置信度的概率.

分類偏差為:

其中,C為物體類別,本文中使用了COCO數(shù)據(jù)集進行訓(xùn)練,因此C為80,p(c)、q(c)分別為各類的真實值和預(yù)測輸出的概率.

追蹤分支的偏差值為位置偏差:

|Ax-Gx|+|Ay-Gy|+|Aw-Gw|+|Ah-Gh|

其中,Ax,Ay,Aw,Ah為網(wǎng)絡(luò)輸出的預(yù)測中心坐標(biāo)和寬高.Gx、Gy、Gw、Gh為真值的中心坐標(biāo)和寬高.兩個部分都選擇了SGD作為優(yōu)化器.

7 多目標(biāo)追蹤神經(jīng)網(wǎng)絡(luò)的評估

本文中使用了VOT-2016數(shù)據(jù)集進行訓(xùn)練和測試,使用VOT官方工具包中的測試方法對網(wǎng)絡(luò)進行評估.

VOT的測試指標(biāo)有EAO、Accuracy 、Robustness三個指標(biāo),其中Accuracy用作評價跟蹤網(wǎng)絡(luò)準(zhǔn)確性,數(shù)值越大則準(zhǔn)確度越高.Robustness用作評價跟蹤網(wǎng)絡(luò)跟蹤目標(biāo)的穩(wěn)定性,數(shù)值越大,穩(wěn)定性越差.EAO是VOT-2015提出的,其目的是描述一個追蹤網(wǎng)絡(luò)同時擁有好的recall和accuracy.測試結(jié)果如表2所示.本文的多目標(biāo)追蹤網(wǎng)絡(luò)在EAO中,Accuracy和Robustness均取得了不錯的結(jié)果,在追蹤多目標(biāo)的情況下仍比一部分單目標(biāo)追蹤網(wǎng)絡(luò)實時性要好.

表2 VOT數(shù)據(jù)集測試結(jié)果與其他主流算法對比

8 結(jié)論

(1)本文針對在線視頻中多目標(biāo)的追蹤方法進行了研究,提出一種在線的、實時的多目標(biāo)追蹤神經(jīng)網(wǎng)絡(luò).通過一個骨干網(wǎng)絡(luò)將檢測與追蹤兩個分支融合為一個網(wǎng)絡(luò),在降低了運算量的同時,使得網(wǎng)絡(luò)同時擁有目標(biāo)檢測與目標(biāo)追蹤的能力;

(2)根據(jù)骨干網(wǎng)絡(luò)的特征,使用了改進的目標(biāo)檢測網(wǎng)絡(luò),使其滿足于對多種目標(biāo)地辨別.檢測網(wǎng)絡(luò)通過金字塔特征堆疊方式,增強了對大中小物體的檢測.通過向上采樣與原特征相加來引入殘差方法避免梯度爆炸發(fā)生;

(3)骨干網(wǎng)絡(luò)的特征和檢測分支的結(jié)果同時作為追蹤網(wǎng)絡(luò)的輸入,利用深度可分離卷積對不同特征相關(guān)性的判斷,使其具備了對多目標(biāo)追蹤的能力.同時因為采用一個骨干網(wǎng)絡(luò)和雙分支的結(jié)構(gòu),保證了網(wǎng)絡(luò)可以實時地運行于各種在線視頻;

(4)本文中使用的方法在公開數(shù)據(jù)集的測試中,在EAO和Accuracy中都超過了主流的追蹤算法,同時處理速度也得到了保證,證明了深度可分離卷積在沒有增加太多計算量的情況下,有效地提高了特征提取的能力.

猜你喜歡
深度特征檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
深度理解一元一次方程
如何表達“特征”
不忠誠的四個特征
深度觀察
深度觀察
深度觀察
抓住特征巧觀察
主站蜘蛛池模板: 成人伊人色一区二区三区| 日韩少妇激情一区二区| 性69交片免费看| 国产精彩视频在线观看| 日韩国产黄色网站| 在线观看免费黄色网址| аⅴ资源中文在线天堂| 欧美自拍另类欧美综合图区| 91精品情国产情侣高潮对白蜜| 国产精品午夜福利麻豆| 亚洲欧美在线综合图区| 亚洲91精品视频| 在线看免费无码av天堂的| 重口调教一区二区视频| 色欲色欲久久综合网| 伊伊人成亚洲综合人网7777| 亚洲中文字幕av无码区| 国产精品网曝门免费视频| 九色综合视频网| 91精品免费高清在线| 国产成人高清在线精品| 青青青国产视频手机| 91青青草视频在线观看的| 国产在线第二页| 久久精品女人天堂aaa| 国产激情在线视频| 福利一区三区| 在线观看亚洲成人| 国产三级毛片| 国产免费黄| 国产综合色在线视频播放线视| 最新国产麻豆aⅴ精品无| 狠狠亚洲五月天| 亚洲无码熟妇人妻AV在线| 玩两个丰满老熟女久久网| 国产精品夜夜嗨视频免费视频| 国产黄色视频综合| 国产精选小视频在线观看| 日韩av高清无码一区二区三区| 毛片在线播放网址| 啪啪免费视频一区二区| 久久亚洲日本不卡一区二区| 亚洲系列中文字幕一区二区| 亚洲自拍另类| 久久人人妻人人爽人人卡片av| 欧美另类一区| 理论片一区| 黄色网页在线播放| 亚洲第一区在线| 国产精品福利社| 91色在线视频| 久久91精品牛牛| 亚洲国模精品一区| 亚洲三级成人| 青青草原国产av福利网站| 亚洲天堂2014| 噜噜噜久久| 久久成人国产精品免费软件| 国产最新无码专区在线| 国产欧美另类| 日本爱爱精品一区二区| 国产主播在线观看| 久久久久青草大香线综合精品| 亚洲欧美极品| Aⅴ无码专区在线观看| 2021国产精品自产拍在线| 免费看a级毛片| 成·人免费午夜无码视频在线观看 | 国产性生大片免费观看性欧美| 黄色在线网| 国产制服丝袜91在线| 狠狠亚洲五月天| 国产视频只有无码精品| 国产69精品久久久久妇女| 亚洲av日韩av制服丝袜| 最新国产高清在线| 亚洲一级无毛片无码在线免费视频| 国产成人亚洲毛片| 亚洲色图欧美视频| 天堂岛国av无码免费无禁网站| 欧美亚洲一区二区三区导航| 91九色最新地址|