999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義分割的室外場景識別技術研究

2022-03-15 10:34:22張怡萌余順年
計算機仿真 2022年2期
關鍵詞:語義實驗

張怡萌,陳 寧,余順年

(集美大學機械與能源工程學院,福建 廈門 361021)

1 引言

隨著科技的發展,人工智能在計算機領域逐漸成為了研究的熱門話題,其在各個領域的應用引起了人們的關注。近年來,深度學習領域的創新發展,給計算機視覺帶來了新的突破性的研究。尤其是近年來對于計算機的發展有了更高的需求,需要計算機更加智能化和擬人化,能夠具備更強的邏輯處理能力進行預判和分析。目前,計算機視覺技術多用于目標檢測、識別以及跟蹤等方面。場景識別技術是計算機視覺領域的一個重要的研究課題,而深度學習是近階段人工智能方向的研究熱點。

場景識別技術經歷了長時間的發展,而傳統的場景識別技術在目前的應用中存在很大的局限性。隨著深度學習技術的不斷發展,基于卷積神經網絡的深度遷移學習技術應用在場景識別中的研究已經得到了廣泛的關注。

隨著移動機器人技術的發展,以及人們對于各種傳感器應用的不斷理解,場景識別技術也逐漸由簡單的室內環境識別擴展到場景更為復雜的室外環境識別。在室外移動機器人和無人駕駛技術領域,利用環境感知、道路識別和場景理解成為了機器人領域的研究熱點。斯坦福大學的Mohan[1]結合了深度反卷積神經網絡和卷積神經,形成了一種用于場景分析的新網絡結構。該研究使用多分塊訓練,首先對場景信息有效地學習,然后通過反卷積網絡對道路區域進行像素級分割。rust等人[2]提出了一種卷積神經網絡,用于學習在像素級別區分不同的圖像塊和注釋卷積塊網絡。文章合并了圖像塊的空間信息,并將其作為網絡的輸入。同時將網格與模型結合,用于查找特定類型的像素位置。該方法將圖像塊進行分類,并在KITTI 數據集進行檢測,得到了良好的效果。這種方法的主要優點是可以提高各種場景下檢測結果的魯棒性,并提高檢測模型的適用性。

本文針對傳統的室外場景識別技術魯棒性弱和識別精度低等問題,提出了一種基于語義分割的改進的deeplabV3+算法的室外場景識別技術。該方法在深度學習的基礎上,嘗試利用改進后的K-近鄰算法對大量的特征點進行檢索關鍵特征后提取與交叉匹配比對,之后把提取到的信息,用語義分割的結果表達出來。本文在VOC2012和cityscapes兩個不同的數據集下使用改進后的算法進行檢測,并用自定義建立的數據庫進行室外場景的實驗結果驗證,對場景中的全部特征進行識別,之后輸入未標簽的新數據進行匹配,從而實現室外場景的語義重建。

2 語義分割結構模型

2.1 卷積神經網絡

深度學習(deep learning)的概念由加拿大的 G.E.Hinton 博士[3]在2006年提出,是一種基于深度置信網絡非監督貪心逐層訓練算法,將低層特征結合起來創建更抽象的高層特征。隨著深度學習研究內容不斷創新發展,目前已經應用在機器視覺、數據處理、視頻分析、智能駕駛和語言翻譯等眾多領域。2016年和人類世界圍棋冠軍進行比賽DeepMind公司開發的AlphaGO[4],是深度學習的應用潛力得到進一步的挖掘。到目前,深度學習在數據、算法和模型上取得了驚人的進展,也成功促使了人工智能技術大規模的發展和應用。

卷積神經網絡(convolutional neural network,CNN)是基于深度學習理論的一種人工神經網絡,該網絡可省去圖像預處理與特征抽取等步驟,將數據作為輸入[5]。源于仿生學的啟發,在二十世紀六十年代初,Hubel 和 Wiesel 以貓為對象實施了視覺實驗,研究提出了視覺皮層功能分層模型[6]。CNN的基本結構為:輸入層、卷積層(convolutional layer)、池化層(pooling layer)、全連接層及輸出層。在卷積神經網絡中,卷積層和池化層通常有多個,并且采用交替設置。

2.2 模型選擇與模型簡介

本文比對了各模型在PASCAL VOC2012測試集的MIOU,如表1所示,DeeplabV3+的準確率MIOU值要高于其它幾種神經網絡。

表1 各個語義分割框架在PASCAL VOC2012數據集上

因此,本文基于deeplabV3+框架進行實驗,使用一種改進后的K-近鄰算法對神經網絡進行優化,同原始的神經網絡實驗結果進行對照。

2.2.1 deeplabV3+網絡結構

2015年,谷歌發布了DeepLab模型。經過不斷的改進以及優化卷及神經網絡,將模型升級為DeepLab-V2[7]和DeepLab-V3[8],新的模型具有更強大的建模技術以及特征提取功能。隨后,谷歌在DeepLab-V3的基礎添加了一個簡單高效的解碼器模塊[9]用于優化分割后的特征目標,主要用于特征目標的邊界優化,并將更新后的模型命名為DeepLab-V3+[10],同時對多孔金字塔池化(ASPP)[11-13]和解碼器模塊使用可分離的卷積神經網絡,從而為語義分割提供了一個計算速度更快、分割能力更強的網絡結構。

Deeplabv3+采用編碼器-解碼器的方式,編碼器部分使用Xception網絡[14]作為基礎網絡進行特征提取。Xception網絡是一種深度可分離的卷積網絡。為了解決物體魯棒分割問題,該算法引入了 ASPP 模塊。將圖像輸入進該算法中時,首先經過卷積網絡得到一個初始的特征圖,然后將特征圖輸入到一個1*1的卷積層中,以降低特征圖的層次。其目的是減少特征圖的通道(這里由256通道減少為48通道)。解碼器部分將低層次功能特征與高層次功能特征結合到一起,將編碼器中處理后的特征圖再次輸入進一個1*1的卷積中,得到一個更低層次的特征圖,再次減少特征圖通道數,然后使用4x插值采樣實現雙線性特征圖合并。最后經過3*3卷積操作后采用4倍的雙線性插值,以恢復原始圖像的分辨率并獲得與原始圖像相同的尺寸的分割后的圖片。

2.2.2 K-近鄰算法

K-近鄰(K-Nearest Neighbor,K-NN)[15]是求解分類問題的一種常用算法,是數據挖掘算法的一種。簡單表示為:輸入一個新的未添加標簽的數據,然后在原始訓練集標簽數據與該輸入數據最相似的K個標簽,并且根據找到的這K個標簽,來確定新數據集的分類。

K-近鄰方法是一種原理相對簡單且易于實現的分類識別算法。并且具有在K個近鄰樣本數和訓練樣本總數N都趨近無窮大時并且k/N→0時,能夠保證K-近鄰規則是最優的分類準則等良好特性。但是,也存在著明顯的不足,K-近鄰算法在解決實際模式分類的問題時,K-近鄰算法在分類過多時,識別精度會有所下降,但可以通過增加樣本的數量,提高識別精度。因此,本文選擇采用K-近鄰方法來輔助深度學習系統進行室外場景識別實驗。

按照該算法的基本思路,以本次實驗的分類問題為例,在給出新的實例之后,根據與該實例相似度的訓練樣本,選擇出該訓練樣本與預測樣本的距離d的K個取值,并依據K的取值來確定新的實例:在運算過程中,系統會輸出連續的坐標(X1,y1),(X2,y2),…,(Xn,yn),其中,Xi是該實例的特征向量表示,yi則是實例Xi對應的類別。對于給定的實例,使用K-近鄰算法對樣本的預測估計可以表示為

(1)

其中,Lk(x)表示與實例X最相似的K個實例。

為了提高算法的精度,本文對K-近鄰算法的相似度計算方法進行了改進工作,即,對每個實例進行權重計算,具體體現為對于相似度的計算,考慮到測量的接收信號強度,提高接近度高的訓練樣本的估計權值,考慮到多種算法的復雜程度以及準確率。本文選擇使用歐式距離來代替原算法進行相似度的計算

(2)

為了提高訓練樣本的估計權值,本文的權值選擇使用訓練實例間的歐氏距離的倒數,其中,第i個近鄰的權值設置為

(3)

歐式距離的冪次越高,與預測樣本差別較大的樣本在訓練時發揮的作用就越小,對預測樣本的估計可以表示為

(3)

在確定實例的K-近鄰后,計算每個實例的決策權重,根據決策權重的大小,判斷其在預測的類別歸屬時發揮作用的大小[16]。

2.2.3 本文選取的模型

為了提高deeplabV3+的識別精度,本文的主要目的是在原有的開源deeplabV3+算法中加入K-近鄰算法進行改進,如圖1使所示:在實驗前,要對自己的數據集進行標簽工作,由于數據集樣本數量比較大,因此標簽工作非常復雜繁瑣,為解決此問題,本文在對數據進行處理時,針對于數據集的處理工作,引入非監督學習的概念,使用K-近鄰算法對公開數據集進行特征提取分類,然后把分類結果應用于deeplabV3+測試算法中,進行對自定義數據集的識別測試工作。改進后的模型算法,如圖2所示。

圖1 算法流程

圖2 改進后的deeplabV3+模型框架

3 基于語義分割的室外場景識別

3.1 改進的deepLabV3+進行語義分割實驗

訓練數據集采用開源的VOC2012數據集、cityscapes數據集以及自定義采集的數據集進行實驗。對于自己采集的數據集,由于樣本數量較少,因此利用數據增強方式對數據進行擴充。擴充后的數據集樣本數量增加,大量的樣本使得訓練能夠更加準確多樣性,有效防止訓練過程中由于樣本不足導致的過擬合現象,模型的魯棒性也能得到提升。

如圖3所示,本次實驗所拍攝的圖片為校園及周邊環境,共采集圖片800張,圖像采集時設計包括晝夜、雨天等不同環境下的室外場景。樣本集隨機選取 600 張圖像生成訓練集,其余 200 張圖像則作為測試集。

圖3 部分數據集示例

為了使測試結果更具有說服力,考慮對采集到的數據集進行數據擴增。本次實驗分別從COCO數據集和KITTI數據集中各分選出1500張適合本次實驗的室外環境的圖片,加入進自定義的數據集中進行擴充。擴充后的數據集樣本容量為3800張圖片,其中2850張為訓練集,其余950張圖片作為測試集使用。

目前的deeplabV3+實驗方法需要采用人工標注和輔助標注結合的方式對集裝箱數據集進行標注,人工標注主要使用labeIme樣本目標標注軟件,利用該軟件進行自定義標注時,需要按照目標的形狀進行輪廓描繪,可生成所需要的json文件,然后通過編程語言把json文件轉換為后面訓練所需要的png格式的語義圖片,labelme操作界面如圖4所示,圖片生成結果如圖5所示。

圖4 labelme標注效果

圖5 標簽轉換后生成的圖片

考慮訓練集中的屬性分布,以及考慮到某些屬性不能使用語義分割將屬性分割并可視化。

本文改進的算法需要先對原有數據集進行訓練,VOC數據集測試結果如圖6所示,僅對物體進行無背景的分割,且VOC數據集與本次實驗環境重合度不高,通過對比自定義數據集與VOC數據集樣本中的特征,提取出比對結果中相似度最高的樣本的分類標簽,最終選取了6個屬性。具體屬性值見表2。

圖6 VOC數據集測試結果

表2 自制數據集與VOC數據集相似分類標簽

使用Cityscapes數據集進行測試的結果如圖7所示,Cityscapes數據集樣本由多個國家的不同街道環境組成,數據集樣本容量大,且與本次實驗的環境類別重合度較高,通過對比自定義數據集樣本中的特征與Cityscapes數據集對應,提取出比對結果中相似度最高的樣本的分類標簽,最終選取了12個屬性。具體屬性值見表3。

圖7 Cityscapes數據集測試結果

表3 自制數據集與Cityscapes數據集相似分類標簽

由于VOC數據集的樣本分類標簽屬性相對較少,而且沒有分離背景,因此不太適用于本次實驗的室外場景環境檢測中,而cityscapes數據集樣本是城市景觀,大多為街道環境,而且分類標簽與本次實驗的實驗場景環境相似性更高,分類標簽屬性也更多更適合于本次實驗環境。

3.2 模型訓練及訓練結果

本次實驗在ubuntu16.04桌面版系統下進行,在深度學習框TensorFlow下進行deeplabV3+和FCN的語義分割算法,計算機處理器為Inter(R)Core(TM)i7-7700K CPU@4.20GHz,內存8GB,適配器為NVIDIA GeForce GTX 1080GPU。CUDA9.0版本并行計算框架配合CUDNN9.0版本是深度神經網絡加速庫,使用python版本為3.6.8。

本文選擇使用Xception65網絡模型來初始化網絡參數,并基于deeplabV3+的python版本進行模型的訓練和測試,通過對應網絡的配置文件修改訓練策略參數,其主要的訓練策略如表4所示。

表4 主要訓練策略

本次實驗從GitHub上下載了deeplabV3+的源碼。首先對于數據集的處理,TensorFlow使用TFrecord格式來進行數據存儲,T并且提供了豐富的函數方法對數據進行預處理工作。其對于模型進行初始化參數的設置,由于計算資源的限制,本實驗首先使用deeplabV3+網絡模型訓練了VOC數據集以及cityscapes數據集,對數據集對應特征進行比較之后,使用改進后的K-鄰近算法提取出樣本最相似的分類標簽,本次實驗中,基礎的學習率設置為0.0001,學習率下降策略選擇使用poly,batch_size設置為12,權重衰減設置為0.0004,output_stride設置為4,對應的空洞金字塔的3個空洞卷積參數分別設置為8,12,16。

使用改進后的算法對自定義的訓練集和測試集進行訓練,獲得模型的參數。實驗過程中,生成的損失率隨著時間的增加在不斷降低,當降低到一定的范圍時,損失率得到相對穩定的區間,取區間的最低點,得到的參數為損失率最小值。圖8所示為訓練過程的網絡總損失值的變化曲線。圖9所示為整個訓練過程的學習率變化曲線。

圖8 網絡總損失值的變化曲線

圖9 學習率變化曲線

圖中可以看出,在迭代次數大約40000次時,損失函數值開始趨近于穩定,其中,隨著學習步數的不斷增加,學習率逐漸趨近于0,而總損失值逐漸趨近于0.4。

展示模型識別效果圖,輸入為一張圖片,輸出為一張語義分割圖,分割效果如圖10所示。

圖10 改進后的算法語義分割效果圖

3.3 評價指標

Precision即準確率,是在識別所有的實例時,系統識別出來的所有的實例A所占的比例,其公式為

(5)

Recall即召回率,是在識別出來的所有的實例A中,識別出來正確的A所占的比例,其公式為

(6)

以實例B為例,簡單說明TP、FP、FN的釋義。TP表示數據集中的實例B被正確識別為實例B;FP表示數據集中的實例B被識別成了實例C或者其它非B實例;FN表示數據集中的其它非B實例被識別為實例B。

AP即平均精度(Average-Precision),簡單來說,AP就是Precision-Recall曲線(P-R曲線)的面積,通常情況下,分類的準確率越高,AP值越高。

改進后的語義分割結果與原本的deeplabV3+網絡相比,識別結果分析如表5、圖11所示:

表5 實驗結果

圖11 改進前后結果對比示意圖

3.4 結果分析

本次實驗是在測試公開數據集結果的基礎上測試自定義數據集,與現有的測試數據集的方法不同,省去了對數據集進行標簽的工作,減少了大量的前期準備工作,節省了實驗的時間,輸入新的未添加標簽的數據后,將該數據中能夠提取出來的每個特征與實驗中訓練過的樣本中的生成的特征信息進行對應比較。

試驗結果表明,改進后的語義識別方法比現有的直接使用deeplabV3+算法進行語義識別相比,縮短了訓練時間,提升了訓練精度。原本的方法在采集數據集之后花費了大量的時間在標簽工作上,改進后的訓練算法則避免了這一繁瑣的過程,通過K-近鄰算法計算過相似性之后在進行結果輸出的方式,比原本的直接輸出方式的準確率有提高,而且工作效率也有所提高,使室外場景的語義識別效果得到提升。

4 結束語

本文運用了深度學習的原理,提出了一種基于語義分割的室外場景識別方法,該方法主要通過進行實驗來確認環境的語義識別結果,同時對改進后的deeplabV3+算法與原本的算法進行對比試驗,得到相對較好的結果。本次實驗發現改進后的算法在可行性上提供了有力的支撐,由于原本的算法在對自定義數據集進行訓練之前要經過繁瑣的標簽過程,而改進后的算法在原本深度學習的基礎上引入了一種改進后K-近鄰算法的概念,去掉了前期標注的過程,引入分類標簽,利用原有數據集與自定義數據集樣本的相似特征進行實驗,減少了算法的前期準備時間,提高了識別的準確率以及算法工作的效率。

最終的實驗結果證實了本文的實驗方案是可行的,同時有效的提升了工作效率,為后續進行室外場景的語義分割提供了可行性。

本文的實驗方案雖然能提升室外場景語義分割的速度和效率,但是識別精度以及準確性仍有一定的誤差,這對于實時檢測還是能造成一定的影響,下一步的研究工作可以考慮在保證準確率的同時能夠提高訓練速度以及減小實時識別的誤差影響。

猜你喜歡
語義實驗
記一次有趣的實驗
微型實驗里看“燃燒”
語言與語義
做個怪怪長實驗
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
主站蜘蛛池模板: 四虎精品黑人视频| 一区二区三区国产精品视频| 国产精品综合久久久| 国产三区二区| 婷婷六月综合网| 国产啪在线91| 夜精品a一区二区三区| 亚洲国产日韩在线观看| 国产精鲁鲁网在线视频| 婷婷六月综合网| 先锋资源久久| 麻豆精品国产自产在线| 国产99在线观看| 女同国产精品一区二区| 久久99国产综合精品1| 日韩区欧美区| 日本免费a视频| 2021无码专区人妻系列日韩| 九九九精品成人免费视频7| 中文字幕人妻av一区二区| 国产在线一区二区视频| …亚洲 欧洲 另类 春色| 9999在线视频| 69免费在线视频| 美女啪啪无遮挡| 日韩精品专区免费无码aⅴ| 四虎AV麻豆| 无码免费的亚洲视频| 青青久久91| 国产黄在线免费观看| 色视频国产| 91精品国产91欠久久久久| 亚洲综合中文字幕国产精品欧美| 久久精品丝袜高跟鞋| 亚洲无限乱码| 最近最新中文字幕在线第一页| 99久久精品视香蕉蕉| 国产91视频免费观看| 欧美黄色网站在线看| 午夜综合网| 亚洲精品在线影院| 中国一级特黄视频| 色综合天天娱乐综合网| 亚洲 日韩 激情 无码 中出| 国产高清国内精品福利| 欧美日韩成人在线观看| 亚洲精品国产日韩无码AV永久免费网| 国产精品私拍99pans大尺度| 午夜电影在线观看国产1区| 狠狠综合久久| 日韩AV无码免费一二三区| 国产爽妇精品| 毛片网站免费在线观看| 免费看a级毛片| 99视频精品全国免费品| 极品性荡少妇一区二区色欲| 欧美国产精品不卡在线观看| 国产综合精品一区二区| 制服丝袜在线视频香蕉| 亚洲AV一二三区无码AV蜜桃| 99久久无色码中文字幕| 热伊人99re久久精品最新地| 91久久夜色精品| 黄色福利在线| 片在线无码观看| 国产视频一区二区在线观看 | 国产熟睡乱子伦视频网站| 国产精品无码制服丝袜| 亚洲性一区| 国产理论一区| 老熟妇喷水一区二区三区| 性色一区| 性色生活片在线观看| 亚洲国产第一区二区香蕉| 欧美成人二区| 国产精品女熟高潮视频| 国产人免费人成免费视频| 欧美日韩亚洲国产| 天堂网亚洲综合在线| 亚洲中文字幕手机在线第一页| 538国产在线| 欧美午夜小视频|