屈力剛,楊英鐸,邢宇飛,荊麒瑀
(沈陽航空航天大學(xué)航空制造工藝數(shù)字化國防重點(diǎn)學(xué)科實(shí)驗(yàn)室,遼寧沈陽 110000)
工業(yè)機(jī)器人作為工廠自動(dòng)化生產(chǎn)線的重要組成部分,可以通過接受外部傳感器信號獲得目標(biāo)的位置與姿態(tài),并完成分揀、抓取、裝配等各種任務(wù)。近年來,深度學(xué)習(xí)與圖像的結(jié)合,使得計(jì)算機(jī)可以通過圖像來計(jì)算任意擺放在世界坐標(biāo)系中工件的姿態(tài),而不再需要使用夾具固定在確定的位置,極大的提高了自動(dòng)化的程度。而圖像語義分割作為圖像分析與處理的基礎(chǔ),是位姿估計(jì)的重要組成部分。如何精準(zhǔn)的獲得圖像中目標(biāo)的類別、位置和輪廓是圖像語義分割的主要任務(wù),也是研究的難點(diǎn)之一。在實(shí)際的工程應(yīng)用過程中,有很多形狀相似但是尺寸不同的零件,在語義分割的過程中很難區(qū)分這些不同尺寸零件的具體類別。在這些形狀相似、尺寸不同的零件中,以具有代表性的標(biāo)準(zhǔn)件為例,結(jié)合深度圖像提升對標(biāo)準(zhǔn)件進(jìn)行語義分割的過程中分類的準(zhǔn)確度,并自制標(biāo)準(zhǔn)件數(shù)據(jù)集進(jìn)行驗(yàn)證方法的有效性。
圖像的語義分割(Image Semantic Segmentation)由文獻(xiàn)[1]首次提出,并將圖像語義分割定義為:為圖像中的每一個(gè)像素分配一個(gè)預(yù)先定義好的表示其語義類別的標(biāo)簽。而卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)的出現(xiàn)及快速發(fā)展,圖像分割領(lǐng)域取得了巨大的突破。文獻(xiàn)[2]提出了FCN(Fully Convolu?tional Networks),將CNN的全連接層用卷積層取代,適應(yīng)任意尺寸的圖像輸入。同時(shí)使用上采樣的反卷積層,可以輸出更精確的結(jié)果。……