張曉東,蘇瑞芳,董唯光
(1.寶雞職業技術學院 機電信息學院,寶雞721013;2.蘭州交通大學 自動化與電氣工程學院,蘭州730070)
隨著工業4.0 智能制造的發展, 工業機器人發展越來越迅速,機器人視覺系統是機器人的核心組成部分[1]。生產線上,人會因為疲憊作出判斷失誤和測量錯誤,但是機器人卻能高效穩定的生產,工業機器人視覺系統利用機器代替人眼作出各種測量和判斷,但是隨著機器人的生產時間增加,需要大量的視覺圖像采集存儲空間,這就使得數據庫容量負擔大大增加。為此,需要壓縮采樣率低、重建恢復效果好、計算效率高的壓縮采樣算法。
迄今為止,已有部分學者對工業機器人視覺圖像壓縮問題進行了研究。對于工業機器人而言,傳統的視覺圖像數據壓縮處理方法包括基于信號特征的特征值提取壓縮法、多尺度分析的小波壓縮法、傅里葉變換的插值壓縮法、數據壓縮稀化法等[2],這些方法雖然降低了存儲與傳輸負擔,但是這些傳統的信號檢測與壓縮方法仍需具有很高的采樣頻率,存在著壓縮計算復雜、存儲空間浪費和適用范圍低等問題。由Donoho 和Candes 等人提出的壓縮感知(compressed sensing,CS)理論[3-4],有效地解決了上述問題并指明了新的方向。CS 理論將壓縮與采樣同時進行,在滿足一定條件下通過少量的信號測量值來重構原始信號。該理論降低了模數轉換器帶寬的要求,取而代之的是信號的稀疏性。稀疏度與信號的重構精度和計算復雜度息息相關,是壓縮感知理論應用的前提條件[5]。部分學者將CS 運用在信號處理、諧波檢測、圖像重構等方面[6-8]。
目前,工業機器人視覺圖像信號是一種非線性信號,該視覺圖像信號的稀疏性差,導致重構效率低。因此,對于降低工業機器人視覺圖像的復雜度及提高重構效率將成為CS 理論研究的關鍵。文獻[9-10]提出了一種自適應視覺圖像分塊方法,該方法能夠自適應地將一個視覺圖像分解為若干個小的塊分量。對于重構精度和重構速度,文獻[11]證明廣義匹配追蹤(gOMP)算法的重構性能和運行時間優于一般的貪婪重構算法。與gOMP 算法相比,本文研究了利用廣義Jaccard 系數的優化gOMP 重構算法具有更好的稀疏性與穩健性。
結合以上2 種思想,本文提出了一種利用自適應分塊預處理技術與優化的壓縮感知重構算法相結合的工業機器人視覺圖像處理方法。利用自適應分塊技術把工業機器人視覺圖像信號分解為若干個視覺圖像塊分量,然后對每個塊分量圖像利用優化的CS 重構算法進行處理, 重構得到工業機器人原始視覺圖像信號。與直接采用CS 壓縮重構工業機器人視覺圖像方法相比,該方法充分利用自適應分塊預處理與優化的壓縮感知重構算法的優點,不但計算復雜度降低,而且重構精度得到提高。
對于大小IM*In個像素的機器人視覺圖像X,為體現不同圖像內容的紋理結構、邊緣特征,并控制分塊過程的復雜度,在對工業機器人視覺圖像進行稀疏變換之前,以機器人視覺系統圖像內相鄰像素間的灰度差值表征內容間的相關度,以此作為機器人視覺圖像塊大小的分割依據,即:

機器人視覺圖像自適應分塊算法的具體流程如圖1所示。利用四叉樹算法,即根據機器人視覺圖像的紋理變化情況,在需要對視覺圖像進一步分割時,將對應視覺圖像分成4 個等份的塊,從而有效分離平坦區域和細節復雜區域。首先,將圖像分成均勻大小的B×B 塊,設定分塊閾值T,當區域塊相鄰像素灰度平均差值小于T 時,說明此塊機器人視覺圖像內容比較平坦,停止分塊。為防止相鄰機器人視覺圖像塊邊緣出現塊效應, 且減小計算量,當塊大小分割至4×4 時即停止繼續分塊。

圖1 機器人視覺圖像自適應分塊算法流程Fig.1 Algorithm flow chart of robot vision based on adaptive blocking
機器人視覺圖像自適應分塊閾值T 由整幀視覺圖像相鄰像素灰度的行差、列差的平均值決定,即:

壓縮感知理論主要包括信號的稀疏表示,信號的非線性測量表示, 以及信號的重構算法設計,其成立條件是信號是可壓縮的或稀疏的[13-14]。
將原始有限長一維離散時間實信號X∈RN,可以把信號X= [X(1),X(2),…,X(N)]T在某正交基向量下進行展開,把向量作為列向量轉換成字典矩陣ψ=[ψ1,ψ2,…,ψN],信號X∈RN表示為

假設稀疏系數向量θ 是K-稀疏的,即向量θ 中非零系數個數K?N, 取另一個與正交基不相關的測量矩陣Φ∈RM×N(M?N)對原始信號X 進行壓縮測量,得到:

由于方程(7)屬于高度欠定方程,存在無數多組解,但向量θ 是K-稀疏的,從M 個測量向量中可重建θ,即:

求解該問題典型的重構算法有:正交匹配追蹤算法(orthogonal matching pursuit,OMP)、正則化正交匹配追蹤算法、分段正交匹配追蹤算法、廣義正交匹配追蹤算法[11]等。
2.2.1 廣義正交匹配追蹤重建算法
在2012年,韓國高麗大學Wang Jian 等人提出gOMP 算法是OMP 算法的一個改進,該算法每次選擇的原子個數大于1(而OMP 算法每次只選擇1 個最佳原子)。
算法1gOMP 重構算法
輸入:稀疏度K,感知矩陣A=Φψ,投影向量y,S 為≥1 的正整數。
輸出:重構信號。
初始化:r0=y,索引集J0≠?,A0=?,迭代次數t=1。
步驟:
(2)求y=Atθt的最小平方解:
(3)更新殘差rt=y-At
(4)如果‖rt-r‖≤ε,進入步驟(5)中運行;否則,令r=rt,t=t+1,跳回步驟(1)中運行;
2.2.2 優化內積的gOMP 重建算法
原始gOMP 算法中,信號代理為

對任意兩個向量x,y, 它們的相似度可以用Jaccard 系數來表示[12]:

式中:x=(x1,x2,…,xn),y=(y1,y2,…,yn)。
改進的gOMP 使用Jaccard 相似系數作為計算“代理”向量的標準,也就是將式(7)改為式(9):

式中:Φi表示Φ的第i 列。
在式(11)中,利用廣義Jaccard 相似系數可以充分反映出兩個任意向量x,y 之間的相似程度。在計算相似性時,Jaccard 系數把任意兩個向量中的各個元素的作用效果放大,主要原因是式(11)分母中減去兩個向量中相同的部分, 放大了向量的差異,增大了向量的相似程度, 從而使得原子不容易混淆,具體表現在各個元素對原子的選取,以此優化了支撐集,從而使得重構更加精準,如圖2所示。

圖2 廣義Jaccard 系數匹配與內積度量匹配對殘差的影響Fig.2 Effect on residuals of generalized Jaccard coefficient matching and inner product matching
本設備由工業機器人、AGV 機器人、托盤流水線、裝配流水線、視覺系統和碼垛機立體倉庫等六大系統組成[13],如圖3所示。

圖3 實驗室設備組成圖Fig.3 Composition diagram of laboratory equipment
通過視覺系統對工件進行識別,然后由工業機器人進行裝配,裝配完成后,再入庫[14]。因此,機器人圖像識別與壓縮存儲是關鍵,圖4為所需要識別抓取和裝配的工件。

圖4 抓取和裝配的工件Fig.4 Workpiece of grab and assemble
采用本文所研究的基于自適應分塊預處理的工業機器人壓縮感知視覺圖像處理示意圖如圖5所示。

圖5 基于自適應分塊預處理的工業機器人壓縮感知視覺圖像處理Fig.5 Industrial robot visual image processing based on adaptive block and compressed sensing
本實驗在學院工業機器人實驗室進行,其中機器人為匯博機器人、電腦參數Windows10 版本,i5CPU 2.7 GHz,4 GB 內存,Matlab2010 上進行。選取一張256×256 的工件圖像作為仿真原圖像。本文中機器人視覺圖像重構質量評價指標為峰值信噪比(peak signal to noise ratio,PSNR)。

仿真時,首次塊大小B 取32,為驗證基于工業機器人視覺圖像的自適應分塊優勢,將與均勻分塊的效果進行比較。仿真時,均勻塊大小分別取8×8,16×16,32×32,基于相鄰像素自適應分塊的采樣率均設置為40%,得到表1、表2的實驗結果,圖6為自適應分塊處理的機器人壓縮感知視覺重構圖像。

圖6 自適應分塊預處理的機器人壓縮感知視覺重構圖像Fig.6 Industrial robot visual reconstruction image based on adaptive block and compressed sensing
對比表1、表2的實驗結果可知,采樣率相同情況下,相比于均勻分塊,基于相鄰像素的自適應分塊的機器人壓縮感知視覺重構方法的重構質量提高2 dB~3 dB,且重構時間縮短40 ms~50 ms。

表1 分塊的機器人視覺圖像重構時間的對比Tab.1 Robot visual image reconstruction time comparison in blocking

表2 分塊的機器人視覺圖像重構質量PSNR 的對比Tab.2 Robot visual reconstruction image quality PSNR comparison in blocking
本文研究了基于自適應分塊處理的工業機器人壓縮感知視覺圖像處理,利用相鄰像素均值為分塊依據,本文自適應分塊處理的機器人壓縮感知視覺重構方法的重構圖像質量提高了2 dB~3 dB,且重構時間縮短了40 ms~50 ms,這為工業機器人視覺圖像數據存儲和圖像重構提供新的方法。