李 鑫, 趙坤鵬, 朱凌寒
(合肥工業大學 電氣與自動化工程學院,安徽 合肥 230009)
隨著科學技術的進步,自動化生產線正朝著復雜化、規模化的方向快速發展。在生產線中同時生產多品種產品已成為工業自動化的一種趨勢。其中的關鍵技術之一是提取產品的圖像特征,對圖像進行識別并劃分為指定的類別。對生產線中的多種產品進行識別的過程中,會存在以下問題:1)產品之間的形狀很相似;2)產品的圖像是移動中獲取的,因此必然存在一定失真、邊緣模糊等現象。這些問題會給識別的結果帶來很大的影響。因此,尋找一種具有平移、比例和旋轉不變性且對幾何失真不敏感的產品識別方法具有重要意義。
目前,傅里葉描述子[1,2]、形狀不變量[3]、不變矩[4]常用于圖像形狀識別,但是都不能確定產品形狀原始特征。Hu M K等人[5]在1962年提出了連續函數矩的概念,且被證明具有平移不變性、比例不變性、旋轉不變性[6]。在Hu的基礎上, Wong R Y[7]進一步給出了離散狀態下不變矩的表達公式。文獻[8]指出,對于存在失真的圖像識別,由于受到比例因子的影響,Hu不變矩在連續情況下具有比例不變性,但是在離散情況并不成立。文獻[9]指出,人工神經網絡在非線性并行處理以及樣本學習中具有很強的能力[10]。目前,應用最為廣泛的為反向傳播(back propagation,BP)神經網絡[11],但其每層神經元的個數以及網絡層數[12]不容易確定。
本文的實驗對象是生產線上多品種、存在失真的產品,根據上述研究,本文提出了一種改進的不變矩和概率神經網絡(probsbilistic neural networks,PNN)相結合的多品種產品識別算法,首先通過圖像的預處理[13]提取出產品的邊緣特征信息,然后利用文獻[14]提出的不變矩改進的原理并結合概率神經網絡來實現對實驗對象的識別。
Hu不變矩理論是利用二階和三階中心矩非線性組合,構造7個滿足旋轉、平移和尺度不變性特征的矩向量。
對于一幅大小為M×N的二維離散圖像的密度函數f(x,y),以黎曼積分的形式給出(p+q)階二維矩定義
(p+q)階中心矩為

然后求取歸一化的中心矩
根據所求的中心矩,求取7個Hu不變矩
M1=η20+η02
M3=(η30-3η12)2+(3η21-η03)2
M4=(η30+η12)2+(η21+η03)2
M5=(η30-3η12)(η30+η12)[(η30+η12)2-
3(η21+η03)2]+(3η21-η03)(η21+η03)·
[3(η30+η12)2-(η21+η03)2]
M6=(η20-η02)[(η30+η12)2-(η12+η30)2+
4η11(η30+η12)(η21+η03)
M7=3(η21-η03)(η30+η12)[(η30+η12)2-
3(η21+η03)2]-(η30-3η12)(η21+η03)·
[3(η30+η12)2-(η21+η03)2]
(4)
在文獻[8]中表明了失真比例系數在離散狀態下對不變矩的影響,因此,提出了改進的不變矩來消除失真比例系數對圖像識別的影響。
設圖像離散區域坐標(x,y)失真比例系數為ρ,失真后坐標為(x′,y′),則有
x′=ρx,y′=ρy
(5)

歸一化中心矩公式:

M′1=ρ2M1,M′2=ρ4M2,M′3=ρ6M3,M′4=ρ6M4,
M′5=ρ12M5,M′6=ρ8M6,M′7=ρ12M7
(8)

由于7個不變矩變化范圍過大,在實際仿真中采用的不變矩為
Mk=|lg|Mk‖,k=1,2,…,7
(10)
PNN是Specht于1988年提出來的一種基于Bayesian決策理論和核密度估計的概率密度估計方法的神經網絡模型。PNN是結構相對簡單、易于設計且建立在徑向基函數網絡基礎上的分類器。與傳統BP網絡相比,具有訓練速度快、收斂性好、網絡結構設計靈活方便等優點。其網絡拓撲結構如圖1所示。

圖1 PNN的拓撲結構
輸入層含有m個神經元,代表輸入樣本的維度數量,其作用是接受輸入樣本并進行規格化
X=(x1,x2,…,xm)
(11)
模式層含有q個隱神經元,即樣本訓練之和;針對輸入樣本,計算其與其他各訓練樣本間的歐式距離,再通過高斯概率密度函數求其相似度
式中X為帶分類的輸入樣本,Yi為訓練樣本,‖X-Yi‖為歐式距離,σ為平滑因子。
求和層則是將樣本在模式層中的同一模式的輸出求和后,乘以代價因子
最后,決策層再通過選擇求和層中輸出最大者作為對應的分類結果。
由此可以得到如下結論,隨著訓練樣本數量的增加,模式層神經元隨之增多,所以,PNN可以不斷橫向擴展,且分類效果不斷提高。
1)先對目標圖像進行灰度化處理。由于目標圖像是真彩色圖像,具有豐富的色彩信息,每個像素顏色都有R,G,B三個顏色分量表示,若直接對真彩色圖像進行處理,需要非常大的數據量,因此,對目標圖像進行灰度化轉換就是降低其像素的信息量,提高圖像處理速度。
2)然后選取適當的閾值T,將每個像素的灰度值與T進行比較,獲取目標圖像的二值圖像,其目的是分離目標圖像和復雜背景。
3)對二值圖像進行噪聲濾除和邊緣檢測,噪聲主要表現在目標周圍的噪聲塊和目標內部的噪聲孔,邊緣檢測的基本問題則是檢測準確度與抗造性能之間的矛盾。本文首先采用形態開—閉的級聯形式構成的形態開閉濾波器完成二值圖像的濾波,然后采用數學形態學的邊緣檢測器得到最終的目標圖像邊緣。
4)對目標圖像的邊緣化二值圖像提取特征值,根據式(4)、式(9)、式(10)求取產品改進的Hu不變矩。
5)為每種不同形狀產品的不變矩添加分類標簽,將部分標準件樣本作為訓練樣本,對概率神經網絡進行訓練,然后用未參加訓練的標準件樣本和實物樣本作為測試樣本,測試本文的可行性和優越性。
為了驗證本文圖形識別算法的可行性和優越性,本文在基于MATLAB R2017a運行環境下選取工業自動化生產線上常用到的4種不同形狀的標準件、實物進行實驗,分析改進的Hu不變矩和PNN識別的效果。
本文首先選取工業自動化生產線上常用到的正方形、長方形、拱形、半圓形的標準件作為實驗對象,分類編號分別為1#~4#。
分別對每種不同形狀的產品標準件的原始圖像做放縮(放大1.4倍,縮小0.8倍)、旋轉(旋轉60次,每次旋轉間隔為3°),每種產品標準件得到180幅樣本圖像,總計720幅樣本圖像。分別將720幅樣本圖像轉化為灰度圖像,然后根據已有經驗選取相應的閾值將其轉換為二值圖像,再采用形態開閉濾波器、邊緣檢測器獲取產品比較清晰的輪廓。
求取每種產品輪廓的傳統的不變矩和改進的不變矩,為其添加分類編碼,從中分別選取576幅樣本的不變矩和分類編碼作為訓練樣本,對概率神經網絡進行訓練,在訓練過程中不斷調整網絡,使其達到較好的訓練效果。
然后分別選取剩余的144幅樣本的傳統的不變矩和改進的不變矩作為測試樣本,各類測試樣本數36,輸入到各自對應的概率神經網絡中進行測試,得到標準件的識別結果如表1。

表1 兩種方法的標準件識別結果
根據實驗結果可以看出,144組測試樣本,各類測試樣本數均為36,將標準件通過的傳統不變矩進行識別測試時,綜合識別率為n=99.3 %。將標準件通過改進的Hu不變矩和PNN進行識別測試時,綜合識別率為n=100 %。
本文選取標準件相對應的實物作為實驗對象,如圖2。

圖2 產品實物的原始圖像
對每種不同形狀的產品實物的原始圖像做放縮(放大1.4倍,縮小0.8倍)、旋轉(旋轉12次,每次旋轉間隔為15°),得到每種產品實物的36幅樣本圖像,總計144幅樣本圖像。各類測試樣本數均為36。對樣本圖像進行預處理并求取其傳統的不變矩和改進的不變矩,然后分別將144幅樣本的不變矩作為測試樣本,輸入到各自對應的標準件訓練過的概率神經網絡中進行測試,得到實物改進的Hu不變矩的識別結果如表2。

表2 兩種方法的實物識別結果
根據實驗結果可以看到,將實物通過改進不變矩和PNN進行識別測試,在對長方形、三角形和拱形進行識別時均出現錯誤,僅識別出了正方形,綜合識別率為n=0.25。
將實物通過改進的Hu不變矩和PNN進行識別測試,在正方形、三角形和拱形的識別中分別出現了1次誤判情況,144組測試樣本,綜合識別率為n=98.61 %。
綜合以上實驗結果表明,改進的Hu不變矩和PNN結合的識別算法不僅可以穩定的區分4種產品的標準件,還可以對存在缺損和失真的實物產品進行高準確率的識別。
本文針對生產線中的多種產品進行識別的過程中存在的問題,提出了一種改進的不變矩和PNN相結合的多品種產品識別算法。該方法采用改進的不變矩算法來描述產品的邊緣特征,消除了失真比例系數在離散狀態下對不變矩的影響。仿真結果表明,本文提出的方法對于相似產品以及存在幾何失真、邊緣模糊產品的識別具有較高的準確率,是一種比較實用的識別方法。