四元共空間特征提取算法及其在紙幣識別中的應(yīng)用

2019-01-31 02:34:14蓋杉

通信學報 2018年12期

蓋杉

（南昌航空大學信息工程學院，江西南昌 330063）

1 引言

隨著人們對流通紙幣質(zhì)量要求的提高以及自動取款機和出納機的迅速普及，銀行對于自動化紙幣清分技術(shù)的需求日趨強烈。紙幣清分系統(tǒng)是一種光機電一體化的復雜產(chǎn)品，其主要功能是對紙幣圖像進行分析與處理，并根據(jù)處理結(jié)果實現(xiàn)對紙幣圖像自動分類與檢測。鑒于紙幣的重要性，銀行對其分類的準確性要求極高。因此，紙幣特征提取是紙幣清分系統(tǒng)最為關(guān)鍵的環(huán)節(jié)，區(qū)分性好的特征將有利于后續(xù)識別性能的提升。

由于不同幣值的人民幣和意大利幣幾何尺寸具有差異性，Kato等[1]將紙幣圖像的長度、寬度等幾何特征作為識別的重要依據(jù)。Takeda等[2]運用隨機函數(shù)在特定區(qū)間內(nèi)產(chǎn)生與輸入特征向量維數(shù)相當?shù)碾S機掩模，通過計算未被遮掩的像素個數(shù)得到特征向量，簡稱掩模特征方法即簡記為 MASK（mask feature）方法。類haar特征[3-4]主要采用積分圖像描述原始紙幣圖像，然后使用基于Ada-Boosting（adaptive boosting）的學習算法對原始特征向量進行選擇，得到更為有效的級聯(lián)分類器。劉家鋒等[5]將整幅紙幣圖像按一定大小劃分為互不重疊的矩形區(qū)域，將每個矩形區(qū)域的灰度均值作為原始特征，運用 K-L（Karhunen-Loeve）變換等方法提取更為有效的紙幣圖像特征，簡稱網(wǎng)格特征方法即簡記為GRID方法。Choi等[6]利用離散小波變換（DWT,discrete wavelet transform）獲取描述紙幣圖像邊緣紋理信息的高頻分量，將通過預先設(shè)定的閾值提取紙幣圖像的高頻分解系數(shù)作為特征向量。蓋杉等[7]采用 contourlet變換獲取紙幣圖像不同方向與尺度上的頻域信息，在此基礎(chǔ)上引入模糊邏輯獲取紙幣圖像識別特征（CFFE，contourlet-fuzzy feature extraction）。

上述方法雖然在紙幣識別中取得了一定的效果，但是仍然存在一些不足。當紙幣圖像出現(xiàn)傾斜、折角等情況，幾何特征的有效性將會下降，進而影響到最終的識別性能。掩模特征雖然能夠克服紙幣特征的不穩(wěn)定性，但是最優(yōu)掩蓋集如何選取仍然是個技術(shù)難點。多尺度變換特征缺乏對紙幣圖像相位信息的有效描述。類haar特征計算復雜度較高，難以滿足紙幣實時性要求。網(wǎng)格特征提取的難點是如何確定方向塊的大小及位置。因此如何找到一種有效的圖像分析方法是提取模式有效特征、提高識別率的重要途徑。四元矩陣[8-10]是一種基于頻域的新圖像表述方式，從解析信號組成的角度來看，四元矩陣理論是在四元代數(shù)與 Hilbert變換理論的基礎(chǔ)上發(fā)展而來的。四元矩陣能夠有效地描述圖像結(jié)構(gòu)紋理特征信息和局部位移信息，并且比幅值含有更多的含熵信息。

本文通過引入四元矩陣將紙幣圖像的結(jié)構(gòu)紋理信息與相位信息作為整體直接進行分析處理，提出一種基于四元矩陣理論共空間模式紙幣圖像特征提取算法（QCSP, quaternion-common spatial pattern），并采用BP（back propagation）神經(jīng)網(wǎng)絡(luò)作為分類器完成識別。實驗結(jié)果表明本文提出的算法能夠取得較高的識別率，提取的紙幣特征具有較好的可分性，并且能夠滿足實際紙幣清分系統(tǒng)的實時性要求。

2 四元數(shù)統(tǒng)計特性

作為復數(shù)的推廣，四元數(shù)是實數(shù)域基向量{1,i,j,k}的線性組合，即由一個實部和 3個虛部構(gòu)成，采用式(1)定義為

其中，qr,qi,qj和qk為實數(shù)，3個正交單位向量i、j、k 滿足

四元數(shù)乘方運算能夠描述單位向量的統(tǒng)計信息，利用四元數(shù)具有的自反特性給出其定義，則有

根據(jù)式(4)，給出四元向量的定義如下

其中，I表示單位矩陣，qR表示四元數(shù)對應(yīng)的實系數(shù)向量，ψ表示由實數(shù)域到四元數(shù)域的轉(zhuǎn)換矩陣。令η ∈ {i,j,k}，式(4)可簡化為qη=-ηq η，然后采用協(xié)方差矩陣與 3個厄米特協(xié)方差矩陣來描述四元數(shù)的實部與虛部之間具有的相關(guān)性與二階統(tǒng)計特性。為了進一步解決四元矩陣的因式分解項，本文引入如下定理[11]。

定理1 設(shè)Q為四元酉矩陣，Λx為實非負對角矩陣，則對任意的四元矩陣X，其因式分解表示為

四元矩陣能夠?qū)垘艌D像實現(xiàn)四元線性時變系統(tǒng)的稀疏描述，可以利用等價的復伴隨矩陣對其進行快速求解。四元矩陣分解具有的3個相位信息能夠描述紙幣圖像結(jié)構(gòu)具有的互為正交方向上的強度變化。另外，四元矩陣分解具有的幅值信息能夠揭示紙幣圖像的能量分布情況。

3 四元共空間模式特征提取

3.1 QCSP方法

受復數(shù)共空間模式構(gòu)造原理啟發(fā)，本文首次將復數(shù)共空間模式推廣到四元數(shù)域。令xγ(γ = 1 ,2,… ,n)表示屬于某類別γ的紙幣樣本向量，則空間協(xié)方差矩陣定義如式(6)所示。

其中， E [·]表示數(shù)學期望算子。對屬于類別γ的所有紙幣樣本空間協(xié)方差矩陣求平均值，即得到Cγ。為了能夠同時對這些協(xié)方差矩陣進行對角化，給出復合協(xié)方差矩陣即，采用式(7)對該協(xié)方差矩陣進行對角化，即

其中，Cc是厄米特矩陣，U表示四元酉矩陣，Σ表示對角矩陣，H表示厄米特共軛轉(zhuǎn)置算子。采用白化矩陣對復合協(xié)方差矩陣C進行白化，即

結(jié)合式(8)與式(9)，采用式(10)計算四元矩陣空間濾波器，則有

因此，紙幣樣本xγ經(jīng)過四元矩陣空間濾波器作用后，得到矩陣yγ=Γxγ。對于四元數(shù)q=qr+qη(η = i ,j,k)，根據(jù) STU-CCSP（strong uncorrelating transform complex common spatial pattern）算法[12]的思路，采用等價的復數(shù)描述四元數(shù)固定系數(shù)對之間的內(nèi)在聯(lián)系。受此啟發(fā)，本文采用上述定義的厄米特協(xié)方差矩陣Cqη(η =i,j,k)來挖掘矩陣yγ分解系數(shù)之間具有的內(nèi)在聯(lián)系。接下來，采用式(11)對厄米特協(xié)方差矩陣Cqη(η =i,j,k)進行擴展，則有

其中，厄米特協(xié)方差矩陣可以分解為如式(2)所示。

其中，Qη為四元酉矩陣，Λη為實對角矩陣。結(jié)合式(11)與式(12),Λη定義為

如上所述，對于紙幣樣本xγ，經(jīng)過四元濾波器作用后得到四元分解矩陣yγ，采用四元數(shù)實部與虛部的方差作為紙幣圖像分類識別的特征向量，即

采用式(14)～式(17)計算得到屬于某一類別的紙幣樣本特征向量

綜上所述，基于四元共空間模式特征提取算法的具體步驟如下：

步驟1定義所有類別的空間協(xié)方差矩陣Cγ；

步驟2計算復合協(xié)方差矩陣Cc，并對Cc進行對角化；

步驟3計算白化矩陣M與白化數(shù)據(jù)vγ=Mxγ，并對Cc進行白化操作；

步驟4對矩陣Gγ進行對角化，并計算得到特征向量W；

步驟 5計算厄米特協(xié)方差矩陣

步驟 6構(gòu)造復合厄米特協(xié)方差矩陣Ccη=并對Ccη進行對角化

步驟 7計算標準四元矩陣濾波器和復合四元矩陣濾波器

步驟8根據(jù)yγ=Γcx與yηγ=Γηx，計算紙幣樣本的特征向量

3.2 QCSP算法理論分析

本文提出的QCSP特征提取算法不僅具有較高的穩(wěn)定性，同時還具有較低的時間計算復雜度。首先，從數(shù)學分析的角度證明本文特征提取算法的穩(wěn)定性。對于在高速采集過程中受噪聲干擾的紙幣樣本向量定義如式(19)所示。其中，xγ′是原始紙幣樣本，Τψ是四元矩陣變換，μ是紙幣特征區(qū)域上的噪聲信號。通過引入條件理論中的變換條件數(shù)作為特征穩(wěn)定性的度量，基于變換集合Θ，給出類條件數(shù)定義，則有

式(20)存在下界，即

其中，X表示四元矩陣， σmax(X)是四元矩陣的最大奇異值。因此，當XTX的奇異值足夠大時，QCSP算法能夠獲得足夠穩(wěn)定的特征向量。另外，采用式(5)計算得到四元向量的增廣向量q? =ψqR，其具有的增廣協(xié)方差矩陣定義為

經(jīng)上述推導，并結(jié)合式(22)與式(23)，可以得出QCSP特征提取算法的時間復雜度是基于復數(shù)共空間模式特征提取算法的四分之一。因此，基于QCSP紙幣特征提取算法能夠滿足實際紙幣清分系統(tǒng)對實時性的要求。

4 實驗結(jié)果與分析

4.1 實驗數(shù)據(jù)庫構(gòu)建

本文自行設(shè)計清分系統(tǒng)的圖像模塊采用基于“接觸式傳感器(CIS)-FPGA-DSP”的結(jié)構(gòu)模式。將對實時性要求較高的邏輯運算放在FPGA中完成，將紙幣圖像預處理、特征提取與識別放在DSP中完成。為了驗證本文提出算法的有效性，從自行設(shè)計的紙幣清分系統(tǒng)中分別采集人民幣、美元與歐元構(gòu)建3個紙幣圖像數(shù)據(jù)庫。

紙幣圖像樣本是通過接觸式圖像傳感器得到，具體構(gòu)建的3個實驗數(shù)據(jù)庫描述如下：1) 數(shù)據(jù)庫1(D1, database 1)由20 000張人民幣樣本圖像組成，具有100元、50元、20元、10元、5元等5個主幣，每個幣值有4個面向，共有20種圖像；2) 數(shù)據(jù)庫2 (D2, database 2)由18 000張美元樣本圖像組成，具有100美元、50美元、20美元、10美元、2美元、1美元6種主幣，每個幣值有4個面向，共有24種圖像；3) 數(shù)據(jù)庫3 (D3, database 3)由15 000張歐元樣本圖像組成，具有500歐元、200歐元、100歐元、50歐元、20歐元、10歐元、5歐元7種主幣，每個幣值有4個面向，共有28種圖像。其中，全新的紙幣樣本有32 860張，占比62%；各種污損紙幣樣本為15 105張，占比28.5%；扭曲變形和噪聲紙幣樣本為5 035張，占比9.5%。

4.2 紙幣圖像預處理

本文中所處理的紙幣圖像樣本來自于高速掃描裝置，紙幣在一個機械通道中高速運行，由圖像傳感器對其進行掃描，獲得圖像信息。由于紙幣在通道中高速連續(xù)運行，這樣就不可避免地造成紙幣圖像發(fā)生傾斜、側(cè)移等現(xiàn)象。因此在進行紙幣圖像特征提取之前需要經(jīng)過一個預處理過程，首先利用錢幣圖像邊緣為直線的特點，采用在圖像上等間隔位置檢測邊緣的方法，在每一條邊上檢測出一個邊緣點序列，然后對邊緣點序列采用最小二乘擬合得到錢幣圖像的邊緣。

4.3 QCSP算法實驗結(jié)果

為了驗證本文提出算法的有效性，將QCSP算法應(yīng)用于紙幣識別中，并將QCSP算法與一些經(jīng)典的紙幣特征提取算法如DWT[6]算法、MASK[2]算法、GRID[5]算法和 CFFE[7]算法進行比較。另外，鑒于BP神經(jīng)網(wǎng)絡(luò)能夠自適應(yīng)地發(fā)現(xiàn)紙幣樣本數(shù)據(jù)之間的規(guī)律性，而且具有較強的自學與自組織能力，本文將BP神經(jīng)網(wǎng)絡(luò)作為紙幣識別階段的分類器。使用BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的輸入層節(jié)點個數(shù)為提取紙幣圖像的特征維數(shù)，輸出層節(jié)點個數(shù)為各幣種具有的面值與面向，2個隱含層節(jié)點個數(shù)分別為18與32，訓練權(quán)系數(shù)更新步長為0.1，最小誤差為10-8，最大迭代次數(shù)為9×104次。數(shù)據(jù)庫D1～D3中測試樣本的平均識別率如圖3～圖5所示，實驗結(jié)果表明采用本文提出的QCSP算法所獲得的平識別率明顯高于其他 4種算法，3個數(shù)據(jù)庫的識別率分別提高到98.86%, 99.18%與93.68%。

圖1 人民幣數(shù)據(jù)庫D1平均識別率

圖2 美元數(shù)據(jù)庫D2平均識別率

為了進一步驗證本文提取紙幣特征的抗干擾性，對其中15 105張具有不同污損程度的紙幣樣本進行實驗。采用 DWT算法、MASK算法、GRID算法、CFFE算法和QCSP算法的紙幣識別率分別為82.31%，88.54%，92.57%，96.89%和98.24%，這本文提出的QCSP算法紙幣特征提取算法相比于其他算法能夠更有效地克服污損對紙幣圖像特征造成的影響。另外，在采集大量紙幣樣本的過程中，不可避免地會出現(xiàn)樣本圖像殘缺不全、受噪聲干擾導致紙幣圖像定位不準確以及紙幣圖像傾斜過大等情況，針對上述情況，本文在紙幣識別階段引入拒識類的策略，有效地增加了算法的穩(wěn)定性。表1～表3顯示了采用本文提出的QCSP算法與DWT算法、MASK算法、GRID算法、CFFE算法所得到的實測識別率與拒識率。實驗結(jié)果表明采用本文提出的QCSP算法較其他4種方法取得了更高的識別率和較低的拒識率。

圖3 歐元數(shù)據(jù)庫D3平均識別率

在Intel Core I7 2.4 GHz CPU和8 GB RAM的平臺上給出紙幣特征提取與識別的運行時間如表 4所示。實驗結(jié)果表明本文算法較其他算法具有更低的時間復雜度。另外，紙幣清分系統(tǒng)是一種高速運行的裝置，考慮到紙幣圖像掃描裝置與控制裝置的動作時間，本文提出的算法較其他算法更能夠滿足紙幣清分系統(tǒng)的實時性要求。

5 結(jié)束語

針對紙幣圖像具有豐富的相位結(jié)構(gòu)特征信息，結(jié)合四元矩陣自身的特性，本文提出一種基于四元共空間模式的紙幣圖像特征提取算法。該算法能夠有效地克服掩模特征的不穩(wěn)定性以及網(wǎng)格特征較難區(qū)分風格相近紙幣圖像的難題。另外，本文提出的算法還能夠彌補小波變換與 contourlet變換缺乏對紙幣圖像相位信息描述的缺陷。為了驗證提出算法的有效性，本文將其應(yīng)用到紙幣識別系統(tǒng)中，實驗結(jié)果表明本文提出的算法不僅能夠取得較高的識別率，而且對于污損、扭曲變形和受噪聲干擾的紙幣圖像也具有良好的可分性。為了進一步提高紙幣識別的穩(wěn)定性和準確性，本文在紙幣識別階段引入拒識類的策略。本文提出的算法已成功應(yīng)用在一個資源約束的嵌入式清分系統(tǒng)中，并且能夠滿足系統(tǒng)實時性的要求。

表1 數(shù)據(jù)庫D1實際測試數(shù)據(jù)（識別率/拒識率）

表2 數(shù)據(jù)庫D2實際測試數(shù)據(jù)（識別率/拒識率）

表3 數(shù)據(jù)庫D3實際測試數(shù)據(jù)（識別率/拒識率）

表4 紙幣識別時間/ms